ATi Radeon X1900 - trojnásobná síla shaderů
24.1.2006, Zdeněk Kabát, článek
Právě byly oficiálně představeny dlouho očekávané Radeony série X1900, jež mají přinést důstojné uvedení nové architektury. GPU R580 obsahuje 12 quadů po třech pixel shaderech, a tak jich nyní čip obsahuje 48! Tato architektura přináší ale i další vylepšení.
Kapitoly článku:
- ATi Radeon X1900 - trojnásobná síla shaderů
- Změny v architektuře, nové ceny
Úpravy pixel shaderů a jejich důsledek
Pixel shadery jsou malé programy ve vysokoúrovňovém programovacím jazyku (DirectX 7 a vyšší, extenze v OpenGL), které umí manipulovat s pixely, tedy barvou jednotlivých bodů scény. S jejich pomocí probíhá osvětlování, stínování a je prováděna celá řada efektů.
Na grafu, který uvádím výše, je vidět, jak se mění závislost her na výkonu pixel shaderů, nebo přesněji, jaké procento her pixel shadery využívá. Tento nárůst znamená prakticky to, že každá nová počítačová hra již alespoň minimálně tyto grafické podprogramy potřebuje a navíc je potřebuje stále intenzivněji a vyžaduje vyšší výkon.
Druhý graf pak ukazuje, jak se mění poměr mezi potřebnými texturovacími a aritmetickými operacemi. Pixel shadery jakožto komplexní programy totiž mohou obsahovat jak instrukce zpracovávající texturu, tak instrukce, které se zabývají ostatními aritmetickými výpočty (osvětlení, používání normálových map, paralaxní mapování apod.). I kdyby byl graf pravdivý jen z poloviny, je jasné, že matematické operace jsou využívány mnohokrát intenzivněji než texturovací.
Do této statistiky je třeba ještě zahrnout fakt, že filtrování textur si u většiny scény vystačí s bilineárním filtrem či point samplingem, které lze provést za jeden cykl, zatímco trilineární a anizotropní filtry potřebují cyklů více.
Z těchto poznatků vychází nová architektura pixel shader enginu u Radeonů X1900. Původní R520 obsahovala 16 pixel shaderů ve čtyřech "quadech", R580 tento počet ztrojnásobuje! Znamená to, že jádro obsahuje celkem 48 pixel shader ALUs, které jsou schopné simultánně provádět operace na jednotlivých vláknech s pixely zaslaných z Ultra-Threading Dispatch procesoru (viz preview X1000). Počet texturovacích jednotek naopak zůstává stejný, stejně jako počet Render Back-Ends.
Co to tedy znamená? Zatímco na výstupu do frame bufferu je stále maximální fillrate 10,4 Gpixel/s, pixel shadery jsou schopné zpracovat třikrát tolik instrukcí než dříve. U moderních her, které jsou silně na shaderech závislé, najdete i takové efekty, které vyžadují několik taktů, než jsou zpracovány. Protože nemusí být na konci každého taktu poslány na výstup, je poměr PSP:TMU v našem případě 3:1 naprosto vhodný. Ovšem u starších her, které tolik shaderů neobsahují, bude výkon stále omezen počtem vyrenderovaných pixelů, tedy počtem RBE.
Výsledkem by mělo být zvýšení rychlosti karty ani ne v 3DMarcích, ani ne v průměrných fps her, ale v minimální rychlosti náročných titulů. Zatímco maximum, kterého se dosahuje v nenáročných scénách, bude stále omezeno počtem RBE, minimum již využije možnosti 48 pixel shaderů a zvýší tak framerate v komplikovaných scénách o desítky až stovky procent.
Fetch4 a práce s shadow map
Shadow mapy, tedy stínové mapy, jsou textury, v nichž jsou uloženy informace o osvětlení 3D scény. Vznikají tak, že je scéna vyrenderována z pohledu jednotlivých světelných zdrojů a následně jsou informace o vzdálenosti zdroje světla a jednotlivých objektů uloženy do jednokanálové textury. S nárůstem výkonu grafických karet se stále častěji uvažuje nad používáním měkkých stínů (např. ve hře F.E.A.R.), což je ale výpočetně velmi náročné. Je třeba pomocí dynamického větvení zjistit, kde jsou hrany stínů a na těchto hranách použít nějaký filtr.
Klasicky jsou textury filtrovány po jednom pixelu, který se skládá ze 4 barevných složek (RGBA - červená, zelená, modrá, alpha kanál). V případě černobílé textury byl ale tento způsob velmi neefektivní, a tak ATi zavedla novou technologii Fetch4, která namísto jednoho samplu vezme hned čtyři. To v konečném důsledku vede k rychlejšímu generování hran měkkých stínů a také lze Fetch4 využít při filtrování libovolných jiných černobílých textur, např. výškových map.
Další změny jen sporadické
Více důležitého se toho v architektuře X1900 neudálo, a tak snad zmíním jen zvětšení integrované paměti (cache) pro technologii Hierarchical Z. Ta zajišťuje vyřazení překrývajících se polygonů v počáteční fázi grafické pipeline, konkrétně na konci vertex enginu. Zbylé věci, se kterými se ATi chlubí, byly již k dispozici u Radeonu X1800 (Shader Model 3.0, HDR + MSAA, Adaptive AA apod.).
Verze Radeonu X1900, nové ceny a konkurence
O dvou základních verzí R580 jsem se zmínil již na první stránce, jedná se o rychleji taktovaný Radeon X1900XTX a o chlup pomalejší, ovšem o dost levnější Radeon X1900XT. Kromě toho se na trh dostane Radeon X1900 CrossFire Edition se stejnými parametry jako X1900XT a po úspěchu druhé generace CrossFire v podání Radeonu X1800XT slibuje velmi dobrý výkon, už jen díky 96 pixel shaderům. Tato master karta bude stát $599.
Nechybí ani oblíbená multimediální verze All-In-Wonder X1900, který nabízí Avivo, TV a FM tuner a kompletní vstupy a výstupy potřebné pro zachytávání videa, externí nahrávání apod. Bude dodáván s bohatým softwarovým bundlem (Adobe Premiere Elements 2.0, Photoshop Elements 4.0) a dálkovým ovládáním Remote Wonder Plus a jeho výkon při přehrávání HDTV by měl být podstatně vyšší než u konkurence.
Zde je tabulka desktopových "herních" grafických karet s oficiálními cenami od dnešního dne:
Grafická karta | Paměť | Frekvence | Konfigurace | Cena | Dostupnost |
Radeon X1900XTX | 512MB | 650/775 | 8/48/16/16 | $649 | 24.1. |
Radeon X1900XT | 512MB | 625/725 | 8/48/16/16 | $549 | 24.1. |
Radeon X1800XT | 512MB | 625/750 | 8/16/16/16 | $499 | 5.11. |
256MB | $399 | ||||
Radeon X1800XL | 256MB | 500/500 | $299 | 5.10. | |
Radeon X1600XT | 256MB | 590/690 | 5/12/4/4 | $169 | 30.11. |
Radeon X1600Pro | 256MB | 500/390 | $129 | ||
Radeon X1300Pro | 256MB | 600/400 | 2/12/4/4 | $109 | 5.10. |
Radeon X1300 | 128MB | 450/250 | $99 | ||
Radeon X1300 HM | 32MB | 450/500 | $49 |
Pozn.: Sloupec konfigurace znamená: vertex shadery / pixel shadery / texturovací jednotky / Render Back-Ends
Ještě dodám, kteří partneři se se svými výrobky objeví v krátké době na trhu. No tak, jsou to prakticky všichni - Asus, Connect3D, GeCube, HIS, MSI, Sapphire a Tul Corporation (PowerColor). U nás bude nejrychleji Asus, HIS, MSI (vše skrz LEVI) a Sapphire (přímé zastoupení). Ceny se budou pohybovat kolem 14-16 tisíc Kč bez DPH, což není úplně hrozné (přeci jen se jedná o nejrychlejší sólovou kartu na trhu).
Konkurence v podobě nVidie ale zůstává, protože GeForce 7800GTX 512MB rozhodně není žádné ořezávátko. Přesto lze očekávat, že tyto doladěné Radeony vyhrají souboj v hi-endu a posléze, po příchodu nových derivátů, i ve vyšším mainstreamu. Nezbývá tedy než čekat na nové GeForce 7900 a 7600, v tuto chvíli ale máme (ač zatím nepotvrzeno testy) nového krále. ATi, takto to mělo být!
Zdroj: ATi