Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Radeon R9 290X: Hawaii pod lupou

20.11.2013, Petr Štefek, recenze
Radeon R9 290X: Hawaii pod lupou
Hawaii je po delší době zbrusu nové grafické jádro AMD, které budeme vídat v těch nejvýkonnějších grafických kartách tohoto výrobce. Novinky nejsou jen na úrovni GPU, ale ve fungování celé karty.
AMD si poměrně dlouho vystačilo s jedním GPU, které reprezentovalo vrchol nabídky. Konkurence ale nijak zásadně netlačila na pilu, takže tato strategie dávala smysl. Po příchodu GK110 použitého v poměrně drahých grafických kartách GeForce GTX Titan a GeForce GTX 780 muselo AMD nějak odpovědět. Hawaii je s odstupem několika měsíců zajímavou odpovědí, a to i přesto, že jde jen o mírně vypilovanou architekturu, kterou zde máme již 2 roky. Z historie ovšem víme, že podobné vypilovanější verze původních architektur se AMD velmi dařily.

Největší devizou nového GPU Hawaii je jednoznačně větší počet funkčních jednotek. AMD s větším GPU přijít muselo, aby mělo odpověď na monstrózní GPU GK110 Nvidie. Dobrou zprávou je, že AMD nechtělo odpověď za každou cenu a neudělalo z toho Pyrhovo vítězství, takže GPU má přijatelné provozní vlastnosti a hlavně cenu, která leží pod GeForce GTX 780. AMD má menší čip než Nvidie a přesto se zdá, že podle prvních testů v renomovaných magazínech často výkonnostně překonává GK110 v nižších konfiguracích. Tento výsledek jsem upřímně nečekal, protože v poslední době platí u grafických karet zlaté pravidlo, že dostáváte přesně tolik výkonu, za kolik zaplatíte. Skvělé koupě jako byly v minulosti např. Radeony 9500 se už dnes nevyskytují.

U AMD tentokrát nějak zásadně nepropagují novou architekturu, ale spíše upozorňují na decentní změny a upravují stávající produkty. Tato strategie je značně odlišná od toho, co jsme vídávali v minulých letech. Při návrhu GPU a jejich architektur se nyní již více odráží možnost flexibilně měnit konfigurace pro různé účely a AMD přistoupilo k rozdělení GPU na funkční části (Shader Engines), kde celá strategie do značné míry připomíná to, co jsme zvyklí vídávat u Nvidie s jejich SMX jednotek, kde každá z nich disponuje určitým počtem shaderů, geometrických jednotek, rasterizérů a vlastní L1 cache. V případě AMD se Shader Engines omezují na podobnou definici s tím, že mimo tyto funkční bloky jsou umístěny funkční jednotky, které není třeba duplikovat (L2 cache, paměťové řadiče, DSP, DMA kontrolery, PCIe rozhraní atd.). Díky takto flexibilní architektuře se dají lépe připravovat nová GPU do jednotlivých prodejních segmentů.





AMD má sice jistou flexibilitu v návrhu designu GPU, ale stále musí respektovat složení jednotlivých Shader Engines, jejichž součástí jsou CU (Compute Units), geometrické procesory nebo rasterizační jednotky. Nicméně zdá se, že by AMD mohlo poměrně lehce měnit i počty CU v rámci jednoho Shader Engine. Nemuselo by tak nutně platit, že by AMD muselo pro níže položené karty obětovat vždy zhruba 1/4 funkčních jednotek spojeným přímo s jedním Shader Engine. Jestli se dočkáme v budoucnu nějakého nového GPU, je zatím ve hvězdách. Prozatím ale víme, že na trh dorazí odlehčené GPU Hawaii pro Radeon R9 290. Pokud tedy AMD hypoteticky navrhovalo GPU jako nástupce Tahiti, mohlo by pouze snížit počet CU a zachovat čtveřici Shader Engines v rámci jednoho GPU.

Když se podíváme na počet ACE (Async Compute Engine), tak v případě nového GPU Hawaii máme čtyřnásobné množství. Původní Tahiti mělo k dispozici dvojici ACE a nové GPU Hawaii dostalo do vínku 8 těchto funkčních jednotek. Každá z nich dokáže pracovat s 8 pracovními frontami (celkem tedy 64). To nemá příliš velký vliv na herní výkon, ale sleduje se tu budoucí využitelnost Hawaiie v rámci HSA, což znamená lepší výkon v aplikacích, kde je nutná velmi úzká spolupráce mezi GPU a CPU (od tohoto tandemu se také odvozuje označení heterogenní výpočty). Akcelerace, resp. výpočty, kde profituje aplikace z využití paralelní výpočetní architektury, již známe, ale stále se i přes vzniky různých jednotících projektů typu OpenCL pracuje na efektivitě, s jakou mohou obě strany tohoto řešení pracovat. Vyšší počet ACE povede v případě GPU výpočtů k lepšímu využití zdrojů v podobě CU (Compute Units), které budou efektivněji zásobovány daty ke zpracování.





Další menší změny ve front-endu a back-endu pomohou zlepšit AMD renderovací výkon a s tím úzce souvisí geometrický výkon, který je u Hawaiie na papíru podstatně lepší než u předchozích GPU. Geometrické procesory jsou zdvojeny (Tahiti mělo 2 a Hawaii má 4) a jejich spolupráci s rasterizéry každého Shader Engine. Zdvojení geometrických procesorů ale není u AMD nic nového, protože podobný krok proběhl i při přechodu z generace Radeonů 6900 na 7900. Tehdy byl handicap geometrického výkonu AMD patrný při syntetických testech, kde bylo využito teselace na vyšších úrovních (nová geometrie byla podstatně komplexnější než model, z kterého vycházela). Tak jako tehdy, i nyní u Hawaiie přichází AMD se zdvojením jednotek zodpovědných za geometrii scény, ale stejně to na brutální výkony konkurenčního GK110 (GeForce GTX 780/Titan) stačit nebude.

V syntetických testech Hawaii s GK110 prohrává, ale v reálném světě není po masivním nasazení teselace (vytvoření komplexnějšího geometrického modelu z původně jednodušší modelů – objekt se tváří jako by byl vymodelován z podstatně vyššího počtu polygonů) ani vidu, ani slechu. To se ale nyní může změnit, protože konzole nové generace mají dostatek geometrického výkonu a mohou kouzlit podobně jako grafické karty při využití Direct3D 11 teselace objektů. Vzhledem k tomu, že v konzolích jsou GPU AMD, nelze čekat, že by zde docházelo k nějakému masivnímu nasazení tak vysokého levelu teselování, že by s tím jakýkoli čip AMD měl problém. Reálnější spíše je, že Nvidie opět nevyužije svého potenciálu v oblasti akcelerace geometrie.





AMD ale nezdvojilo pouze samotné geometrické jednotky, ale také zapracovalo na optimalizaci data flows off-chip i on-chip. V případě off-chip datových toků bylo docíleno zvýšení výkonů v oblasti teselování objektů. Local Data Store může být nyní využito přímo geometrickými procesory, aby snížilo potřebu využívat off-chipp data. Mezi další dílčí vylepšení patří optimalizace pozice cache v rámci designu GPU tak, aby dokázala efektivněji obsloužit větší počet jednotek. Podle všeho AMD počítá s podstatně vyšším využitím geometrického výkonu procesorů, než jak tomu bylo u minulé generace GPU, ale zároveň se jedná spíše o pozvolné navyšování výkonu než o razantní snahu dotáhnout se na výkony konkurenčního čipu GK110. To by ostatně bylo i zbytečným plýtváním prostředků na něco, co nemá prozatím praktické využití.

Když tady mluvíme o zvýšeném geometrickém výkonu a o tom, že počet jednotek byl zdvojnásoben, zní to velmi jednoduše. AMD zase přidalo nějaké geometrické procesory navíc a tím to končí. Konec příběhu a v podstatě se nic zajímavého nestalo. Pravdou ovšem je, že implementace dalších geometrických procesorů a vybalancování jejich efektivity v rámci návrhu funkčních jednotek není nic jednoduchého. AMD zde na sebe může být opravdu pyšné, resp. pyšný na sebe může být vývojový tým AMD zodpovědný za Hawaii. Zjednodušeně řečeno platí, že čím vyšší je počet těchto samostatných procesorů, tím vznikají větší nároky na rozložení pracovní zátěže.





Další extrémně podstatnou změnou u nového GPU Hawaii je změna počtu rasterizačních jednotek, kterých je dvojnásobné množství oproti staršímu Tahiti. Něco podobného se už dlouho nestalo, ale vše to má jednoduchý důvod. ROP jednotky jsou primárně zodpovědné za výkony, kterých se nám dostává se vzrůstajícím rozlišením. A jak všichni víme, neodvratně se nám blíží 4K rozlišení nejen ve filmech a televizích, ale také na počítačích. Potřeba výkonu v této oblasti byla léta téměř neměnná, protože se vše odehrávalo v rozlišeních do 2560x1600 a typicky spíše ve Full HD, resp. v rozlišení 1920x1080. Většina tíhy tak byla vložena na bedra shaderů nebo geometrických procesorů. Časy se ale mění a další skok v rozlišení nás čeká v podobě zmiňovaného 4K alias 3840x2160, což znamená čtyřnásobné množství pixelů oproti Full HD.

Hawaii je pro tyto účely vybaveno 64 ROPs, což je 100% zvýšení počtu oproti Tahiti (32). Podobné zvýšení počtu jednotek přináší logicky i zvětšení plochy čipu, tedy i náklady. Vliv na výkon bude znatelný především v nejvyšších rozlišeních (2560x1440 a výše). V této oblasti se současným Radeonům daří oproti konkurenčním kartám Nvidie sbírat nějaké ty bodíky navíc, protože s rostoucím rozlišením se jejich výkon propadá méně. Podle prvních testů se zdá, že se AMD skutečně velmi soustředilo na to, aby Radeon R9 290X byl ve 4K rychlejší než konkurenční řešení a zdá se, že v současné době je u většiny titulů podporujících toto rozlišení (viz. například Anandtech) Hawaii skutečně rychlejší. To je pro AMD velký úspěch, když uvážíme, že Hawaii je levnější než GK110 (v případě koncového produktu dokonce velmi významným způsobem).





Zajímavé je sledovat upgrade L2 cache, která se zvětšila o zhruba 33 %, což odpovídá zvýšení počtu paměťových řadičů, které nyní obsluhují 512bitovou sběrnici. Zvýšení ROP na dvojnásobek nemá žádný podstatný vliv na velikost cache, ale Hawaii má teď L2 cache o velikosti 1 MB. Vzhledem k tomu, že velikost a rychlost L2 cache hraje jednu z hlavních rolí v případě renderovacího výkonu, je rychlá a dostatečně objemná cache nutností, aby se snížily off-chip operace, jež vyžadují přístup do paměti akcelerátoru, která je podstatně pomalejší.

Paměťové řadiče u GPU Hawaii doznaly také logického přídavku s ohledem na širší paměťovou sběrnici. Nyní se jejich počet z původní šestice 64bitových rozrostl na 8, takže jednoduchým propočtem zjistíme, že Hawaii pracuje s 512bitovou paměťovou sběrnicí. Původní Tahiti pracovalo se šířkou sběrnice 384bit a paměťové čipy byly schopné stabilně pracovat na frekvencích okolo 6 GHz, což dávalo ve výsledku slušnou propustnost 288 GB/s. Velikost paměťových řadičů, které zvládaly podobně vysoké frekvence, byla vzhledem k ostatním částem jádra poměrně velká, a tak AMD přistoupilo k integraci vyššího počtu menších řadičů, které obsluhují pomalejší paměťové čipy GDDR5 na frekvencí okolo 5 GHz. Při zvětšené šířce ovšem získalo AMD nárůst paměťové propustnosti o zhruba 10 %.

AMD tak udělalo jistý kompromis, který šetří místo na jádru (podle všeho je ušetřené místo rovné zhruba 20 % původní plochy, kterou zabíralo 6 řadičů v jádru Tahiti). Jak už bylo řečeno výše, i přes pomalejší paměťové čipy bylo AMD schopné tímto krokem dosáhnout na propustnost paměťového subsystému akcelerátoru okolo 320 GB/s. Pro AMD je to změna uvažování, protože v minulých letech jsme byli svědky spíše odlišné strategie, kdy akcelerátory měly užší paměťovou sběrnici (maximálně 256-bit) a rychlejší paměti GDDR5 (5-6 GHz). Konkurenční Nvidia v minulosti razila opačnou taktiku, a tak jsme mohli u některých řad GeForce vidět šířku sběrnice až 384-bit ve spojení s čipy GDDR5 s efektivní frekvencí okolo 4 GHz. Integrace 512bitové sběrnice ale není zcela jasná výhra, neboť pro akcelerátor potřebujete dražší plošný spoj (PCB) a také musíte na kartu integrovat více paměťových čipů (dle počtu řadičů – Hawaii s 16 čipy GDDR5 vs. Tahiti s 12 čipy GDDR5). Celkově se ale tento kompromis AMD zřejmě vyplatí, protože vede k vytyčenému cíli, kterým je celkově malý nárůst plochy GPU a tím pádem také nižší náklady na jeho výrobu.





V oblasti Compute Units se toho mnoho nezměnilo. Je zde optimalizace novější architektury GCN 1.1, ale jinak můžeme hovořit spíše o jejich vyšším počtu než o nějakých zásadních změnách v designu. Hawaii má 4 Shader Engines, v kterých je celkově 44 CU. Starší Tahiti mělo také 4 Shader Engines, ale v nich pouze 32 Compute Units. Protože současné herní tituly preferují spíše výkon oblasti shaderů a texturování, je tento krok ke zvýšení počtu jednotek pochopitelný. AMD tvrdí, že Hawaii je o 30 % výkonnější a lví podíl na tom má právě zvýšení počtu stream procesorů a texturovacích jednotek o zhruba 38 %. Je zřejmé, že architektura GCN je navržena tak, aby šlo poměrně snadno revidovat počty CU v jednotlivých SE podle toho, kam GPU chceme směřovat.

Strategie AMD byla poměrně jasná a spočívala v navrhování relativně malých (ve srovnání s konkurencí), ale výkonných jader, která nacházela uplatnění hlavně v herních desktopových kartách. Jen málokdy jsme se mohli setkat s GPU, které by přesáhlo plochu 400 mm2 (šlo o dva případy – první je R600 a druhým Hawaii). Nvidia jednou za čas přijde s jádrem, které má titánské rozměry a výkon, ale nesmíme zapomenout, že nasazení podobných jader do herních akcelerátorů je pro společnost pouze druhotný cíl, protože tím prvním je trh s pracovními stanicemi a profesionálními akcelerátory nebo superpočítači (jeden založený na kombinaci paralelní výpočetní architektury GPU a x86 výpočetních jader máme v ČR ve VŠB-TUO Ostrava). AMD sice postupně stahuje ztrátu v této oblasti, ale stále nelze říci, že by Nvidii významným způsobem konkurovala.




Zdroj: Anandtech - srovnání velikostí GPU

Hawaii je pro AMD největší GPU, jaké kdy společnost vyrobila a v tom počítáme i éru ATI. Plocha 438 mm2 ve spojení s 6,2 mld. tranzistorů tvoří pro AMD velký milník. Celkový rozdíl velikostí Tahiti a nového jádra Hawaii je 73 mm2, což představuje zhruba 20% navýšení plochy. Nesmíme zapomenout, že AMD dosáhlo 30 procent zvýšení výkonu, takže je tento obchod zatraceně výhodný. Počet tranzistorů integrovaných na o 20% větší ploše je o 44% větší než u Tahiti (1,92 mld. tranzistorů rozdílu). Větší GPU už AMD při stávajícím výrobním procesu 28 nm nevyrobí. Nový výrobní proces v TSMC směřují pod hranici 20 nm, takže to také znamená, že GPU následující generace budou co do plochy spíše menší i při podstatném zvýšení počtu funkčních jednotek.

Jak se bude vyvíjet strategie AMD, je těžké odhadovat, ale zdá se, že celkový obraz bude stejný, jako tomu bylo do nynější doby, kdy v první inkarnaci nové architektury na novém výrobním procesu společnosti vyzkouší možnosti na menších jádrech a větší jádra budou následovat až u faceliftované architektury. Jedno je ale zřejmé. V případě GPU Hawaii se nebude opakovat debakl, který ATI zažilo se svým jádrem R600, které bylo velké, drahé a hardwarově pokročilé, ale zůstalo tak nějak na ocet a nedokázalo přesvědčit vývojáře, aby schopnosti tohoto GPU využili. Hawaii má připravenou půdu už mnoho měsíců a navíc je jeho poměr ceny ku výkonu prozatím v kategorii high-endu nedostižný.
reklama