reklama
Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Nvidia Tesla K20 - součást nejvýkonnějšího superpočítače

27.11.2012, Petr Štefek, technologie
Nvidia Tesla K20 - součást nejvýkonnějšího superpočítače
V dnešním článku si představíme hardware, který se stal stěžejním základem pro nejvýkonnější superpočítač Titan. Základem akcelerátorů Tesla K20 je jádro GK110, které drží primát čipu s největším množstvím tranzistorů.
Když jsme nové Tesle K10 spílali za nevalné výkony ve FP64, který nevyvážil ani slušný výkon v single-precision výpočtech, tak nás Nvidia přesvědčovala, že tato řada se bude pohybovat ve zcela jiných vodách, než kde je potřeba mít výkony v double-precision výpočtech. Předchozí generace Tesly M2090, která byla založena na jádru GF110, nabízela teoretický výkon 655 GFLOPS. Nová řada Tesla K20X nabízí dvojnásobek této hodnoty 1,31 TFLOPS, což je pozoruhodné, ale trošku nás to nutí zamyslet se nad tím, jak Nvidia postoupila od dob GF110 dále. S více než dvojnásobkem tranzistorů nabízí dvojnásobné výkony.

Levnější model Tesla K20 je na tom v přímém srovnání se svým předchůdcem přeci jen o něco lépe, protože nabízí oproti Tesle M2075 víc než dvojnásobný výkon. Přepočteno na čísla zde máme 515 GFLOP versus 1,17 TFLOPS, což už vypadá o poznání lépe. Samozřejmě svou vinu na tom má třetinový výkon FP64 oproti FP32, to je oproti starší architektuře velký rozdíl, neboť tam byl tento handicap pouze poloviční. Na druhou stranu to vyvažuje velký nárůst výkonu v single-precision (FP32), kde je rozdíl téměř trojnásobný (1,33 TFLOPS oproti 3,95 TFLOPS – M2090 vs. K20X).

Pozorný čtenář si ale nyní musí klást otázku, jak je možné, že již před několika měsíci uvedená Tesla K10 má vyšší výkon ve FP32 než tento high-endový čip. Je to hned ze dvou důvodů. Prvním je, že v případě akcelerátorů Tesla K10 se 4,5 TFLOPS dělí mezi dva čipy GK104. Druhým důvodem je návrh jádra GK104, které je podstatně jednodušší a menší, takže postrádá vlastnosti jako Error Code Correction na úrovni cache jádra nebo podporu dynamického paralelismu (Hyper Q). V případě superpočítačů se bez ECC neobejdete a bez výkonu v double precision také ne, takže zde máme pěkně rozdělené využití. Tesla K10 jednoduše směřuje jinam než Tesla K20.




Zdroj: Anandtech - Deska superpočítače Titan s Nvidia Tesla K20X.


Jak už jsme si uvedli v úvodu, tak Tesla K20 je využita v případě superpočítače Titan, který sesadil z prvního místa hardware od IBM. Spojení klasické procesorové architektury x86 a specializovaných paralelních výpočetních architektur nyní tedy slaví úspěch a papírově skutečně tradiční architektury deklasují. Není zde ale jen IBM, počítat musíme také s Intelem a AMD. Druhá jmenovaná společnost má k dispozici své profesionální akcelerátory FirePro S9000/10000 a Intel svůj zbrusu nový počin Xeon Phi. Obě řešení jsou schopna překonat magickou hranici 1 TFLOP v případě FP64 operací. Nvidia tedy má papírově náskok skoro 30%, ale nikdo nyní nedokáže zhodnotit, jaké budou výkony těchto řešení v reálném světě. Počítat musíme také s celkovou cenou řešení, spotřebou a dalšími atributy. Je tedy úplně reálné, že obě konkurenční řešení mohou být základem příštích superpočítačů, které z trůnu sesadí Titan.

Tesla K10 je již dostupná několik měsíců a jak víme z reálných aplikací, tak Tesla K20 také. Samozřejmě ještě není Tesla K20 volně dostupná na trhu, ale Nvidia již dodává akcelerátory svým partnerům. Tito integrátoři budou pak zajišťovat dostupnost na trhu pro další využití a zde mluvíme o profesionálních aplikacích, takže nečekejte, že si Tesla K20 koupíte v e-shopu. To se může samozřejmě stát až v době, kdy bude dostupná aktivně chlazená verze pro pracovní stanice.

Cenová politika v případě akcelerátorů Tesla K20 bude nastavena velmi vysoko ve srovnání s kartami pro běžné použití v domácích počítačích. Pokud je odhad správný, tak cena modelu K20 by mohla být někde okolo 4 000 USD (zhruba 80 000 korun) a dražší K20X by mohla stát někde okolo 5 000 USD (zhruba 100 000 korun). Jak vidíte, tak se nejedná o žádnou láci, ale výkon přepočtený na dolar bude jistě velmi zajímavý, a to v případě systému s až tisícovkami akcelerátoru jde až v první řadě.





Jaká bude dostupnost Tesla K20/K20X se prozatím neví a je zřejmé, že Nvidia se bude snažit v prvé řadě pokrýt své projekty jako byl Titan a teprve potom dojde na další partnery. Společnost nicméně již přijímá objednávky. Jestli bude společnost stíhat uspokojit zájem je ve hvězdách, ale podle dosavadních náznaků se Nvidia snaží vytvořit dojem, že nová Tesla jde na odbyt podstatně lépe než tomu bylo u předchozí generace.

Pokud Nvidia objevila další pole, kde bude úspěšná, tak se dá předpokládat, že hodnota společnosti poroste raketovým tempem. Prozatím se ovšem její akcie pohybují na minimech za posledních mnoho měsíců, což je opravdu s podivem. Společnosti se daří získávat podíl na trhu grafických karet a její mobilní Tegra 3 také není úplný propadák a výsledky jsou rozhodně lepší než u předchozí generace (byť se výkonnostně nejedná o zázrak – konkurence to stále umí lépe). Možná, že analytici mají výhrady k předpokládané ziskovosti nebo dalším parametrům, které částečně určují cenu akcie.

Jak už jsem zmiňoval, tak Nvidii se povedl dobrý marketingový krok, který spočíval v obsazení postu nejvýkonnějšího počítače dneška (v teoretickém výkonu), takže nemusí nikoho sáhodlouze přesvědčovat, že její technologie je životaschopná a velmi konkurenční. Nyní už můžeme jen čekat, jestli se s Teslou povede překonat magickou hranici 1 mld. dolarů a z HPC byznysu se stane tažný kůň společnosti. AMD má podobné předpoklady, ale jako obvykle je nezvládá využít a její pokročilé architektury v lepším případě končí v herních počítačích a pracovních stanicích. Takhle se to opravdu nedělá.
reklama