NVIDIA Pascal slibuje přes 4 TFLOPS v FP64, Volta až 7

25. 11. 2015 12:10 1

NVIDIA se pochlubila, že její příští generace grafických karet s označením Pascal dosáhne výkonu přes 4 TFLOPS, a to v double precision (FP64). Tím by daleko přesáhla možnosti dnešní generace Maxwell, jež v této disciplíně zrovna nevyniká.

Reklama

NVIDIA se rozpovídala o své další generaci karet na SC15, čili letošní konferenci věnované supercomputingu. Podívejme se ale nejdříve na možnosti aktuální generace karet a vezměme si nejvýkonnější Teslu založenou na čipu Maxwell, tedy model M40. Tato karta s čipem GM200 vyniká svým výkonem v FP32 (single precision), kde dosahuje 7 TFLOPS, ovšem v FP64 je to pouze 0,21 TFLOPS. To ještě starší Tesla K40 (GK110 - Kepler) má v FP32 sice "pouze" 4,3 TFLOPS, ale v FP64 1,43 TFLOPS. Co se týče konkurence, pak AMD má v současnosti nejlepší model FirePro S9170 se 32 GB paměti, který v FP64 dosáhne 2,62 TFLOPS (bavíme se o jednočipových kartách).

NVIDIA opět potvrdila, že čipy Pascal jsou a budou vyráběny 16nm procesem FF+ v TSMC a dle všeho bychom se nových karet měli dočkat v první polovině příštího roku. Otázka stále je, kolik tranzistorů bude tyto čipy tvořit, přičemž odhady hovoří prostě o tom, že se 8 miliard tranzistorů v čipech Maxwell GM200 zdvojnásobí (a možná i více než zdvojnásobí). Herní karty pak ponesou až 16 GB paměti HBM2 a profesionální i 32 GB.

Jeden ze slidů prezentace firmy NVIDIA ukazuje nárůst hrubého výkonu jjeích grafických čipů, stejně jako nárůst propustnosti paměťového systému. V grafu vidíme Teslu K40 se svými 1,43 TFLOPS a pak dvoučipovou K80 s nějakými 1,660 TFLOPS. Následuje už Pascal, jehož výkon má strmě růst na cca 4 TFLOPS a Volta dokonce až na 7 TFLOPS, což ani nepotřebuje komentář. O tyto výsledky se zaslouží také paměti HBM (HBM2 a další), jež v případě generace Pascal dosáhnou propustnosti slíbeného 1 TB/s a Vollta půjde ještě dále na 1,2 TFLOPS. Zde už také u profesionálních řešení namísto sběrnice PCI Express pro propojení více karet nastoupí NV Link se svými 80 GB/s. Tomu nemůže konkurovat ani PCIe 3.0 x16.

Stále více se tedy ukazuje, že před námi je nástup revoluční generace karet NVIDIA i AMD, jejichž výkon bude využitelný pro hraní ve vysokém rozlišení (Ultra HD) a těšit se můžeme také na to, co tyto karty předvedou v chystaných superpočítačích. V jejich případě se očekává velký pokrok ve výkonu a celkový nárůst systémů s výkonem v řádu PetaFLOPS. Konkrétně půjde o Summit Supercomputer pro Oak Ridge National Laboratory a Sierra Supercomputer pro Lawrence Livermore National Laboratory, jež jsou oba stavěny pro výkon přes 100 PFLOPS, což bude asi dvojnásobek dnes nejvýkonnějšího Tianhe-2.

Společnost NVIDIA se ve své prezentaci věnovala také pamětem HBM, jimž se bohužel problémy s vysokou spotřebou nevyhnou a vypadá to, že budou ještě daleko závažnější než v případě GDDR5. Dnešní generace HBM na kartách AMD s čipy Fiji je tedy v porovnání s GDDR5 velice úsporná, což umožní vložit ušetřenou energii do GPU. Už HBM2 se ale mají svou spotřebou přiblížit starým GDDR5, přičemž tedy nejde o spotřebu samotných pamětí, ale paměťové architektury v GPU. Blíží se tedy tzv. Looming Memory Power Crisis. Pro srovnání, implementace rozhraní pro HBM1 v čipech Fiji potřebuje pro svůj provoz nějakých 25 W. U HBM2 s propustností 1,2 TB/s to bude už 60 W a pokud bychom měli pokračovat, pak 2,5TB/s paměti HBM budou potřebovat 120W a 3TB/s už 160 W. A není samozřejmě možné, aby si takovou porci energie ukousla pouze paměťová architektura.

NVIDIA tedy nyní dle svých slov pracuje na tom, aby tato krize nenastala, na což má ještě dost času, neboť v případě karet Pascal a Volta ještě nic řešit nemusí, i když evidentně s uváděnými 60 W spotřeby také není spokojena.

Zdroj:

wccftech

Reklama