NVIDIA Volta GV100: podívejte se zblízka
25.8.2017, Jan Vítek, aktualita

Díky konferenci Hot Chips se můžeme podívat na blízké záběry čipu GV100 generace Volta, který se montuje na akcelerátory Tesla V100. Prezentoval je samotný Rob Ober z NVIDIE, hlavní platformový architekt.
Ober tak měl ve svém batohu schovanou jednu kartu Tesla V100 v serverovém provedení, a to konkrétně formátu SXM2. Ten nese napájecí okruhy s regulátory napětí a cívkami a uprostřed už trůní samotný 12nm čip složený z 21 miliard tranzistorů, který má navíc hned u sebe osázeny paměti HBM2 s celkovou kapacitou 16 GB.

GV100 se skládá z celkem 5120 CUDA jader uspořádaných do 84 jednotek SM, přičemž v čipu se nachází ještě 4 další SM, které mají pokrýt možné chyby ve výrobním procesu. Je jasné, že tak velký monolitický čip bude velice těžké vyrobit zcela bez defektů, a tak si NVIDIA a TSMC ponechávají tuto rezervu. NVIDIA pak může jednoduše deaktivovat ty SM, v nichž se objevila chyba. To ale neřeší případ, že defekt vznikne třeba v paměťovém kontroleru, jehož části nahradit nejdou, a v takovém případě musí být celé GPU zahozeno.

Čip GV100 je zatím bezpečně to nejlepší, co NVIDIA ve spolupráci s TSMC dokázala vyrobit. Však stále aktuální GP100 generace Pascal je velký 610 mm2 a je složen z 15,3 miliard tranzistorů. GV100 je o třetinu větší a má zmíněných 21 miliard tranzistorů.

Na opačné straně je GPU Volta podpořeno solidním kusem oceli a pak tu máme pro propojení se serverovou deskou dva široké konektory s celým polem spojů (mezzanine connector), přičemž jeden z nich slouží pro propojení pomocí rozhraní PCI Express a druhý pro NVLink. Napájecí systém karty se 16 regulátory napětí a cívkami obklopuje GPU a dokáže do něj pumpovat nějakých 300 W při napětí kolem 1 V, takže 300 A.

Do jednoho serveru DGX-1 formátu 3U lze zapojit 8 takových karet, které tak díky 40960 CUDA jádrům nabídnou výkon 960 TFLOPS pro AI. Karty mají k dispozici také 6 rozhraní NVLink 2.0, které zajistí vzájemné propojení s propustností 300 GB/s a celý DGX-1 si dokáže vzít až 3200 W energie, takže naprostá nezbytnost je efektivní chlazení. To NVIDIA také nabízí, ale mnozí zákazníci si prý radši vyberou vodní chlazení od třetí strany.
Zdroj: Tom's Hardware