NVIDIA Tesla V100: monstrum z 21 miliard tranzistorů

Jensen Huang vzal na sebe příjemnou povinnost představit prvního zástupce GPU generace Volta, jímž je něco vskutku speciálního. Jde o dosud bezpečně největší GPU, a to Tesla V100, které je vyrobeno z neuvěřitelných 21 miliard tranzistorů.

Reklama

Vypadá to, že AMD má skutečně co dohánět a my můžeme tak trochu s obavami sledovat, jak se nůžky mezi výkonem GPU NVIDIA a AMD dále rozevírají. Posuďte sami. Donedávna nepřekonané GPU NVIDIA Tesla P100 zabírá plochu 610 mm

a je vyrobeno z 15,3 miliard tranzistorů, díky čemuž nabídne 10,6 TFLOPS výkonu v FP32. Nyní tu máme už Volta V100 s plochou 815 mm

tvořenou 12nm procesem FFN firmou TSMC, kteréžto GPU už má 21,1 miliard tranzistorů a nabídne výkon rovných 15 TFLOPS. Díky tomu všemu se mohl totiž navýšit počet CUDA jader z 3584 kusů na 5120, přičemž taktovací frekvence zůstala na plně srovnatelných 1465 MHz.

NVIDIA Tesla V100: monstrum z 21 miliard tranzistorů

- klikněte pro zvětšení -

NVIDIA ale začala prezentaci obecně tématem AI a hlubokého učení, ale také novým

projektem Holodeck

. Ten umožní, aby se lidé z celého světa vyzbrojení VR headsety sešli ve virtuální místnosti, kde se mohou podívat na podrobné modely produktů, v tomto případě nového supersportu. Model počítá s interaktivní fyzikou, takže bude třeba možné vzít do virtuálních rukou volant, přičemž uvedený model auta nebyl jen prázdná skořápka, ale dopodrobna vymodelovaný s veškerými součástmi.

- klikněte pro zvětšení -

Huang se pak už věnoval především AI, jejímu prudkému vývoji, který způsobuje obrovský rozmach nových startupů i zapojení tradičních odvětví. Rád přitom opakoval, že NVIDIA tak demokratizovala výpočetní techniku ve smyslu jejího rozšíření do všech vědních oborů. Jinými slovy, pokud máte k dispozici data, můžete jimi ládovat hluboké neuronové sítě za libovolným účelem.

Pak už byla představen samotný čip

Tesla V100

založený na architektuře Volta, který byl ukázán po boku čtyř pamětí HBM2 s kapacitou 16 GB a propustností už 900 GB/s. Nová je tu teaké verze rozhraní NVLink, která už nabídne rovnou propustnost 300 GB/s pro komunikaci mezi kartami.

- klikněte pro zvětšení -

Tesla V100 je přizpůsobena nejen pro výpočty v FP32, kde poskytuje 15 TFLOPS, ale také v double precision, čili FP64, kde je její výkon přesně poloviční. Největší nárůst ale nastal ve výkonu pro AI (mixed precision), který NVIDIA označuje za Tensor TFLOPS a těch má přesně 120.

- klikněte pro zvětšení -

Plné GPU GV100 se skládá ze šesti komplexů GPC, dále má 84 SM generace Volta tvořících po dvojících celkem 42 TPC. Pro paměti HBM2 má celkem osm 512bitových segmentů paměťového kontroleru, takže celková šířka je 4096 bitů.

jednotka SM

Každý z 84 SM je vybaven 64 FP32 jádry, 32 FP64 jádry a osmi novými Tensor jádry provádějící operaci D = A x B + C s maticemi 4x4 s využitím instrukcí TensorOp, což zajišťuje 12násobně rychlejší operace s optimalizací pro hluboké učení. Každý SM má také čtyři texturovací jednotky, takže dohromady tu je 336 TMU oproti 224 v top čipu generace Pascal. TDP přitom zůstalo na stejné úrovni jako o generaci dříve, takže je stále 300W.

Výsledný akcelerátor Tesla V100 je oproti svému předchůdci o polovinu rychlejší v klasických výpočtech pro High-Performance Computing (HPC), ale díky nové architektuře má být dvanáctkrát rychlejší při trénování hlubokých neuronových sítí.

- klikněte pro zvětšení -

Poté už přišla na řadu ukázka studia

Square Enix

, aby se nezapomnělo také na hry. Toto studio připravilo ze světa Final Fantasy krátkou ukázku toho, jak by už v dohledné době mohly vypadat hry, přičemž cílem není nic jiného než filmová kvalita. Posuďte sami, jak moc zobrazená postava vypadá reálně.

- klikněte pro zvětšení -

NVIDIA také zaměstnává řadu vědců z různých oborů a mezi nimi rovněž astrofyziky. Ti si připravili

simulaci

toho, jak ve vzdálené budoucnosti bude probíhat interakce mezi naší galaxií Mléčná dráha a galaxií Andromeda. Ty se totiž mají nejdříve letmo setkat a pak rovnou srazit, aby vytvořily jedno velké těleso. Simulovány přitom byly miliony hvězdných těles rychlostí asi 100 milionů za sekundu.

Nakonec hardwarové části prezentace byly představeny dva konkrétní produkty, a to očekávaný nástupce

DGX-1

vybavený už akcelerátory Tesla V100, a to rovnou osmi kousky s výkonem 960 Tensor TFLOPS. Připravit si pro něj musíme "jen" 149 tisíc dolarů.

A pak tu je opravdová novinka, a sice

pracovní stanice NVIDIA DGX

, která je vybavena čtyřmi Tesla V100 s podporou NVLink, vodním chlazením a výkonem 480 Tensor TFLOPS.

Otázka je, kdy se NVIDIA chystá vyslat na trh herní verze čipů Volta. Starší roadmap mluvily nejdříve o začátku příštího roku, ale nyní to vypadá, že na fámách o tom, že přijdou ještě letos, asi opravdu něco bude. V každém případě musím zopakovat, že ve světě herních karet není NVIDIA v pozici, že by měla něco dohánět, kdežto ve světě AI a strojového učení má vážnější a silnější konkurenci.

Zdroj:

NVIDIA

Reklama