www.svethardware.cz
>
>
>
>

NVIDIA ohlásila pascalovou Teslu P100: 15,3 mld tranzistorů

NVIDIA ohlásila pascalovou Teslu P100: 15,3 mld tranzistorů
, , aktualita
Společnost NVIDIA si dle očekávání připravila pro představení na GTC 2016 horkou novinku v podobě výkonného GPU Pascal. A i když nejde o očekávané herní GPU na příslušných kartách, je tato novinka jistě zajímavá, neboť ukazuje možnosti nové generace.



reklama
CEO NVIDIE Jen-Hsun Huang tak využil svou přednášku na GTC pro představení "nejpokročilejšího akcelerátoru, který byl kdy postaven", což má být Tesla P100. Ten je založen na grafickém čipu GP100, což bude vlajková loď nové generace Pascal, od níž se budou odvíjet i schopnosti herních grafických karet. Tesla P100 se má stát základem budoucích datových center a superpočítačů, které využijí i strojové učení a hluboké neuronové sítě. Jejich úkolem tak může být hledání vhodných léků pro palčivé nemoci, porozumění změnám klimatu nebo vývoj inteligentních strojů.





Jen-Hsun Huang pak zmínil "pět zázraků", s nimiž GPU GP100 přichází:
  • Architektura NVIDIA Pascal, díky níž Tesla P100 nabídne 12násobek výkonu pro neurální sítě v porovnání s předchozím řešením založeným na architektuře Maxwell
  • NVIDIA NVLink pro co nejlepší škálovatelnost. Tato vysokorychlostní sběrnice obchází PCI Express či jiné používané sběrnice a může propojit až osm GPU Tesla P100 s propustností, která je 5x vyšší než nejlepší jiné řešení. Je tak zřejmé, že NVIDIA mluví o PCI Express se 16 GB/s, neboť NVLink slibovalo 80 GB/s. IBM již mimochodem počítá s NVLink ve svých procesorech POWER8.
  • Výrobní proces 16nm FinFET, který umožnil na jedno GPU vměstnat 15,3 miliard tranzistorů, což je velice blízko k tomu, co jsme očekávali (16 miliard). Je to tedy zatím největší FinFET čip, který byl kdy vyroben (uvidíme, co na to AMD Vega).
  • CoWoS (Chip on Wafer on Substrate) s HBM2, aneb propojení GPU a pamětí HBM2 pomocí tzv. interposeru - křemíkové destičky. NVIDIA chce konkrétně využít 16 GB HBM2, které překvapivě budou mít propustnost 720 GB/s a ne očekávaný 1 TB/s.
  • Nové AI algoritmy a podpora tzv. half-precision, čili FP16, kde dokáže GP100 nabídnout přes 21 TFLOPS výkonu.




Co se týče hrubého výkonu, tak můžeme mluvit o FP16, FP32 a FP64 (half, single a double precision). Architektura Pascal v nich přesně škáluje, čili jde vždy o polovinu výkonu: 21,2 TFLOPS, 10,6 TFLOPS a nakonec 5,3 TFLOPS v FP64.





Společně s novým akcelerátorem si NVIDIA připravila také DGX-1 Deep Learning System, který označuje za "superpočítač v krabici". DGX-1 totiž obsahuje osm Tesla P100 se 16 GB paměti, které dohromady nabídnou 170 TFLOPS (FP16) díky sbým 28 672 CUDA jádrům. Nyní se tedyo dostáváme i ke složení čipu GP100, který tedy obsahuje 3584 CUDA jader (jiné zdroje však udávají 3840 CUDA jader, což může být pro GP100 maximum). To není v porovnání s TITAN X mnoho, však ten jich má 3072, a tak je zřejmé, že tato CUDA jádra budou mnohem výkonnější. Něco podobného ostatně očekáváme také od AMD.





DGX-1 také obsahuje dva 16jádrové procesory Intel Xeon E5-2698 v3 na 2,3 GHz, 512 GB paměti DDR4 a čtyři 1,92TB SSD v RAIDu. Pro komunikaci se využijí dva 10Gb Ethernety a 4 IB EDR. Vše bude zásobit 3200W zdroj či zdroje, a tak je jasné, že tato "krabice" nebude zrovna malá. Její rozměry jsou 866 x 444 x 131 mm a hmotnost kolem 60 kg. Jednu z nich si již objednala Všeobecná nemocnice v Massachusetts pro své datové centrum. Využije ji pro provoz umělé inteligence, která se bude učit diagnózovat srdeční choroby s využitím dat z radiologie a patologie a ve své databázi bude mít 10 miliard lékařských snímků. Zájem také vyjádřilo IBM, Facebook nebo Baidu.




- osmkrát Tesla P100 v DGX-1 Deep Learning System -


Akcelerátory Tesla P100 jsou již ve výrobě a nejdříve budou k dispozici právě v DGX-1. Ty se dostanou na trh v červnu a přijdou na 129.000 dolarů, čili více než 3 miliony korun.

Zdroj: NVIDIA
Nejpopulárnější grafické karty
reklama
Nejnovější články
Vesmírná sonda Rosetta ukončila svou misi Vesmírná sonda Rosetta ukončila svou misi
Vesmírná sonda patřící Evropské kosmické agentuře včera po poledni slavnostně ukončila svou dlouhou pouť vesmírem. V závěru své dvanáctileté mise sonda dopadla na kometu, ze které sbírala data.
Dnes,  aktualita, Kateřina Hoferková
Kostní implantáty vyrobené 3D tiskem pomohou lékařům Kostní implantáty vyrobené 3D tiskem pomohou lékařům
Tým amerických vědců z Northwestern University vyvíjí flexibilní kostní implantáty, které jsou vyráběny pomocí technologie 3D tisku. Tyto implantáty mohou pomoci například i v rozvojových zemích.
Včera,  aktualita, Kateřina Hoferková
Chystá se nový Ethernet: 5 Gb/s na stávajících kabelech Chystá se nový Ethernet: 5 Gb/s na stávajících kabelech
Ve spotřebitelském sektoru jsme už mnoho let odkázáni na 1Gb/s Ethernet, což se má brzy změnit. Můžeme se těšit až na propustnost 5 Gb/s, přičemž té bude možné dosáhnout na stávajících kabelových rozvodech.
Včera,  aktualita, Jan Vítek,  7 komentářů
K čemu vůbec jsou karty Founders Edition? Prý k řešení problémů K čemu vůbec jsou karty Founders Edition? Prý k řešení problémů
NVIDIA s představením generace Pascal odstartovala také kontroverzní program, když začala vydávat na trh karty série Founders Edition. Ty mnoho výrobců vidí jako snahu slíznout smetanu, ale tak to prý není.
Včera,  aktualita, Jan Vítek
ADATA SX8000: první běžné SSD s Intel 3D MLC ADATA SX8000: první běžné SSD s Intel 3D MLC
Dle Samsungu už mají brzy získat převahu SSD vybavená pro rozhraní PCI Express a protokol NVMe. Nástup nových ADATA SX8000 to jen dokazuje a jde prý také o první spotřebitelské modely vybavené 256Gbit paměťmi Intel / Micron 3D MLC.
Včera,  aktualita, Jan Vítek