www.svethardware.cz
>
>
>
>

NVIDIA GP100: specifikace a detaily nového vlajkového GPU

NVIDIA GP100: specifikace a detaily nového vlajkového GPU
, , aktualita
NVIDIA včera večer představila hlavní čip generace Pascal a i když zcela vynechala herní stránku, můžeme se věnovat alespoň té technologické. Podívejme se tedy na to, co nám nové GP100 a jeho deriváty mohou nabídnout.



reklama
NVIDIA se na GTC 2016 věnovala Pascalu z profesionálního hlediska a představila nový akcelerátor Tesla. Ten ale ponese stejný základ jako nové herní grafické karty, a sice GPU generace Pascal, konkrétně GP100. Právě z toho budou vycházet i GPU pro herní karty i poloprofesionální modely známé jako TITAN. Nicméně právě o nich zatím ještě není známo nic a NVIDIA zatím tají, kdy mají nové herní akcelerátory vstoupit na trh, zatímco Tesla P100 je plánována již na červen. Jde přitom o velice složitý čip s 15,3 miliardami tranzistorů, takže by se dalo usuzovat, že výroba menších čipů by už mohla a měla také probíhat. Na jejich představení si ale ještě počkáme. GP100 mimochodem zabere plochu 610 mm2, pouze o 9 více v porovnání s GM200.





Jak už bylo řečeno v hlavní aktualitě o GP100, NVIDIA zabalila informace o nové generaci do pěti zázraků či divů, abychom se vyhnuli zbožštění nového GPU. Jde o samotnou architekturu Pascal, výrobní proces 16nm FinFET, sestava CoWoS s HBM2, rozhraní NVLink a nové algoritmy pro AI. Co se ale ukrývá v samotném čipu, který může obsahovat až 3840 CUDA jader?




- schema GPU GP100 - klikněte pro zvětšení -


Právě onen počet CUDA jader je zajímavý, neboť GP100 má svých 15,3 miliardy tranzistorů, téměř dvojnásobek čipu GM200 (TITAN X), jenž má 3072 CUDA jader. Pokud by tedy šlo o stejně složitá jádra, musel by jich GP100 mít kolem 6000, takže je zřejmé, že taková nejsou. GP100 se mimochodem skládá také z 240 texturovacích jednotek (TMU) a má 4096bitové rozhraní pro HBM2 uspořádané do osmi 512bitových segmentů. Propustnost 720 GB/s akcelerátoru Tesla P100 napovídá, že GPU nemusí využít všechny a tato Tesla navíc ani nemá nést plný počet CUDA jader, ale 3584.

Klíčová struktura každého GPU Pascal bude mít označení SM (Streaming Multiprocessor), přičemž u GPU Maxwell to jsou SMM (Streaming Maxwell Multiprocessor) a u Kepleru to bylo SMX (opět Streaming Multiprocessor). Jde o hlavní jednotku, která "vytváří, spravuje, plánuje a vykonává paralelní instrukce". Čip Pascal s 3840 CUDA jádry tvoří celkem šest GPC (Graphics Processing Cluster) a každý z nich je tvořen deseti SM, jichž je tak dohromady šedesát. Ty můžete jako celkovou sestavu vidět na schematu nahoře nebo jako jednotlivý SM na následujícím obrázku.





Každý Streaming Multiprocessor architektury Pascal obsahuje 64 FP32 CUDA jader, což je pouze polovina v porovnání s SM generace Maxwell. Interně je pak SM rozdělen na dvě části po 32 CUDA jádrech, které mají některé části samostatné, jako například buffer pro instrukce a jiné sdílené, což je cache L1 nebo čtyři texturovací jednotky. Tato konfigurace je v podstatě stejná jako u GPU Maxwell, přičemž Warp Scheduler nyní umí v každém taktu připravit dvě instrukce. A kvůli tomu, že SM zde mají jen polovinu CUDA jader generace Maxwell, jich samotných je tu dvakrát více, což právě stojí za vyšší efektivitou jednotlivých shaderů (CUDA jader) v Pascalech. NVIDIA tak staví na změnách, jež byly využity již v generaci Maxwell, která přinesla podstatně vyšší výkon v porovnání s Keplery. Celé GP100 obsahuje 14 MB v Register Files a 4 MB Shared Memory, čili dvojnásobek na jedno CUDA jádro, díky čemuž mohou pracovat efektivněji a využívat rychlejší přístup ke svým sdíleným pamětem a registrům.

NVIDIA tak skloubila 16nm výrobní proces se změnami v architektuře, přičemž obojí má přinést vyšší výkon i energetickou efektivitu. Můžeme se tedy těšit na to, co předvedou herní verze Pascalu.

Zdroj: wccftech
Nejpopulárnější grafické karty
reklama
Nejnovější články
Falcon 9 vybuchl kvůli porušení héliové nádrže Falcon 9 vybuchl kvůli porušení héliové nádrže
Na samotném začátku tohoto měsíce explodovala raketa Falcon 9 společnosti SpaceX a ta se od té doby snažila zjistit především to, co tuto nehodu způsobilo. Nyní už to vypadá, že "viník" byl nalezen, a to héliová nádrž.
Včera,  aktualita, Jan Vítek
Autonomní vozidlo Googlu se zapletlo do zatím asi největší nehody Autonomní vozidlo Googlu se zapletlo do zatím asi největší nehody
Ani samořízeným vozům se čas od času nevyhne nehoda, ale naprostou většinu z nich způsobí řidič běžného automobilu. Nejinak je tomu i v případě poslední nehody, která je nejspíš jednou z největších, do jaké bylo zapleteno SUV od Googlu.
Včera,  aktualita, Jáchym Šlik
SpaceX vyzkoušelo Raptor, motor pro mise na Mars SpaceX vyzkoušelo Raptor, motor pro mise na Mars
Společnost SpaceX má s ohledem letů na Mars velice ambiciózní plány, do nichž spadá také využití silnějších motorů, než jaká má dnes k dispozici. Jedná se o vyvíjený Raptor, který byl nyní vůbec poprvé vyzkoušen.
Včera,  aktualita, Jan Vítek
AMD Zen Plus: 7nm APU Gray Hawk přijde v roce 2019 AMD Zen Plus: 7nm APU Gray Hawk přijde v roce 2019
Nyní je aktuální generace APU Bristol Ridge, ale my už se můžeme podívat do budoucnosti, kde se rýsují již 7nm APU založená na procesorové architektuře Zen Plus. Jde o Gray Hawk chystané na rok 2019.
Včera,  aktualita, Jan Vítek,  1 komentář
Twitter nejspíše hledá, kdo by jej mohl koupit Twitter nejspíše hledá, kdo by jej mohl koupit
Agentura Reuters přinesla zprávu, že Twitter vyjednává s hned několika technologickými společnostmi a hledá mezi nimi tu, která by jej byla ochotna koupit. Není to ani tak moc překvapivé vzhledem k tomu, jaké finanční výsledky Twitter má v posledních letech.
Včera,  aktualita, Jan Vítek