www.svethardware.cz
>
>
>
>

NVIDIA GP100: specifikace a detaily nového vlajkového GPU

NVIDIA GP100: specifikace a detaily nového vlajkového GPU
, , aktualita
NVIDIA včera večer představila hlavní čip generace Pascal a i když zcela vynechala herní stránku, můžeme se věnovat alespoň té technologické. Podívejme se tedy na to, co nám nové GP100 a jeho deriváty mohou nabídnout.
K oblíbeným
reklama
NVIDIA se na GTC 2016 věnovala Pascalu z profesionálního hlediska a představila nový akcelerátor Tesla. Ten ale ponese stejný základ jako nové herní grafické karty, a sice GPU generace Pascal, konkrétně GP100. Právě z toho budou vycházet i GPU pro herní karty i poloprofesionální modely známé jako TITAN. Nicméně právě o nich zatím ještě není známo nic a NVIDIA zatím tají, kdy mají nové herní akcelerátory vstoupit na trh, zatímco Tesla P100 je plánována již na červen. Jde přitom o velice složitý čip s 15,3 miliardami tranzistorů, takže by se dalo usuzovat, že výroba menších čipů by už mohla a měla také probíhat. Na jejich představení si ale ještě počkáme. GP100 mimochodem zabere plochu 610 mm2, pouze o 9 více v porovnání s GM200.





Jak už bylo řečeno v hlavní aktualitě o GP100, NVIDIA zabalila informace o nové generaci do pěti zázraků či divů, abychom se vyhnuli zbožštění nového GPU. Jde o samotnou architekturu Pascal, výrobní proces 16nm FinFET, sestava CoWoS s HBM2, rozhraní NVLink a nové algoritmy pro AI. Co se ale ukrývá v samotném čipu, který může obsahovat až 3840 CUDA jader?




- schema GPU GP100 - klikněte pro zvětšení -


Právě onen počet CUDA jader je zajímavý, neboť GP100 má svých 15,3 miliardy tranzistorů, téměř dvojnásobek čipu GM200 (TITAN X), jenž má 3072 CUDA jader. Pokud by tedy šlo o stejně složitá jádra, musel by jich GP100 mít kolem 6000, takže je zřejmé, že taková nejsou. GP100 se mimochodem skládá také z 240 texturovacích jednotek (TMU) a má 4096bitové rozhraní pro HBM2 uspořádané do osmi 512bitových segmentů. Propustnost 720 GB/s akcelerátoru Tesla P100 napovídá, že GPU nemusí využít všechny a tato Tesla navíc ani nemá nést plný počet CUDA jader, ale 3584.

Klíčová struktura každého GPU Pascal bude mít označení SM (Streaming Multiprocessor), přičemž u GPU Maxwell to jsou SMM (Streaming Maxwell Multiprocessor) a u Kepleru to bylo SMX (opět Streaming Multiprocessor). Jde o hlavní jednotku, která "vytváří, spravuje, plánuje a vykonává paralelní instrukce". Čip Pascal s 3840 CUDA jádry tvoří celkem šest GPC (Graphics Processing Cluster) a každý z nich je tvořen deseti SM, jichž je tak dohromady šedesát. Ty můžete jako celkovou sestavu vidět na schematu nahoře nebo jako jednotlivý SM na následujícím obrázku.





Každý Streaming Multiprocessor architektury Pascal obsahuje 64 FP32 CUDA jader, což je pouze polovina v porovnání s SM generace Maxwell. Interně je pak SM rozdělen na dvě části po 32 CUDA jádrech, které mají některé části samostatné, jako například buffer pro instrukce a jiné sdílené, což je cache L1 nebo čtyři texturovací jednotky. Tato konfigurace je v podstatě stejná jako u GPU Maxwell, přičemž Warp Scheduler nyní umí v každém taktu připravit dvě instrukce. A kvůli tomu, že SM zde mají jen polovinu CUDA jader generace Maxwell, jich samotných je tu dvakrát více, což právě stojí za vyšší efektivitou jednotlivých shaderů (CUDA jader) v Pascalech. NVIDIA tak staví na změnách, jež byly využity již v generaci Maxwell, která přinesla podstatně vyšší výkon v porovnání s Keplery. Celé GP100 obsahuje 14 MB v Register Files a 4 MB Shared Memory, čili dvojnásobek na jedno CUDA jádro, díky čemuž mohou pracovat efektivněji a využívat rychlejší přístup ke svým sdíleným pamětem a registrům.

NVIDIA tak skloubila 16nm výrobní proces se změnami v architektuře, přičemž obojí má přinést vyšší výkon i energetickou efektivitu. Můžeme se tedy těšit na to, co předvedou herní verze Pascalu.

Zdroj: wccftech
reklama
Nejnovější články
Uživatelé Windows 10 za pár eur mohou mít v Německu problém se zákonem Uživatelé Windows 10 za pár eur mohou mít v Německu problém se zákonem
Extrémně levné klíče k Windows sice mohou (nějaký čas) fungovat, ale jejich majitele riskují problémy se zákonem. Německé orgány předvolávají některé jejich uživatele a hovoří se dokonce o domovních prohlídkách.
Včera, aktualita, Jáchym Šlik10 komentářů
Rover Perseverance zvládl na Marsu svou první jízdu i otočku Rover Perseverance zvládl na Marsu svou první jízdu i otočku
Přistání Perseverance na Marsu v druhé polovině února bylo velkou událostí. Jak si ale vede americký rover nyní? NASA oznámila, že před pár dny úspěšně absolvoval test, při kterém vozítko popojelo a udělalo otočku.
Včera, aktualita, Kateřina Hoferková
Asusu unikla nepředstavená mobilní GeForce RTX 3050 Ti Asusu unikla nepředstavená mobilní GeForce RTX 3050 Ti
Asus na svých stránkách zveřejnil informace o notebooku TUF Dash F15. To by nebylo nic až tak zvláštního, kdyby se ve specifikacích neobjevil dosud nepředstavený mobilní čip Nvidia GeForce RTX 3050 Ti.
Včera, aktualita, Milan Šurkala1 komentář
John McAfee obviněn z podvodu s kryptoměnami, hrozí mu 100 let vězení John McAfee obviněn z podvodu s kryptoměnami, hrozí mu 100 let vězení
Bude-li mít John McAfee smůlu, v životě už nevytáhne paty z vězení. 75letému podnikateli totiž v USA hrozí až 100letý trest v souvislosti s obviněním z podvodů s kryptoměnami. Ty měl nejprve nakoupit a poté propagovat na sociálních sítích.
Včera, aktualita, Milan Šurkala8 komentářů
Google reaguje na digitální daň: zvýší ceny reklamy o 2 % ve Francii a Španělsku Google reaguje na digitální daň: zvýší ceny reklamy o 2 % ve Francii a Španělsku
Několik států se snaží více zdanit technologické giganty, jako jsou Google nebo Facebook. Např. ve Španělsku a Francii na to Google zareaguje tím, že pro inzerenty zdraží reklamu. Ti tak za stejný počet kliků zaplatí více.
6.3.2021, aktualita, Milan Šurkala7 komentářů