Architektura Ampere: jak NVIDIA vylepšila výkon nových GeForce?

Architektura Ampere: jak NVIDIA vylepšila výkon nových GeForce?
, , článek
Grafické karty NVIDIA generace Ampere představují největší výkonnostní skok po mnoha letech a my nyní čekáme na to, zda na něj bude společnost AMD schopna zareagovat. To si ale můžeme ukrátit článkem o samotné architektuře Ampere.
K oblíbeným
Kapitoly článku:
  1. Architektura Ampere: jak NVIDIA vylepšila výkon nových GeForce?
  2. Co se skrývá pod chladičem: konfigurace, CUDA, výkon
  3. Ray tracing, DLSS a paměti GDDR6X
reklama
NVIDIA nás dokázala dokonale překvapit, neboť do poslední chvíle se jí povedlo utajit pravdu o výbavě nových karet RTX 3000 generace Ampere. Sama dobře ví, že informace o nich unikají především od různých AIB výrobců, které lze těžko uhlídat, takže pokud chce něco utajit, musí mlčet i před nimi. A to je těžké, když AIB firmy či jiní výrobci podílející se na celém procesu musí už předem vědět, na čem pracují a musí mít k dispozici vzorky. 
 
 
Právě díky tomu jsme se mohli dopředu dozvědět třeba o novém 12pinovém napájecím konektoru, podobě chladiče pro referenční verze a také o většině specifikací. Ovšem zatímco například kapacitu pamětí a šířku sběrnice NVIDIA kvůli výše uvedenému prostě nemá šanci utajit, pravou konfiguraci nových GPU pod pokličkou udržet může, neboť do nich nikdo nevidí. My jsme se přitom předem dozvěděli, že nové GeForce RTX využívají polovinu CUDA jader, než ve skutečnosti mají, takže je zřejmé, že je NVIDIA ve verzích pro vývoj karet v AIB společnostech či jiných nechala deaktivované. 
 
A není divu, že si NVIDIA dala takovou práci se skrytím této skutečnosti, neboť jde o hlavní trumf, s nímž Ampere přichází na trh. Je tu sice jeden zakopaný pes, ovšem v praxi to přesto vypadá na velice dobré řešení, které jistě lidem z AMD přidělalo hodně vrásek na čele. 
 
Společně s opravdovým počtem CUDA jader pro FP32 tak NVIDIA logicky do poslední chvíle utajila i skutečný výkon karet, samozřejmě i cenu, o níž se předem s nikým nemusela bavit a otázky také existovaly o použitém výrobním procesu, z nějž se nakonec vyklubala 8nm technologie firmy Samsung.
 
Model NVIDIA GeForce RTX 3070 NVIDIA GeForce RTX 3080 NVIDIA GeForce RTX 3090
GPU Ampere GA104-300 Ampere GA102-200 Ampere GA102-300
Výrobní proces Samsung 8nm Samsung 8nm Samsung 8nm
Velikost čipu 395,2 mm2 628,4 mm2 628,4 mm2
Počet tranzistorů 17,4 miliard 28 miliard 28 miliard
CUDA jádra 5888 8704 10496
TMU / ROP ? 272 / 96 ?
Tensor / RT  184 / 46 272 / 68 328 / 82
Základní takt 1500 MHz 1440 MHz 1400 MHz
Turbo 1730 MHz 1710 MHz 1700 MHz
FP32 20 TFLOPs 30 TFLOPs 36 TFLOPs
RT TFLOPS 40 TFLOPs 58 TFLOPs 69 TFLOPs
Tensor-TOPS 163 TOPs 238 TOPs 285 TOPs
Paměti 8 GB GDDR6 10 GB GDDR6X 24 GB GDDR6X
Sběrnice 256-bit 320-bit 384-bit
Propustnost na pin 14 Gbps 19 Gbps 19,5 Gbps
Celková propustnost 448 Gbps 760 Gbps 936 Gbps
TDP 220 W 320 W 350 W
Cena $499 US $699 US $1499 US
Dostupnost říjen 2020 17. září 2020 24. září 2020
 
Specifikace nových RTX 3090, 3080 a 3070 jsou už téměř celé známé a my se můžeme nejdříve zaměřit na samotné čipy. Ty se samy o sobě zmenšily, zatímco počet tranzistorů výrazně narostl, takže je otázka, jak je to vůbec s novým 8nm procesem Samsungu, neboť dle těchto údajů to nevypadá jen na trochu vylepšený 10nm proces, ale uvidíme. 
 
Čip GA102 je o více než 100 mm2 menší než TU102, přičemž počet tranzistorů je vyšší o téměř 10 miliard. Téměř jej tak dohání GA104 se 17,4 miliardami (vs. 18,6 mld.), přičemž kontrast mezi velikostí čipů je zřejmý: 395 vs. 754 mm2. Hustota tranzistorů je tak v porovnání s 12nm FinFET firmy TSMC mnohem vyšší, a to odhadem asi o 80 %. Čip TU102 byl dle velikosti a počtu tranzistorů vyroben s hustotou 24,7 MT/mm2 (MT - milion tranzistorů), zatímco GA102 dosahuje 44,6 MT/mm2.
 
výrobci už ukazují své RTX 3000 
 
Ovšem ani to by zdaleka nestačilo, aby mohl třeba čip GA104 nabídnout 5888 CUDA jader, neboť to je mnohem více, než obsahuje jakákoliv verze z hlediska počtu tranzistorů složitějšího čipu TU102 (max. 4608 CUDA). I z toho je zřejmé, že NVIDIA musela nějakým způsobem zasáhnout do architektury, zvláště když se musí počítat i s vyšším výkonem jader RT a Tensor. A my už víme, jaký způsob využila. 
 
Vedle toho všeho je navíc podstatný i ten fakt, že RTX 3080 jako nástupkyně RTX 2080, a to dle označení i ceny, se dle použitého čipu GA102 posunula v hierarchii o stupeň výš. Využívá pochopitelně osekanou verzi tohoto GPU, ale i tak obsahuje 83 % CUDA jader z čipu GA102-300.
 
A pokud dáme dohromady vylepšenou architekturu s efektivně dvojnásobným počtem CUDA jader, větší čip s podstatně vyšší hustotou tranzistorů, nové výkonnější paměti a stejnou cenu, máme tu čtyři hlavní důvody pro oprávněné nadšení z nové generace firmy NVIDIA.
 
Toto nadšení ale může velice rychle opadnout, pokud se ukáže, že nových GeForce bude do konce roku opravdu velký nedostatek. Odkazovaná zpráva na serveru TweakTown totiž tvrdí, že 8nm proces má v této době příliš nízkou výtěžnost a NVIDIA se kvůli ní zdráhá nechat Samsung výrobu řádně rozjet, než se chybovost sníží. Zda je to pravda, to nevíme, ale nesporné je to, že v současné době NVIDIA nad AMD drží výkonnostní nadvládu a nepociťuje z jeho strany tlak. To dobře ilustruje její 80% podíl na trhu se samostatnými grafickými kartami.
 
 
Na druhou stranu lze říci, že nové RTX 3000 konkurují v podstatě všemu, respektive odsouvají všechny předchozí modely do pozadí zájmu. Pouze takový zákazník, který je sice dobře informovaný, ale není ochoten si počkat (anebo je z hlediska výkonu nihilista), může mít dnes zájem o grafické karty z řad RTX 2000, GTX 1600 či AMD Navi. Jedinou možností je ulovit novou kartu za velice zajímavou cenu, což jsou spíše výjimky, jako spatřená MSI GeForce RTX 2080 Ti GAMING X TRIO za 23 tisíc. Ceny klesat mohou, ale spíše se lze připravit na to, že RTX 2000 spíše postupně zmizí z trhu a výhodnou nabídku do té doby představovat nebudou. Ještě je tu také bazar, ovšem to už je kapitola sama pro sebe. My nyní načneme také novou kapitolu, ale ta už bude o architektuře generace Ampere.  
reklama
Nejnovější články
ASRock ROMED4ID-2T: EPYC nyní už i na trošku přerostlé Mini ITX ASRock ROMED4ID-2T: EPYC nyní už i na trošku přerostlé Mini ITX
Pokud má někdo zájem, může si díky společnosti ASRock postavit sestavu založenou na procesoru AMD EPYC i na desce formátu Mini ITX. Je to pravda trošinku přerostlá Mini ITX, ale ne o moc. 
Včera, aktualita, Jan Vítek
AMD Ryzen 7 5800U na Zen 3 ukazuje vysoký nárůst IPC v Single-Core AMD Ryzen 7 5800U na Zen 3 ukazuje vysoký nárůst IPC v Single-Core
AMD nám udělalo poněkud nepořádek ve značení procesorů, a tak tu máme mobilní Ryzen 7 5700U na architektuře Zen 2 a 5800U, který už bude mít Zen 3. A jak ukazují první testy, jednovláknový výkon šel opravdu hodně nahoru.
Včera, aktualita, Milan Šurkala8 komentářů
3DMark dostal nové UI a také umí odhadovat herní výkon sestavy 3DMark dostal nové UI a také umí odhadovat herní výkon sestavy
UL Benchmarks představují novou verzi 3DMarku coby hlavní aplikace, pomocí které spouštíme všechny možné testy patřící do celé nabídky. Ta má přepracované uživatelské rozhraní a pak je tu ještě jedna novinka. 
Včera, aktualita, Jan Vítek
ASRock ohlašuje tenounká PC Mars s mobilními AMD Renoir ASRock ohlašuje tenounká PC Mars s mobilními AMD Renoir
Společnost ASRock si tentokrát nepřipravila nové komponenty, ale hotová PC řady Mars 4000U, jejíž označení už napovídá, čím budou tyto počítače vybaveny. Jde o řadu AMD Ryzen 4000U, čili mobilní Renoir. 
Včera, aktualita, Jan Vítek1 komentář
Intel je opět jednička, prudký růst na trhu s čipy však ukazují jiní Intel je opět jednička, prudký růst na trhu s čipy však ukazují jiní
Firma IC Insights opět zveřejnila svůj přehled o světovém trhu mezi výrobci polovodičů, kam patří všichni, ať už mají či nemají své výrobní kapacity. Intel je opět na svém zdánlivě neotřesitelném prvním místě, ale na rozdíl od jiných moc nerostl.
Včera, aktualita, Jan Vítek