Architektura Turing podrobněji: TU106 jako polovina TU102
12.9.2018, Jan Vítek, aktualita
Server VideoCardz už mohl nahlédnout do whitepaperu, který NVIDIA uvolní až v pátek. Tehdy se budeme moci blíže podívat na architekturu nových čipů TU102, TU104 a TU106, které tvoří trojici nových GeForce.
Základní stavební jednotkou nových čipů je Turing SM, který tvoří výsledný GPC - GPU Processing Cluster. NVIDIA do architektury Turing zavedla nová jádra, a sice INT32, díky čemuž SM dokáží najednou zpracovávat výpočty v pevné i pohyblivé řádové čárce. Vedle toho tu jsou také jádra Tensor pro AI a nakonec dle diagramu (krom plánovače, registrů, texturovacích jednotek a L1 cache) jedno RT jádro pro ray tracing.
Server VideoCardz udává, že jádra INT32 odlehčí jádrům FP32, což umožní dosáhnout podstatně vyššího výkonu. Jejich společné nasazení zase umožnila nová unifikovaní architektura paměti L1 cache a NVIDIA tvrdí, že společně s jinými změnami v novém SM (Streaming Multiprocessor) lze očekávat 50% zvýšení výkonu na jedno CUDA jádro.
Máme tu také nové technologie či techniky jako Mesh Shading - nový shaderový model pro vertexy, tesselaci a geometrii pro zpracování více objektů ve scéně. Pak tu máme také Variable Rate Shading (VRS) dávající vývojářům možnost omezení shadingu v případě, že to nemá z hlediska kvality zobrazení smysl a pak můžeme zmínit Texture-Space Sharing ukládající výsledky shaderových operací v paměti pro jejich případné sdílení.
Turing dostal také vylepšenou bezztrátovou kompresi dat pro efektivnější využití propustnosti paměti, takže jde prostě o ještě více vylepšené algoritmy, v jejichž případě měla dle NVIDIE paměťová propustnost efektivně narůst o celou polovinu, což vypadá až podezřele dobře.
Dále tu máme nový video engine s podporou DisplayPort 1.4a a rozlišení 8K při 60 Hz, přičemž karty Turing mohou využít dva 8K displeje, ať už fyzicky napojené na DisplayPort nebo na USB C. K tomu patří i NVENC enkodér pro H.265 při až 8K/30 FPS a dekodér NVDEC s podporou HEV YUV444 10/12b HDR, H.264 8K a VP9 10/12 HDR.
TU102 podporují dvě rozhraní NVLINK x8 druhé generace a TU104 má pouze jeden takový a TU106 nepodporuje žádný. Podporu fyzického rozhraní SLI už nenajdeme v žádném z těchto čipů.
Dozvíme se ale především to, že RTX 2070 opravdu nebude založena na osekaném GPU pro RTX 2080, jako tomu bylo v předchozích generacích. Využije tak plně vybavený čip TU106, jenž bude přesně poloviční TU102, ovšem toto GPU není na RTX 2080 Ti využito v plné výbavě. To ale i znamená, že TU106 už v podstatě není mainstream a nástupce GP106 (GTX 1060) a předchozích. NVIDIA tak v podstatě "povýšila" TU106 na následovníka GP104, ostatně je proti němu také podstatně větší. TU102 pak bude zase následovník pro GP100, pokud ovšem časem opravdu nepřijde TU100.
NVIDIA TURING GPU | |||
---|---|---|---|
TU102 | TU104 | TU106 | |
Proces | 12nm FFN | 12nm FFN | 12nm FFN |
Velikost čipu |
754 mm2
|
545 mm2
|
445 mm2
|
Počet tranzistorů |
18,6 mld.
|
13,6 mld.
|
10,6 mld.
|
NVIDIA SKU s plným GPU | Quadro RTX 6000 | Quadro RTX 5000 | GeForce RTX 2070 |
GPC |
6
|
6
|
3
|
TPC |
36
|
24
|
18
|
SM |
72 (12 na GPC)
|
48 (8 na GPC)
|
36 (12 na GPC)
|
Tensor Cores |
576
|
384
|
288
|
RT Cores |
72
|
48
|
36
|
FP32 Cores (CUDA) |
4608
|
3072
|
2304
|
INT32 Cores |
4608
|
3072
|
2304
|
ROP |
96
|
64
|
64
|
TMU |
288
|
192
|
144
|
Pam. rozhraní |
384-bit
|
256-bit
|
256-bit
|
L2 Cache |
6144 kB
|
4096 kB
|
4096 kB
|
Zdroj: VideoCardz