Nvidia pro workstation: RTX 4000, 4500 a 5000 s až o 50 % vyšším výkonem pro AI
9.8.2023, Milan Šurkala, aktualita
Nvidia dnes obohatila sérii profesionálních karet RTX o tři nové modely na architektuře Ada Lovelace. Máme tu nové RTX 4000, 4500 a 5000, které proti předchůdcům přináší vyšší výkon a mají i zajímavé spotřeby.
V nabídce profesionálních grafických karet Nvidia se objevily nové modely na architektuře Ada Lovelace. Ta např. přináší až 2krát vyšší propustnost v FP32 výpočtech, podobně tak až 2krát vyšší výkon RT a Tensor jader. Máme tu DLSS 3, které najde využití nejen ve hrách, ale také profesionálních aplikacích pro akceleraci zobrazování díky AI. Nechybí ani větší paměť, která využívá ECC (kontrola chyb), a karty jsou také optimalizovány pro různé typy rozšířených realit (AR, VR i MR).
Nabídka začíná u dvou RTX 4000, stávající v menší SFF verzi a nově i druhá v klasické. Liší se takty čipu i pamětí, což se podepisuje na výkonu, ale také spotřebě. SFF verze si totiž vystačí s pouhými 70 W, přitom v FP32 nabídne vysoký výkon 19,2 TFLOPS. To je výkonem někde mezi GeForce RTX 4060 (15,1 TFLOPS) a RTX 4060 Ti (22,1 TFLOPS), ty však mají spotřebu 115 W, resp. 160 W. Využití tu najde 160bitová sběrnice pamětí a máme tu nepříliš obvyklou kapacitu pamětí 20 GB. Plnohodnotná verze s vyššími takty je s výkonem 26,7 TFLOPS lehce pod úrovní GeForce RTX 4070, vystačí si však jen se 130 W proti 200 W. Proti profesionální RTX A2000 má novinka 2,1násobný grafický výkon, o 70 % vyšší v CADu, 2násobný pro rendering, o 80 % v úlohách AI a 2,1násobně vyšší v HPC.
RTX 4000 SFF |
RTX 4000 |
RTX 4500 |
RTX 5000 |
RTX 6000 |
|
CUDA jádra |
6144 |
6144 |
7680 |
12800 |
18176 |
Tensor jádra |
192 |
192 |
240 |
400 |
568 |
RT jádra |
48 |
48 |
60 |
100 |
142 |
Frekvence | cca 1,56 GHz | cca 2,17 GHz | cca 2,58 GHz | cca 2,55 GHz | cca 2,51 GHz |
Výkon v FP32 |
19,2 TFLOPS |
26,7 TFLOPS |
39,6 TFLOPS |
65,3 TFLOPS |
91,1 TFLOPS |
Výkon v RT | 44,3 TFLOPS | 61,8 TFLOPS | 91,6 TFLOPS | 151 TFLOPS | 210,6 TFLOPS |
Výkon Tensor | 306,8 TFLOPS | 327,6 TFLOPS | 634 TFLOPS | 1044,4 TFLOPS | 1457 TFLOPS |
Rozhraní | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 |
Paměti | 20 GB GDDR6 | 20 GB GDDR6 | 24 GB GDDR6 | 32 GB GDDR6 | 48 GB GDDR6 |
Paměťová sběrnice | 160-bit | 160-bit | 192-bit | 256-bit | 384-bit |
Rychlost pamětí | 14 Gbps | 18 Gbps | 18 Gbps | 18 Gbps | 20 Gbps |
Propustnost pamětí | 280 GB/s | 360 GB/s | 432 GB/s | 576 GB/s | 960 GB/s |
Spotřeba |
70 W |
130 W |
210 W |
250 W |
300 W |
Rozměry |
69×168 mm |
112×241 mm |
112×267 mm |
112×267 mm |
112×267 mm |
Porty |
4× miniDP 1.4a |
4× DP 1.4a |
4× DP 1.4a | 4× DP 1.4a | 4× DP 1.4a |
RTX 4500 se dostává na 7680 CUDA jader, což je stejně jako GeForce RTX 4070 Ti, a vzhledem k podobným taktům má i podobný výkon, nicméně spotřeba je jen 210 W místo 285 W. Její 192bitové rozhraní pracuje s 24 GB paměti, ty však mají nižší takty. Nvidia říká, že pro generativní AI nabídne o 40 % více výkonu než RTX A4500, v grafice je to o 60 %, v renderování 50 %, stejně tak to platí pro vyhodnocování AI algoritmů a CAD. V Omniverse má být výkon 2,7krát vyšší.
Trojici novinek uzavírá RTX 5000. Ta dostává 12800 CUDA jader, čímž výrazně překonává RTX 4080 s 9728 jádry. Díky tomu má o 34 % vyšší hrubý výkon, nicméně se spokojí jen s 250W spotřebou, zatímco u GeForce RTX 4080 Nvidia udává 320 W. Tato karta má rovněž 256bitové paměti, ty ale mají dvojnásobnou kapacitu 32 GB, běží však mnohem pomaleji (18 Gbps místo 22,4 Gbps). Proti RTX A5500 nabídne o 50 % více výkonu v trénování a generativní AI, renderování je 2,1krát rychlejší, grafika o 90 %. HPC výpočty mají být v průměru 2,2krát rychlejší a Omniverse dokonce 3,3násobně. RTX 6000 je už stará známá.