Nvidia pro workstation: RTX 4000, 4500 a 5000 s až o 50 % vyšším výkonem pro AI

Nvidia dnes obohatila sérii profesionálních karet RTX o tři nové modely na architektuře Ada Lovelace. Máme tu nové RTX 4000, 4500 a 5000, které proti předchůdcům přináší vyšší výkon a mají i zajímavé spotřeby.

Reklama

V nabídce profesionálních grafických karet Nvidia se objevily nové modely na architektuře Ada Lovelace. Ta např. přináší až 2krát vyšší propustnost v FP32 výpočtech, podobně tak až 2krát vyšší výkon RT a Tensor jader. Máme tu DLSS 3, které najde využití nejen ve hrách, ale také profesionálních aplikacích pro akceleraci zobrazování díky AI. Nechybí ani větší paměť, která využívá ECC (kontrola chyb), a karty jsou také optimalizovány pro různé typy rozšířených realit (AR, VR i MR).

Nvidia pro workstation: RTX 4000, 4500 a 5000 s až o 50 % vyšším výkonem pro AI

Nabídka začíná u dvou RTX 4000, stávající v menší SFF verzi a nově i druhá v klasické. Liší se takty čipu i pamětí, což se podepisuje na výkonu, ale také spotřebě. SFF verze si totiž vystačí s pouhými 70 W, přitom v FP32 nabídne vysoký výkon 19,2 TFLOPS. To je výkonem někde mezi GeForce RTX 4060 (15,1 TFLOPS) a RTX 4060 Ti (22,1 TFLOPS), ty však mají spotřebu 115 W, resp. 160 W. Využití tu najde 160bitová sběrnice pamětí a máme tu nepříliš obvyklou kapacitu pamětí 20 GB. Plnohodnotná verze s vyššími takty je s výkonem 26,7 TFLOPS lehce pod úrovní GeForce RTX 4070, vystačí si však jen se 130 W proti 200 W. Proti profesionální RTX A2000 má novinka 2,1násobný grafický výkon, o 70 % vyšší v CADu, 2násobný pro rendering, o 80 % v úlohách AI a 2,1násobně vyšší v HPC.

	RTX 4000 SFF	RTX 4000	RTX 4500	RTX 5000	RTX 6000
CUDA jádra	6144	6144	7680	12800	18176
Tensor jádra	192	192	240	400	568
RT jádra	48	48	60	100	142
Frekvence	cca 1,56 GHz	cca 2,17 GHz	cca 2,58 GHz	cca 2,55 GHz	cca 2,51 GHz
Výkon v FP32	19,2 TFLOPS	26,7 TFLOPS	39,6 TFLOPS	65,3 TFLOPS	91,1 TFLOPS
Výkon v RT	44,3 TFLOPS	61,8 TFLOPS	91,6 TFLOPS	151 TFLOPS	210,6 TFLOPS
Výkon Tensor	306,8 TFLOPS	327,6 TFLOPS	634 TFLOPS	1044,4 TFLOPS	1457 TFLOPS
Rozhraní	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16
Paměti	20 GB GDDR6	20 GB GDDR6	24 GB GDDR6	32 GB GDDR6	48 GB GDDR6
Paměťová sběrnice	160-bit	160-bit	192-bit	256-bit	384-bit
Rychlost pamětí	14 Gbps	18 Gbps	18 Gbps	18 Gbps	20 Gbps
Propustnost pamětí	280 GB/s	360 GB/s	432 GB/s	576 GB/s	960 GB/s
Spotřeba	70 W	130 W	210 W	250 W	300 W
Rozměry	69×168 mm	112×241 mm	112×267 mm	112×267 mm	112×267 mm
Porty	4× miniDP 1.4a	4× DP 1.4a	4× DP 1.4a	4× DP 1.4a	4× DP 1.4a

RTX 4500 se dostává na 7680 CUDA jader, což je stejně jako GeForce RTX 4070 Ti, a vzhledem k podobným taktům má i podobný výkon, nicméně spotřeba je jen 210 W místo 285 W. Její 192bitové rozhraní pracuje s 24 GB paměti, ty však mají nižší takty. Nvidia říká, že pro generativní AI nabídne o 40 % více výkonu než RTX A4500, v grafice je to o 60 %, v renderování 50 %, stejně tak to platí pro vyhodnocování AI algoritmů a CAD. V Omniverse má být výkon 2,7krát vyšší.

Trojici novinek uzavírá RTX 5000. Ta dostává 12800 CUDA jader, čímž výrazně překonává RTX 4080 s 9728 jádry. Díky tomu má o 34 % vyšší hrubý výkon, nicméně se spokojí jen s 250W spotřebou, zatímco u GeForce RTX 4080 Nvidia udává 320 W. Tato karta má rovněž 256bitové paměti, ty ale mají dvojnásobnou kapacitu 32 GB, běží však mnohem pomaleji (18 Gbps místo 22,4 Gbps). Proti RTX A5500 nabídne o 50 % více výkonu v trénování a generativní AI, renderování je 2,1krát rychlejší, grafika o 90 %. HPC výpočty mají být v průměru 2,2krát rychlejší a Omniverse dokonce 3,3násobně. RTX 6000 je už stará známá.

Zdroj: wccftech.com, nvidia.com

Reklama