Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Nvidia uvedla Blackwell Ultra B300 i GB300 s více paměti HBM3e

21.3.2025, Milan Šurkala, aktualita
Nvidia uvedla Blackwell Ultra B300 i GB300 s více paměti HBM3e
Nvidia na konferenci GTC 2025 představila spoustu novinek na poli hardwaru i softwaru. Nejnovějšími produkty pro výpočty budou ty založené na architektuře Blackwell Ultra. Čeká nás např. GB300 NVL72.
Společnost Nvidia před několika dny pořádala svou konferenci GTC 2025 a na ní bylo představeno spoustu nových věcí, např. akcelerátor RTX Pro 6000 s 96 GB VRAM. Pokud ale zamíříme výše, máme tu architekturu Blackwell Ultra a s ní vyšší výkon a více paměti. Jednou z novinek je systém DGX B300, který proti generaci HGX H100 nabízí 11krát vyšší výkon pro inferenci a 4krát vyšší pro trénování AI. Celkový výkon pro inferenci v FP4 činí 144 PFLOPS, pro trénování v FP8 pak 72 PFLOPS, to jsou už ale stejné hodnoty jako u HGX B200.
 
Celkové množství HBM3e paměti je 2,3 TB. Jde sice o systém NVL16, což by napovídalo 16 GPU, Nvidia je ale začala počítat podle GPU chipletů. Každé GPU B300 se skládá ze dvou spojených čipů, takže tu máme 8 GPU, které se ale každé skládá ze dvou spojených čipů, z toho pak pramení NVL16 (NVSwitch GPU-to-GPU s rychlostí 1,8 TB/s). Každé GPU má nyní k dispozici 288 GB paměti 12-Hi HBM3e, což je o polovinu více než u předchozí generace se 192 GB. Jde o systém se dvěma procesory Intel Xeon, 8portovým Nvidia ConnectX-8 s přenosovými rychlostmi až 800 Gb/s. Dále je tu 8×3,84TB SSD. Spotřeba celého zařízení činí 14 kW.
 
Nvidia přestavila i rack systém GB300 NVL72. Zde máme 72 GPU Nvidia Blackwell Ultra a 36 CPU Nvidia Grace. Ta dávají celkem 2592 jader ARM Neoverse V2 (každé CPU má 72 jader). Výkon v FP4 se dostává na 1400 PFLOPS (s řídkými maticemi), příp. 1100 PFLOPS (tedy 1,1 ExaFLOPS), ve formátu FP8 a FP6 je to pak 720 PFLOPS. Pro AI by měl dosahovat 1,5× vyššího výkonu než předchozí GB200 NVL72. HBMe je o kapacitě 40 TB, dále tu může být až 21 TB GPU paměti s celkovou propustností 576 TB/s a 18 TB CPU paměti (SOCAMM) s LPDDR5X a propustností 14,3 TB/s. Díky těmto výkonům by nové systémy měly být vedle tradičních nasazení více vhodné i pro běh AI agentů nebo generování fotorealistických videí pro trénink autonomních aut a robotů.
 


Doporučujeme náš velký přehled desktopových grafických čipů.