Nvidia Blackwell GB200 pro vědu aneb CPU může být pro výpočty až 200× dražší
15.5.2024, Milan Šurkala, aktualita
GPU karty od Nvidie (ale i AMD) jsou už pěknou řádku let používány k vědeckým výpočtům. Nejnovější generace Blackwell GB200 má pro některé typy nasazení být až 200krát levnější než CPU. Zvládá to totiž mnohem efektivněji.
Grafické karty se už dlouhou dobu používají nejen ke hraní her, ale také k vědeckým výpočtům. Charakteristika čipu je pro některé z nich velmi výhodná, a tak Nvidia už v roce 2006 představila svou technologii CUDA. Akcelerace pomocí GPU se pak rozšířila do mnoha dalších oblastí a dnes je z toho celý ekosystém různých nástrojů, které umožňují provádět výpočty mnohem rychleji než na CPU.
V březnu Nvidia představila novou architekturu Blackwell, která se brzy dostane do grafických karet GeForce RTX 5000, prozatím je ale oficiální jen výpočetní varianta. Jednou z nich je GB200. Nvidia se nyní podělila o to, jak velký výkonnostní nárůst vlastně přináší. Pochopitelně tu máme oblíbená "až", která hovoří o nejlepším možném případě a ne o tom průměrném. Asi nelze čekat, že se výkon obecně řádově zvýší, nicméně pokud jde např. o trénování generativní AI s LLM o bilionu parametrů (1000 miliard), pak by Blackwell měl být 25krát efektivnější než Hopper.
Nvidia mluví např. i o tom, že pokud byste chtěli předpovídat počasí a provádět k tomu příslušné simulace, na CPU by to bylo 200krát dražší s 300krát větším množstvím energie než na Blackwellu. Běh digitálních dvojčat (dnes často používaná technika v průmyslu, kdy se zkoušky provádí na digitálním dvojčeti reálného produktu) má spotřebovat 58krát méně energie a být 65krát levnější než na CPU.
Poněvadž některé vědecké výpočty spoléhají na přesnější 64bitová desetinná čísla (FP64), Blackwell zde zapracoval a nabídne tu o 30 % vyšší výkon než Hopper. Simulátor obvodů Cadence SpectreX běží na GB200 Grace Blackwell Superchipu (kombinace ARMového CPU Grace a GPU Blackwell) 13krát rychleji než CPU.
Velkou výhodou má být i rychlejší práce s AI ve vědeckém nasazení. Zde umožňuje lépe aplikovat algoritmy AI na zpracovávání dat, které mohou přinášet možnost další možnost, jak nalézat nová vědecká poznání (AI občas vidí v datech netušené věci, což je sice někdy na škodu, když začne vyhazovat zjevné nesmysly, ale někdy také k užitku, když v datech najde souvislosti, které tam dosud nikdy nikdo neviděl). Rack GB200 NVL72 se 72 GPU a 30 TB paměti pak umožní běh LLM i s 1,8 bilionem parametrů. Nvidia také pracuje na platformě CUDA-Q, která kombinuje CPU, GPU a QPU (kvantové počítače) dohromady. Toto např. využívá společnost BASF v chemickém vývoji.
Zdroj: blogs.nvidia.com