Arm od NVIDIE vytvoří barcelonský superpočítač za 150 milionů eur
20.6.2022, Jan Vítek, aktualita
V poslední době jsme se věnovali především společnosti AMD a superpočítačům vytvořeným z jejího hardwaru, přičemž v dohledné době by si měl svou pozornost vyžádat také Intel. Ale co NVIDIA?
Superpočítače založené na hardwaru firmy NVIDIA se pomalu dostávají do pozadí žebříčku TOP500, kde stálež figurují v případě první desítky u čtyř systémů: Summit, Sierra, Perlmutter a Selene, ovšem ty jsou postupně odsouvány z předních míst novějšími modely Frontier, Fugaku a LUMI. Právě Fugaku je ale založen na procesorech architektury Arm a tu má využít i chystaný superpočítač s hardwarem od NVIDIE, který je chystán pro Barcelonu.
Jde tu pochopitelně o čipy NVIDIA Grace, které známe už dávno, ale jejich vývoj ještě trvá. Nasazeny budou v systému MareNostrum 5, což je jeden ze superpočítačových projektů spadajících do EuroHPC JU a daný systém bude nainstalován v Barcelona Supercomputing Centre (BSC). Fungovat by měl začít už během příštího roku.
MareNostrum 5 nebude žádné ořezávátko, neboť nabídne výkon 314 petaFLOPS v FP64, čímž spolehlivě předčí i nový finský LUMI a v aktuálním žebříčku TOP500 by se zařadil na třetí místo mezi Fugaku a LUMI. Výkon mimochodem zajistí společně CPU a GPU akcelerátory.
Dále se dozvídáme o 200 petabajtech úložného prostoru pro horká data, čili tu půjde o výkonné paměti typu NAND Flash, přičemž dvojnásobných 400 petabajtů bude určeno pro data, která zrovna nemusí být rychle přístupná. Pro jejich uložení tak postačí klasické pevné disky.
MareNostrum 5 využije konkrétně 144jádrové Grace superchip, čili dva 72jádrové procesory na stejném modulu, které pak budou napojeny na GPU akcelerátory H100 generace Hopper s 80 GB vlastní HBM3 s propustností 3,2 TB/s. A že jde o NVIDII, dozvídáme se také o výkonu v AI, kde jde už o 18 exaFLOPS, což se ovšem obvykle týká jen FP8 (8bit v plovoucí řádové čárce). S takovým výkonem ale půjde o nejvýkonnější AI superpočítač v Evropě.
The Next Platform spekuluje, že na základě uvedeného výkonu by systém MareNostrum 5 mohl obsahovat cca 4500 akcelerátorů H100 pro cca 270 petaFLOPS a zbylých 44 petaFLOPS mohou dodat superčipy Grace v počtu 5730. Bezpečně ale víme to, že se tu uplatní také jednotky BlueField data processing units (DPU), které zajistí komunikaci jednotlivých uzlů s co nejnižší latencí a v propustností 400 GB/s.
MareNostrum 5 se využije pro obvyklé věci: modelování klimatu, medicínu, AI, atp. Napájen bude kompletně z obnovitelných zdrojů a vzniklé teplo bude využito pro další účely.