NVIDIA Grace a Hopper vytvoří dva nové superpočítače s až 10 AI exaFLOPS
31.5.2022, Jan Vítek, aktualita
Včera jsme se dozvěděli o tom, že superpočítač Frontier převzal vládu ve světě superpočítačů jako nejvýkonnější systém a asi není náhoda, že nedlouho na to se ozývá NVIDIA se svými Grace a Hopper.
Superpočítač Frontier s hardwarem firmy AMD dosahuje výkonu 1,1 exaFLOPS, zatímco Grace a Hopper od NVIDIE by měly ve výsledných systémech poskytnout dokonce až 10 exaFLOPS. Rozdíl je však v tom, že výkon Frontieru se počítá v double precision, čili v FP64, zatímco pod termínem "AI exaFLOPS" si můžeme představit spíše FP16 (half precision) nebo jen INT8 (popřípadě BFloat16 - Brain Floating Point, Tensor Flop, aj.). AI exaFLOPS tak mají poměrně široký záběr a jde o neurčitý pojem, který NVIDIA ráda využívá, neboť její hardware je v tomto ohledu silný, ale co se týče tradiční disciplíny superpočítačů, čili FP64, začínají mít mezi nejmodernějšími systémy v TOP 500 navrch platformy AMD a Intelu.
Nyní se dozvídáme, že Grace CPU a Grace Hopper Superchips, které ještě nejsou k dispozici, budou v budoucnu využity v novém superpočítači pro Los Alamos National Laboratory amerického Ministerstva energetiky. Půjde o systém Venado založený na platformě HPE Cray EX, který nabídne právě až 10 AI exaFLOPS.
A to je další věc, kterou je třeba okomentovat, neboť označení "Peak AI performance" značí nejspíše maximální teoretický výkon a pokud se budeme bavit v tomto smyslu, pak ani Frontier nemá "jen" 1,1 exaFLOPS v FP64, ale rovnou 1,69 exaFLOPS. Jde tu totiž o zásadní rozdíl mezi hodnotami Rmax a Rpeak, kde ta první značí výkon, jejž bylo skutečně dosaženo a druhá jen teoretický maximální výkon. Mimochodem, Frontier dosáhl reálného výkonu 6,88 HPL-AI exaFLOPS, takže je otázka, zda nakonec nebude silnější než Venado. Na druhou stranu, NVIDIA už v březnu ohlásila také vlastní systém EOS, který s výbavou osmnácti 32-DGX H100 Podů dosáhne výkonu až kolem 18 AI exaFLOPS.
Rovněž na HPE Cray EX pak bude založen další nový systém pro Švýcarské národní výpočetní středisko, kde bude nasazen pro účely vědecké komunity, ale nedozvídáme se ani název a ani očekávaný výkon.
NVIDIA a Los Alamos National Laboratory však neprozrazují moc podrobností ani o systému Venado. Dozvídáme se pouze to, že půjde o směs dvouprocesorových 144jádrových Grace CPU Superchip a kombinace CPU+GPU, čili Grace Hopper Superchip a bezesporu se tu také využije rozhraní NVLink-C2C pro propojení tohoto výkonného hardwaru.
Dle starší aktuality ale i tento hardware může posloužit pro sestavení superpočítače s výkonem cca 1 exaFLOPS v FP64, konkrétně na platformě Atos BullSequana XH3000. Nakonec můžeme připomenout ještě další novinku určenou pro NERSC (National Energy Research Scientific Computing Center) systém Perlmutter s výkonem 3,8 AI exaFLOPS. Výkonné AI superpočítače nám tak v poslední době rostou jak houby po dešti.