EU chystá 400 PFLOPS heterogenní systém s hardwarem AMD, ARM a Maxeler
8.9.2021, Jan Vítek, aktualita
Evropská unie prostřednictvím své iniciativy EU Horizon 2020 hodlá nechat na Evropské půdě postavit superpočítač, který se má vyrovnat dnes nejvýkonnějšímu systému světa, japonskému Fugaku.
Jedná se to konkrétně o projekt spadající do EuroExa, na nějž hodlá Evropská unie poskytnout grant ve výši 20 milionů eur prostřednictvím iniciativy EU Horizon 2020. Výsledkem má být superpočítač s výkonem cca 400 PetaFLOPS připravovaný pro roky 2022 či 2023, který by měl značně vylepšit postavení Evropy v žebříčku TOP 500. Tam dnes ostatně figuruje jako nejvýkonnější systém japonský Fugaku, který nabízí (Rmax) 442 PetaFLOPS, čili nový evropský systém by měl být přinejmenším srovnatelný. Na druhou stranu pozdě v příštím roce či dokonce v roce 2023 už mají na světě fungovat první superpočítače s výkonem už v řádu ExaFLOPS. Dobře víme o třech: Aurora (Intel), El Capitan a Frontier (oba AMD) s výkonem mezi 1 a 2 ExaFLOPS.
V červnu tohoto roku patřilo EU už jen 92 z 500 nejvýkonnějších systémů světa, neboť 11 bylo "ztraceno" kvůli Brexitu. Aktuálně nejvýkonnějším systémem v EU je německý JUWELS Booster Module s procesory AMD EPYC 2. generace a NVIDIA A100, který má výkon 44 PetaFLOPS.
Plánovaný evropský superpočítač má být založený na hardwaru firem AMD EPYC, ARM Cortex a využije také FPGA firmy Maxeler, přičemž při zmíněném výkonu 400 PetaFLOPS má mít spotřebu až kolem 30 MW. Zabírat má přibližně čtvercovou plochu o hraně 40 metrů.
Více o konkrétním hardwaru, který by měl být pro stavbu nového systému použit, bohužel nevíme. Je ale zřejmé, že půjde o heterogenní systém založený na procesorech x86 i ARM, přičemž v tomto případě nebyly zmíněny žádné GPU akcelerátory.
Víme ovšem o tom, že procesory AMD EPYC budou tvořit výkonnostní páteř celého systému, přičemž procesory ARM Cortex budou využity pro kompresi dat, aby mohl celý systém dosáhnout v praxi vyšší propustnosti. A konečně FPGA od Maxeleru budou celý tok dat řídit, čili to vypadá, že pro dosažení cílového výkonu bude zapotřebí opravdu velký počet procesorů EPYC, na nichž ten bude v podstatě celý záviset.
Grant EU ve výši 20 milionů eur pochopitelně nebude stačit na postavení celého systému, navíc když jeho část půjde i na vývoj nového systému ponorného chlazení. Čili výpočetní uzly zde budou ponořeny do jisté elektricky nevodivé kapaliny, jež pak bude sama v oběhu chlazena ve vedlejším systému pro odvod tepla.
Krom toho se tu počítá také s vývojem jisté architektury pro globálně sdílenou paměť, a sice UNIMEM. Rovněž systém pro distribuci a přenos obrovských objemů dat, který bude záviset na výkonu FPGA Maxeler, je třeba teprve vyvinout a k tomu všemu poslouží desky Co-design Recommended Daughter Board (CRDB), jež budou obsahovat všechen hlavní hardware, čili CPU EPYC/Cortex i FPGA. Právě na CRDB bude založen konečný hardware, jenž bude škálovat v počtu 16 desek v blade jednotce Open Compute Unit (1OU).
Zdroj: THW