reklama
Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Superpočítač Perlmutter nabídne 4 exaFLOPS v AI, brzy bude druhý v TOP 500

28.5.2021, Jan Vítek, aktualita
Superpočítač Perlmutter nabídne 4 exaFLOPS v AI, brzy bude druhý v TOP 500
NVIDIA se může pochlubit svým prvním superpočítačovým systémem, který bude založen na jejím hardwaru a nabídne výkon už v řádu exaFLOPS. Jenomže zde nejde o obvyklé FP64, ale výkon pro AI. Jak se bude Perlmutter vyvíjet? 
Superpočítač pro Berkeley Lab v rámci National Energy Research Scientific Computing Center (NERSC) tak ve skutečnosti nepatří do éry počítačů s výkonem v řádu exa, ale ani tak to nebude zrovna střízlík, neboť v FP64 nabídne výkon kolem 180 PetaFLOPS. To z něj v případě aktuálního žebříčku učiní druhý nejvýkonnější systém světa hned za japonským Fugaku, ovšem nebude dlouho trvat a začnou být zprovozňovány první superpočítače, které už skutečně nabídnout výkon v řádu exa. Prvním by měl být Frontier založený na hardwaru AMD, který dosáhne 1,5 exaFLOPS. 
 
 
Perlmutter dosáhne výkonu 4 exaFLOPS, pokud jde o "AI performance", čili to v žádném případě není FP64, ale spíše výkon jader Tensor. Ostatně tento systém bude založen jednak na procesorech AMD EPYC 7763 se 64 jádry Zen 3 a pak na akcelerátorech NVIDIA A100 generace Ampere. 
 
 
O tomto superpočítači již víme už dokonce od roku 2018, kdy byl odhalen ještě jako systém s procesory EPYC "Milan" a GPU NVIDIA "Volta-Next". Nyní se dozvídáme podrobnosti o jeho výkonu a jednotlivých fázích stavby. 
 
 
Jak ukazuje tabulka, zmíněné (necelé) 4 exaFLOPS se týkají výkonu tensorových jader a v klasických FP64 bude mnohem nižší. Uvedená tabulka se ovšem týká pouze první fáze stavby. 
 
 
Perlmutter je založen na architektuře HPE Cray Shasta a v první fázi využívá v 12 skříních celkem 1536 výpočetních uzlů, kde každý je založen na jednom AMD EPYC 7763 s 256 GB systémové paměti DDR4 a na čtyřech NVIDIA A100, každý se 40 GB paměti. Tato GPU jsou propojena rozhraním NVLink. Systém také využívá úložiště s kapacitou 35 PB a propustností až 5 TB/s. 
 
První fáze Perlmutteru nabídne 60 petaFLOPS v FP64 a 3,823 FP16 exaFLOPS díky akcelerátorům A100. Tento hardware už byl sestaven a právě nyní probíhá jeho zprovoznění. Později ještě v tomto roce přijde druhá fáze, v níž bude přidáno dalších 3072 uzlů, které ale tentokrát budou založeny už jen na procesorech AMD EPYC 7763 využívajících 512 GB paměti. Čili právě díky nim se výkon v FP64 zvedne o dalších 120 petaFLOPS na zmíněných celkových 180. Fugaku tak se svými 442 petaFLOPS zůstane na prvním místě žebříčku TOP500 neohrožen, ale i jeho dny jsou již sečteny.  


reklama