AMD Instinct MI250X: vícečipové GPU se 48 TFLOPS v FP64
25.10.2021, Jan Vítek, aktualita
Od známého leakera ExecutableFix se dozvídáme detaily o grafických akcelerátorech AMD řady MI200. Jedná se konkrétně o dvě verze, a sice MI250 a MI250X a blíže představena byla konkrétně MI250X.
AMD Instinct MI250X je tak karta, která se skrývá za dobře známým kódovým označením Aldebaran a je zřejmé, že právě ona by měla tvořit páteřní výkon nové generace superpočítačů založených na hardwaru AMD. Jde především o letošní Frontier, který bude dle oficiálních informací postaven i z karet Instinct, ovšem jakýchsi "speciálních verzí s HBM". V nasazení pamětí HBM to ovšem pochopitelně nespočívá, neboť ty budou v generaci Aldebaran využity tak jako tak. Systém El Capitan již má být dokončen na začátku roku 2023, čili v jeho případě by už AMD mohlo teoreticky nabídnout něco novějšího, ale to se teprve ukáže.
AMD Instinct MI100
Dle ExecutableFix už lze mluvit o dvou konkrétních verzích MI200, čili MI250X a MI250, zřejmě silnější a slabší kartě generace Aldebaran. Právě Instinct MI250X má nabídnout celkem 110 CU ve dvou samostatných 7nm čipech na 1,7 GHz (turbo) a dále 128 GB paměti HBM2e, přičemž TDP dosáhne 250 W.
To jsou vcelku uvěřitelné specifikace nového serverového akcelerátoru, který má právě ve verzi MI250X nabídnout 383 TFLOPS v FP16/BF16 a vedle toho dokonce 47,9 TFLOPS v double precision (FP64). MI250 má být rovněž dvoučipové GPU, ovšem s osekaným počtem jednotek CU. Budou to ale zřejmě výrazně odlišné CU, neboť dnešní MI100 jich má celkem 120 a mnohem výkonnější Aldebaran tedy 110 ve dvou čipech.
Výkon si můžeme zasadit do kontextu dnešní nabídky, kde figuruje od NVIDIE aktuální Ampere s dosud nejvýkonnějším akcelerátorem A100 80GB. Ten v FP64 dosahuje výkonu "jen" 9,7 TFLOPS a v FP16 pak 78 TFLOPS, i když v FP16 Tensor je to 312 TFLOPS. Ale především je A100 už rok a půl starý čip, který by NVIDIA mohla už někdy na jaře nahradit novější generací (NVIDIA H100?).
V případě AMD je to výše zobrazený akcelerátor MI100 starý téměř rok a založený na první generaci CDNA. Ten nabízí v FP16 výkon 185 TFLOPS a 11,5 TFLOPS v FP64, čili je vidět, že MI250X by měl oproti starším akcelerátorům dosáhnout v FP64 více než dvojnásobného výkonu na jeden čip, což se bude obzvlášť hodit právě pro jeho nasazení v nových superpočítačích.
V nejbližší době se ale ukáže také zbrusu nová konkurence, a sice Intel Xe-HPC, neboli známé Ponte Vecchio, které jsou chystány i pro opožděný superpočítač Aurora, poslední ze tří známých systémů s výkonem dostávajícím se už do řádu ExaFLOPS.