Na nový výpočetní hardware Intelu jsme si museli trochu počkat, ale konečně je tedy. To, co bylo dosud známo jako procesory Sapphire Rapids a jako GPU Ponte Vecchio, nyní přichází s oficiálními názvy Xeon CPU Max Series a Max Series GPU. A rozhodně nejde o žádná ořezávátka. Velmi zajímavě vypadají nové serverové procesory Xeon Max Series, které mohou mít až 56 výkonných jader P-Core. Ta jsou rozdělena do 4 dlaždic, které jsou navzájem spojené. Spotřeba může činit až 350 W, máme zde 20 zabudovaných jednotek Intel Accelerator Engine a podporuje i CXL 1.1 (Compute Express Link).

To ale zdaleka není to nejpůsobivější. Procesory jsou totiž vybaveny obří pamětí HBM2e s kapacitou 64 GB, tedy více než 1 GB této paměti na jádro, rychlost dosahuje 1 TB/s a jde tak o jediný procesor x86 s pamětmi HBM. To je tak velké množství, že to umožňuje úplně vynechat klasické paměti RAM (v tomto případě DDR5) a provozovat procesor v režimu HBM Only. Navíc to nepotřebuje ani žádnou změnu v kódu. HBM Flat Mode můžete použít v případě, že je potřeba více než 64 GB paměti, nicméně pro optimální výkon to bude chtít zásahy do kódu. HBM Caching Mode pak z HBM paměti udělá další paměť cache a umožní jak větší prostor než 64 GB, tak i nepotřebuje změny v kódu. Procesor může mít až 112,5 MB LLC paměti a najdeme tu 8kanálový řadič pamětí DDR5-4800 pro až 16 paměťových modulů na socket.

Dále tu máme Intel Max Series, což jsou výpočetní GPU postavená na architektuře Xe-HPC. Ta je blízká herní variantě Xe-HPG, nicméně tu máme několik vylepšení důležitých právě pro výpočty. Dostalo se tak na 8 řadičů pro paměti HBM2e a 16 Xe Links.

Výpočetní výkon závisí na konfiguraci. Základem bude varianta Max Series 1100 (1-Stack) s 56 Xe jádry a 48 GB paměti, přičemž by měla dosahovat 300W spotřeby ve formě karty PCIe. Dále tu bude OAM modul Max Series 1350 typu 2-Stack a celkem 112 Xe jádry, paměť stoupne na 96 GB a spotřeba na 450 W. Jako poslední tu máme OAM modul Max Series 1550 s plným počtem 128 Xe jader, 128 GB paměti HBM2e a spotřeba se dostane až na 600 W.

V případě 2-Stack varianty tu registry nabídnou velmi vysokou rychlost 419 TB/s a mají kapacitu 64 MB. Stejnou kapacitu má i L1 cache, jejíž rychlost je čtvrtinová a činí 105 TB/s. 6krát větší kapacitu má L2 cache, a to 408 MB, rychlost pak klesá na stále excelentních 13 TB/s. Nakonec je tu ještě ona 128GB paměť HBM2e s rychlostí 3,2 TB/s. Tento nejvýkonnější model nabídne výpočetní výkon 52 TFLOPS nejen v FP32, ale i v FP64.

Zdroj: hothardware.com, networkworld.com