Grace Superchip je dle NVIDIE o polovinu rychlejší než dva AMD Rome
23.3.2022, Jan Vítek, aktualita
NVIDIA včera vedle generace Hopper blíže představila také procesory Grace, které už dle svého názvu tvoří pro nové GPU akcelerátory ideální společníky. Co jsme se dozvěděli o jejich vlastnostech a výkonu?
Grace Hopper je jméno americké počítačové vědkyně a kontraadmirálky v United States Navy, čili už dle toho je zřejmé, že procesory Grace a akcelerátory Hopper patří k sobě. Procesory Grace přitom známe už z minulého roku, ovšem ty se na trh přesto ještě nechystají. Nastoupit mají až někdy za rok, čili v první polovině 2023, ale to bylo zmíněno už v minulém roce.
Grace Superchip - CPU + CPU
Pokud tak NVIDIA uvádí, že Grace jsou v benchmarku SPECrate_2017_int_base o polovinu rychlejší než EPYC generace Rome, může být AMD ještě relativně v klidu, neboť Rome jsou už postarší Zen 2, zatímco dnes jsou aktuální Zen 3 Milan či rovnou Milan-X obohacené o paměť V-Cache a až Grace dorazí na trh, budou tu 5nm Zen 4. A to pochopitelně nehledě na fakt, že jde o odlišné architektury, a sice ARM (v9) na straně NVIDIE a x86 na straně AMD, která je ve světě serverů díky Intelu mnohem lépe ukotvená.
Na obrázku přitom vidíme dva procesory Grace vedle sebe, přičemž ty jsou propojeny pomocí rozhraní NVLink-C2C (chip to chip) a NVIDIA srovnávala jejich spojený výkon s rovněž dvěma procesory EPYC Rome, a sice se 64jádrovými verzemi ve vlastních serverech DGX A100. Jeden Grace má přitom 72 jader, čili uváděných 144 jader má tak právě až výsledný Grace Superchip.
Grace mají jako první využívat ARM v9 s podporou Scalable Vector Extensions (SVE - obdoba AVX), přičemž půjde o 5nm čipy s podporou PCIe Gen 5.0, DDR5, HBM3, CCIX 2.0 a CXL 2.0. Zmíněné rozhraní NVLink-C2C může posloužit i pro propojení dvou Grace má být přitom v porovnání s moderním PCIe 5.0 celkem 25x energeticky efektivnější a má také zabírat 90x menší plochu (nejspíše na čipu), přičemž aktuálně nabízí propustnost 900 GB/s a podporu protokolů CXL či Arm AMBA CHI. Co se týče fyzické implementace, NVLink-C2C lze využít v rámci samotných čipů, případně dvou čipů propojených křemíkovým interposerem, nebo i v rámci PCB, čili o tomto rozhraní můžeme uvažovat jako o obdobě konkurenčního Infinity Fabric.
Grace Superchip má TDP 500 W, což tedy platí dohromady pro obě CPU a dále je tu pozoruhodných 396 MB paměti cache, k čemuž se ale zatím více nedozvíme, takže neznáme rozvržení mezi jednotlivé úrovně a ani to, zda jde o celkovou kapacitu, nebo kapacitu jednoho čipu. Pravděpodobnější je ale ta první možnost.
Grace Hopper Superchip - CPU + GPU
Dále tu máme produkt zvaný Grace Hopper Superchip, čili CPU Grace a GPU Hopper na jedné desce. I zde se použije NVLink-C2C s propustností 900 GB/s, která zajistí, aby oba čipy mohly společně využívat jeden pool paměti LPDDR5X ECC a HBM3. NVIDIA přitom mluví o 600 GB paměti, která se zřejmě bude z většiny skládat právě z LPDDR5X (512 GB?) a zbytek tu bude v podobě HBM3.