O novém akcelerátoru AMD Radeon Instinct MI100 se mluví už nějakou dobu. Nyní se oficiálně představuje. Přináší architekturu CDNA s kódovým označením Arcturus. GPU je vyráběno 7nm procesem FinFET a má celkem 120 CU s celkem 7680 jádry. Díky architektuře CDNA je optimalizováno pro HPC výpočty a nikoli na hraní her. V FP64 (double precision) tak dosahuje excelentní hodnoty 11,5 TFLOPS, v FP32 (single pecision) je to dokonce 23,1 TFLOPS. Pro zajímavost, předchozí MI60 měla tyto hodnoty na 7,4, resp. 14,7 TFLOPS, konkurenční Nvidia Ampere A100 slibuje 9,7, resp. 19,5 TFLOPS.

V případě FP32 Matrix hovoříme o výkonu 46,1 TFLOPS a FP16 Matrix nabídne dokonce 184,6 TFLOPS (předchozí MI60 pouze 29,5 TFLOPS). Karta podporuje také bFloat16 (92,3 TFLOPS) a v Int4 i Int8 nabízí shodně 184,6 TOPS. Jádra nového GPU běží na frekvenci 1502 MHz. Najdeme tu 32 GB HBM2 paměti, která má takt 1,2 GHz a využívá 4096bitovou sběrnici. Paměťová propustnost tak dosahuje vynikající hodnoty 1,23 TB/s.
Akcelerátory MI100 lze kombinovat a vytvářet bloky čtyř karet. Takové bloky mohou být dva, což vytvoří shluk osmi karet. Karty mohou přes Infinity Fabric X16 vzájemně komunikovat s rychlostí 276 GB/s (3 linky po 92 GB/s v peer-to-peer konfiguraci), a pokud se započítá i sběrnice PCIe 4.0 x16 (64 GB/s), dosahuje agregovaná P2P propustnost 340 GB/s. V serverech pak díky duálnímu propojení mohou bloky čtveřic karet dosahovat až 1,1 TB/s. Samotné karty podporují již zmíněnou sběrnici PCIe 4.0 x16, takže komunikace CPU a GPU může dosáhnout rychlosti 64 GB/s.

Zajímavostí je, že přestože je spotřeba karty 300 W, chladič je pasivní (o proud vzduchu se tak musí postarat ventilátory samotného serveru). Délka karty je 267 mm a napájí se PCIe slotem i pomocí dvou 8pinových konektorů. První kusy karet se dostanou na trh před koncem roku v systémech společností HPE, Dell, Supermicro a Gigabyte (spolu s procesory AMD EPYC).