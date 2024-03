generativní AI se ve většině případů děje na výpočetních kartách společnosti Nvidia, která zde má zastoupení hodně přes 90 %. Přesto jsou zde další společnosti, které vyvíjí své akcelerátory, jako je např. AMD se svými kartami Instinct nebo Intel s kartami Stable Diffusion 3 se rozhodli postavit proti sobě akcelerátory Nvidie, a to konkrétně A100-80GB a H100-80GB, a Intelu. V tomto případě šlo o model Gaudi 2 s 96 GB paměti HBM2E. Výsledkem je, že pro trénink této umělé inteligence mohou být lepší karty Intelu a nikoli Nvidie.

Využili variantu modelu se 2 miliardami parametrů a optimalizaci xFormers pro Nvidii a FusedSDPA pro Intel. Bylo otestováno 16 akcelerátorů a velikost dávky činila 16 na akcelerátor (celkem tedy 256). Zatímco A100 byla schopna zpracovat 381 obrázků za sekundu, H200 se už dostala na 595 obrázků. Intel však se svými 927 obrázky překonal H200 o 56 %. Díky větší paměti se ale na něj vešla i větší 32kusová dávka, což zvýšilo výkon dokonce na 1254 obr./s. To je o 111 % více než na Nvidii H100 a více než 3násobek toho, co zvládla Nvidia A100.

Testy inference (tedy běhu) AI na Stable Diffusion s 8 miliardami parametrů už ale byly pro Intel o něco horší. Ten zvládl vygenerovat obrázek o rozlišení 1024×1024 pixelů ve 30 krocích za 3,2 sekundy. Nvidia A100 (tedy slabší karta z oněch dvou Nvidií) na to sice potřebovala trochu delších 3,6 sekundy, nicméně přes TensorRT to už zvládla za 2,7 sekundy. Dá se předpokládat, že Nvidia H100 by to zvládla mnohem rychleji a Intel by překonala i v základním nastavení.