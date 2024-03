Gaudi 2, u kterého se snaží vyzdvihnout některé jeho světlé stránky. Např. Stability.AI nedávno

Přestože Nvidia je firmou, která nyní drží drtivý tržní podíl v oblasti hardwaru pro trénování a běh systémů umělé inteligence, AMD i Intel se snaží konkurovat a přinášet novinky. V případě Intelu tu máme už trochu postarší akcelerátor, u kterého se snaží vyzdvihnout některé jeho světlé stránky. Např. Stability.AI nedávno publikovala testy , kde bylo Guadi 2 v trénování její AI o více než 50 % rychlejší než H100-80GB a dokonce 3krát rychlejší než A100-80GB. Také mluví o větší efektivitě, což platí např. při inferenci modelu BloomZ 176B. Tam má sice Nvidia H100 větší propustnost 39,21 tokenů za sekundu proti 35,05 u Intelu, jenže zatímco Nvidia na to potřebuje 3912 W, Intel si vystačí s 1958 W. Má tak o 50 % nižší spotřebu a o 79 % vyšší propustnost na watt.

Tohle je ale současnost. Co však přinese budoucnost? Blízká budoucnost by měla přinést novou generaci akcelerátoru Gaudi 3, který by ze 7nm procesu měl přejít na 5nm výrobu. Výpočetní výkon má vzrůst na 4násobek, síťová propustnost vzroste na 2násobek a propustnost pamětí HBM má jít nahoru o 50 %. Vzhledem k tomu, že v dubnu se má konat nějaké představení v souvislosti s řadou Gaudi, dá se předpokládat, že by mohlo jít o uvedení právě tohoto akcelerátoru.

V roce 2025 Intel plánuje představení architektury Falcon Shores, což má být první architektura GPU cíleně vyvíjená jen pro nasazení v AI. Současně také Intel připravil velmi jednoduchý postup pro migraci mezi jednotlivými architekturami. Systémy jako Hugging Face, Mosiac ML, PyTorch by mělo být možné převést z Nvidie na Gaudi a z Gaudi na Falcon Shores jen pomocí 3-5 řádků zdrojového kódu v Pythonu. Intel dále hovoří o tom, že připravuje nové varianty akcelerátorů řady Gaudi 2 tak, aby vyhověly americkým regulacím a mohly se nadále vyvážet do Číny. Jak je vidět, americký ban není zrovna z nejstriktnějších a Čínu ve vývoji systémů AI asi až tak extrémně nezpomalí.