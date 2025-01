Společnost DeepSeek je na poli umělé inteligence docela nováčkem. Byla založena v roce 2023 dnes již 40letým podnikatelem Liangem Wenfengem. Od té doby vydala už několik LLM, přičemž o firmě se začalo trochu více mluvit s uvedením modelu DeepSeek-V3. To pravé ale přišlo před několika dny s novým modelem DeepSeek-R1. Zdá se, že ten by mohl být doslova revolucí na tomto poli. Je totiž o řády levnější na trénování než ostatní modely, je levnější také na běh, je navíc i open-source. Tímto opravdu s vervou zaútočil především na americké firmy, jako je např. Nvidia.



Zatímco Meta, OpenAI a jiní trénují své modely za desítky, stovky, někdy i miliardy USD, DeepSeek mluví o částce pouhých 5,6 milionu USD (nakolik je to pravda, toť otázkou). Přitom když se zkoušely jeho výkony, tak je na úrovni nejlepších modelů výše zmíněných společností, výborný je prý především v matematice a logickém uvažování. Problémy řeší postupně krok za krokem a především velmi efektivně. Má nižší nároky nejen na trénování, ale i na běh. Nevyžaduje tedy tak silný hardware, což je dýkou do zad zejména Nvidii a USA, které si od banů na export výkonného hardwaru do Číny slibovalo, že udrží Čínu technologicky pozadu. Jak se zdá, v Číně už nebudou tak moc potřebovat ani tu zamčenou RTX 5090D , kterou jim Nvidia připravila dle stanovených restrikcí nebo jiné ořezané výpočetní karty (ta má stejně zásadní problém v nemožnosti chodu v multi-GPU konfiguraci). Výkonný HW se pochopitelně hodí vždy, každopádně Číňanům se povedlo několik velmi zajímavých optimalizací, aby tuto závislost významně omezili.

Jedním z kroků je optimalizace na slabší hardware (pokud třeba Nvidii H800 můžeme považovat za "slabší"). Zaměřili se na co nejlepší optimalizaci využití paměti, aby se neprojevil problém s omezenou datovou propustností, kterou výpočetní karty mají kvůli restrikcím. Další zajímavostí je, že se trénují jen důležité části. Dokázali tak zajistit to, že se trénování provádí jen ve specifické části modelu a ne v celém (kde stejně nedochází k výraznějším změnám). Výsledkem dle DeepSeeku je, že trénování se týká jen cca 5 % modelu, tedy jeho nejpatřičnější části, což o 95 % snižuje zatížení GPU. Trénování tak zabere zlomek času a prostředků, přitom to nemá mít výraznější dopad na přesnost. Zapracovalo se také na kompresi v oblasti klíčů a k nim příslušejících hodnot, což dále snížilo paměťové požadavky, zvyšuje to rychlost inference a umožňuje to svižnější běh i na slabším hardwaru.

Není divu, že se s novým modelem zdá, že vůbec není potřeba až tak moc extrémně výkonného hardwaru. Hodně na to doplatila Nvidia, jejíž nové akcelerátory nyní vypadají jako nepříliš potřebné. Hodnota akcií tak ke včerejšímu večeru spadla o výrazných 17 %. AMD až tak závislé na AI není, takže to spadlo "jen" o 6 %, a Intel, kterému se v rámci AI vůbec nepovedlo prosadit, z toho nyní "profituje". Poněvadž na AI není příliš závislý, hodnota akcií se pohyboval jen o 2-3 % níže. Aplikace DeepSeek se už stala nejstahovanější mobilní aplikací v kategorii produktivity na Apple App Store.