Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

xAI uvádí chatbota Grok 3, dle prezentovaných benchmarků má být nejlepším modelem

18.2.2025, Milan Šurkala, aktualita
xAI uvádí chatbota Grok 3, dle prezentovaných benchmarků má být nejlepším modelem
Společnost xAI uvedla novou verzi chatbota Grok 3. Ta měla mít k dispozici 10krát vyšší výpočetní výkon a podle benchmarků překonávat GPT, Gemini i třeba nejnovější DeepSeek. Představí se i předplatné SuperGrok.
Sice se zpožděním, ale i přesto se představuje nová verze chatbota Grok 3 od společnosti xAI Elona Muska. Novinka byla natrénována v obřím datovém centru v Memphisu, které nyní čítá okolo 200 tisíc GPU. Oproti předchozí generaci Grok 2 tak měl k dispozici asi 10krát vyšší výpočetní výkon, což se mělo odrazit i na výkonu samotného modelu. Ten by měl v přesnosti odpovědí překonávat svou typickou konkurenci, jak jsou např. modely GPT-4o, Gemini nebo i nejnovější DeepSeek-v3 a DeepSeek-r1.
 
Podle Muska jde o AI, která nejvíce ze všech hledá pravdu, a to i v případech, kdy by měla být politicky nekorektní. Mnozí ji ale vyčítají, že je přece jen politicky trochu vychýlená, což Musk dal za vinu trénovacím datům. Připustil však, že by se model měl v budoucnu dostat trochu více do středu.
 
Grok-3 benchmarky
 
V testech je vidět, že konkurenci jako Gemini-2 Pro, DeepSeek-v3, Claude 3.5 Sonnet nebo GPT-4o překonává v matematických úlohách nejen Grok-3, ale i rychlejší a méně přesný Grok-3 mini. Podobně i ve vědeckém benchmarku GPQA nad všemi vyčnívá Grok-3, přičemž slabší model Grok-3 mini má stejný výkon jako Gemini a Claude. V případě kódování je Grok-3 o parník před ostatními a o trochu je poráží i mini verze benchmarku. Jako vždy, i zde musíme počítat s tím, že zde může jít o cherry-picking benchmarků tak, aby prezentovaný model vypadal co nejlépe.
 
Grok-3 benchmarky
 
Přístup k nejnovějšímu modelu dostanou nejprve předplatitelé X Premium+ s cenou 50 USD měsíčně. K dispozici bude ale ještě přídavné předplatné SuperGrok za 30 USD měsíčně, které přidává neomezené dotazy s DeepSearch a neomezené generování obrázků. Během následujícího týdne by Grok měl dostat i hlasový mód, kdy chatbot bude disponovat syntetickým hlasem. Další týdny pak přinesou Grok-3 do API k aplikaci. Současně by se měl také uvolnit zdrojový kód předchozího modelu Grok-2 jako open-source. xAI chce takto vždy uvolňovat předchozí model poté, co se plně přejde na nový.