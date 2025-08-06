OpenAI uvolnilo open-weight modely GPT-OSS ve verzích 20B i 120B
Včera, Milan Šurkala, aktualita
Po několika letech jsme se od OpenAI dočkali nových open-weight modelů. Ty si každý může stáhnout, použít i komerčně, přičemž lze vidět i více dovnitř modelu.
Posledním open-weight modelem od OpenAI byl GPT-2 z roku 2019. Open-weight znamená, že jsou veřejně dostupné natrénované váhy (weights) modelu, umožňuje to tak si model stáhnout, analyzovat, vylepšovat, stavět na něm vlastní systémy. Není to ale open-source, a tak např. není přístup k samotnému trénovacímu algoritmu nebo trénovacím datům, na jejichž základě tyto váhy vznikly. Nyní společnost OpenAI zveřejnila dva nové modely GPT-OSS, a to gpt-oss-20b a gpt-oss-120b. Oba dva jsou dostupné pod licencí Apache 2.0 a dovolují tak vytváření výzkumných, ale i komerčních projektů. Navrženy jsou také pro agentovou práci (jako AI agenti), podporují zobrazení "přemýšlení", vyhledávání na webu i vykonávání kódu v Pythonu. Můžete také nastavit úroveň uvažování.
gpt-oss is out!— Sam Altman (@sama) August 5, 2025
we made an open model that performs at the level of o4-mini and runs on a high-end laptop (WTF!!)
(and a smaller one that runs on a phone).
super proud of the team; big triumph of technology.
Varianta gpt-oss-120b je určena pro náročnější nasazení, má už dle svého názvu zhruba 120 miliard parametrů. Konkrétně je to 117 miliard a 5,1 mld. je aktivních. Na běh tohoto modelu potřebujete výkonný AI hardware, doma to tedy většina z nás nespustí, chce to jednu kartu Nvidia H100 (resp. alespoň nějakých 60 GB RAM/VRAM). A to není běžný domácí hardware. Naproti tomu gpt-oss-20b má 21 miliard parametrů (3,6 mld. aktivních) a pro tento už potřebujete 16 GB paměti. A to už se najde na leckterém herním GPU a umožní běh lokálně na lepším herním PC nebo pracovním PC s lepším GPU. Podle Sama Altmana má výkon o4-mini a může běžet i na high-endovém laptopu (to ale vztahoval k většímu modelu, zatímco menší model prý běží na telefonu, čemuž se ale příčí informace o náročnosti ze samotných stránek s modely). Modely využívají nativní kvantizaci MXFP4 a 128K kontextové okno. Kdo chce, může si je vyzkoušet přes webové rozhraní na adrese gpt-oss.com. Ke stažení jsou pak např. na Hugging Face, stránku mají i na Githubu.
Zdroj: wccftech.com, techradar.com, openai.com, obrázek (ChatGPT)