AI poprvé porazila mistra ve hře Go
28.1.2016, Jan Vítek, aktualita
Inženýři z programu Google DeepMind vytvořili umělou inteligenci, která dokázala vůbec poprvé porazit mistra ve hře Go v rovném souboji. Zatím tedy ještě neporazila světového šampiona, zatím "pouze" evropského.
Novou umělou inteligenci tedy mají na svědomí inženýři z programu DeepMind, který byl založen v Londýně v roce 2010 jako společnost, již v roce 2014 akvizoval Google. AI porazila konkrétně evropského šampiona, jímž je Fan Hui z Francie, ovšem původem je pochopitelně z Číny. Stalo se tak tedy již minulý rok v říjnu, ovšem výsledky byly zveřejněny v časopisu Nature až nyní.
Využita byla kombinace heuristického algoritmu Monte-Carlo tree search a hlubokých neurálních sítí označená jako AlphaGo, která se nějakou dobu pod dohledem cvičila ve hře Go s využitím záznamů o průběhu her lidských mistrů. AI se učila také díky vlastním zkušenostem z hraní Go sama proti sobě, aby se připravila na zápas s Fan Hui. V DeepMind se tedy na něj důkladně připravili a to i proto, že hra Go byla vždy jednou z největších výzev pro umělou inteligenci, která i po desetiletích vývoje stačila pouze na amatérské hráče. AlphaGo dokázala porazit veškeré ostatní AI specializované na Go v 99 procentech případů a evropského šampiona zdolala se skóre 5:0. Vývojáři AI přitom soudili, že taková věc se podaří až někdy za deset let.
Go je původem čínská hra, jež vznikla již někdy před 2500 lety. Pro AI jde o výzvu především kvůli své celkové složitosti a množství potenciálních tahů, jež je daleko větší než třeba u šachů, kde počítač porazil světového šampiona již před lety. Jde o souboj IBM Deep Blue a Garryho Kasparova z roku 1997. V takovém případě se mohla využít "hrubá síla", čili zvážení všech možných tahů a výběr toho nejlepšího, což ale v Go není dost dobře možné. AlphaGo tak nejdříve zkusí minimalizovat počet možných tahů pomocí tzv. Policy network a výsledek předá Value network, která nakonec vybere ten nejlepší s ohledem na další možný vývoj. Umělá inteligence tak přemýšlí podobně jako lidský hráč.
Využita byla kombinace heuristického algoritmu Monte-Carlo tree search a hlubokých neurálních sítí označená jako AlphaGo, která se nějakou dobu pod dohledem cvičila ve hře Go s využitím záznamů o průběhu her lidských mistrů. AI se učila také díky vlastním zkušenostem z hraní Go sama proti sobě, aby se připravila na zápas s Fan Hui. V DeepMind se tedy na něj důkladně připravili a to i proto, že hra Go byla vždy jednou z největších výzev pro umělou inteligenci, která i po desetiletích vývoje stačila pouze na amatérské hráče. AlphaGo dokázala porazit veškeré ostatní AI specializované na Go v 99 procentech případů a evropského šampiona zdolala se skóre 5:0. Vývojáři AI přitom soudili, že taková věc se podaří až někdy za deset let.
Go je původem čínská hra, jež vznikla již někdy před 2500 lety. Pro AI jde o výzvu především kvůli své celkové složitosti a množství potenciálních tahů, jež je daleko větší než třeba u šachů, kde počítač porazil světového šampiona již před lety. Jde o souboj IBM Deep Blue a Garryho Kasparova z roku 1997. V takovém případě se mohla využít "hrubá síla", čili zvážení všech možných tahů a výběr toho nejlepšího, což ale v Go není dost dobře možné. AlphaGo tak nejdříve zkusí minimalizovat počet možných tahů pomocí tzv. Policy network a výsledek předá Value network, která nakonec vybere ten nejlepší s ohledem na další možný vývoj. Umělá inteligence tak přemýšlí podobně jako lidský hráč.
Již v březnu tohoto roku čeká AlphaGo nejtěžší úkol, a sice rovněž pět her s nejlepším hráčem Go v posledním desetiletí, Lee Sedolem. Tento souboj proběhne v korejském Soulu a opět půjde o rovný zápas, v němž umělá inteligence nebude mít žádnou výhodu v podobě handicapu pro lidského hráče, jako tomu bývalo dříve. Uvidíme tedy, zda Alpha Go Sedola porazí, ovšem pokud ne, je v podstatě jisté, že vzhledem k možnosti dalšího vývoje a "tréninku" to bude otázka času. Deep Blue také neporazil Kasparova hned napoprvé.
Zdroj: DeepMind