Galerie 3
Software Googlu dokáže slovně popsat obrázky
Aktualita Ostatní Google

Software Googlu dokáže slovně popsat obrázky

Jan Vítek

Jan Vítek

3

Říká se, že obrázek vydá za tisíc slov. Google to ale otočil a říká, že někdy jsou to slova, která jsou nejužitečnější. Představuje tak software, který dokáže automaticky slovně popsat obrázky a fotografie.

Reklama

Výzkumníci firmy Google na tomto softwaru pracují se Stanford University a společně jej představili jako nástroj, který je schopen slovně popsat a označit fotografie s mnohem větší přesností než dosavadní software. Ten je prý schopen rozpoznat pouze jednotlivé objekty, ale nedokáže popsat celou scénu. To mají dokázat algoritmy vyvinuté týmem pracovníků Googlu a Stanfordu, přičemž zpráva mluví o téměř lidské úrovni porozumění. Výsledný text tak může být například "skupina mladých lidí hrajících frisbee" nebo "žlutý školní autobus zaparkovaný na parkovišti". Tento druhý příklad, jak je vidět z následujícího obrázku, je však zrovna nepřesný a nepřesnosti jsou i v dalších popisech.

Software Googlu dokáže slovně popsat obrázky
Popisky bez chybPopisky s mírnými chybamiAlespoň trochu se vztahují k obrázkuNepřesné

Osoba řídící motocykl na nezpevněné cestě

Dva psi si hrají v trávě

Skateboardista dělá trik na rampě

Pes ve skoku chytající frisbee

Skupina mladých lidí hrajících frisbee

Dva hokejisté bojují o puk

Malá holka v růžové čepici fouká bubliny

Lednička plná spousty jídla a pití

Stádo slonů jdoucí přes suchou trávu

Blízký záběr na kočku ležící na gauči *

Červený motocykl zaparkovaný u kraje cesty

Žlutý školní autobus zaparkovaný na parkovišti

*/ mělo by být lying, ne laying

Software tedy ještě zdaleka není bezchybný a je otázkou, zda vůbec někdy bude. Nicméně i v této podobě by se mohl využít k přesnějšímu vyhledávání obrázků pomocí zadaného textu. Případně by tento software mohl pomoci nevidomým lidem, nahradit obrázky pro případ, že nemáme k dispozici dostatečně rychlé internetové připojení.

Software Googlu dokáže slovně popsat obrázky

Softwarový systém je založený na dvou neuronových sítí umělé inteligence. Jedna se zabývá vlastním zkoumáním obsahu obrázků a druhá má pak na starosti generování textu, aby dával smysl ve větě či výrazu. Software se může sám učit, čímž se zlepšují jeho schopnosti a výsledná přesnost popisu. Ta má být dle tvůrců v současné době dvakrát vyšší než u jakéhokoliv jiného softwaru.

Více se dozvíte v

této práci

.

Zdroj:

Hexus.net


Reklama
Reklama

Komentáře

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

Reklama
Reklama