reklama
Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Software Googlu dokáže slovně popsat obrázky

19.11.2014, Jan Vítek, aktualita
Software Googlu dokáže slovně popsat obrázky
Říká se, že obrázek vydá za tisíc slov. Google to ale otočil a říká, že někdy jsou to slova, která jsou nejužitečnější. Představuje tak software, který dokáže automaticky slovně popsat obrázky a fotografie.
Výzkumníci firmy Google na tomto softwaru pracují se Stanford University a společně jej představili jako nástroj, který je schopen slovně popsat a označit fotografie s mnohem větší přesností než dosavadní software. Ten je prý schopen rozpoznat pouze jednotlivé objekty, ale nedokáže popsat celou scénu. To mají dokázat algoritmy vyvinuté týmem pracovníků Googlu a Stanfordu, přičemž zpráva mluví o téměř lidské úrovni porozumění. Výsledný text tak může být například "skupina mladých lidí hrajících frisbee" nebo "žlutý školní autobus zaparkovaný na parkovišti". Tento druhý příklad, jak je vidět z následujícího obrázku, je však zrovna nepřesný a nepřesnosti jsou i v dalších popisech.






Popisky bez chyb
Popisky s mírnými chybami
Alespoň trochu se vztahují k obrázku
Nepřesné
Osoba řídící motocykl na nezpevněné cestě
Dva psi si hrají v trávě
Skateboardista dělá trik na rampě
Pes ve skoku chytající frisbee
Skupina mladých lidí hrajících frisbee
Dva hokejisté bojují o puk
Malá holka v růžové čepici fouká bubliny
Lednička plná spousty jídla a pití
Stádo slonů jdoucí přes suchou trávu
Blízký záběr na kočku ležící na gauči *
Červený motocykl zaparkovaný u kraje cesty
Žlutý školní autobus zaparkovaný na parkovišti
*/ mělo by být lying, ne laying


Software tedy ještě zdaleka není bezchybný a je otázkou, zda vůbec někdy bude. Nicméně i v této podobě by se mohl využít k přesnějšímu vyhledávání obrázků pomocí zadaného textu. Případně by tento software mohl pomoci nevidomým lidem, nahradit obrázky pro případ, že nemáme k dispozici dostatečně rychlé internetové připojení.





Softwarový systém je založený na dvou neuronových sítí umělé inteligence. Jedna se zabývá vlastním zkoumáním obsahu obrázků a druhá má pak na starosti generování textu, aby dával smysl ve větě či výrazu. Software se může sám učit, čímž se zlepšují jeho schopnosti a výsledná přesnost popisu. Ta má být dle tvůrců v současné době dvakrát vyšší než u jakéhokoliv jiného softwaru.

Více se dozvíte v této práci.

Zdroj: Hexus.net
reklama