reklama
Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Google GNMT: překladový systém slibuje téměř "lidskou kvalitu"

28.9.2016, Jan Vítek, aktualita
Google GNMT: překladový systém slibuje téměř "lidskou kvalitu"
Společnost Google pro svou službu Translate připravila nový překladový systém GNMT, o němž říká, že výrazně sníží počet chyb. Google dokonce uvádí, že se úroveň překladu systému GNMT blíží tomu, čeho jsou schopni lidé.
Chtělo by se dodat, že právě lidé jsou schopni při překladech v podstatě čehokoliv, ale nejdříve se podívejme na to, co nám systém Google Neural Machine Translation (GNMT) nabídne. Služba Google Translate mimochodem letos oslavila 10 let, kdy ji firma odstartovala s využitím Phrase Based Machine Translation (PBMT), který byl ve své době nejlepší možná věc pro strojové překlady. Ovšem od té doby se toho stalo mnoho ve světě umělé inteligence a hlubokých neuronových sítí. Google sám poté začal využívat NMT (Neural Machine Translation) a poté Recurrent Neural Networks (RNN), jež se snažily pochopit význam celé věty pro lepší překlad.





NMT ve své době ukázal podobnou přesnost překladu jako původní PBMT, ovšem s tou výhodou, že šlo o výrazně jednodušší systém. Ten ale na druhou stranu potřeboval zase vyšší výpočetní výkon, ovšem to už technický pokrok snadno zajistil. Nyní má nastupovat ještě přesnější systém GNMT využívající neuronové sítě, který má "překonat mezeru mezi lidským a strojovým překladem".





Google slibuje, že jeho GNMT dokáže oproti předchozímu systému snížit výskyt chyb v překladech o 55 až 85 %, což měli potvrdit překladatelé dobře znalí obou cílových jazyků. Nová metoda má počítat s vektory, do nichž jsou zašifrována slova, kde každý vektor představuje význam všech do té doby přečtených slov. Když se přečte celá zdrojová věta, započne dekodér postupně generovat (v tomto případě anglická) slova, přičemž každému vektoru je přiřazena jiná váha v překladovém procesu a použity jsou pak ty, které jsou nejvíce relevantní. Jde ale také o systém, který už využívá jednotky TPU, čili Tensor Processing Unit, které mají právě v oblasti AI vysoký výkon i díky své specializaci na výpočty s přesností FP16.

My si ale už můžeme tento nový systém vyzkoušet, neboť Google říká, že už je využit pro překlady z čínštiny do angličtiny. Google sám ale nakonec přiznává, že systém GNMT zdaleka není schopen vytvořit přesné překlady a dělá chyby, které by člověk nikdy neudělal. A právě to je největší kámen úrazu. Na lidské chyby si lze zvyknout a vytušit z nich, jak to asi překladatel myslel a v čem se spletl, i když je k tomu často potřeba znalost obou jazyků. A když už nic jiného, člověk se většinou snaží, aby přeložená věta sama o sobě dávala smysl. To u aktuální podoby GNMT tak zcela neplatí. Dobrý příklad je následující věta přeložená z čínštiny pomocí GNMT:

Old man suffered a severe brain injury, sent to the hospital after the death of Jamaica.

Píše se tu, že starý muž utrpěl vážné poranění mozku a byl poslán do nemocnice po úmrtí Jamajky. Významově je věta zcela pochopitelná, ovšem člověku je na rozdíl od překladové AI poněkud podivné to, že je někdo poslán do nemocnice až po smrti nějakého státu. Nehledě na to, že překlad celého článku dříve a ani potom už Jamajku vůbec nezmiňuje. Lidský překladatel by si tak řekl, že je na tom logicky asi něco špatně, ovšem umělá inteligence to dokáže přejít bez povšimnutí, a proto lze tvrdit, že ani GNMT se lidem zatím nepřiblížil. Jak jsem si ověřil v několika dalších překladech, tento systém je schopen tvořit věty, které jsou bez problémů srozumitelné, ale stejně tak bývají na výstupu naprosté bláboly (ono ale také pochopitelně záleží na kvalitě původního textu). Chyby v překladu bohužel dokáží degradovat celý překlad, v němž se lze velice snadno ztratit, ale celkově to působí tak, že Google je na dobré cestě. Ostatně jeho GNMT se má v překladech z čínštiny do angličtiny v příštích měsících značně zlepšovat, tak uvidíme.

Zdroj: Google
reklama