Pokrok zastavit nelze. Stroj člověka porazil na celé čáře

Roboti a počítačové programy se vyvíjejí každou minutou
 PC a Mobily 
19. dubna 2019 08:28 / Depositphotos
  16   0
Pokrok zastavit nelze. Vidíme to dnes a denně, a tak nás asi ani nepřekvapí, že například projekt nazvaný DeepMind od společnosti Google dokáže stále nové věci. Ve spolupráci s univerzitou v Oxfordu se naučil odezírat ze rtů. Stačilo mu k tomu jen se dívat na televizi. A stále se vylepšuje.

Sledovat programy bylo k tomu třeba poměrně dlouho. Vědci nabídli počítači celkem 5 000 hodin televizního vysílání ze šesti různých stanic. Videomateriál obsahoval 118 000 sekvencí. Oxfordský tým vědců nejprve trénoval program na záznamech z let 2010 až 2015. Potom ho otestoval na videích z roku 2016. To měla za úkol umělá inteligence už odezírat celé fráze a věty. A dokázala to velice úspěšně.

Stroj člověka porazil na celé čáře

Když poté výzkumný tým srovnával výsledky počítače s lidským profesionálem, ukázalo se, že stroj byl v překladu 200 náhodně vybraných klipů výrazně úspěšnější.

Profesionální lidský odezírač dokázal správně označit jen 12,4 procenta slov, umělá inteligence byla úspěšná v 46,8 procenta případech! Navíc většina neúspěchů se týkala jen drobností, třeba písmene „s“ v závěru slova. Výsledky tedy byly mnohem lepší, než dokázal v minulosti do té doby jakýkoli jiný automatický program.

Tím však práce neskončila. Program DeepMind už se učí i taktické a strategické dovednosti. Aby si stroje ale dokázaly takovou dovednost osvojit, musí se učit na obrovském vzorku dat. Zdá se, že už jsme se přiblížili k okamžiku, kdy bude člověk minimálně v oblasti odezírání zcela nahrazen.

DeepMind už umí rozeznávat víc než 17 500 slov, navíc dokáže rozlišovat mnohem komplikovanější gramatické kategorie.

Potíže byly, ale daly se překonat

Největším problémem při učení bylo podle zveřejněných informací prý to, že řada videoklipů od BBC měla asynchronní zvukovou a obrazovou stopu – počítač pak nebyl schopen dobře přiřadit správné významy k pohybům úst. To celý proces učení výrazně zdrželo.

Aplikací v reálném životě se nabízí nyní víc než dost. Jednou z těch užitečných je například automatické vytváření titulků u videa, ale nabízejí se i mnohem rozporuplnější využití. Pokud by se podařilo spojit tento systém například se systémem bezpečnostních kamer, mohly by stroje monitorovat každé vyřčené slovo.

To by s vysokou pravděpodobností uvítali v tajných službách, na letištích i obecně v bezpečnosti. Logicky však přiházejí i obavy ze zneužití. A je jedno, zda si pod tím představit Orwellův totalitní svět z románu 1984, nebo zneužití špionážními službami či státní mocí.

Další éra v telefonování?

Experti však nevylučují ani to, že objev změní zřejmě i komunikaci s mobilními telefony. Protože jestli bude přístroj odezírat naše slova přímo ze rtů, neměl by být problém s ním komunikovat zcela potichu.

Velkou nadějí mohou být takovéto a podobné pokročilé aplikace pro neslyšící. Stačilo by, že chytrý telefon odečte slova ze rtů hovořícího a převede je následně v text, řeč nebo znaky. Čtěte také: Víte, co je VoWiFi? Pomůže vám ušetřit za volání vysoké částky.

Terezie Zamlynová | inStory.cz
Komentáře
Reklama

Mohlo by vás zajímat

Věda & Vesmír

Nejvyšší vrchol ve Švédsku se propadl o výšku devítipatrové budovy

Dům a zahrada

Co stihnout na zahradě, než se pořádně ochladí

Cestování

Chystáte se do Švýcarska? Zapomeňte na auto. Tuto zemi poznáte nejlépe z vlaku

Zavřít reklamu