Žyniuonis Daiktai: Google Mike Cohen
"Google" direktorius kalbos technologijų Mike Cohen supranta kalbą apie tokio lygio, dauguma iš mūsų ne galvoti apie tai. Jis supranta jį ant pagrindinio lygio garso derinių ir kontekstinių įkalčiais. Jis turi - jis atsakingas už tam "Google" padalinį, kuris veikia nuo kalbos atpažinimo technologija
Mokymo kompiuterį atpažinti kalboje yra sudėtinga.. Norėdami suprasti anglų kalbą, yra daug kliūčių vienas turi įveikti. Anglų kalba turi homonimų LOT - žodžius, kurie fonetiškai skamba tas pats, bet reikšti skirtingus dalykus. Pagalvokite " prie jų " " du " ir " per. " Žmonės kalbantys su akcentu arba regioniniu tarmės gali ištarti žodžius taip, kad manimi labai skiriasi nuo standartinio tarimas. Ir tada yra žodžiai, kaip " maršrutu " kad turi pakaitinius tarimas - galite pasakyti " šaknis " arba " traktas " ir abu yra teisingi.
Kaip padaryti, jums mokyti kompiuterį, kad šiuos skirtumus? Kaip mašina suprasti, ką mes sakome ir tinkamai reaguoti? Tai yra iššūkius Cohen jo komanda veidą "Google". Mes kalbėjomės su Cohen ir paprašė jam duoti daugiau informacijos apie savo darbą kalba atpažinimo tyrimų ir taikomųjų programų.
Ant kiekvieno puslapio, pamatysite mūsų klausimus pavadinime ir Coheno atsakymus organizme. Mes pradėjome su kalbos atpažinimo technologijos pagrindai, kaip pamatysite kitame puslapyje.
Kaip veikia kalbėjimo atpažinimo technologija darbą, susijusį su pagrindinio lygio?
Gerai, kad iš esmės, taip, kad lauke nuėjo per pastaruosius porą dešimtmečių yra vis daugiau ir daugiau į duomenų bazių ar statistikos-modeliavimo metodų. Ką reiškia, kad yra, o ne žmonės eiti ir bandyti programuoti visas šias taisykles ar visų šių, kaip kalba veikia aprašymų, bandėme kurti modelius, kur mes galėtume pamaitinti daug ir daug duomenų modelių ir modelių išmoksite apie kalbos struktūrą iš duomenų. Taigi duomenų bazių metodai yra grindžiamas koncepcijas kurti didelius statistinius modelius kalba šeriant tai daug duomenų.
Tai pirmasis principas ir kad judėjimas link mašina mokymo ar duomenų valdomas arba statistinius metodus buvo iš tikrųjų vienas iš svarbiausių pažangos dėl kalbos atpažinimo srityje istorijoje. Ir taip šis klausimas tampa, kokios modelio turėtume pradėti, kad mes galime tada pamaitinti šiuos duomenis, kad galėtume gauti gerus rezultatus iš jo kalb