Mes atidžiau pažvelgti, kaip tiksliai tai daroma toliau.
Kalbos atpažinimas ir statistinės Industrija
Ankstyvas kalbos atpažinimo sistemos bandė taikyti gramatikos ir sintaksės taisykles kalboje rinkinį. Jeigu pasakytas tilptų į tam tikrą taisyklių rinkinį, programa galėtų nustatyti, ką žodžiai buvo. Tačiau žmogaus kalba turi daug išimčių savo taisykles, net kai jis kalbėjo nuosekliai. Akcentai, tarmių ir manierų gali žymiai pakeisti būdą tam tikri žodžiai ar frazės yra kalbama. Įsivaizduokite ką nors iš Bostono sakydamas žodį ". Tvarto " Jis nebūtų ištarti " r " ne visi, o žodis ateina iš rhyming su ". John " Arba mano sakinį, " aš ruošiuosi pamatyti vandenyną. &Quot; Dauguma žmonių neturi tarti savo žodžius labai atsargiai. Rezultatas gali išeiti kaip " Aš goin 'da pamatyti tha vandenyną. &Quot; Jie paleisti keletą žodžių kartu su jokiu pastebimu pertraukos, tokių kaip " Aš goin '" ir ". vandenynas " Taisyklės pagrįstas sistemas buvo nesėkmingi, nes jie negalėjo dirbti šiuos variantus. Tai taip pat paaiškina, kodėl ankstesnė sistemos negalėjo dirbti nepertraukiamos kalbos -. Jums teko kalbėti kiekvieną žodį atskirai, su trumpu pauzės tarp jų
Šiandien kalbos atpažinimo sistemos naudoja galingas ir sudėtingas statistinio modeliavimo sistemas. Šios sistemos naudoja tikimybę ir matematines funkcijas, siekiant nustatyti labiausiai tikėtiną rezultatą. Pasak Jono Garofalo, kalbos Group Manager prie informacinių technologijų laboratorijos nacionalinio instituto standartų ir technologijos, du modeliai, kurie dominuoja lauką šiandien Hidden Markov modelis ir neuroniniai tinklai. Šie metodai apima sudėtingus matematinius funkcijas, bet iš esmės, jie imasi žinomą informaciją į sistemą išsiaiškinti informacijos paslėptas nuo jo.
Paslėptas Markovo Modelis yra labiausiai paplitusi, todėl mes atidžiau pažvelgti tuo procese. Pagal šį modelį, kiekvienas fonema yra tarsi grandinės nuorodą, o baigtas grandinės yra žodis. Tačiau, grandinė atsišakoja į skirtingas puses, kaip programos bando suderinti skaitmeninį garsą su fonemos, kad labiausiai tikėtina, kad ateiti kitą. Šio proceso metu, programa priskiria tikimybės rezultatą kiekvienam fonemos, remiantis įmontuotu žodyną ir Viskas mokymo
Šis procesas yra dar sudėtingesnis frazių ir sakinių -. Sistema turi išsiaiškinti, kur