Millal siis ikkagi arvutiga normaalset eesti keelt rääkida saab?
Eelnevast on näha, et tänu Eesti teadlaste tööle on meil võimalik vastava tarkvaraga panna arvuti nii eesti keelt kõnelema kui ka kuulama ja tekstiks pöörama. Aga millal see lõpuks ikkagi praktiliselt kasulikuks saab?
Suurtes keeltes kõnelejate elu on selles osas juba lihtsam. Kõnetuvastuse ja ka -sünteesi tarkvara on oma toodetesse ehitanud kõik kolm suuremat IT-giganti:
- Siri on Apple’i kõnepõhine digitaalne assistent, mis vastab kõnele kõnega. Siriga saab rääkida telefonis, tahvelarvutis ja teleris. Siri oskab inglise, hispaania, prantsuse, saksa, itaalia, jaapani, korea, hiina (nii mandariini kui kantoni murret), araabia, hollandi, taani, norra, rootsi, vene, türgi, tai ja portugali keelt.
- Google Voice Search on kõnetuvastus-süsteem, millega saab suulise kõnega esitada käske või päringuid Google Now süsteemis telefonis, tahvlis ja Chrome’i brauseris. Google Voice Search mõistab 39-t keelt, teiste seas leedu, soome, rootsi ja vene keelt.
- Microsofti Cortana on kõnepõhine digitaalne assistent, mis on integreeritud Windows 10 sisse, Xboxi mängukonsooli, Windows Phone mobiilidesse ja mujale. Cortana oskab inglise, hispaania, saksa, itaalia, prantsuse, hiina ja jaapani keelt.
https://youtube.com/watch?v=4Trq7AvtoEY%3Ft%3D56s
Peale suurkeelte nagu inglise ja hispaania on meile kõige lähemale tulnud leedu ja soome keele mõistmisega Google. Kuid Eestis ei ole veel palju põhjust maailma suurtelt meie emakeele tuge loota.
Kommertshuvi eesti keele vastu pole, aga toetusraha ootab
Fakt on, et eesti keel on väike. Statistikaameti andmete järgi ütles viimases rahvaloenduses 886 859 inimest, et nende emakeel on eesti keel. Kui võtta juurde need, kes eesti keelt võõrkeelena oskavad, saame ilmselt veidi üle miljoni eesti keele rääkija.
Meisteri sõnul sõltub keele kõnelejate hulgast, kas eraettevõtted hakkavad sellele kõnetuvastust tegema. “Umbes kümmekond või rohkem aastaid tagasi anti hinnang, et kui keele kõnelejaid on alla kümne miljoni, siis pole see majanduslikult mõttekas. See on olnud üks lähtekoht, miks meil maksumaksja raha eest seda tööd tehakse. Kommertshuvi ei ole,” ütleb Meister.
“Mõned aastad tagasi ütles Google, et nemad teevad kõnetuvastuse kõigile üle ühe miljoni kõnelejaga keelele,” jagab Meister keeletehnoloogia telgitagustes liikuvat infot. Sellise suurusega keeli on maailmas ligi nelisada, kõnetuvastust pakutakse kommertstoodetes Meisteri sõnul umbes kolmekümne keele jagu, kui arvestada ühe keelena näiteks USAs, Suurbritannias ja Uus-Meremaal räägitavad inglise keele variandid.
See on ka üks põhjus, miks Meister loodab, et Eestis leidub hakkajaid ettevõtjaid, kes teadlaste tehtud kõnetehnoloogiale rakendust leiaks. Juhtumisi on selleks valmis ka hulk raha: jaanuari algusest kuni aasta lõpuni saab taotleda toetust sihtasutusest Archimedes. Seal on nutika spetsialiseerumise rakendusuuringute toetusteks 9 miljonit eurot, mis on mõeldud muuhulgas just teadustöö ühendamiseks ettevõtlusega.
Seega ei saa me jääda lootma ülejäänud maailma peale, et keegi eestikeelse kõne infoajastusse tooks, ainult siinsetele teadlastele ja ettevõtjatele.
See artikkel on esimene osa seerias, mis uurib, kuidas me saame arvutitega eesti keeles rääkida. Loe teist lugu siit, kuidas arvuti kõik Eesti raadio- ja telesaated läbi kuulab. Kolmas artikkel uurib, kuidas Eesti arstid on kõnetuvastuse võtnud töösse.
Parandatud 10.02.16: täpsustatud nende keelte arvu, mille kõnelejaid on maailmas üle miljoni.