Riigikogu kantselei on kuulutanud välja riigihanke riigikogu stenogrammisüsteemi arendus- ja hooldusteenuse tarbeks. Hanke tingimuste kohaselt peab selle võitja kindlasti kasutama Tallinna Tehnikaülikooli (TTÜ) poolt arendatud kõnetuvastussüsteemi Kaldi.
Kaldit soovivad ka teised asutused kasutada
TTÜ vanemteaduri Tanel Alumäe sõnul on nad riigikoguga lähemas suhtluses olnud juba paar aastat. Kuigi Alumäe ei saanud konfidentsiaalsusele viidates teisi uusi koostööpartnereid nimetada andis ta mõista, et TTÜ kõnetuvastussüsteemist on huvitatud mitmed riigiasutused.
“Oleme kunagi aastaid tagasi süsteemi riigikogu salvestustega testinud. Sealt tuli välja, et see on suhteliselt lihtne ülesanne. Inimest ei saa kindlasti päris ära kaotada. Riigikogu istungite puhul on väga oluline, et tulemus oleks võimalikult vigadevab. Ennustame, et riigikogu salvestuste puhul tuleb vigu 5-10%,” sõnas Alumäe.
TTÜ kõnetuvastussüsteemi näol on tegemist eesti keele pikkade kõnesalvestuste tuvastussüsteemiga, mis põhineb vabavaralisel kõnetuvastuspaketil Kaldi.
Mikrofonide asetusest sõltub tulemus
Alles hiljuti katsetati süsteemi Eesti kohtute istungisalvestistega, millest selgus, et kõnetuvastuse jaoks on mikrofonide asetused väga olulised. Alumäe sõnul ei tohiks riigikogus mikrofonide asetusega probleeme tekkida, kuid salvestuse õigsuse ja korrektsuse huvides peab selle siiski inimene üle töötlema.
Millal saabub päev, mil süsteem on piisavalt täpne, et inimene ei peaks seda üle kontrollima ei osanud Alumäe öelda. Kokku tegeleb TTÜs süsteemi arendusega kaks inimest.
Hanke kohaselt teeb riigikogu kõnetuvastuse parandamiseks TTÜ-ga pidevat koostööd. Serverisse edastatud helifail peab andma tulemuseks transkribeeritud faili, mis sisaldab infot salvestuses esinevate kõnelejate kohta, ning koos algusja lõpuaegadega lausungitranskriptsioone, kusjuures igale transkriptsioonile on omistatud mingi kõneleja.
TTÜ kõnetuvastussüsteemi võimekuse saab iga huviline panna proovile veebikeskkonna abil, mida viimatise aruande kohaselt on aasta aja jooksul kasutatud 4364 korda.