Riigikogu võtab kasutusele TTÜ nutika kõnetuvastussüsteemi

Pane tähele! Artikkel on ilmunud enam kui 5 aastat tagasi ning kuulub Geeniuse digitaalsesse arhiivi.
TTÜ kõnetuvastussüsteem aitab transkribeerida riigikogu kõnepuldis öeldut. Foto: PM/SCANPIX BALTICS

Riigikogu kantselei on kuulutanud välja riigihanke riigikogu stenogrammisüsteemi arendus- ja hooldusteenuse tarbeks. Hanke tingimuste kohaselt peab selle võitja kindlasti kasutama Tallinna Tehnikaülikooli (TTÜ) poolt arendatud kõnetuvastussüsteemi Kaldi.

Kaldit soovivad ka teised asutused kasutada

TTÜ vanemteaduri Tanel Alumäe sõnul on nad riigikoguga lähemas suhtluses olnud juba paar aastat. Kuigi Alumäe ei saanud konfidentsiaalsusele viidates teisi uusi koostööpartnereid nimetada andis ta mõista, et TTÜ kõnetuvastussüsteemist on huvitatud mitmed riigiasutused.

“Oleme kunagi aastaid tagasi süsteemi riigikogu salvestustega testinud. Sealt tuli välja, et see on suhteliselt lihtne ülesanne. Inimest ei saa kindlasti päris ära kaotada. Riigikogu istungite puhul on väga oluline, et tulemus oleks võimalikult vigadevab. Ennustame, et riigikogu salvestuste puhul tuleb vigu 5-10%,” sõnas Alumäe.

TTÜ kõnetuvastussüsteemi näol on tegemist eesti keele pikkade kõnesalvestuste tuvastussüsteemiga, mis põhineb vabavaralisel kõnetuvastuspaketil Kaldi.

Mikrofonide asetusest sõltub tulemus

Alles hiljuti katsetati süsteemi Eesti kohtute istungisalvestistega, millest selgus, et kõnetuvastuse jaoks on mikrofonide asetused väga olulised. Alumäe sõnul ei tohiks riigikogus mikrofonide asetusega probleeme tekkida, kuid salvestuse õigsuse ja korrektsuse huvides peab selle siiski inimene üle töötlema.

Millal saabub päev, mil süsteem on piisavalt täpne, et inimene ei peaks seda üle kontrollima ei osanud Alumäe öelda. Kokku tegeleb TTÜs süsteemi arendusega kaks inimest.

Hanke kohaselt teeb riigikogu kõnetuvastuse parandamiseks TTÜ-ga pidevat koostööd. Serverisse edastatud helifail peab andma tulemuseks transkribeeritud faili, mis sisaldab infot salvestuses esinevate kõnelejate kohta, ning koos algusja lõpuaegadega lausungitranskriptsioone, kusjuures igale transkriptsioonile on omistatud mingi kõneleja.

TTÜ kõnetuvastussüsteemi võimekuse saab iga huviline panna proovile veebikeskkonna abil, mida viimatise aruande kohaselt on aasta aja jooksul kasutatud 4364 korda.

Populaarsed lood mujal Geeniuses

Igal argipäeval

Ära jää ilma päeva põnevamatest lugudest

Saadame sulle igal argipäeval ülevaate tehnoloogia-, auto-, raha- ja meelelahutusportaali olulisematest lugudest.