Uudis

Päris diktor vs arvutiga loodud diktor: kuula Tartu teadlaste kõnesüntesaatori usutavust

Kõnesüntesaator suudab edukalt jäljendada Meelis Kompuse kõnet, kes töötas varem ERR-is. Foto: Eero Vabamägi/Scanpix/montaaž

Tartu ülikoolis valminud kõnesüntesaator oskab kirjaliku teksti järgi panna kõnelema tuntud raadiodiktorid. Tegu on eestikeelse närvivõrkudel põhineva kõnesünteesiga.

Senine parim eestikeelne kõnesüntesaator – tarkvara, mis kirjalikust tekstist teeb kunstliku kõne – räägib küll väga puhta häälega, kuid kõne on arusaadavalt kunstlik ja masinlik.

Tambet Matiisen Tartu Ülikooli arvutiteaduse instituudist treenis aga närvivõrgud reaalsete Eesti raadio diktorite salvestiste põhjal. Treenimiseks kasutati 16,88 tundi uudistesalvestisi, kus kõnelesid Meelis KompusTarmo MaibergBirgit ItseVallo KelmsaarIndrek KiislerTõnu Karjatse ja Kai Vare.

Tulemus on on kuuldavalt mürasem, justkui oleks kõnet kuulda läbi kehva leviga mobiiltelefoni. Aga see-eest on kõnesüntesaatoriga loodud helil päris iseloom, mis on tõesti sarnane reaalse diktoriga.

Siin on näide Kai Vare kõnest. Esimene lõik pärineb ERRi arhiivist ja teine on tehtud kõnesüntesaatoriga.

Siin räägib Meelis Kompus ja siis arvuti, mis püüab olla nagu Meelis Kompus.

Päris Tarmo Maiberg versus kõnesünteesi Tarmo Maiberg.

Kuigi hetkel on veel aru saada, et tegu pole päris inimliku ja puhta kõnega, on tarkvara rääkijate kõne iseloomu jäljendamisel üllatavalt osav. Kui tegu poleks võrdlusega, kus kõrvuti kõlavad päris ja sünteesitud kõne, võiks see isegi mõne kuulaja ära petta.

Kuna kõnesüntesaatorisse saab kirjalikult ette anda mis tahes teksti, annab see viljaka pinnase näiteks libauudiste tegemiseks.

Sama moodi võiks näha tulevikus või tegelikult ka juba olevikus, et internetimeemid võivad muutuda heliliseks. Näiteks nagu see:

Proovi ise neurokõne süntesaatorit veebilehel siin.

Telli Geeniuse uudiskiri

Saadame sulle igal argipäeval ülevaate tehnoloogia-, auto- ja rahaportaali olulisematest lugudest.