Google uuendas kõnetuvastuse teenust uute funktsioonidega

Pane tähele! Artikkel on ilmunud enam kui 5 aastat tagasi ning kuulub Geeniuse digitaalsesse arhiivi.

Google Cloud Speech API on teenus, mida rakenduste loojad saavad ära kasutada äppide inimkõnest arusaamise õpetamiseks. Olgu selleks siis helifaili transkribeerimine või telefoni kõnekeskuses käsklustele reageerimine. Nüüd on moodulil hulk uusi funktsioone, mis selle veelgi kasulikumaks muudavad.

Üks uutest lahendustest on võimalus salvestuse heli ja tekst siduda. Nii on võimalik pika transkribeeritud teksti puhul kuulata, millal ja kuidas mingit lauset või sõna täpselt öeldi. Samuti muutuvad salvestused niiviisi otsitavaks – salvestatud intervjuust on kerge vaevaga võimalik leida otsitav sõna.

Säärane funktsioon on saadaval iga sõna kohta, nii et otsing peaks olema suhteliselt täiuslik. Ja sõnu on võimalik tekstiks muuta nüüd lausa kuni 180 minutilistes failides, võrreldes varasema 80 minutiga. Seega ei ole mingi probleem kolme tunni pikkune ülikooliloeng Google’ile anda ning seejärel õppejõu teksti mugavalt tahvelarvutist lugeda.

Kolmandaks API uuenduseks saab uute keelte tugi. Tõsi, eesti keelt siin veel ei ole, peagi ehk on, kuid neil kel on soovi suahiilikeelset kõnet tuvastada, on nüüd see võimalus. Uute keelte hulgas on veel ka näiteks bengaali, urdu ja gujarati keeled, mida kõneldakse Indias.

Märksõnad: , ,

Populaarsed lood mujal Geeniuses

Igal argipäeval

Ära jää ilma päeva põnevamatest lugudest

Saadame sulle igal argipäeval ülevaate tehnoloogia-, auto-, raha- ja meelelahutusportaali olulisematest lugudest.