Soomlased loovad ChatGPT analoogi, mis oskab mõelda ka eesti keeles

Soomlased asusid looma ChatGPT analoogi.Foto: Shutterstock

Turu Ülikool koos välispartneritega loob soome, eesti ja teistes väikekeeltes mõtleva ja nende kultuure tundva tehisintellekti, mis tagab väikekeelte kestmise ka ChatGPT järgsel ajastul. Eesti keele instituudi keeletehnoloog Eleri Aedmaa selgitab, mida peavad eestlased omalt poolt tegema, et tema sõnul hädavajalik algatus õnnestuks.

Aedmaa sõnul veavad äsja välja kuulutatud konsortsiumi eest Turu Ülikool ning keeletehnoloogiaettevõte SiloGen. Loodav maailma suurim avatud keelemudel hõlmab kõiki Euroopa keeli, sealhulgas eesti keelt, ning rakendab maailma suuruselt kolmandat ja Euroopa suurimat superarvutit LUMI.

Eleri Aedmaa sõnul on eesti keele jaoks võtmetähtsusega see, kui palju eri laadi ja algupäraseid digitaalseid eestikeelseid tekste suudame nii sellele kui tulevastele keelemudelitele õppimiseks ette anda.

“Praegu populaarseks saanud suurte keelemudelite ühine nõrk külg on see, et neid on treenitud peaaegu täielikult inglise keele põhjal. See tähendab, et kui näiteks GPT-4 ka otsekui saab eesti keelest aru, on tegu ikkagi ainult tõlkimisega – piltlikult öeldes masin mõtleb inglise keeles ja tõlgib jutu viimasel hetkel eesti keelde. See on aga eesti keelele pikemas plaanis väga ohtlik,” selgitas Aedmaa.

Uute tööriistade väärtus peitub selles, et need nii-öelda mõistavad lisaks sõnadele ja lausetele ka laiemat kultuurikonteksti. “Kui keelemudel on treenitud ainult ingliskeelse materjali baasil, siis see paratamatult eesti kultuuri ei tunne,” lisas Aedmaa.

“Olukord on võrreldav sellega, kui leiutati trükipress – mis oleks eesti keelest saanud, kui raamatuid oleks trükkima hakatud ainult suurkeeltes, aga eesti keeles mitte?” sõnas Aedmaa.

Sama mure vaevab enamikku maailma keeli

Aedmaa sõnul luuaksegi nüüd soomlaste algatusel uus keelemudel ehk GPT-laadne digitaalne masin, mida on algusest peale treenitud enam-vähem võrdselt paljude erinevate keelte põhjal. Eesmärgiks on Euroopa keelte suveräänsus ja keeletehnoloogia demokraatlikkus.

“Uus keelemudel on erinevalt enamikust senistest ka avatud koodiga – selle loogika on läbipaistev ja seda saavad kõik soovijad uute keeletehnoloogiarakenduste jaoks kasutada,” lisas Aedmaa.

Ingliskeelne ChatGPT jahmatas maailma sellega, et oskas inimese sarnaselt tavakeelest aru saada ja ise samamoodi vastata. Aedmaa sõnul ei olnud aga selle taga mingi imetehnoloogia, vaid ennekõike see, et programmile anti ette enneolematult palju tekste, mille seest mustreid leida ja õppida niimoodi inimeste suhtlust imiteerima.

“Seega äsja alanud uuel keeletehnoloogiaajastul loeb tekstide mass. Eesti keelega selle kriitilise massi saavutamiseks peaksime digiteerima ja avalikuks tegema kõik tekstid, mis vähegi võimalik. Kogu Rahvusraamatukogu, kõik arhiivid, võimalikult palju uusi ja vanu uudiseid ning veebisuhtlust. Mida rohkem eesti keelt on veebis vabalt leitav, seda kindlam on eesti keele tulevik,” soovitas Aedmaa.

Märksõnad: AI, chatgpt, eesti keel, soome keel, tehisintellekt, ülikool

Soomlased loovad ChatGPT analoogi, mis oskab mõelda ka eesti keeles

Sama mure vaevab enamikku maailma keeli

Eesti ühe vanima mobiili omanik: enam kui 30 aasta vanuse Ericssoniga saab siiani kõnesid teha

SubClub.eu hiilgav tähelend ja vaikne hääbumine: meenutused Eesti ühest populaarseimast filmiportaalist

Kumba Hiina tipptelefoni sel aastal osta tasub? OnePlus 13 versus Honor Magic7 Pro

13 aastat ootamist: Ühiskaart jõuab varsti viimaks nutitelefonidesse

Suures testis 6 paari riiulikõlareid: ootamatu võitja ja veel ootamatum kaotaja

Uus iPhone 16e on väljas: soodsaim Apple’i telefon on nüüd väga kallis

5 viirusetõrjeprogrammi, millega 2025. aastal pahalaste vastu võidelda

Juba kolmas kord: Läänemeres kulgev C-Lion1 merekaabel sai taas kahjustada

Kumba Hiina tipptelefoni sel aastal osta tasub? OnePlus 13 versus Honor Magic7 Pro

Eesti ühe vanima mobiili omanik: enam kui 30 aasta vanuse Ericssoniga saab siiani kõnesid teha

Redditi jälgedes: Instagram testib uut “ei meeldi” nuppu

SubClub.eu hiilgav tähelend ja vaikne hääbumine: meenutused Eesti ühest populaarseimast filmiportaalist

Kuidas Lidl sind teadliku toitumise teekonnal abistab?

Jalad valmistavad muret? Millal otsida abi jalaravispetsialistilt?

Upsell – ideaalne raha teenimise võimalus aktiivsele noorele

Ettevõte vajab ootamatut rahasüsti? Olemas on kiire, paindlik ja kuluefektiivne lahendus

Tabel: kust saab Eestis hoiuse eest parimat intressi?

Sõiduautojuhtidel avaneb võimalus Eestis A1-kategooria mootorsõidukit juhtida, aga oluliste mööndustega

Võrdlustest: Igas mõttes üle keskmise seitsmekohalised, aga võita saab vaid üks

Autoankeet: muusik Antti Kammiste on tõeline autogurmaan

Mitte vaid elekter: Mercedese uuendatud lipulaev saab siiski V-12 mootori

Kliimasoojenemise tõttu väheneb Euroopas tuule kiirus, mis võib oluliselt tõsta suvist elektrihinda

Swedbanki strateeg: ühel hetkel saabub terav aktsiaturgude langus, mis nõrgimad tegijad turult välja sõelub

Kas valida autole elektriline või kütusel põhinev eelsoojendi?

Sama mure vaevab enamikku maailma keeli

5 viirusetõrjeprogrammi, millega 2025. aastal pahalaste vastu võidelda

Juba kolmas kord: Läänemeres kulgev C-Lion1 merekaabel sai taas kahjustada

Kumba Hiina tipptelefoni sel aastal osta tasub? OnePlus 13 versus Honor Magic7 Pro

Eesti ühe vanima mobiili omanik: enam kui 30 aasta vanuse Ericssoniga saab siiani kõnesid teha

Redditi jälgedes: Instagram testib uut “ei meeldi” nuppu

SubClub.eu hiilgav tähelend ja vaikne hääbumine: meenutused Eesti ühest populaarseimast filmiportaalist

Ära jää ilma päeva põnevamatest lugudest