Soomlased loovad ChatGPT analoogi, mis oskab mõelda ka eesti keeles

Soomlased asusid looma ChatGPT analoogi.Foto: Shutterstock

Turu Ülikool koos välispartneritega loob soome, eesti ja teistes väikekeeltes mõtleva ja nende kultuure tundva tehisintellekti, mis tagab väikekeelte kestmise ka ChatGPT järgsel ajastul. Eesti keele instituudi keeletehnoloog Eleri Aedmaa selgitab, mida peavad eestlased omalt poolt tegema, et tema sõnul hädavajalik algatus õnnestuks.

Aedmaa sõnul veavad äsja välja kuulutatud konsortsiumi eest Turu Ülikool ning keeletehnoloogiaettevõte SiloGen. Loodav maailma suurim avatud keelemudel hõlmab kõiki Euroopa keeli, sealhulgas eesti keelt, ning rakendab maailma suuruselt kolmandat ja Euroopa suurimat superarvutit LUMI.

Eleri Aedmaa sõnul on eesti keele jaoks võtmetähtsusega see, kui palju eri laadi ja algupäraseid digitaalseid eestikeelseid tekste suudame nii sellele kui tulevastele keelemudelitele õppimiseks ette anda.

“Praegu populaarseks saanud suurte keelemudelite ühine nõrk külg on see, et neid on treenitud peaaegu täielikult inglise keele põhjal. See tähendab, et kui näiteks GPT-4 ka otsekui saab eesti keelest aru, on tegu ikkagi ainult tõlkimisega – piltlikult öeldes masin mõtleb inglise keeles ja tõlgib jutu viimasel hetkel eesti keelde. See on aga eesti keelele pikemas plaanis väga ohtlik,” selgitas Aedmaa.

Uute tööriistade väärtus peitub selles, et need nii-öelda mõistavad lisaks sõnadele ja lausetele ka laiemat kultuurikonteksti. “Kui keelemudel on treenitud ainult ingliskeelse materjali baasil, siis see paratamatult eesti kultuuri ei tunne,” lisas Aedmaa.

“Olukord on võrreldav sellega, kui leiutati trükipress – mis oleks eesti keelest saanud, kui raamatuid oleks trükkima hakatud ainult suurkeeltes, aga eesti keeles mitte?” sõnas Aedmaa.

Sama mure vaevab enamikku maailma keeli

Aedmaa sõnul luuaksegi nüüd soomlaste algatusel uus keelemudel ehk GPT-laadne digitaalne masin, mida on algusest peale treenitud enam-vähem võrdselt paljude erinevate keelte põhjal. Eesmärgiks on Euroopa keelte suveräänsus ja keeletehnoloogia demokraatlikkus.

“Uus keelemudel on erinevalt enamikust senistest ka avatud koodiga – selle loogika on läbipaistev ja seda saavad kõik soovijad uute keeletehnoloogiarakenduste jaoks kasutada,” lisas Aedmaa.

Ingliskeelne ChatGPT jahmatas maailma sellega, et oskas inimese sarnaselt tavakeelest aru saada ja ise samamoodi vastata. Aedmaa sõnul ei olnud aga selle taga mingi imetehnoloogia, vaid ennekõike see, et programmile anti ette enneolematult palju tekste, mille seest mustreid leida ja õppida niimoodi inimeste suhtlust imiteerima.

“Seega äsja alanud uuel keeletehnoloogiaajastul loeb tekstide mass. Eesti keelega selle kriitilise massi saavutamiseks peaksime digiteerima ja avalikuks tegema kõik tekstid, mis vähegi võimalik. Kogu Rahvusraamatukogu, kõik arhiivid, võimalikult palju uusi ja vanu uudiseid ning veebisuhtlust. Mida rohkem eesti keelt on veebis vabalt leitav, seda kindlam on eesti keele tulevik,” soovitas Aedmaa.

Märksõnad: AI, chatgpt, eesti keel, soome keel, tehisintellekt, ülikool

Soomlased loovad ChatGPT analoogi, mis oskab mõelda ka eesti keeles

Sama mure vaevab enamikku maailma keeli

Redmi A2: üliodav telefon, mis kestab

Apple Mapsi autod pildistavad kaardirakenduse jaoks Eesti tänavaid

OpenAI avalikustas kauaoodatud otsingumootori

Kas ilm on tõesti muutunud? TalTechi meteoroloogia professor Aarne Männik annab aru

Apple Maps sai ametliku veebiversiooni

Samsung Galaxy Fold6: Suur volditav telefon on ajaga küpsemaks saanud

Redmi A2: üliodav telefon, mis kestab

Kasulikud pilvetarkvara tööriistad ettevõttele

OpenAI avalikustas kauaoodatud otsingumootori

Kas ilm on tõesti muutunud? TalTechi meteoroloogia professor Aarne Männik annab aru

Xiaomi 14 Ultra: on aeg teha telefoniga pilte nagu profikaameraga

Sony pakub spordisõpradele magusate hindadega telereid

Jää veebis anonüümseks Alternatiivse ID-ga

Eesti inimesed eelistavad suvel üha enam alkoholivaba õlut, siidrit või long drinki

Kas sa tõesti ikka veel liisid autot? 7 põhjust, miks kohe liisingust loobuda.

Väljapaistev ja võimekas: Eestis jõudis müüki kauaoodatud Volkswagen Amarok!

Kas sa tõesti ikka veel liisid autot? 7 põhjust, miks kohe liisingust loobuda.

Eesti esimese elektriauto Nobe investorid hoiatavad koostöö eest asutaja Roman Muljariga. Muljar: “Kuuldused Nobe surmast on tugevasti liialdatud!”

Tallink Grupi puhaskasum langes 82 protsenti. Investor: selles valguses on Infortari 0,55-eurone ülevõtupakkumine veel hea

Speedest toob laupäeval Ülenurme lennuväljale (väga) kiired sõidukid

Füsioterapeut Piret Tamm: ma teen Onlyfans’i, aga lihtsalt taastusravi patsientidele

Väljapaistev ja võimekas: Eestis jõudis müüki kauaoodatud Volkswagen Amarok!

Youngtimer Camp 2024 toob kokku sadu klassikalisi autosid ja kohal on ka M-Sporti rallimeeskond

Galerii: USA autode näitus Haapsalus toimus sellisel kujul viimast korda

Sama mure vaevab enamikku maailma keeli

Redmi A2: üliodav telefon, mis kestab

Kasulikud pilvetarkvara tööriistad ettevõttele

OpenAI avalikustas kauaoodatud otsingumootori

Kas ilm on tõesti muutunud? TalTechi meteoroloogia professor Aarne Männik annab aru

Xiaomi 14 Ultra: on aeg teha telefoniga pilte nagu profikaameraga

Sony pakub spordisõpradele magusate hindadega telereid

Ära jää ilma päeva põnevamatest lugudest