Meta sai tehisaru õpetamiseks ligi 4 miljardit eesti keele sõna

Eesti on valmis ka edaspidi teistele keelemudelitele sõnu jagama.Foto: Depositphotos

Justiits- ja digiminister Liisa Pakosta võõrustas eile Facebooki ja Instagrami emafirma Meta esindajaid, kellega arutleti eesti keele ja kultuuri esindatuse üle tehisintellektsetes mudelites.

Muuhulgas võtab Meta vastu eesti keele korpuse andmed, mis sisaldavad peaaegu 4 miljardit sõna. Ministeeriumi sõnul loob andmete jagamine eelduse, et suured keelemudelid mõistaks Eesti kultuuri konteksti ja muutuks ka eesti keele kasutamises osavamaks.

Pakosta sõnul on tähtis, et suured keelemudelid arvestaksid eesti keele ja kultuuriga. “See on meie keele ja kultuuri jätkusuutlikkuse mõttes ülioluline, et eesti keele korpuse andmed oleksid keelemudelite arendajatele kättesaadavad,” märkis Pakosta.

Justiits- ja digiministeerium ning haridus- ja teadusministeerium koostöös Eesti Keele Instituudiga tegutsevad selle nimel, et tagada eestikeelsete andmestike kättesaadavus ja leitavus. Ühtlasi panustatakse kvaliteetsete andmepakettide laiendamisse, et eesti keel oleks suurtes keelemudelites paremal tasemel.

Populaarsed lood mujal Geeniuses

Igal argipäeval

Ära jää ilma päeva põnevamatest lugudest

Saadame sulle igal argipäeval ülevaate tehnoloogia-, auto-, raha- ja meelelahutusportaali olulisematest lugudest.