Keeletehnoloog Helen Kaljumäe suurtest keelemudelidest ja veel suuremast tehisintellekti maailmast

Eesti Keele Instituudi keeletehnoloog Helen Kaljumäe.Foto: Jake Farra

Kui midagi uut ja märkimisväärset sünnib, tahame me sellest rääkida – nii on olnud suurte keelemudelitega alates ChatGPT ilmumisest. OpenAI loodud suurel keelemudelil põhinev tekstirobot osutus muljetavaldavaks, sest korraga oli võimalik lihtsalt lahendada keerulisi ülesandeid.

Algas laiem arutelu tehisintellekti (TI) võimekuse üle, mis tõi meie argivestlustesse terminid nagu suur keelemudel, masinõpe ja (generatiivne) tehisintellekt.

Mida need ikkagi tähendavad ja kuidas nad omavahel seotud on?

Inimkeel masinate maailmas

Kuigi suured keelemudelid (SKMid) on tähelepanu keskpunktis, on oluline mõista, et need on osa laiemast keeletehnoloogia valdkonnast, mis töötab selles suunas, et saaksime masinatega inimkeeles suhelda. SKMid on keeletehnoloogia ja masinõppe koostöö tulemus, mis võimaldab arvutitel automaatselt uut sisu – näiteks lepinguid, lühijutte või reklaamtekste – luua.

SKM on üks konkreetne näide generatiivsest tehisintellektist ehk tehisintellektist, mis suudab luua uusi tekste, pilte, heli ja videosid. SKM on masinõppel põhinev mudel, mis kasutades tohutuid andmekogusid ja keerukaid algoritme, õpib keeles esinevaid mustreid ja struktuure, mille tulemusena suudavad SKMid luua teksti, mis on sageli inimese kirjutatust eristamatu. Tänu sellele saame arendada rakendusi, mis ulatuvad vestlusrobotitest automaatse sisuloomeni.

Masinõpe kui kaasaegse tehisintellekti süda

Lisaks SKMidele treenitakse masinõppega palju teisi mudeleid, mis tegelevad muude andmetüüpide ja probleemidega. Masinõpe hõlmab tehnoloogiaid, kus masin õpib andmete põhjal iseseisvalt ülesandeid täitma – näiteks pilte analüüsima, kõnet ära tundma, andmete põhjal otsuseid langetama või prognoose tegema.

Masinõpe ei piirdu ainult keele või tekstiga, see hõlmab ka teisi andmetüüpe nagu pilt, heli või video. Treenitakse ka multimodaalseid masinõppe mudeleid, mis suudavad töödelda mitmesuguseid andmeid korraga, nt DALL·E, mis on spetsiaalselt treenitud tekstipõhiste kirjelduste alusel pilte genereerima.

Tehisintellekt kui katustermin

Tehisintellekt on veelgi laiem mõiste, mis hõlmab kõiki tehnoloogiaid ja meetodeid, mis võimaldavad masinatel imiteerida või ületada inimintellekti erinevates ülesannetes.

Kuigi sageli kujutavad inimesed TIst rääkides ette üldist tehisintellekti (Artificial General Intelligence, AGI), mis on võimeline lahendama kõiki vaimseid ülesandeid samamoodi nagu inimene, on oluline mõista, et AGI on hetkel veel endiselt tulevikumuusika ja vajab rohkelt teadusuuringuid. TI mõiste alla kuulub palju erinevaid spetsiifilisi süsteeme, mis on loodud kindlate ülesannete lahendamiseks.

Kuigi masinõpe on oluline tehisintellekti haru, ei piirdu TI ainult sellega. Masinõpe keskendub süsteemide võimele ise õppida ja kohaneda, samas kui TI võib hõlmata ka reeglipõhiseid süsteeme. Masinõpe on eriti kasulik masintõlkesüsteemide loomisel, sest ülesanne nõuab võimet õppida keerulisi grammatilisi struktuure ja sõnavara suurtest tekstikogudest.

Foto: EKI

TI kõige lihtsam vorm on aga inimese koostatud reeglipõhine süsteem. Siin on heaks näiteks ekspertsüsteemid, mis kasutavad kindlas valdkonnas probleemide lahendamiseks või otsuste tegemiseks eelnevalt määratletud reegleid ja loogikat. See tähendab, et süsteem põhineb ekspertide teadmistel ilma masinõppe võimekust kasutamata.

Niisiis leidub väga erineva eesmärgi ja tehnoloogiaga TI-rakendusi, millest paljud ei ole üldse keeletehnoloogia või SKMidega seotud. Näiteks autonoomsed sõidukid kasutavad süvaõpet ja arvutinägemise algoritme, et mõista ümbrust ja reageerida reaalajas. Meditsiinis kasutavad TI-süsteemid pildituvastust haiguste varajaseks avastamiseks. Finantssektoris rakendatakse andmeanalüüsi ja masinõpet investeerimisotsuste tegemiseks ning riskide hindamiseks.

Miks siis just suured keelemudelid tähelepanu keskpunktis on?

Kuigi keelemudelid moodustavad vaid väikese osa TI valdkonnast, pälvivad nad palju tähelepanu, sest mitte kunagi varem pole sellise võimekusega tehnoloogia olnud nii laialdaselt kättesaadav või lõppkasutajale sedavõrd lihtsasti kasutatav.

SKMid demonstreerivad hästi TI potentsiaali, kuid TI ei võrdu suurte keelemudelitega ning SKMid on vaid üks osa keeletehnoloogiast ja masinõppest. Suurema pildi nägemine aitab meil paremini mõista, kuidas erinevad TI osad on omavahel seotud ja millistes olukordades meil erinevatest tehnoloogiatest kõige rohkem kasu on.

Populaarsed lood mujal Geeniuses

Igal argipäeval

Ära jää ilma päeva põnevamatest lugudest

Saadame sulle igal argipäeval ülevaate tehnoloogia-, auto-, raha- ja meelelahutusportaali olulisematest lugudest.