“Ei tohi ära unustada, et meie planeeti juhivad inimesed, mitte šimpansid.” Jaan Tallinn AI õpetamisest ja ohtudest

Tehnoloogiaärimees Jaan Tallinn.Foto: Annika Haas

Aasta lõpus said kokku Tartu Ülikooli informaatikateadlane, professor ja keeletehnoloogia õppetooli juhataja Mark Fišel ning programmeerija ja ettevõtja Jaan Tallinn, et rääkida tehisintellekti kvaliteedist, rollist, keeleoskusest ja võimalikest ohtudest. 

Jaan, kõigile on teada, et sa oled nii investor, arendaja kui ka filantroop, kes hoolib eksistentsiaalsete ja katastroofiliste riskide maandamisest. Soovid sa sellele loetelule midagi lisada?

20 aastat tagasi tegin Skype’i. Kui mu Skype’i-periood läbi sai, hakkasin investeerima erinevatesse tehnoloogiaettevõtetesse, mis on nüüdseks Metaplaneti kujul kasvanud päris suureks. Teisest küljest hakkasin Eliezer Yudkowski kirjutiste mõjul muretsema sellepärast, kuhu AI trajektoor lõpuks välja jõuab, mis on tema loogiline lõpp ja mida see inimkonna jaoks tähendab.

Viimased 15 aastat olen tegelenud nii investeerimisega kui ka filantroopiaga, aktivismi ja erinevate organisatsioonide asutamise toetamisega.

Meil sinuga on üsna vastandlikud või siis teineteist täiendavad rollid. Sina vaatad, et AI liiga ohtlikuks või targaks ei läheks, ning mina vastupidi üritan arendada tehisintellekti lahendusi, et need muutuksid piisavalt targaks.

Tehisintellekti tasubki vaadata kui kogumit võimekusi. Olukorras, kus oleks hea mingisugune võimekus lisada, on loomulikult selle lisamine kasulik. Samas ei tohi ära unustada, et meie planeeti juhivad inimesed, mitte šimpansid, sellepärast, et meil on ports võimekusi, mida šimpansitel ei ole. Ehk et juhul kui me läheme AI-ga lihtsalt pimesi edasi ja üritame teda võimalikult võimekaks teha, kaob meil selline eelis siin maailmas. Eelis nende võimekuste näol, mida me hetkel kasutame maailma juhtimiseks.

Seda mõttekäiku jätkates … Igasugused tõlkegeneraatorid ja juturobotitest assistendid töötavad kõige paremini just inglise keelega ning eesti, läti ja näiteks soome keel, isegi hispaania, vene ja araabia keeled alles jõuavad järele. Kas inglise keele valdajad ei karda, et teised võtaksid üle? Sest isegi inglise keeles ei ole see tehnoloogia veel ideaalne.

Tegelikult on raske seostada erinevaid keeli sellise üldise võimekusega, sest ei ole ühtegi füüsikalist põhjust, miks keel peaks olema oluline tehisintellekti komponent. Kui võtame näiteks sellise laineid löönud tehisintellekti nagu AlphaGo või AlphaZero, siis keelega polnud seal midagi pistmist. Samas õppis ta etteantud reeglite järgi mängima God, malet ja šoogit paremini kui inimesed. Ehk on täiesti mõeldav kujutada ette tehisintellekti, mis kunagi inimkeelega ei suhestu, vaid läheb otse füüsikaseaduste kui siinsete mängureeglite peale. 

Selles mõttes on keel lihtsalt mugav asi, millega viimase paradigma ehk siis suurte keelemudelite pealt ehitatud tehisintellekti treenida. See ei ole tehisintellekti jaoks midagi fundamentaalset.

Ma arvan, et see on hästi sõnastatud. Olen nõus, et keel ei ole lahutamatu komponent. See on sinna ilmselt lisatud, sest tehisintellekt on viis, kuidas panna arvuti suhtlema reaalmaailmaga, eelkõige inimestega ning inimeste jaoks on see kõige mugavam.

Ma arvan, et see ei ole selle pärast. Arvan, et see on seetõttu, et keele kujul on suur hulk andmeid Internetis kättesaadavad. AI-d ei arendata praegu sihikindlalt, vaid talle antakse ette võimalikult suur andmehulk, mida on võimalik mugavalt kätte saada, ja siis lastakse sellel segul mõned nädalad või kuud podiseda ja vaadatakse, mis juhtub. Tehisintellekti arendamisel ei tehta samamoodi nagu tavalises tehnoloogiaarenduses, kus sa mõtled, et mis on maailmast puudu ja siis üritad seda auku kuidagi täita. 

Tartu Ülikooli informaatikateadlane, professor ja keeletehnoloogia õppetooli juhataja Mark Fišel.Foto: Zane Fišele

Nõus, aga ma arvan, et see on üks vältimatu järgmine samm, sest tegelikult jääb andmetest varsti puudu. Praeguste andmetega ei saa minu arvates järgmist suurt kvaliteedihüpet teha. Ja järgmine hüpe ei tule ka sellest, et me inimkonnana genereerime andmeid juurde. Pigem peab vaatama metoodeid, mis õpiksid kuidagi efektiivsemalt. 

Põhimõtteliselt on jah kaks suunda. Üks on meetodite efektiivsemaks tegemine. Aga samas pannakse hetkel rohkem rõhku sünteetilistele andmetele. Lihtsalt genereeritakse andmeid juurde nendes valdkondades, kus see genereerimine on lihtsam, nagu näiteks programmeerimine ja matemaatika.

Küsimus on tegelikult selles, et Eesti riik investeerib nende mudelite arendamisse, aga kas sellest piisab? Ja teisest küljest, kui Llama või GPT-4 oskaks paremat eesti keelt, siis sellest me võidaksime ka. Aga selleks on vaja, et Eesti riik või need, kelle käes on eestikeelsete tekstide autoriõigused, saadaksid oma andmeid OpenAI-le või Metale, mida paljud ei taha teha. 

Mina arvan, et sellest pigem ei oleks eriti kasu. OpenAI-l ega Anthropicul, mida ma ju paremini tean, ei ole väga suurt ärihuvi väiksemaid keeli lihtsalt eraldi projektina toetada. Need sulaksid lihtsalt ära sinna suure andmekogumi sisse.

Mulle endale tundub strateegiliselt õige see, et võtta mingi olemasolev mudel ja katsuda seda peenhäälestada. Kuni ta hakkab piisavalt hästi õppima. Seeläbi õnnestub kaasa joosta ka selle üldise mudelite tugevamaks muutumisega.

See langeb kokku ka minu suhtumisega. Peamine takistus on see, et isegi kui teeme mudeli, mis oskab perfektset eesti keelt, või siis nii head eesti keelt kui üks keelemudel osata saab, kasutab maailm jätkuvalt ChatGPT-d või Llamat või Claude’i, mis oskab seda halvemini.

Seetõttu oleks minu meelest kasulik, kui suudaksime anda kõik Eesti andmed kellelegi Anthropicus või mujal, mitte lihtsalt eraldi projektiks, vaid selleks, et järgmise treenimise iteratsioonis läheks see nende üldandmestikku sisse ja nende mudelid oskaksid eesti keelt paremini kui praegu.

Kuna ma olen Anthropicu aktsionär ja nõukogu vaatleja, siis on lihtne küsida, et kas neil sellist huvi on, aga ma ise eeldan, et ega väga suurt huvi ei ole.

Olen kuulnud, et Island maksis Open AI-le juurde selle eest, et nad saaksid oma andmeid neile anda ja et islandi keel oleks kaasatud, aga meil on pudelikaelaks pigem see, et Eesti arhiivid ja meediagrupid ei ole selleks valmis.

Milline on sinu suhtumine üldisemalt selles osas, et mida Eesti peaks tehisintellektiga tegema? Kas investeerima kohapeal tehtud arengutesse ja mudelitesse ning kasvatama kompetentsi või, vastupidi, investeerima suurematesse mudelitesse. Impordime neid ja ei pinguta ise üldse?

Baasmudelite treenimisega me ilmselt konkureerida ei suuda. Ega vist keegi Euroopas. See ei oleks tõenäoliselt mõistlik. Pigem olemasolevate mudelite peenhäälestamine või kui tõesti selgub, et Islandi-sugustel projektidel on jumet, siis nende järgimine. Ma ise olen küll skeptiline, aga võib olla, et ma eksin. Võib-olla on tõesti taolisest lähenemisest kasu.

Kas oled skeptiline ka open-weight (avatud kaaludega) või open-source (avatud koodiga) mudelite osas, mis jäävad nendele kommertstoodetele sisuliselt alla?

Ei ole skeptiline. Ma arvan, et esimene asi, mida teha, ongi just see, et võtta mingid avatud kaaludega mudelid, proovida neid peenhäälestada ja vaadata, kui kaugele need jõuavad võrreldes tippmudelitega, mis ei ole spetsiaalselt eesti keelele peenhäälestatud. On võimalik, et need jõuaksid suhteliselt kannule, aga on ka võimalik, et ei jõuaks.

Mis on sinu isiklik kogemus tehisintellektiga? Kas peale Claude’i on veel lahendusi, mida sa regulaarselt kasutad ning sellisel juhul kas eesti või inglise keeles?

Ma kasutan peamiselt Claude’i. Peamiselt inglise keeles. Peamiselt programmeerimiseks ja vahel eneseharimiseks. Kui mul tekib küsimus, siis ütlen, et seleta nüüd lahti, kuidas see asi käib. 

Kuidas sa tunned, kas sinu arust tänapäeval peaksid lapsed üldse IT-d õppima minema? Või automatiseeritakse see varsti 90 protsendi ulatuses?

Mul on kuus last ja kaks neist õpivad ülikoolis IT-d. Eks üks kaalutlus IT õppimiseks on üldine mõtlemisvõime arendamine. Muide, kui ma meie intervjuu küsimused Claude’ile vastamiseks andsin, siis tema andis ka selle vastuse ja ma olen igatpidi nõus.

Olen ise ka varem intervjuudes öelnud, et programmeerimine õpetab sulle kahte asja. Üks on see, mis tunne on siis, kui mõte on lõpuni välja mõeldud, nii et arvuti (ilma tehisintellekti abita) ka sellest aru saab. Teine on see, et sa eksid. Sa kogu aeg eksid. Sa arvad, et sul on õigus, aga sul ei ole õigus. Need on need kaks asja, mis tulevad programmeerides intuitiivselt kätte. Nii et selles mõttes on see üldhariduslikult võib-olla jätkuvalt kasulik. 

Aga ma ei näe ühelgi valdkonnal praegu seda, et tulevik oleks kindel. Et kui IT-d mitte õppida, siis ma ei oska öelda ka seda, et õpi palun midagi muud. Ma tõesti ei tea, mis see muu oleks.

Et noh … mul üks laps õpib arheoloogiat. See on võib-olla tõesti natuke kindlam kui IT. (Naerab.)

Mine sa tea … ei ole mõeldamatu, et robotid hakkavad kaevamist ja pildi järgi analüüsimist ja muud sellist tegema.

Ma ise julgeks väita, et tehisintellekt sekkub paljudesse aladesse, aga sellest tulevad ikkagi tööriistad, mis võtavad meie rutiini ära, aga inimene on ikkagi lõpuks see, kes neid kasvatab, mitte et nad otsustavad ise. See on hea sissejuhatus sinu prioriteetidesse. Miks sinu meelest on superintelligentsi või tehisintellekti oht tänapäeval aktuaalsem kui muud teemad, nagu näiteks inimkonna rumalus, kliima, julgeolek vms?

Seal on väga, väga palju võimalikke vastuseid. Üks vastus sellele oleks küsida: mida me praegu teeme? Me kutsume välja digitaalseid tulnukaid, kes rumalamaks ei muutu, vaid kes muutuvad iga kuuga järjest targemaks. 

Kui me teame, et meil on tulnukate laev silmapiiril, mis hakkab Maa poole tulema, ja siis küsime, kumb on olulisem, kas see, mis tulnukate laevast saab, või näiteks meie geopoliitiline julgeolekuolukord, siis minu meelest on suhteliselt selge, et mingid julgeolekuolukorrad ja teised teemad, millega inimkond on võib-olla tuhandeid aastaid tegelenud, on selgelt kodusemad kui see, et me võib-olla ei ole enam juhtivliik või ainus vaimselt intelligentne liik.

Aga ma maadlen selle mõttega, et kas see on lihtsalt paljude inimeste arvamus või ongi objektiivne tõde see, et tegelikult tehisintellekt ongi nii ohtlik nagu … tuumarelvad. Noh, tuumarelvad on muidugi tuumatehnoloogia, mis annab midagi kasulikku ka, aga … 

Sinu prioriteetides oli muu hulgas konstruktiivselt kirjas, et keskendutakse ikkagi sellele, et ta võib kõik hävitada või orjastada. AI võib aidata lahendada tervisehädasid või toetada keeltega, nii et minu jaoks on huvitav, et keskendutakse ikkagi sellele, et ta võib kõik hävitada või orjastada.

Tuumateema kohta on Eliezer Yudkowski, inimene, kes mind selle teema juurde tõi, hästi öelnud, et pange tähele, et tuumarelvi ei antud inimestele kuskilt kõrgemalt poolt kätte. See on asi, mille inimesed leiutasid. See on argument selle kasuks, et kuigi tuumarelvad on ohtlikud, on tuumarelvadest veelgi ohtlikum võime neid leiutada.

Mida me praegu AI-le õpetame, on võime leiutada asju. Tuumarelvi ja veelgi hullemaid asju. Võime arendada bioloogilisi relvi, mis tegelikult ongi praegu selline turvateemade teravik, kuna see on asi, mille arendamise võimekus AI-l järjest suureneb. See on võimekus, mis on arusaadav erinevatele julgeolekuinstitutsioonidele. Võimekus planeeti üle võtta ei ole veel arusaadav, kuna tundub teaduslik fantastika, aga võime abistada terroristi bioloogilise relva arendamisel, on asi, millest võib sellistes respektaablites seltskondades rääkida küll.

Sain enda jaoks päris hea vastuse. Vahe on lihtsalt selles, et tuumarelv on lõpuks siiski mingisugune tööriist. Ei ole vaja karta relva ennast, vaid inimesi, kes seda kasutavad. Tehisintellekti puhul ei kardeta mitte seda, kui ta muutub tööriistaks, vaid omaette generaatoriks. 

Asi, mis hoiab tehisintellekti tööriistana, on mingite võimekuste puudus. Seni kuni neil ei ole võimekust endale ise järglast arendada, ise mingisugust serverit või riistvara ehitada, nanomasinaid või füüsilist infrastruktuuri ehitada, nii kaua võib ennast suhteliselt julgelt tunda, jah. Aga niipea kui tal enam ei ole vaja inimesi selleks, et oma jätkusuutlikkust garanteerida, on inimeste jaoks tegemist väga suure probleemiga. 

Räägime lõpetuseks veel korra tänapäevasest tööriista moodi tehisintellektist. Kuna sina oled investor ja investeerid ka tehisintellekti arendavatesse ettevõtetesse, siis millest sa lähtud oma investeerimisvalikut tehes? Nägin teistes intervjuudes, et investeeridki selleks, et sul oleks kontroll selle üle, et kui keegi hakkab midagi ohtlikku leiutama, siis sa saaksid seda pidurdada. Mis sinu investeerimistees on?

Jah, tõepoolest, suur kriteerium on see. Otseselt oma tegevusega tehisintellekti arengut kiirendada ei tahaks. Ehk siis küsimus on see, mis juhtub siis, kui mina ei investeeri. Olukorras, kus on mingi ettevõte, millel on võib-olla potentsiaalselt mingi ohtlik plaan ja neil on raskusi investorite leidmisega, siis ma väga ei kiirustaks neid toetama. Samas kui Antrhopicu puhul olid alternatiivpakkumised riskikapitalistidelt laual. Ehk kui ma EI oleks investeerinud, oleksid nad selgelt raha mujalt saanud. Oluline on see, milline on mu kontrafaktuaalne mõju.

Sellest ma saladust ei tee, et minu meelest meie praegune tehisintellekti arendus, selline pime paradigma, ei ole pikas plaanis kõige mõistlikum. Ja nii palju, kui see minu võimuses on, üritan ma seda liigutada turvalisematele radadele. Mitte et väga palju minu võimuses oleks, aga midagi ikka.

Tõlgendan ma su vastust õigesti, et sa ei vaatagi, kus need augud on või kuhu peaks mida juurde tegema? Kas sa oletad, et tehisintellekti asjad niikuinii arenevad ja neid auke ei jäägi ja pigem on oluline just see, et mitte vales suunas, mitte halbade kavatsustega?

Auke ma vaatan ka loomulikult. See minu prioriteetide leht räägibki enamasti aukudest. Aga aukude täitmine on hetkel pigem filantroopia. Suur osa mu tegevusest on puht heategevuslik, kus ma toetan erinevaid uurimisgruppe ja organisatsioone, kes mõnes mõttes teevad majanduslikult motiveeritud organisatsioonide kodutööd.

Mõtlesin siin ka eesti keele oskust ühe auguna, aga sellele ma sain tegelikult sinu reaktsiooni ka, et Claude juba oskab piisavalt hästi ja sinu kogemusel see ei ole kehv.

Minu kogemuses ta jänni ei jää, aga minu kogemus ei ole selgelt eksperdi pilk.

Lõpuks mängibki suuremat rolli see, kuidas kogeb seda keskmine kasutaja, mitte ainult eksperdid.

Populaarsed lood mujal Geeniuses

Igal argipäeval

Ära jää ilma päeva põnevamatest lugudest

Saadame sulle igal argipäeval ülevaate tehnoloogia-, auto-, raha- ja meelelahutusportaali olulisematest lugudest.