Kunas täpselt ja kuidas tehisintellekt meie ellu tugevalt tuleb, on praegu võimatu ennustada, aga see juhtub kindlasti. Esimese hooga võib see endaga kaasa tuua töökohtade kadumist ja inimestele probleeme, kuid tegelikult sünnib AI-revolutsioonist palju võitjaid, rääkis TaltTechi tarkvarateaduse instituudi professor Tanel Tammet intervjuus Henrik Roonemaale.
TalTechis toimub 5. juunil innovatsioonifestival pealkirjaga “Tehisintellekt ühiskonna teenistuses”, kus hulk nii välismaa kui Eesti spetsialiste proovivad leida vastust küsimusele, kuidas AI-d võimalikult erinevates valdkondades rakendada ja AI toodud muutustest kasu lõigata.
Kas sa oled täna juba AI-d kasutanud?
Ma olen täna AI-d tundide kaupa kasutanud, aga mina kasutan seda eksperimenteerimiseks mitte selleks, et ta mulle mingeid vastuseid või jutte annaks.
Sa oma veebiotsingusse, töösse, kirjutamistesse ei ole teda rakendanud?
Ei. Olen proovinud mitmel moel, lasta tal artikli osi ilusamaks kirjutada ja koodi kirjutamise assistendina, aga ma polnud tulemusega rahul.
Ma küsin sellepärast, et suurte keelemudelite laiema avalikkuse ette jõudmisest on poolteist aastat möödas, aga endiselt on selline tunne, et see laine tuleb, kuid pole veel kohal. See on minus tekitanud kahtlusi, kas me üldse ajame õiget asja ja kas see laine üldse ongi olemas.
Ma olen päris veendunud, et on olemas. Keegi ei oska prognoosida, milles see laine seisneb, mis tegelikult hästi tööle hakkab ja mille jaoks kasulik on või millal need asjad juhtuvad.
Minu jaoks oli ChatGPT põhiline efekt selles, et ta muutis tuleviku palju prognoosimatumaks. ChatGPT niivõrd hea tase oli enamusele erialainimestele, ka tema ehitajatele, väga suureks üllatuseks.
Aga see maailma muutev kas pauk või pikem protsess ikkagi tuleb?
See mitte lihtsalt ei tule, vaid see käib juba tükk aega.
Selle sajandi esimesed kakskümmend aastat on olnud sellised, kus tehnoloogia jaoks pole midagi nii üliproduktiivset juhtunud kui meile tundub. Kõiksugu asjad, mis arvutites on või internet ja mobiiltelefonid ei ole tööviljakust nii väga palju muutnud. See kasvab maailmas ühe aeglasemalt ja see on probleem. Tööprotsesside automatiseerumise tempo on pidurdunud ja läheb edasi üha aeglasemalt.
Tegelikke töid teevad endiselt inimesed. Kõik asjad, mida on lihtne automatiseerida, on juba tehtud, aga jäigas programmikoodis ning seda on vaevaline kirjutada. Mul on masinõppe osas suur lootus, et me oleme uue kiire tehnoloogilise tõusu alguses.
Kas sa tead seda vana nalja, et arvuti ei tee kunagi seda, mida sa tahad, et ta teeks vaid alati seda, mida sa ütled, et ta teeks?
Olen ikka kuulnud, jah.
Mulle tundub, et esimest korda on mingi lootus, et arvuti hakkab tegema seda, mida sa tahad, et ta teeks ja sa saad selle talle inimese moel ära seletada. Tekib teistlaadne kvaliteet inimese ja masina suhtlusesse.
Need asjad lähevad kõik palju aeglasemalt, kui alguses tundub. See värk on ikka päris keeruline. Mina ei tea, kui kiiresti seda reaalselt majanduses kasutada õnnestub ja kuidas.
Praegu on kõik eksperimentaalne tegevus, proovime ühes ja teises kohas. Masinõpe toimib hästi pildituvastuses ja aegridade pealt toimuva ennustamises, need on reaalselt kasutuses.
Palju inimesi kasutavad suuri keelemudeleid oma projektiplaanide genereerimiseks, küsivad nende käest kümme ideed mõne töö jaoks või et kirjuta mulle kümme küsimust.
See on tõsi, personaalse assistendi tasemel ta kahtlemata natuke inimesi aitab.
Eelmisel nädalal olid suured skandaalid, et Google’i AI soovitas inimestel süüa iga päev ühe väikse kivi, sest see olevat tervislik ja andis nõu, et kui juust ei püsi pizza peal, siis tuleks pizzakastmesse lisada liimi. Me tegime hiljuti ühe podcastiepisoodi Kristjan Korjusega Pactumist. Tema ütleb, et suurte keelemudelite äkiline ebausaldusväärsus või loomulik kalduvus fantaseerida on selle tehnoloogia paratamatu osa ja see probleem jääb selle tehnoloogiaga kaasas käima. Targa arvuti puhul on valetamisega raske harjuda. Kui ma palun tal Excelis veeru kokku liita, siis ma ju ei mõtle, et äkki ta liitis valesti. See tundub imelik.
See tundub natuke aega imelik, aga inimesed harjuvad sellega suhteliselt ruttu ära. Ma olen täpselt sama meelt nagu Kristjan, et see tehnoloogia oli üllatavalt hea, aga ta on olemuslikult mitmes dimensioonis piiratud.
Seda, et ta põhimõtteliselt valetab, ei saa sellelt tehnoloogialt kuidagi ära võtta. Teine asi on see, et ta põhimõtteliselt ei tee otsinguid või planeerimist, tal pole sellist mehhanismi sees. Ta saab baaskasutada olemasolevaid lihtsamaid otsingustruktuure, aga ise ta neid ei tee.
See kõik ei tähenda, et me siit kuidagi edasi ei saa ja et see ongi keelemudelite ajaloo lõpp, vaid see on praegu üks silmapaistev vaheetapp.
Nii et me peame ära harjuma sellega, et kui ma arvuti käest midagi küsin, siis sealt tulev vastus ei ole õige, vaid teatud tõenäosusega?
See on niikuinii niimoodi. Guugeldades saad ka igausuguseid vastuseid. Mis sel vahet on, kas see on inimese tehtud või mitte. Ega me ei saa sellest aru ka.
Me oleme oma mõtlemises automaatselt läinud seda teed, et AI on meile täpne faktiline partner. Äkki me peaksimegi temasse teistmoodi suhtuma.
Ükski AI ei ole täpne faktiline partner ja ta ei saa põhimõtteliselt seda olla. AI on selline asi, mis olemuslikult teeb midagi, mida me ei oska ette ennustada. Muidu me seda AI-ks ju ei nimetaks, vaid arvaks, et see on mingi kalkulaator. AI peabki olema kuigivõrd ennustamatu ja sel juhul ta ei saa olla garanteeritult õige.
Millisena sa näed AI tootestamise tulevikku? Täna on suhtlus temaga nagu 1980ndatel arvutiterminali taga: sul on vilkuv kursor, sisestad teksti ja siis ootad vastust. Mina ei usu, et see ongi nüüd see ja nii jääbki.
Google on aastakümneid täpselt samamoodi töötanud, et kirjutad ja Google vastab ja see on väga hästi saanud niimoodi jääda. Aga selle kallal, kuidas LLMi tootestada, tehakse praegu väga palju tööd. Head keelemudelid on suhteliselt värskelt tulnud ja katsetamine võtab veel päris tükk aega.
Minu ideaalpilt oleks see, et me saaksime palju kergemini hakata tegema tarkvara, kus on inimkeelne kasutajaliides. Et saad mingeid asju seletada ja kirjeldada ja arvutiga dialoogi pidada ja siis see kaadervärk suudab sulle vastata.
Mistahes põhjalikuma programmi kasutamine on praegu ju õudsalt keeruline. See takistab arvutite võimsat kasutamist, isegi paljud spetsialistid ei viitsi neid asju ära õppida.
Võtame näiteks andmebaasid, neile on läbi aegade püütud teha poolinimkeelseid kasutajaliideseid. Näiteks SQL oli alguses mõeldud selleks, et oleks natuke nagu inimese moodi. Tegelikult on see ikkagi hirmkeeruline ja ainult karm spetsialist suudab päringuid koostada. Me suudaks seda suurte keelemudelite abil palju lihtsamaks teha. See lootus on väga reaalne.
Mina mõtlen sellest väga tarbijakeskselt, ma näen oma elus lõpmatut hulka kohti, kus inimese ja masin suhtlust saaks põhjalikult muuta, alates maja küttesüsteemist ja lõpetades perearsti või millega iganes.
Maja küttesüsteem ja perearstiasi on natuke huvitav küll, aga mitte nii väga. Mind huvitavad oluliselt rohkem suured tööstusprotsessid nagu asjade tootmine, kaubandus, finants, juhtimine. Et nende automatiseerimist edasi viia, et seal oleks vähem inimesi vaja.
Nii et paljukardetud AI kui valgekraede koondaja võib tõeks saada?
See on võibolla ainult alguses niimoodi. Tihtipeale teeb tehnoloogia tööd efektiivsemaks. Pole nii, et AI hakkab ise tarkvara arendama ja inimesi pole sinna üldse enam vaja, vaid me pigem arvame vastupidi: arendajate efektiivsus tõuseb ja nende võime asju teha hakkab kasvama. Nad muutuvad hoopis tähtsamaks. Ka valgekraedega võib samamoodi juhtuda.
Alati on kaotajad ja võitjad, aga ma arvan, et võitjaid on siin päris palju, kelle võimekus hakkab kasvama.
Teiseks, kui me vaatame füüsilist tegevust nagu kasvõi ehitamine, siis see on nii megakeeruline ülesanne, et keelemudelid ei oska seal praegu kuidagi aidata. Hetkel pole siin läbimurde algeidki. Küll nad tulevad, aga ma ei oska ennustada, millal.
Kas sa näed, et suured keelemudelid on üks keeruline asi ja maailmas saab neid olema käputäis või muutub see üldteadmiseks ja me võime Eestisse neid siia kasvõi mitu tükki teha?
Alguses paistis, et on jah kaks-kolm tükki ja teised keegi ei jõua teha, aga praegu mulle paistab, et nii ei ole. Keelemudelit arv on kiiresti kasvanud ja see kasvamise tempo kogu aeg tõuseb. See asi läheb kogu aeg odavamaks ja lihtsamaks, neid saab ehitada olemasolevate peale ja nii edasi.
Nad ei muutu nähtavas tulevikuks selliseks, et ma hakkan oma sülearvutis suuri keelemudeleid ehitama, aga väikseid võib juba täna teha. Neist pole küll eriti kasu, aga nad täitsa töötavad. Viis aastat tagasi tuli välja GPT2, mille kohta OpenAI ütles, et see on nii ohtlik relv, et seda ei tohi inimestele kätte anda, nad teevad sellega mingit hullu kurja. Näiteks seda on võimalik täitsa ise ehitada.
Kas te ehitate neid ka TalTechis laborites või eksamitööna?
Mõned kolleegid on küll selliseid asju katseliselt ehitanud, aga see pole põhitegevus, sest suurt mudelit me kuidagi ei jõua teha ja suur mudel on igal juhul palju parem. Ma ise tegelen põhiliselt uurimisega, kuidas neid mõistlikumalt kasutada saab. Mitte et kus nad eksivad, vaid et kus nad annavad regulaarselt mõistlikke rakendatavaid tulemusi.
Kui palju andmeid ühe mudeli tegemiseks vaja on? Kas me võime ette kujutada, et teeme näiteks Eesti kirjanduse peale spetsialiseerunud suure keelemudeli või Tammsaare romaanide peale?
Tammsaare ja kogu Eesti kirjanduse suure keelemudeli saab mingite päevadega heas sülearvutis juba ise ehitada. Siis ta hakkabki produtseerima Eesti kirjanduse moodi teksti, nii naljakas kui see ka pole. Kasu on temast küll vähe, sest kasu tuleb praeguse GPT4 taseme juures ja sellel tasemel on treenimiseks vaja palju rohkem andmeid.
Samas, vajalike andmete hulk pole astronoomiliselt suur ja pidur pole mitte niivõrd andmete hulk, vaid eeskätt ikkagi treenimise rehkendustöö. See on koletu suur.
Kas me peaks Eestis mõtlema selle peale, et kui me läheme näiteks Google’i või Meta või kellegi tehtud AI käest küsima, mis on Eesti, ja siis ta võibolla vastab meile, et Eesti on üks mõttetu väikeriik Venemaa külje all, siis meil peaks olema eestimeelne oma keelemudel? Selline, mis annaks vastuseid ja oskakski rääkida meile asjadest eestlase vaatepunktist? Nagu digitaalne eestlane.
Jumala õige. Mõni selline täitsa mõistlik Eesti keelemudel on muide juba olemas ja praegu ehitatakse neid suuremaks ja paremaks, see töö täitsa käib. Küsimus on selles, mis sellest pärast kasu on peale selle, et see on selline huvitav asi. Seda küsimust tuleks veidi laiendada.
Suur probleem on see, et keelemudelid üldiselt ei tea suurt midagi peale selle, mille peal nad treenitud on ja kui sa tahaks neid mõnes organisatsioonis kasutada, näiteks et vasta kliendi küsimusele, siis ta ei tea mitte midagi, mis seal organisatsioonis toimub.
See on üldine küsimus, kuidas saada keelemudel mingi organisatsiooni infot kasutama. Praegu üks peamine tehnoloogia, mis seisneb lihtsalt selles, et sa võtad suure posu organisatsiooni dokumente, indekseerid need ära ja kui küsimus tuleb, siis kõigepealt otsid nendest välja tükid, mis paistavad sellele küsimusele relevantsed olevat ja siis paned nad keelemudeli promptile juurde lootuses, et ta siis töötab.
Enamasti töötab ka, aga niipea kui sa läheksid ütlema, et ma tahan andmebaasist ka midagi pärida või et Eestis on X-tee ja küsime sealt, siis see enam nii kenasti ei lähe.
Kui ma olen lihatööstuse juht ja toksin arvutisse küsimuse, et miks mu viimase kahe nädala müük on madalam kui mullu samal ajal, oleks ju väga huvitav rakendus.
Just. Selliste asjade juurde me tahakski tegelikult jõuda ja seda keegi ei oska väga täpselt öelda, kuidas seda teha. Selle kallal tehakse praegu massiliselt tööd.
Mõnedel riikidel maailmas on oma AI-strateegiad juba olemas, et proovida AI jaoks ette valmistuda. Eestis tundub, et me seda väga palju ei tee. Kas me peaksime riiklikul tasemel praegu midagi tegema või on selleks liiga vara ja me ei oskakski midagi teha?
Kindlasti oleks tark kui inimeste hulk, kes oskavad keelemudelitega midagi praktilist ette võtta ja neid uurida, oleks suurem. Rahvast pole vaja massiliselt harida, sest inimesed saavad ise ka aru, mis on põnev, nad lähevad ja katsetavad, aga spetsialistide hulga suurendamine oleks küll väga mõistlik asi teha.
Nii et tuleks ülikoolis uus bakalaureusekava avada?
Pigem ma ütleks, et olemasolevaid kavasid oleks mõttekas niimoodi sättida, et see kompentents kasvaks. Ülikooli tuleks võtta inimesi, kes on nende asjadega juba tegelenud ja ega neid ei ole väga palju kusagilt võtta. Tudengeid on ka vaja motiveerida, et nad teeks keerulisi asju, sest loomu poolest tudeng teeb lihtsaid asju, kes see viitsib keerulisi asju teha.
Me oleme täna ChatGPT 4.o versioonis. Milline versioon on sinu arvates see, mille saab südamerahuga tootvasse töösse võta nii nagu me täna Excelit kasutame?
Pole aimu ka. Prognoosid on alates sellest, et poole aasta pärast saab kuni et sellist asja ei tule mitte kunagi. Täiesti targad inimesed arvavad ühte ja arvavad teist ning kummalgi pole sellisteks oletusteks alust. Need on kõik kõhutunde pealt tehtud.
Mina arvan, et see värk tuleb, aga mitte poole aasta pärast ja tuleb üles-alla lainetustena, kuid pidevalt kasvades.
Suured keelemudelid enam lõpmatult palju ei arene, tõenäoliselt tulevad sinna natuke teistsugused tehnoloogiad juurde. Sellised asjad, mis inimese jutust aru saavad ja oskavad talle midagi müistlikku vastata, kasvavad igal juhul. Ma olen optimist ja arvan, et midagi hirmsast ei juhtu ja seisma see asi ei jää.
Nii et sina Jaan Tallinna ja mitmete teiste inimeste maailmalõpumeeleolu ei oma?
Ei oma. Ma saan neist aru ka, riskid on kuigivõrd olemas, aga sõltub, kui suureks keegi mingit riski peab. Meil ei ole ka eriti võimalusi neid riske maandada. Nende ürituste mõju, et midagi pidurdada või reguleerida, on prognoosimatu. Nad ei pruugi mitte midagi paremaks teha.
Targem on võtta vastu see, mis tulema peab?
Mingi piirini. Ühte riski saaksime maandada, kui me ise sellesse usume ja sellega tegeleme. Suur risk on kogu see arvutivärk üldisemalt.
Ta aitab väga hästi automatiseerida suuri tööprotsesse nii, et see aitab tsentraliseerimisele kaasa. Saad teiste süsteemidega kaugelt sidet pidada ja nii edasi. Tänu sellele on olemas Amazon, Google, Bolt, Wise ja kõik sellised asjad.
Suurfirmad monopoliseerivad majandusest suuri tükke ja üha rohkem, nii et väikesed tegijad jäävadki väikeseks. See toob automaatselt kaasa suurema majandusliku ja sotsiaalse kihistumise, see hakkab kaasa tooma riigivõimu tsentraliseerumist ja demokraatia vähenemist, sest kui majandus tsentraliseerub, siis teeb poliitika sama.
Sellised asjad on ajaloos alati viinud päris jõledate olukordadeni, mis lõppevad sõdade, revolutsioonide ja ei tea millega. Risk kasvab, et rahulik ühiskondlik elu sellisena ei jätku. See on päris suur risk.
Tehisintellekt aitab sellele kaasa, tehes tsentraliseerimist veel kergemaks ja veel paremaks. Me näeme ju praegugi, et AI on põhiliselt suurfirmade käes.
See on kogu ühiskonna mure ja siin on küll võimalik inimestel midagi ära teha, püüdes jälgida, et monopole väga ei soodustata ja et väikesed saaksid ka elada. See on päris keeruline, aga tehtav asi.
Siin vist AI-st palju abi ei ole, vaid see osa tuleb meil endal ära teha.
See tuleb täitsa ise ära teha jah. Üks levinud arvamus, mis ei pruugi tingimata õige olla, aga natuke võib olla, on see, et katsed keelemudelite ja masinate asja pidurdada on eeskätt vesi nende veskile, kelle käes need asjad juba on selleks, et teistel oleks raskem konkureerida.