Tulevik vajab tarku infotehnolooge: informaatika magistriõpe pakub võimalusi robootikast tehisnägemise ja loomuliku keele töötlemiseni

Robotitel on meie igapäevaelus kasvav roll ja nii on üsna selge, et IT-spetsialistidel tulevikus tööd ja väljakutseid jagub ning vajadus nende järele kasvab kiiresti.Foto: TalTech

Kaasaegses maailmas pole enam pea ühtegi valdkonda, kus infotehnoloogiat ei kasutataks – alustades tööstusest, meditsiinist, avalikust sektorist ja transpordist ning lõpetades omavahelise suhtlusega. Robotitel on meie igapäevaelus kasvav roll ja nii on üsna selge, et IT-spetsialistidel tulevikus tööd ja väljakutseid jagub ning vajadus nende järele kasvab kiiresti.

TalTechi IT-teaduskonna informaatika magistriprogrammi juht Juhan-Peep Ernitsa sõnutsi on õppekava mõeldud IT valdkonna bakalaureusekraadiga üliõpilastele, kes soovivad tehnilisi oskusi edasi arendada.

“Õppekavas moodustavad enamuse valikained, mille kaudu saab iga üliõpilane keskenduda just teda huvitavale teemavaldkonnale,” selgitab ta.

Järgneval joonisel on ülevaade viimastel aastatel informaatika magistris kaitstud magistritööde teemavaldkondadest:

Selleks, et saaks selgemaks, mida TalTechis informaatika magistriõppes õpitakse, selgitab Ernits kahe silmapaistva ja põneva magistritöö näitel.

Magistritöö keeletehnoloogiast: “Eestikeelse küsimus-vastus-süsteemi arendamine”

Selle magistritöö autor on Anu Käver, kes lõpetas magistriõpingud2021. aasta kevadel. Praegu töötab Käver tarkvarainsenerina ning on arendustiimi juht ühes fin-tech ettevõttes.

Anu Käveri magistritöö käsitles interneti otsimootoreid, juturoboteid ja erinevaid dialoogisüsteeme, mis püüavad elektroonilistest andmemassiividest leida inimese jaoks hetkel vajalikku informatsiooni. Arvestades seda, milline elektroonilise info üleküllus maailmas valitseb, on tegu vägagi päevakajalise valdkonnaga tehisintellekti arendamisel.

Infootsingu rakenduste aluseks on tihtipeale küsimus-vastus-süsteemid. Käver arendas magistritöös välja esimese eestikeelse küsimus-vastus-süsteemi. Süsteem töötab nii, et saab ette lõigu eestikeelset teksti, mis on ühe inimese poolt loomulikus keelepruugis esitatud küsimus. Seejärel peab süsteem leidma tekstist lühima lõigu, mis sisaldab vastust küsimusele.

Toome näite. Tekstilõik: Politseinikud kontrollisid 29. mai õhtul Tallinna ringteel liiklusõnnetusse sattunud BMW sõiduautot. Sõiduki juht ja reisija õnnetuses viga ei saanud, kuid politseinikel oli alust arvata, et mõlemad mehed võisid olla narkojoobes.

Küsimus: Kus tegi narkouimas juht avarii?

Süsteemi leitud vastus: Tallinna ringteel.

Väljakutse: kuidas süsteemile eesti keel selgeks õpetada?

Suurimaks väljakutseks kõige selle juures oli asjaolu, et edukamad tänapäevased küsimus-vastus-süsteemid treenitakse masinõppe abil ja see nõuab väga suuri treeningandmestikke. Näiteks koosneb kõige populaarsem ingliskeelne küsimus-vastus-andmestik SQuAD ligi 150 tuhandest andmeühikust (tekstilõik+küsimus+vastus). Eesti keeles sellised andmestikud aga puuduvad.

Probleemile tuli läheneda kahest nurgast. Esiteks koostas Anu ise Vikipeedia artiklite põhja algupärase 1115 küsimusega eestikeelse treeningandmestiku. Teiseks üritas ta ära kasutada ülekandeõpet (transfer learning) ehk kasutas ingliskeelset SQuADi andmestikku eestikeelse süsteemi treenimiseks. Mõne eksperimendi jaoks tuli kogu SQuADi masintõlke abil eesti keelde tõlkida.

Anu proovis ka vastupidist – tõlkis enda koostatud andmestiku, mida ta kasutas nii treenimisel kui tulemuste valideerimisel, inglise keelde. Leitud vastus tuli seejärel eesti keelde tagasi tõlkida.

Neid meetodeid omavahel kombineerides treenis ta mudeleid järgemööda eesti ja inglise keeles või liitis andmestikud kokku. Kombineerimist võimaldas suurte universaalsete keelemudelite kasutamine töö aluskomponendina. Kaks neist, XLM-RoBERTa ning mitmekeelne BERT, modelleerivad korraga sajakonna eri keele sõnavara ühtses vektorruumis. Selline mudel suudab mitut keelt korraga “mõista”, kuid teda tuli edasi treenida konkreetset ülesannet täitma – küsimustele vastama. Ainult eestikeelsete eksperimentide puhul oli kasutusel ka eesti keele mudel EstBERT .

Parimas eksperimendis oli õige vastuse leidmise täpsus (F1-skoor) 82,4 protsenti. Kuna parima mudeli aluseks on mitmekeelne keelemudel, töötab süsteem tegelikult paljudes keeltes, täpsus on siiski suurim eesti ja inglise keeles.

Magistritöö robootikast: “Pime kaardistamine ja lokaliseerimine väikesemõõdulistele kaevandusrobotitele”

Andreas Nagel, kes kaitses oma magistritöö 2021. aasta kevadel, töötab praegu ühes robotite väljatöötamisega seotud ettevõttes tarkvaraarendajana.

Tema asus informaatika magistrikraadi omandama pärast arvutisüsteemide bakalaureuse õppekava lõpetamist. Informaatika magistriõpingute käigus sai ta aru, et tema huvi on tegeleda robootikaga, täpsemalt robotite tarkvaraga. Robotitele tarkvara arendamine eeldab tervikliku süsteemi mõistmist, samuti teadmisi tõenäosusteooriast ja füüsikast.

Magistritöö kirjutamise käigus lõi ta tipptasemel samaaegse kaardistamise ja lokaliseerimise raamistiku, et anda TalTechis loodud ümbruse kaardistamise ja enese lokaliseerimise võimekus loodust imiteerivale vurrudepõhisele sensorvõrgustikule.

Lihtsamalt öeldes – tehti esimene samm, et panna robotid näriliste viisil vurrude abil pimedas orienteeruma. Üheks sellise navigeerimismeetodi rakenduseks võiks olla näiteks kaevanduskäikude kaardistamine mahajäetud kaevandustes, kus inimestel võib olla ohtlik liikuda.

Miks robotite tarkvara arendamine on oluline teema?

Autonoomsed robotid ilmuvad järk-järgult meie igapäevaellu: metsaistutus-, lumekoristus-, pakirobotid ning isesõitvad autod arendatakse iga aastaga üha paremaks ja targemaks. Ühel hetkel toimub läbimurre nende autonoomse tegutsemise ning otsustamise võimekuses ja nad saavad osaks meie igapäevast. Seepärast tulebki olla veendunud, et tehisintellekt ei teeks vahel „rumalaid” otsuseid ning oleks usaldusväärne. Eriti oluline on usaldusväärsus kriitilistes valdkondades, nagu meditsiin, transport, kõikvõimalikud riiklikud süsteemid ja andmed, kaitsevaldkond jne.

TalTechi infotehnoloogia teaduskonnas tegeletakse just sellega, et tehisintellekti rakendataks hästi läbimõeldult, eetiliselt, (küber)turvaliselt ja usaldusväärselt. Pea kõik infotehnoloogia teaduskonna magistrikavad käsitlevad tehisintellekti ja selle arendamist, kuid just informaatika magistrikaval saab spetsialiseeruda tehisintellekti rakenduste väljatöötamisele.

Sisseastumisinfo leiad siit. Avaldusi saab esitada juba praegu ja seda 6. juuli keskpäevani.

Märksõnad: infotehnoloogia, magistriõpe, robootika, robootikaseadus, TalTech

Tulevik vajab tarku infotehnolooge: informaatika magistriõpe pakub võimalusi robootikast tehisnägemise ja loomuliku keele töötlemiseni

Magistritöö keeletehnoloogiast: “Eestikeelse küsimus-vastus-süsteemi arendamine”

Väljakutse: kuidas süsteemile eesti keel selgeks õpetada?

Magistritöö robootikast: “Pime kaardistamine ja lokaliseerimine väikesemõõdulistele kaevandusrobotitele”

Samsung teeb täna Eestis välkmüügi: ühe tipptelefoni saab eriti odavalt kätte, ent leiab ka tooteid, mida ei ostaks isegi soodushinnaga

Logitech MX Keys S: lihtne ja hea kontoriklaviatuur on kõrget hinda väärt

Logitech G Pro X 2: nii kallid kõrvaklapid peavad tegema laitmatu etteaste

Miks nii? Telia pakub klientidele vana ruuterit, mis maksab konkurentide omadest pea kolm korda rohkem

Rimi avas Noblessneris iseteeninduskaupluse, kus ei ole ühtegi töötajat

Kõik alla 250 euro: 6 väga head robottolmuimejat, mis maksavad vähe ja mida osta soovitame

AOC ja Philipsi Evnia seeria mängurimonitoride mudelirivi sai täiendusi, lisaks tutvustati täiesti uut mudeliseeriat

Logitech MX Keys S: lihtne ja hea kontoriklaviatuur on kõrget hinda väärt

Magistriprogramm, mis aitab firmajuhil hea töötaja leida kasvõi Balilt!

Samsung teeb täna Eestis välkmüügi: ühe tipptelefoni saab eriti odavalt kätte, ent leiab ka tooteid, mida ei ostaks isegi soodushinnaga

Teadlased tutvustavad Tallinnas kõige uuemaid kõnetehnoloogiaid

Sony pälvis TIPA tehnoloogiaauhindade jagamisel võidu neljas kategoorias

Oot-Oot Stuudio annab nõu: kuidas valida funktsionaalne ja vastupidav terassimööbel?

Eesti odaviske tõusev täht Gedly Tugi: on au omada toetajat, kes aitab mul täielikult keskenduda sportlikele eesmärkidele

Eesti oma ettevõte, mis viib filmitööstuse ja ürituskorralduse järgmisele tasemele

Firma suvepäevade korraldamine Naissaarel või Aegnal

Teeme selgeks: kas naastrehvidega on lubatud sõita märtsi või aprilli lõpuni?

Eesti populaarseimad tööandjad põhjendavad, miks nad iga töökuulutuse juures palganumbrit ei avalikusta

Infortar teenis möödunud aastal varasemast kolm korda rohkem kasumit. On vaid üks aga…

Kas keskmise kiiruse kaamerad tulevad? Transpordiamet avalikustas katseprojekti tulemused

Mis vahe on “heal” ja “halval” kolesteroolil ning kui sageli peaks end kontrollima?

Osta kohe: Eesti turul ilma tegevad Hollandi rehvid pakuvad premium-klassi kogemust konkurentidest peajagu odavama hinnaga

Ei aita ka Michelini tunnustus! Restoran SMAK sulges uksed

Proovisõit: Mazda pani MX-30 elektriautosse rootormootori – põnev, aga ühe suure murega

Magistritöö keeletehnoloogiast: “Eestikeelse küsimus-vastus-süsteemi arendamine”

Väljakutse: kuidas süsteemile eesti keel selgeks õpetada?

Magistritöö robootikast: “Pime kaardistamine ja lokaliseerimine väikesemõõdulistele kaevandusrobotitele”

AOC ja Philipsi Evnia seeria mängurimonitoride mudelirivi sai täiendusi, lisaks tutvustati täiesti uut mudeliseeriat

Logitech MX Keys S: lihtne ja hea kontoriklaviatuur on kõrget hinda väärt

Magistriprogramm, mis aitab firmajuhil hea töötaja leida kasvõi Balilt!

Samsung teeb täna Eestis välkmüügi: ühe tipptelefoni saab eriti odavalt kätte, ent leiab ka tooteid, mida ei ostaks isegi soodushinnaga

Teadlased tutvustavad Tallinnas kõige uuemaid kõnetehnoloogiaid

Sony pälvis TIPA tehnoloogiaauhindade jagamisel võidu neljas kategoorias

Ära jää ilma päeva põnevamatest lugudest