Tehismõistus aga vajab arenguks palju kvaliteetseid andmeid. Rõhutatakse kättesaadavust, kvaliteeti, ühtset vormingut ja serveriparkide toetamist. Olles väga agar IT-riik, on meil kindlasti huvi selles mängus kaasa lüüa,” selgitas Luberg.
Täpsemalt Euroopa Liidu tehismõistuse arengutest võib lugeda Sirbi artiklist.
Kui anonüümsed me tegelikult oleme?
Kui Google, Microsoft ja Facebook meie kohta andmeid koguvad, siis räägitakse reeglina anonüümseks tehtud ehk isikustamata andmetest. See tähendab, et kes iganes andmeid haldab, ei saa neid siduda kindla inimesega. Lubergi sõnul ei taga anonüümsus aga tingimata privaatsust.
“Selliseid näiteid on palju, kus anonümiseeritud andmeid teiste allikatega kõrvutades on suudetud valdav enamus tulemusi taas isikustada.
Näiteks lahendati juba 2011. aastal üks Kaggle keskkonnas (keskkond, kus pakutakse välja mitmesuguseid andmetöötlusväljakutseid) avaldatud väljakutse seoste ennustamiseks anonüümitud Flickri andmeid de-anonüümiseerides.
Seetõttu on andmete tegelikuks anonümiseerimiseks vaja teha rohkem kui lihtsalt kasutajate identiteet kustutada.”
Kust alustada, kui suurandmed sind huvitavad?
Lisaks andmekaitsele tuleb aina enam rõhku panna ka andmete korrastamisele ja sellele, kuidas olemasolevaid andmeid enda jaoks tööle panna. Lubergi sõnul on jätkuvalt suureks väljakutseks andmete töötlemine.
“Tehismõistuse valdkond ei piirdu ainult masinõppega, kuigi masinõppe rakenduste arendus on jätkuvalt olulise kaaluga tegevus. Oluline on uurida, milliseid probleeme saab kogutud andmeid kasutades lahendada ja kuidas seda teha.
Näiteks Eesti teadlastele on alates 2021.-st aastast kättesaadavad Soome, Kajaanisse rajatava superarvuti Lumi ressursid. Meil on vaja inimesi, kes oskaks neid ressursse kasutada meie jaoks oluliste probleemide lahendamisel.”
Inimesel, kel on suurandmete vastu huvi, soovitab Luberg alustada programmeerimise õppimisest.
“Väga heaks kohaks, kus alustada programmeerimise õppimisega, on Tallinna Tehnikaülikooli informaatika bakalaureuse õppekava. Kuna andmeid on palju ja neid tuleb juurde, siis oskus andmete töötlemist automatiseerida loob vundamendi, millele saab ehitada erinevaid enda huvidele vastavaid oskusi.
Paljude ettevõtete esindajate sõnul on kõige paremad andmeanalüütikud need inimesed, kes oskavad programmeerida ja mõistavad ka statistika ja tõenäosusteooria põhitõdesid. Kõiki neid asju saab informaatikas õppida,” rääkis ta.
Loe TalTechi informaatika õppekava kohta lähemalt siit.
Selles rubriigis vahendame maailma teadusuudiseid, tulevikuvaateid ning oma kõige põnevamaid tegemisi.