Sharemindi lugu: saladuste hoidja Ameerika kaitsekompleksist Eesti e-riigini

Pane tähele! Artikkel on ilmunud enam kui 5 aastat tagasi ning kuulub Geeniuse digitaalsesse arhiivi.
screen_shot_2015-12-29_at_17.09.24.png

Mida need Tartu geniaalsed matemaatikud nüüd siis välja on mõelnud? “Meie lubadus on: superandmebaas ilma superandmebaasita,” ütleb Dan Bogdanov konkreetselt.

Bogdanov on projekitjuht Eesti ettevõtetest Cybernetica, mis on kokku kogunud Eesti helgeimad peas krüptograafias ja infoturbes. Oma lubadusega peab ta silmas, et “superandmebaas” võib olla korraga ülimalt kasulik, sest sellesse võiks koondada kõik ühe inimese, firma või kasvõi kõigi kodanike kohta käiva info. Aga see on ka hirmutav: sellise andmebaasi haldaja saab rohkem võimu kui võiks ette kujutada “1984-a” lugedes.

Ja nii tulebki mängu Bogdanovi ja tema meeskonna tehtud tarkvara Sharemind, mis lubab andmeid analüüsida ilma, et neid analüüsijale näha oleks.

Et aru saada sellest tarkvarast, millel näevad suurt tulevikku maailma kahe olulisima piirkonna USA ja Euroopa võimukandjad, läksin Emajõe-linna külla Cybernetica kontorisse.

Mis asi see siis tegelikult on?

Kui "konfidentsiaalsete andmete töötlemise süsteem” ei ütle lugejale palju, siis taandubBogdanov Sharemindi selgitamiseks tahvli ette.

Oletame, et andmebaasis on kirjas, et Mari on 34-aastane ja Toomas 52-aastane. Ja oletame, et meil on vaja nende vanustega teha statistikat, algatuseks kõige lihtsama tehtena need kokku liita.

Üks võimalus on andmebaasi lihtsalt vaadata ja näha, et 34+52=86.Aga nii näeksime ära, kui vana on Mari ja Toomas, ja just seda privaatsust lubab Sharemind kaitsta.

Hans Lõugas

Sharemind jagab nimelt iga arvu juhuslikult kolme eraldiseisvasse serverisse. Esimeses serveris on Mari vanus 7, teises 18 ja kolmandas 9. Toomase vanus on esimeses 18, teises 18 ja kolmandas 16. Kui programm andmete analüüsimiseks andmed kokku loeb, saab teada inimeste päris vanuse ja otsitud andmed (7+18+9=34 ja 18+18+16=52 ning 34+52=86).

Kuid inimene, kes pääseb ligi ühele serverile, ei saa midagi teada tegelikest andmetest, sest näeb seal ainult ühte osa.

See on muidugi lihtsustatud näidis keerulisematest arvutustest, mida Sharemind andmetega teeb, et need kildudeks lüüa ja nende privaatsust säilitada.

Aga kõige aluseks on tõepoolest kolm eraldatud serverit, see pole lihtsalt näide. Käin Bogdanovile peale ja palun oma silmadega Sharemindi töötamas näha, mispeale toob ta Cybernetica kontori köögist lõunapausilt ära ühe arendaja. Tanäitabki oma arvuti ekraani, kus jooksevad testprogrammis andmed kolme Sharemindi serveri sees.

Mida sellega siis arvutada?

Mida digitaalsemateks muutuvad meie ühiskonnad, seda rohkem tekib ka andmeid, mida on korraga vaja analüüsida ja mida keegi tahab hoida privaatsetena. "Näiteid võib tuua kõikjalt," ütleb Bogdanov. Selleks võib olla kasvõi veebisaidi külastajate kasutajaprofiil. “Meie meedia on kujunenud selliseks, et maksame veebilehe pidajale oma andmetega. Külastajate huvidest ja andmetest tehakse reklaamiandjale pakkumine – aga seda tehes ei peaks paljastama konkreetsete inimeste huvid, vaid analüüsi saaks teha privaatselt,” toob Bogdanov näite võrgumeediast.

Peeter Langovits (PM/Scanpix)

Tohutult võimalusi ootab avaliku sektori tasemel. “Eesti on täiesti erakordne riik, kuid suur osa maailmast ei kasuta selliseid infosüsteeme nagu meie,” räägib ta. Näiteks muidu tehnoloogiliselt kõrgeltarenenud Jaapan on oma bürokraatias ikka veel väga kohmakas. “Sa võid elada ühes prefektuuris (haldusjaotuse üksus – toim), saada sealt sotsiaaltoetust ja siis minna teise prefektuuri ja sealt samuti edukalt raha saada. Üks bürokraatia ei suhtle teisega, andmeid ei jagata ja mingit tsentraalset süsteemi pole,” iseloomustab Bogdanov. Sharemindi taolise süsteemiga ei peaks ükski asutus oma andmeid loovutama ega kartma nende lekkimist, kuid andmete põhjal järeldusi saaks teha ka välised organid.

Et juttu tõestada, ongi tegelikult Bogdanovi magistritööst välja kasvanudSharemind Eestis proovile pandud.

“2006. aastal hakkasin seda programmeerima, järgmine aasta sain magistrikraadi, siis tulin Cyberneticasse tööle.” Kui ta viis aastat tagasi sai Eesti telekommunikatsiooni ja infotehnoloogia liidult (ITL)Ustus Aguri stipendiumi, ütles ta ettevõtjatele – olgu, vaatame mida Sharemindiga teha saab. Teet Jagomägi ITLi juhatusest oli päri ja veenis liikmeid osalema.Nii koostati toona IT-sektori “tervisearuanne”, kus firmad andsid oma ärilised näitajad analüüsi jaoks ilma konkurentidele paljastamata, kuidas neil täpselt läheb.

Tänavu suvel tehti aga hoopis julgem proov. “Me võtsime haridusministeeriumist IT-erialadel õppijate andmed ja ristasime need maksuametist samade inimeste andmetega selle kohta, palju nad on sotsiaalmaksu maksnud, mis näitab sisuliselt, kas nad on õpingute ajal tööl käinud,” selgitab Bogdanov. “See oleks muidu ennekuulmatu, sest Eestis kaitseb seadus otseselt maksusaladust." Aga Sharemindiga oli võimalik õppijate andmeid nii analüüsida, et üksikisiku andmeid kellelegi ei paljastatud.

Sharemindi senine suurim edulugu on kindlasti DARPA progammi jõudmine. Ameerika valitsuse kaitsevaldkonna uurimisasutus Defense Advanced Research Projects Agency töötab välja uusi militaartehnoloogiaid. Ent loomulikult ei tähenda see ainult maailma arenenuimate robotite võistlusi või isejuhtivate kuulide väljatöötamist. Sharemindi võimalus analüüsitavaid andmeid salajas hoida on selles valdkonnas igal moel kasulik.

Üks tulemus oli projekt Maa ümber tiirlevate satelliitide kokkupõrgete vältimiseks. Nii kommerts-, aga eriti militaarsatelliitide trajektoor on hästivalvatud saladus, mida ükski riik teistele ei loovutaks. Kuid liiklus Maa orbiidil on üha tihedam ja satelliitide kokkupõrkeid saaks ära hoida ainult siis, kui nende trajektoore võrrelda. Selleks tuligi appi Sharemind.

“DARPA programm oli muidugi alguses raske. See, et me sinna saime, oli muidugi suures osas juhus, aga saime. Esimene aasta pidime end väga tugevalt tõestama, aga nüüd on see vilja kandnud,” muigab Bogdanov. Kuigi firma sai 2011–2014 DARPA programmis osalemise eest ka ligi 700 000 dollarit, on suurem kasu ilmselt ülemaailmne prestiiž.Ja sama tähtsana on jalg nüüd ukse vahel. “Cybernetica kutsuti nüüd tagasi DARPA uude nelja ja poole aastasesse programmi, kus me ei ole küll Sharemindiga, aga tegeleme ikka andmekaitsega,” lisab ta.

Võiks arvata, et kui keegi on välja töötanud ühe kasuliku ja unikaalse programmi, siis tehakse see kohe tooteks, patenteeritakse paremad osad ära ja asutakse usinalt müüma. Cybernetica on aga teistsugune ettevõte.

“Esiteks pole midagi patenteerida. Kui, siis peaksime vaatama 1980-ndatel tehtud teadustöö poole, aga see on prior art,” ütleb Bogdanov. Selle asemel on Cybernetica suurelt osalt teadusasutus. Firma sisemiselt seatud eesmärk on see, et vähemalt 10% töötajatest oleksid doktorandid. Paljuski avaldatakse tehtud töö eelretsenseeritud teadusajakirjades, mis garanteerib, et tegeldakse teaduslikult oluliste teemadega.

See kõik ei tähenda, et keegi teine maailmas Sharemindiga midagi sarnast ei teeks. "Väga tugev meeskond on Taanis Arhusi ülikoolis, aga sama tehakse ka näiteks Jaapanis NTT Labsis ja USA-s.” Ameerikas on õigupoolest tekkinud lausa Sharemindi kloon, möönab Bogdanov.

Kas tegu on tehnoloogia teadliku kopeerimisega? "Me oleme neist teadlkud küll ja oleme nendega suhelnud. Aga tegelikult me teame kindlalt, et oleme neist praegu kõvasti ees. Oleme konkurentidest kiiremad.” Tegelikult pole teistest sarnast eesmärki taga ajavatest teadlastest või ettevõtjatest rääkimine tema sõnulasjakohane. "Asi on selles, et turg kasvab praegu kõigi jaoks ja me pole veel sisuliselt konkurendid. Üks hetk jõuame ka selleni, et võtame üksteiselt turgu, aga praegu veel mitte."

Maha magatud võimalus: USA-le jagatakse Euroopa lendajateisikuandmed

Lõppude lõpuks peaks Sharemind aga valmis saama selliseks kommertstooteks, mida maailmale päriselt pakkuda saab. Vajadust selle järele oleks tervel Euroopal.

Äsja võeti vastu Euroopa uus andmekaitsedirektiiv, mis pani paika suuna: Euroopas läheb andmekaitse igatahes tugevamaks kui seni ning vajadus selliste privaatsust kaitsvate andmetöötluslahenduste järele on selge.

"Sharemind'i tarkvara tutvustati meie andmekaitse tiimi liikmetele Brüsselis ja see leidis väga head vastuvõttu,” meenutab Marju Lauristin, kes on europarlamendi andmekaitse direktiivi raportöör. Tema sõnul on uues regulatsioonis selgelt rõhutatud prioriteet selliste privaatsust tagavate andmetöötlustehnoloogiate loomine.

"Sharemind'il on selles suhtes minu arvates väga head võimalused kujuneda Euroopa Liidus tunnustatud brändiks, taotledes tulevikus ka EL komisjoni sertifikaati privaatsust turvava andmetöötluse tunnustatud tehnoloogiana. Sellise sertifikaadi sisseseadmine on on määruses ette nähtud,” ütleb Lauristin.

Poliitilised otsused ongi Sharemindi tuleviku suhtes määrava tähtsusega. Näiteks toob Bogdanov PNRi ehk lennureisijate isikuandmete USA-ga jagamine. “PNR-id oleks suurepärane materjal Sharemindi taolisele tööriistale: vaja on teada, kas [terroristi] nimi on lennureisijate seas, aga teadma ei pea kõikide inimeste andmeid.”Euroopas on olnud aastaid vastuseis, et ameeriklastele siinsete lendajate isikuandmeid anda. Ent ometi muutus Pariisi rünnakute järel poliitiline meelsus nii, et detsembri alguses otsustati isikuandmed ameeriklastele anda.

X-tee moodul: viis riiki andmete põhjal juhtida

Samal ajal võiks Sharemindi oodata suurepärane proovilepanek maailma ühe arenenuima e-taristuga riigis – Eestis.

“Praegu käib ju riigi juhtimine paljuski statistika põhjal.Statistikaametile jagub mul ainult häid sõnu, nad teevad väga tugevat tööd, aga on paraku alarahastatud,” ütleb Bogdanov. Minevikku peegeldava statistika asemel võikski otsuseid langetada praeguste andmete pealt, mis on ju Eestis kõik olemas.

"Meie ideeks on luua X-tee külge Sharemindi moodul. See tähendaks, et kui näiteks peaminister tahaks mingi poliitika jaoks A/B stsenaariumid läbi mängida, siis võiks ta soovitud analüüsi saada otse andmetest,” selgitab ta. X-teega on liidestatud suur hulk Eesti riiklikke andmebaase ja kui Sharemind oleks juba X-tee küljes, saaks selle kaudu teha riiklike baaside põhjal arvutusi. See tähendaks kuudepikkuse ootamise asemel võib olla ainult paari päeva.

"Meie lubadus on: superandmebaas ilma superandmebaasita,” ütlebki Bogdanov, kuidas Sharemind aitaks kogu riigi andmeid korraga analüüsida ilma, et need oleks ühte kohta kokku kogutud.

Kui huvi X-tee kasutajate seas selle vastu tekib, tuleb Sharemindiga koostöö kindlasti plaani võtta, ütleb riigi infosüsteemi ametis (RIA) X-teed arengut juhtiv Heiko Vainsalu. "Tehnilise teostatavuse osas ei ole ma hetkel teadlik ühestki aspektist, mis võiks seda asja takistada. Ühe X-tee rakendusena oleks selline standardiseeritud liides täiesti mõistlik,” hindab Vainsalu. Tema sõnul saaks see kolmanda osapoole algatusel (loe: rahastusel) juhtuda juba 2016 aastal, kuigi realistlikum oleks aasta-kaks hiljem.

Bogdanovi sõnul on Sharemind X-teele loogiline partner ja vaatab põhja suunas, kus novembris soomlased meie X-teel põhineva samasuguse süsteemi käivitasid. “Põhimõtteliselt on nii, et kui võtad X-tee kasutusele, siis on mõne aasta pärast ka Sharemindi vaja."

Populaarsed lood mujal Geeniuses

Igal argipäeval

Ära jää ilma päeva põnevamatest lugudest

Saadame sulle igal argipäeval ülevaate tehnoloogia-, auto-, raha- ja meelelahutusportaali olulisematest lugudest.