Ole homseks valmis: arvutid saavad juba aru, mis maailmas toimub. Milleni see viib?

Pane tähele! Artikkel on ilmunud enam kui 5 aastat tagasi ning kuulub Geeniuse digitaalsesse arhiivi.
autopiloot_tesla.jpg

Üha kasvav infohulk nõuab andmete aina kiiremat ja tõhusamat analüüsi. Järjest olulisemaks on muutumas ka vajadus visuaalse informatsiooni järgi, sestap tähtsustub aina ka arvutinägemine ehk arvutite võimalus visuaalset informatsiooni analüüsida ja töödelda ehk lihtsamalt öeldes aru saada, mis pildil toimub.

Enamike ulmefännide jaoks ei ole arvutinägemine võõras. 1968 aastal linastunud Stanley Kubricku ulmeklassikas "2001 Kosmoseodüsseia" keerles kogu lugu ümber intelligentse arvuti HAL9000, kes lisaks visuaalse informatsiooni analüüsimisele kogu laevas oli võimeline aru saama meeskonna jutust ilma neid kuulmata – lugedes nende sõnu välja lihtsalt huulte liikumisest.

https://www.youtube.com/embed/1s-PiIbzbhw?feature=oembed
Ehkki tänased arvutid veel perfektselt huultelt lugeda ei suuda, ei ole 50 aastat tagasi kauge ulmena tundunud olukord enam nii kaugel, kui toona näis.

Masinnägemist on tööstuses kasutatud juba aastaid. Erinevate toodete ning nende osade automaatseks kvaliteedikontrolliks, tootmisliinil asuvate esemete paigutuse ning asendi kontrollimiseks, robotite juhtimiseks ning siltide ja seerianumbrite lugemiseks. Kuid järjest enam on arvutite võimalus visuaalsest ümbruskonnast aru saada lähenemas ka tavakasutajale.

Mängukonsool aitab operatsioonisaalis

Üks populaarseimaid koduseid seadmeid, mis otseselt kasutajaid vaatab, on ilmselt Microsofti Kinect tehnoloogia. Süsteem, mis visuaalse jälgimise põhjal kannab kasutaja liigutused, viiped ning häälkäsklused üle virtuaalmaailma, kus virtuaalne avatar mängija käskusid kopeerib või arvuti liigutuste peale mõnd tegevust või parameetrit muudab.

Kasutades kaamerat ning sügavust analüüsivat infrapunakaamerat on võimalik välja arvutada, kui kaugel kasutaja kehal olev suvaline punkt kaamerast asub. Samamoodi kaardistatakse ümbritsev ruum, et seal liikuvaid objekte jälgida. Nii on võimalik objektide asukoha muutumine üle kanda arvutiprogrammi. Kuid Kinectiga saab teha rohkemkui ainulttundide viisi teleka ees tantsides Dance Centralit mängida.

Tänaseks on Microsofti tehnoloogiat kasutatud näiteks insuldi üle elanud inimeste taastusraviks. Inimesele antakse spetsiaalsed harjutused oma koordinatsiooni parandamiseks ning Kinecti kaamera jälgib tema harjutusi, analüüsides tulemusi ja arengut. Nii ei pea inimene veetma kuid spetsiaalses taastusraviasutuses, vaid võib seda teha oma kodus.

Kinectikasutatakse ka operatsioonisaalides, kus kirurg vajab patsiendi kohta olulist informatsiooni, kuid ei saa kasutada steriliseerimata klaviatuuri või hiirega arvutit. Kinecti süsteemi abil saab ta käeviibete abil tuua ekraanile just selle informatsiooni, mida hetkel vaja. Samuti on Kinecti edukalt kasutatud viipekeele tõlkimiseks tavateksti.

Facebook seletab, mis pildil on

Lisaks kuulmispuudega inimestele on arvutinägemine täna abistamas ka nägemispuudega inimesi. Äsja käivitas Facebook teenuse, mis kirjeldab nägemispuudega kasutajale uudisvoos olevaid pilte. Läbi piltide analüüsi on võimalik kindlaks teha, mis on pildil ning seda mõne märksõnaga kasutajale kirjeldada.

Sarnast süsteemi on loomas ka Microsoft, kelle "Seeing AI" rakendus on teoreetiliselt võimeline aru saama pildil oleva inimese vanusest ja isegi emotsioonidest.

https://www.youtube.com/embed/3WP7Id8SxYQ?feature=oembed
Sääraseid süsteeme ei saa kasutada mitte ainult nägemispuudega inimestele fotode kirjeldamiseks vaid ka näiteks kontekstitundlike fotopankade loomiseks. Otsides tuhandete fotode seast just seda õiget, on kasutajal tavalises kõnekeeles oma soovi võimalik kirjeldada ning süsteem leiab fotosid analüüsides soovitud pildi.

Videosisu analüüs muudab rongiliikluse turvalisemaks

Teine suur valdkond, kus arvutinägemine kasuks tuleb, on autod. Google'i isesõitev auto pole veel kasutajateni jõudnud, kuid Tesla autopilooti saavad paljud Model S juhid täna juba kasutada. Just Tesla kasutabki ümbritsevast info hankimiseks radarit, 360-kraadist sonarit ning pidevalt pilti analüüsivat kaamerat, mis võimaldab autol pikki teelõike autol iseseisvalt läbidailma, et juht peaks sõiduki juhtimisele keskenduma.

Arvutinägemine põhineb täna suuresti võrdlusel ning eeldustel. Näiteks selleks, et tuvastada mõnd eelnevalt määratletud objekti, võrdleb arvuti igat pildil olevat eset või objekti etteantud parameetritega. Nii võib arvutinägemise alla liigitada ka tegelikult nutiseadmetes leiduvaid sõrmejäljelugejaid.

Samuti kasutatakse tihti ka videosisu analüüsi ehk VCA (Video Content Analysis) süsteeme. Videoanalüüsi kasutatakse rannikuseires, et tuvastada laevu, mis riigi vetes seilata ei tohiks. Hiina on paigutanud kaamerad kiirrongide poolt läbivate raudteelõikude serva. Kui kaamera tuvastab objekti, mis võib põhjustada rongile vigastuse või rööbastelt väljasõidu, vähendatakse automaatselt rongide kiirust. Lisaks on viimastel aastatel asutud kasutama videosisu analüüsi lennujaamades, kus inimeste marsruut on teada. Inimene väljub lennukist ning suundub kas järgmise värava või pagasivööde juurde. Kui ta oma teelt eksib, tuvastab süsteem ebahariliku käitumise.

Võib loota, et lähitulevikus on arvutid võimelised visuaalsest infost eristama ka inimeste nägusid piisavalt kindlalt, et foto või videopildi põhjal oleks võimalik tuvastada, kellega tegu. See võimaldaks läbi turvakaamerate pildi analüüsi kindlaks teha jälgitava inimese teekond ja isegi tema teod.

Populaarsed lood mujal Geeniuses

Igal argipäeval

Ära jää ilma päeva põnevamatest lugudest

Saadame sulle igal argipäeval ülevaate tehnoloogia-, auto-, raha- ja meelelahutusportaali olulisematest lugudest.