Uudis

Proovi ise järele: uus Eestis tehtud domeeninime soovitaja on tõesti väga nutikas

Nimetööriist asub aadressil domeen.ee.

Eestis on valminud Elkdata ja Tartu ülikooli koostöös uus domeeninimesoovitaja. See pakub endale domeeninime otsivale inimesele alternatiive juhuks, kui tema soovitud domeen on juba kasutusel. Tööriist töötab nii eesti kui ka inglise keeles ja saab automaatselt ise aru, mis keel on sisestatud.

Nimesoovitustööriist asub aadressil domeen.ee. Tööriista kuvatakse hetkel vaid siis, kui otsida domeeni, mis on juba kinni, näiteks geenius.ee, eesti.ee jne.

Miks seda vaja on?

“Meie lehel Veebimajutus.ee ja Domeen.ee tehakse iga päev väga palju vaba domeeni otsinguid, millest vaid vähesed saavad vastuseks “domeen on registreerimiseks saadaval”. Ehk paljude jaoks on raske leida endale sobivat domeeninime. Tihtipeale alustatakse ka uue ettevõtte loomisel ettevõtte nime leidmist domeenist, sest soovitud laiendiga võiks sama nimega domeen ka vaba olla,” selgitab Richard Rõõmusaar Elkdata poolelt, miks sellist tööriista neile vaja oli.

Kui geenius.ee on juba võetud, siis äkki sobivad need variandid?

“Meie soov oli luua Eesti inimestele tööriist, mis abistaks sobiva domeeni leidmise teekonnal – annaks nõu, küsiks vajadusel küsimusi, pakuks välja alternatiive. Selles ei ole maailma mõistes midagi uut, inglisekeelsel turul on antud probleemi paljud lahendanud, igaüks omamoodi,” ütleb ta. Eesti keelt silmas pidades seda keegi tema teada varem teinud ei ole.

Tema sõnul on veel kindlasti on võimalik lahendust paremaks teha ning järgmises sammuks tahavad nad reaalsetelt kasutajatelt (domeeninime otsivatelt inimestelt) veebis tagasisidet soovitustele ka küsima hakata ning vastavalt tagasisidele ka parendusi teha.

Sõnade vektoresitlus

Domeenide nõu genereerija on mitmekeelne ning hetkel toetab see inglise- ja eestikeelseid domeene, selgitab keeleteadlane Mark Fishel, kes aitas tööriista teha Tartu ülikooli poolelt.

“Samas aga kasutab see keelest sõltumatut lähenemist, mis põhineb sõnade vektoresitustel ning vene, soome või rootsi keele lisamine ei oleks väga keeruline,” räägib ta. Lisaks teevad vektoresitused lahendust paindlikuks, et see ei piirduks ainult otseste sünonüümidega: nt “leib” –> “pirukas”, “müsli”, “kukkel” jne.

Fisheli sõnul oli üks huvitav väljakutse eesti keele käänete käsitlemises: ühest küljest oli vaja algvormide analüüsi, et näiteks sõna “sõbraga” ei saaks  hallatud teistmoodi kui sõna “sõber”. Teisest küljest aga ei tohi kõiki sõnu algvormi panna: näiteks peab võimaldama, et “vesivärava” saaks käsitletud kui tänavanimetus (sarnased: ), kuid “vesivärav” on juba omaette sõna (sarnased: “jäävärav”, “vesipääs” jt).

Teine kohalik eripära on täpitähed: domeeninimedes sageli kaotatakse täpitähte ja teisi diakriitilisi märke ja sõna “tööõpetus” asemel kirjutatakse “tooopetus”.

“Selleks, et leida sarnaseid nimetusi aga peab neid täpitähti taastama. Nt. sõna “noor” sarnased nimetused on “nooruk”, “poiss” kt, kuid “noorid” käsitletakse kui “nöörid” ning see juba genereerib sõnu nagu “klambrid”, “nõelad” ja nii edasi,” rääkis Fishel.

“Selline võimaluste paljusus tegi tervet projekti põnevaks väljakutseks, ning nende haldamiseks kasutasime hübriidlahendust, mis kasutab nii lingvistilisi töötlusvahendeid (näiteks eesti keele haldamiseks vabavaralist teeki EstNLTK), mitmekeelseid vektoresitusi kui tehisnärvivõrkude põhist ja tõenäosusliku masinõpet,” ütles ta.

Telli Geeniuse uudiskiri

Saadame sulle igal argipäeval ülevaate tehnoloogia-, auto- ja rahaportaali olulisematest lugudest.