Tõlkebüroo katse: Google’i tõlge polegi nii halb?

See on nagu Google’i tõlge! Nii öeldakse tihti kehva, valedest terminitest või toortõlkelistest väljenditest kubiseva teksti kohta. Kui halb siis ikkagi Google’i tõlge on? Teemat uuris tõlkebüroo Eiffel.

Selleks, et välja selgitada, kas ja kuidas Google’i tõlge toimib, valisime välja kolm eri valdkonna teksti ja lasime need Google Translate’il (GT) inglise-eesti suunal ära tõlkida. 

Seega, kas tõlkebürood peaksid kartma, et masintõlge võtab neilt peagi töö? Vaatame järele.

1. Turundustekst

Teksti allikas: https://support.monese.com/

Kuidas tundub?

  • Esmamulje: mõte on üsna täpselt edasi antud, aga väljendus puine – st tõlge on suuresti arusaadav, ent vajab lihvimist.
  • Tegu pole toortõlkega, aga programm on selgelt hätta jäänud nii mõnegi mõtte edasiandmisega („finantsse heaolu omadused“, „eraldage säästud igapäevastest kulutustest kõrvale“) kui ka konteksti paremini sobivate väljendite leidmisega (konto tegevus, hankige konto väljavõtteid).
  • Järeldus: kui soovid tõlget avaldamiseks kasutada, vajad toimetajat ja/või copywriter’it. 

Hinne: 4–

2. Juriidiline tekst 

Teksti allikas: https://anglofon.com/confidentiality-agreement?

Kuidas tundub?

  • Esmamulje: mõte on üsna täpselt edasi antud ja stiil vastab juriidilisele tekstile; tõlge on asjakohane.
  • Programm on pea kõik õigesti ära tõlkinud
  • Paraku on ära tõlgitud ka tõlkimist mittevajav: „without limitation“ ja „including but not limited to“ (tarbetud kordused).
  • Mõistagi on tekstis mitmeid sõnakasutusi, mis ei ole kõige sobilikumad („asjaajamine“, „mõistlik ettevõtja“)
  • Järeldus: kuna lepingute ülitäpne tõlge on väga tähtis ja lepingud on üldjuhul suuremahulised dokumendid, ei soovita olulisi lepinguid lasta Google’i tõlkega teha – küll aga sobib see (vähemasti inglise-eesti keelesuunal) üsna hästi võõrkeelsest lepingust arusaamiseks.

Hinne: 4–

3. Tehniline tekst 

Teksti allikas: http://dtm-print.eu/manuals/LX810-Rewinder-EN.pdf

Kuidas tundub?

  • Esmamulje: tekst on kohati arusaamatu. 
  • Tõlge vajab põhjalikku toimetamist (sh keelekorrektuuri), sest programm on eksinud terminitega („the guide“ on tõlgitud teises lauses hoopis „juhiks“, muutes terve lause arusaamatuks; „established“ on tõlgitud kui „kindlaks teha“, kuigi parem oleks „seada“ vmt). Ka on see hätta jäänud käänamisega. Siinkohal tulebki välja asjaolu, et Google’i tõlge pole üksikuid sõnu tõlkides täpne ning võib toota ka täielikku jura.
  • Järeldus: juhendi eestikeelne tekst vajab inglise keelt valdava toimetaja teravat pilku. 

Hinne: 3

Mis järeldusi saame tõlkebüroona teha?

  1. GT on üksikute sõnade tõlkimisel ebatäpne

Miks? Sest GT ei ole sõnastik. Programm teeb statistilisi oletusi, mis peaks vasteks andma sõna kõige sagedamini esineva tähenduse. Ilma kontekstita satub GT aga segadusse. 

Tekstilõikudega on teine lugu. Aastal 2016 hakkas Google’i tõlge kasutama uut algoritmi GNMT (Google Neural Machine Translation), mis jagab lause omavahel seotud osadeks ja tõlgib neid just kontekstist lähtudes. Google Researchi väitel vähendas see vigu 55–85% võrra. 

Ka meie analüüsist oli näha, et üldiselt saab Google’i tõlge lühikeste tekstidega üsna hästi hakkama. Siiski vajavad kõik tekstid (keele)toimetaja kontrollivat silma ning stiiliparandusi. 

Juriidilise tõlke stiil oli asjakohane, samas kui turundustekst vajab kindlasti sujuvamaks muutmist. 

Kõige kehvemini sai programm hakkama tehnilise tekstiga. Tõlge oli kohati arusaamatu ning osa sõnu valesti tõlgitud. 

  1. Täpsus sõltub keeltest

Kui GT 2006. aastal turule tuli, jättis selle kvaliteet soovida. Erinevate uuringute kohaselt on see aga ajas märgatavalt paranenud, seda just suurkeeltest (inglise, prantsuse, itaalia) suurkeeltesse tõlkimisel.

Selle artikli näidetest on näha, et inglise-eesti tõlgetes jäi programm hätta eelkõige käänamise ja vahel konteksti sobivaima sõna leidmisega. 

Erinevates katsetes on selgunud, et näiteks vene-eesti keele puhul valib programm tihti hoopis ingliskeelse vaste ja eksib ka lausete vormistamisel. Miks see nii on?

Põhjus on lihtne. Nimelt tõlgib Google eesti keelest võõrkeelde või võõrkeelest eesti keelde tõlkimisel teksti esmalt inglise keelde ja alles seejärel sihtkeelde. See suurendab „tõlkes kaotsimineku“ tõenäosust.

Seega on eesti keele puhul eesti-inglise keelepaar ainus, mida Google’i tõlkeprogrammis kasutada tasuks! 

*Euroopa Parlamendi dokumentide kogum, mis on EL mandaadiga ametialaselt tõlgitud 21 keelde.

  1. GT pole suurem asi copywriter 

Kõikide meie eksperimendi käigus tõlgitud tekstide loovus ja löövus jätavad soovida –, aga copywriter’iks polegi Google’i tõlge ju välja töötatud. 

Samas, võib öelda, et juriidiline stiil on antud artiklis toodud näite põhjal Google’i masintõlkel üsna käpas. 

Kokkuvõttes väärib Google’i tõlge inglise-eesti keelesuunal 5-palli skaalal hinnet 4-. Tõlkebürood GT täna seega veel ei asenda! 

Mida selle teadmisega pihta hakata?

Kui vajad kiiret tõlkeabi, pole teksti täiuslikkus tihti esmatähtis ja Google’i tõlge võiks olla omal kohal.

Ent just ametlikumate tekstide puhul tuleb Google Translate’i kasutamisel olla tähelepanelik, et su sõnum ei sisaldaks ebatäpsusi, veidraid väljendeid või kehva õpilase koolikirjandi keelelapsusi-apsusid.

Kui tõlgid täiesti tundmatust keelest, jääb sul üle usaldada tõlkeprogrammi tööd üksnes emakeelest lähtuvalt. Võimalike vigade leidmiseks on vahel abiks ka edasi-tagasi tõlkimisest (back-translation). Kõige kindlam on aga kasutada professionaalse tõlkija abi.

Kuidas Google’i tõlget kiiresti parendada?

  1. Veendu sisu täpsuses

Selleks on kõige lihtsam panna kaks teksti kõrvuti ning võrrelda lähte- ja sihtkeelt.

  1. Vaata üle terminid

Järgmisena vaata üle, et terminid oleksid õiged – asenda ebamäärased väljendid või sõnad vajadusel asjakohasematega.

  1. Edasi sõltub teksti toimetamine sellest, mida sa täpselt vajad

Kui vajad lihtsalt korrektset teksti, siis

– korrigeeri grammatikat ja lauseehitust

– ühtlusta teksti stiil
Kui vajad loovamat lähenemist, siis

– kehastu toimetajaks või loovkirjutajaks
ning proovi anda tekstile vajalik
löövus ja lennukus + kontrolli üle
grammatika + ühtlusta stiil

Selline lähenemine sobib eelkõige lühemate tekstide puhul, tagades kiiresti võimalikult hea tulemuse. Pikemate tekstide puhul eeldab Google’i tõlke toimetamine, et sul on piisavalt aega ja kogemusi üsna spetsiifiliseks keeletööks.

Masintõlget kasutavad ettevõtted näiteks tehniliste juhendite, tootekirjelduste ja isegi lepingute tõlkimiseks. Masintõlge tuleb aga ALATI lasta (tõlkebürool) üle toimetada. Ning selline lähenemine tõlkimisele on igati mõistlik, sest see aitab tõlkekulusid ligi 40% võrra kärpida.

Spoilerihoiatus*

Google Translate kasutab tõlkimisel statistilisi meetodeid. Selle puhul rakendatakse masinloetavasse vormi kohandatud hiigelsuurt paralleelkorpust (nt Europarl Corpus), kus on lähte- ja sihtkeeles kõrvutatud laused ja sõnad, mille alusel leitakse tõlkevasted. 

Seega, Google’i masintõlke algoritmid ei rakenda grammatilisi reegleid, vaid põhinevad statistilisel või mustrianalüüsil. Kuna aga iga keel on mitmetähenduslik ja sõltub kontekstist, põhjustab selline masintõlge tõlkevigu. Sagedasemad vead on näiteks sõnade vahelejätmine ja terminite valesti tõlgendamine. 

*Vahepealkiri sündis Google’i tõlke 100% usaldamisel (Spoiler alert’i eestikeelne vaste võiks pigem olla Räägime välja, Avaldame kogu tõe vmt).

Populaarsed lood mujal Geeniuses

Igal argipäeval

Ära jää ilma päeva põnevamatest lugudest

Saadame sulle igal argipäeval ülevaate tehnoloogia-, auto-, raha- ja meelelahutusportaali olulisematest lugudest.