Vertimas internete: kodėl tai nėra taip paprasta, kaip atrodo
Kiekvienas, kuris bent kartą bandė išversti svarbų dokumentą ar laišką naudodamas internetinį įrankį, žino tą specifinį jausmą – rezultatas atrodo beveik teisingas, bet kažkas vis tiek ne taip. Sakinys skamba keistai. Žodžių tvarka išversta pažodžiui. O kartais vertimas tiesiog prasilenkia su logika taip drastiškai, kad belieka juoktis.
Automatiniai teksto vertėjai per pastaruosius dešimt metų padarė milžinišką šuolį. Tai, ką anksčiau darė paprastos žodynų duomenų bazės, dabar atlieka sudėtingi neuroniniai tinklai, apmokyti ant milijardų sakinių. Tačiau rinkoje yra tiek daug įrankių, kad žmogus nesusigaudo – kas iš tikrųjų veikia, kas tik atrodo, kad veikia, ir kada apskritai verta naudoti automatinį vertimą, o kada geriau kreiptis į žmogų.
Šis straipsnis – ne sausas techninis aprašymas. Tai praktinis vadovas žmogui, kuriam reikia išversti tekstą čia ir dabar, ir kuris nori padaryti tai kuo geriau.
Didieji žaidėjai: kas šiuo metu dominuoja rinkoje
Kalbant apie automatinius vertėjus, pirmiausia visi prisimena Google Translate. Ir tai suprantama – jis nemokamas, prieinamas, veikia su daugiau nei 130 kalbų. Tačiau populiarumas ne visada reiškia kokybę. Google Translate puikiai susidoroja su dažnai vartojamomis kalbomis – anglų, ispanų, prancūzų, vokiečių. Kai tik pasukate į mažiau paplitusias kalbas arba bandote versti specializuotą tekstą, rezultatai gali labai nuvylti.
Rimčiausias konkurentas šiandien yra DeepL. Vokiečių kompanija, įkurta 2017 metais, sugebėjo padaryti tai, kas atrodė neįmanoma – sukurti vertėją, kuris daugeliu atvejų lenkia Google, ypač europietiškų kalbų porose. DeepL tekstus verčia natūraliau, geriau supranta kontekstą ir retai pateikia tokius akivaizdžiai mechaniškus vertimus, kurie iš karto išduoda, kad tekstą rašė mašina. Nemokama versija leidžia versti iki 1500 simbolių vienu kartu, o mokama – neribotus tekstus ir dokumentus.
Yra ir kitų žaidėjų: Microsoft Translator, integruotas į daugelį „Microsoft” produktų, Amazon Translate, skirtas daugiau verslo sprendimams, ir Yandex Translate, kuris vis dar išlaiko stiprias pozicijas verčiant į rusų kalbą ir iš jos. Pastaraisiais metais populiarėja ir ChatGPT bei kiti didieji kalbos modeliai kaip vertimo įrankiai – apie juos kalbėsime atskirai.
Kaip iš tikrųjų veikia šie įrankiai ir kodėl tai svarbu žinoti
Norint išsirinkti tinkamą įrankį, pravartu suprasti bent pagrindus – ne tam, kad taptumėte inžinieriumi, o tam, kad žinotumėte, ko tikėtis ir ko ne.
Šiuolaikiniai vertėjai naudoja vadinamąją neuroninių tinklų technologiją (angl. Neural Machine Translation, NMT). Skirtingai nuo senesnių sistemų, kurios tiesiog keitė žodžius pagal žodyną, neuroniniai tinklai mokosi iš milžiniškų tekstų kiekių ir bando nuspėti, koks vertimas yra labiausiai tikėtinas pagal kontekstą. Todėl jie daug geriau supranta idiomas, frazes ir sakinių struktūrą.
Tačiau čia ir slypi pagrindinė problema: šie modeliai mokosi iš to, kas jau egzistuoja internete. Jei kuri nors kalba yra mažiau reprezentuota internete – mažiau knygų, straipsnių, svetainių – modelis tiesiog turi mažiau medžiagos mokytis. Todėl lietuvių kalba, nors ir gana gerai palaikoma didžiųjų vertėjų, vis tiek kartais pateikia keistokus rezultatus, ypač su sudėtingesniais sakiniais ar specifine leksika.
Dar vienas svarbus dalykas: vertėjai nesupranta teksto. Jie nuspėja tikimybę. Tai reiškia, kad jie gali labai įtikinamai suklysti – parašyti sakinį, kuris skamba teisingai, bet perteikia visiškai kitą prasmę. Tai pavojingiausia situacija, nes tokias klaidas sunkiausia pastebėti.
DeepL prieš Google Translate: realus palyginimas be pagražinimų
Daugelis žmonių naudoja Google Translate tiesiog todėl, kad jis yra pirmasis, kuris ateina į galvą. Tačiau jei jums rūpi kokybė, verta skirti minutę ir palyginti.
Paimkime konkretų pavyzdį. Lietuviškas sakinys: „Jis nuleido rankas ir nusprendė, kad nieko neišeis.” Google Translate angliškai pateikia: „He lowered his hands and decided that nothing would work out.” DeepL: „He gave up and decided that nothing would come of it.” DeepL teisingai atpažino idiomą „nuleido rankas” ir išvertė ją atitinkama anglų idioma „gave up”. Google vertė pažodžiui.
Tai ne išimtis, o taisyklė. DeepL sistemingai geriau susidoroja su idiomomis, sudėtingomis gramatinėmis konstrukcijomis ir teksto tonu. Jei rašote oficialų laišką, DeepL labiau tikėtina išlaikys formalų toną. Jei rašote šiltą, draugišką žinutę, DeepL mažiau tikėtina pavers ją biurokratiniu dokumentu.
Tačiau Google Translate turi savo privalumų. Jis palaiko daugiau kalbų – jei reikia versti iš suahilių, jorubų ar kitų Afrikos kalbų, Google yra vienintelis realus pasirinkimas. Be to, Google Translate turi puikią mobiliąją programėlę su galimybe versti fotografuojant tekstą – tai labai praktiška keliaujant.
Praktinė rekomendacija: jei verčiate tarp pagrindinių europietiškų kalbų ir jums rūpi kokybė, naudokite DeepL. Jei reikia versti iš egzotiškesnių kalbų arba tiesiog greitai suprasti, apie ką kalba – Google Translate visiškai tinka.
Kada automatinis vertimas tikrai veikia ir kada jis gali pakenkti
Čia reikia būti sąžiningais: automatinis vertimas nėra universalus sprendimas. Yra situacijų, kur jis puikiai tinka, ir situacijų, kur juo pasikliauti – rimta klaida.
Automatinis vertimas tinka, kai:
- Norite greitai suprasti svetimkalbio teksto esmę (el. laiškas, straipsnis, instrukcija)
- Verčiate paprastus, trumpus tekstus be sudėtingų idiomų
- Turite laiko patikrinti ir pataisyti rezultatą
- Verčiate tarp kalbų, kurias gerai palaiko pasirinktas įrankis
- Tekstas yra informacinio pobūdžio, ne kūrybinis ar teisinis
Automatinis vertimas gali pakenkti, kai:
- Verčiate teisinius dokumentus – sutartis, įgaliojimus, teismo dokumentus. Net vienas netiksliai išverstas žodis gali turėti rimtų pasekmių
- Verčiate medicininius tekstus, ypač receptus ar diagnozes
- Tekstas turi subtilų toną – diplomatiniai laiškai, derybos, jautri komunikacija
- Verčiate kūrybinį tekstą – poeziją, reklamą, šūkius
- Tekstas bus viešai publikuojamas jūsų vardu ar jūsų įmonės vardu
Ypač pavojinga situacija – kai žmogus nemoka kalbos, į kurią verčia, ir negali patikrinti rezultato. Tokiu atveju net ir geras automatinis vertimas gali turėti klaidų, kurių nepastebėsite.
ChatGPT ir kiti kalbos modeliai kaip vertimo įrankiai
Pastaraisiais metais atsirado nauja kategorija: didieji kalbos modeliai kaip ChatGPT, Claude, Gemini. Daugelis žmonių juos naudoja vertimui, ir tai nėra bloga idėja – tačiau reikia suprasti, kuo jie skiriasi nuo tradicinių vertėjų.
Didieji kalbos modeliai turi vieną svarbų privalumą prieš DeepL ar Google: juos galima instruktuoti. Galite pasakyti: „Išversk šį tekstą į anglų kalbą, išlaikydamas formalų toną, ir jei yra idiomų, naudok atitinkamas angliškas idiomas.” Arba: „Išversk, bet pritaikyk tekstą jaunesnei auditorijai.” Tradiciniai vertėjai tokio lankstumo neturi.
Be to, kalbos modeliai gali paaiškinti, kodėl pasirinko vienokį ar kitokį vertimą, gali pateikti kelis variantus, gali versti su komentarais. Tai ypač vertinga, kai mokotės kalbos arba kai reikia suprasti niuansus.
Tačiau yra ir minusų. Kalbos modeliai kartais „haliucinuoja” – sugalvoja informaciją, kurios nėra originale. Verčiant faktinį tekstą, tai gali būti problema. Be to, jie lėtesni nei specializuoti vertėjai ir dažnai reikalauja mokamos prenumeratos.
Praktinė rekomendacija: naudokite ChatGPT ar panašius įrankius, kai reikia vertimo su kontekstu, kai norite pritaikyti toną, arba kai tekstas sudėtingas ir reikia papildomų paaiškinimų. Paprastam, greitam vertimui – DeepL ar Google greičiau ir patogiau.
Specialistų patarimai: kaip gauti geresnį automatinį vertimą
Net ir naudodami geriausią įrankį, galite gauti prastą rezultatą, jei netinkamai pateikiate tekstą. Yra keletas paprastų gudrybių, kurios gerokai pagerina kokybę.
Pirma – supaprastinkite originalą. Prieš versdami, perskaitykite savo tekstą ir pašalinkite pernelyg ilgus, vingiuotus sakinius. Automatiniai vertėjai geriau susidoroja su aiškiais, struktūruotais sakiniais. Jei galite vieną ilgą sakinį padalinti į du trumpus – padarykite tai.
Antra – patikrinkite skyrybą. Tai skamba trivialiai, bet skyrybos ženklai iš tikrųjų keičia tai, kaip vertėjas interpretuoja sakinį. Trūkstamas kablelis gali pakeisti sakinio prasmę, o vertėjas to nepastebės – jis tiesiog išvers tai, ką „mato”.
Trečia – venkite žargono ir labai specifinės terminologijos, nebent naudojate specializuotą vertimo įrankį. Medicinos, teisės ar IT terminai dažnai verčiami netiksliai, nes jie retai pasitaiko bendriniuose tekstuose, iš kurių mokosi modeliai.
Ketvirta – visada perskaitykite vertimą. Net jei nemokate kalbos, į kurią vertėte, galite pastebėti akivaizdžias nesąmones – per ilgus ar per trumpus sakinius, keistą struktūrą, pasikartojančius žodžius. Jei kažkas atrodo keistai – greičiausiai yra klaida.
Penkta – naudokite „back translation” metodą. Tai ypač naudinga svarbiems tekstams: išvertę tekstą, vėl išverskite jį atgal į originalią kalbą ir palyginkite su originalu. Jei prasmė labai skiriasi – vertimas yra problemiškas.
Šešta – jei verčiate dokumentus, naudokite DeepL arba Google Translate dokumentų vertimo funkciją, o ne kopijuokite tekstą rankiniu būdu. Taip išsaugomas formatavimas ir mažiau tikėtina, kad prarasite kontekstą.
Kai mašina neužtenka: kaip rasti gerą žmogų vertėją
Kartais automatinis vertimas tiesiog nėra parinktis. Jei reikia versti teisinius dokumentus, medicininius tekstus, arba jei tekstas bus viešai publikuojamas – verta investuoti į profesionalų vertėją. Tačiau kaip jį rasti ir kaip neapsigauti?
Lietuvoje veikia kelios vertėjų asociacijos ir platformos. Lietuvos vertėjų sąjunga turi savo narių sąrašą, kur galima rasti sertifikuotus specialistus. Tarptautinėse platformose kaip ProZ.com ar Upwork galima rasti vertėjus su atsiliepimais ir patikrintais įgūdžiais.
Renkantis vertėją, atkreipkite dėmesį į keletą dalykų: ar vertėjas verčia į savo gimtąją kalbą (tai yra aukso standartas), ar turi patirties jūsų srityje (medicinos vertėjas ir teisės vertėjas – skirtingi specialistai), ar pateikia pavyzdžių iš ankstesnių darbų.
Kainų atžvilgiu – pigus vertimas dažnai reiškia prastą kokybę. Profesionalus vertėjas Lietuvoje paprastai ima nuo 0,05 iki 0,15 euro už žodį, priklausomai nuo kalbų poros ir teksto sudėtingumo. Tai gali atrodyti daug, tačiau palyginkite su galimomis klaidos pasekmėmis.
Vertimas kaip įgūdis, o ne tik paslauga: ką verta žinoti kiekvienam
Pabaigoje norisi pasakyti kažką, kas galbūt skamba netikėtai: geriausias vertimas visada bus tas, kurį patikrina žmogus, suprantantis abi kalbas. Automatiniai įrankiai – tai pagalbininkiai, ne sprendimai.
Šiandien rinkoje aiškiai dominuoja DeepL kokybės atžvilgiu europietiškoms kalboms, Google Translate – kalbų įvairovės atžvilgiu, o didieji kalbos modeliai – lankstumo ir kontekstinio vertimo atžvilgiu. Nėra vieno universalaus atsakymo, kuris yra geriausias – tai priklauso nuo to, ką verčiate, į kokią kalbą ir kokiam tikslui.
Svarbiausia, ką galima išsinešti iš šio straipsnio: niekada nepatikėkite automatiniam vertimui aklos. Naudokite jį kaip pirmą žingsnį, kaip pagalbinę priemonę, kaip greitą orientyrą – bet ne kaip galutinį produktą, kai tekstas yra svarbus. Technologijos tobulėja stulbinamu greičiu, ir galbūt po penkerių metų ši situacija bus visiškai kitokia. Tačiau šiandien, 2024-aisiais, žmogaus akis ir žmogaus supratimas vis dar yra neįkainojami.
O jei dar niekada nebandėte DeepL – tiesiog atidarykite jį dabar ir išbandykite su kažkuo, ką anksčiau vertėte Google Translate. Skirtumas dažnai akivaizdus iš pirmo sakinio.