5. Budoucnost s jazykovými strojovými překladači

V předchozí praktické kapitole jsme se plně zabývali tím, jak překladače chybují. Jsou s jejich používáním však spjaty i nějaké další potíže? Jaká budoucnost nás se strojovými překladači a s umělou inteligencí asi čeká? Naučíme se s nimi koexistovat v míru a spokojenosti?

Úvod tématu
4. Strojové překladače a chyby
Kvíz

Potíže s překladači

„Než se pustíš do čtení, zkus se nad tím zamyslet. Jakým dalším problémům můžeš při používání překladačů čelit?“

Problém č. 1: odosobněná komunikace

Když máš k dispozici lidského tlumočníka či překladatele, můžeš se jej vždy doptat na další podrobnosti, na kontext, na okolnosti, na místní zvyklosti. Stroj navíc nemá emoce (ani dobrou vůli), takže tě neupozorní, když pokládáš úplně blbou otázku. Např. Asiaté jsou prý velmi citliví na jakékoli otázky na své soukromí; naopak v Americe otázkami na tělo nikoho nepřekvapíš. 
       Stejně tak tě stroj neupozorní na chybu ve zdrojovém textu (a že jich v textech bývá!). Pamatuješ si na slovo biomy z minulé kapitoly?
       Dalším důvodem, proč lidští překladatelé jen tak nepřijdou o práci, je to, že někteří lékaři prý strojovým překladačům mnohdy příliš nevěří a odmítají s pacienty jejich prostřednictvím komunikovat. A není se čemu divit – daň za chybu by zde mohla být víc než krutá.
       No a v neposlední řadě – není komunikace s živým tvorem v ledasčem příjemnější než komunikace s obrazovkou a klávesnicí?

Problém č. 2: neochota učit se cizí jazyky

Přiznejme si to otevřeně – když vím, že mám v mobilu překladač, mám v letadle či vlaku do cílové destinace mnohem menší motivaci naučit se z průvodce alespoň základní fráze a slovíčka.
        Jenže když se učíš cizí jazyk, nejde jen o ta slovíčka a gramatiku. Ledasco se dozvíš také o kultuře, mentalitě, temperamentu… S těmito znalostmi si pobyt v cizí zemi mnohem lépe užiješ, vyhneš se nedorozumění, navážeš trvalá přátelství… A co víc? Nezakrní ti mozek!

Problém č. 3: porušení mlčenlivosti

Tohle je další dost závažný problém. Profesionální překladatelé většinou se svým zadavatelem podepisují tzv. disclosure agreement (smlouvu o mlčenlivosti). V ní se zavazují, že obsah překládaného dokumentu v žádném případě nikomu nevyzradí. Nepodělí se o něj s konkurenční firmou, ani se pikantnostmi z překládaného soudního spisu nebudou vytahovat na facebookové zdi, natož večer u piva. A – světe div se, porušením mlčenlivosti je i to, že překládaný text nebo jeho úryvek pošleš nezabezpečenou mailovou poštou nebo vložíš do veřejně dostupného překladače! Majitel překladového nástroje si totiž daný text může uložit (použitím jeho překladového nástroje mu k tomu dáváš právo) a někde ho za nějakým účelem použít. Čím totiž na internetu platíme za služby, které se zdají být zdarma? Přece svými uživatelskými daty! Pokud jsi navíc uzavřel/a s klientem (klidně i ústní) smlouvu na překlad, klient předpokládá, že text přeložíš jen a pouze ty, nikoli strojový překladač (pokud jste se samozřejmě nedomluvili jinak).

Problém č. 4: nutnost tzv. post-editace

O tom jsme již mluvili v předchozích kapitolách. Pokud chceš, aby výsledek za něco stál a byl reprezentativní k použití třeba na webu, beztak musíš zaplatit živého člověka, který text zkontroluje a následně upraví. Někdy vyjde i najevo, že výsledek post-editovaného překladu není tak kvalitní, jako by byl, kdyby jej rovnou přeložil člověk, a navíc ani nemusí být levnější.

Slepé použití textu z překladače.

Nebo, jako na tomto obrázku, vyjde najevo, že k překladu vlastně vůbec nedošlo. Pan kadeřník se zkrátka na překladač spolehnul až přespříliš.

Problém č. 5: chyby zjevné a chyby skryté

Zjevným chybám jsme věnovali celou dlouhou předchozí kapitolu. Stroje zkrátka chybují a chybovat budou – nadvětnou kohezi, skryté narážky a hru se slovy asi zvládnou jen stěží. Tohle však není ten hlavní problém – text u těchto typů chyb po překladu nebude dávat smysl, takže se lidský post-editor podívá do originálu a chybu opraví. 
      Jenže u nejnovějšího a v současnosti nejrozšířenějšího typu překladu – toho neuronového, chyby nejsou na první pohled vidět, protože jedním z důležitých úkolů neuronového překladu není jen věcná správnost, ale to, aby výsledná věta vypadala a zněla (hned, nebo jen?) na první pohled hezky a smysluplně. Takové trošku „nahoře huj a dole fuj“. Stroje si proto někdy bezostyšně vymýšlejí, vynechávají celé pasáže, zaměňují slova atp., což ale nepoznáme bez podrobné kolace (tedy přesného srovnávání větu po větě překladu s originálem). Jenže kdo by takovou piplačku v dnešní rychlé době dělal, že?

Problém č. 6: podpora diskriminace

Jazyk překladačů je diskriminační, mohl/a sis toho všimnout ve 2. kapitole, kde je vidět, jak překladače kvůli překladům přes angličtinu udělají z ženského rodu mužský a dopouštějí se tím sexismu
       Společnost ProPublica také např. zveřejnila rozsáhlou studii, ve které prokázala, že překladače častěji označují obžalované Afroameričany za vysoce rizikové, zatímco obžalované bělochy za nízkorizikové, takže se dopouštějí rasismu
       Diskriminační je jednoduše už také to, že překladače neexistují pro většinu malých jazyků.

Problém č. 7: nutnost přizpůsobovat se strojům

Všiml/a sis toho, že když zadáváš větu do strojového překladače, myslíš často už dopředu na to, jak větu zformulovat, aby ji stroj co nejlépe vyhodnotil, a tudíž přeložil? Znamená to, že ve své komunikaci začínáš upouštět od nespisovných a emočně zabarvených výrazů, tvoje komunikace se v takovém případě stává nudnou a šedivou. Takže to, čeho se lidé často obávají – že stroje (roboti) budou jednou rovni lidem, je nic proti tomu, k čemu už máme trošku nakročeno – my sami se začneme přizpůsobovat a přibližovat strojům.

Napadnou tě nějaké další potíže, které jsme nezmínili?


Budeme si my lidé v době AI i nadále rozumět?

V minulé kapitole jsme se bavili o tom, že chyby ze strojových překladů a z mluvené psanosti pravděpodobně zvyšují naši toleranci k chybám v oficiálních jazykových projevech, což my jazykovědci velmi nelibě neseme. Jenže na špatnou úroveň jazyka mladé generace si ta starší stěžovala asi vždy. Takže je to zase jen další neopodstatněný pláč stárnoucích češtinářů a češtinářek? Nebo teď už máme opravdu zaděláno na problém? 
       Na to se bohužel nedá přesně odpovědět, protože jazyk není matematika a nejde říct, že takový počet chyb v textu už je za hranou a jiný je ještě snesitelný (pro někoho je za hranou již jedna chyba v textu, jiný nemrkne okem, ani když se to chybami hemží). Nehledě na to, ono ani není vždy možné přesně stanovit, co je to vlastně chyba. Každopádně je však jasné, že určité tíhnutí jazyka ke zjednodušení je přirozený vývoj (kdyby nebyl, neupustila by čeština například od používání přechodníků).
        Abychom si z toho všeho tedy vyvodili nějaký závěr, musíme se krom příkladů a tvrdých dat spolehnout také na své dojmy a jazykový cit. Pojď to s námi zkusit.

Přímý vliv překladačů na stav jazyka u statistických překladů

Nejdřív ta data. U statistických metod překladu se (na rozdíl od těch neuronových) vědci o přímém vlivu na stav jazyka zmiňují. Jde o to, že statistický překladový software systematicky upřednostňuje nejčastější varianty a opomíjí ty méně časté, čímž dochází ke zplošťování (degradaci, ochuzování) našeho jazyka. Systém se navíc bude utvrzovat ve svých vlastních chybách, protože tím, že bude jako vstupy dostávat strojově přeložené texty, mu tyto původní chyby budou připadat jako norma (tzv. garbage in garbage out).

A u těch neuronových?

Toto tvrzení však už tak úplně neplatí o neuronových překladech, které nefungují na principu upřednostňování nejčastějších variant. I jejich výstupy jsou však chybné, však jsme se o tom přesvědčili při analýze textů. A o to právě jde! Nám uživatelům jazyka (my přece nejsme vývojáři softwaru) teď nejde o to, že ten stroj dělá chyby, ale o to, že my sami se k chybě stáváme tolerantní, zvykáme si na ni a přebíráme ji do svého rejstříku. Český řečník v českém podcastu tak mluví o tom, že se často setkává s kusem informace, a vůbec zde přitom nejde o překlad – onen člověk již chybu převzal do svého slovníku. Seriózní český vydavatel nejmenovaného deníku nedbá na aktuální větné členění ani v případech, kdy dochází k reálné změně významu. Tajemník vysoce postaveného ředitele nejmenované instituce rozesílá oficiální maily, ve kterých je dvakrát tolik interpunkčních znamének, než by mělo být, takže smysl sdělení je pochopitelný až na druhé či třetí přečtení. V dětské knize o geometrických tvarech přeložené z angličtiny se místo kosočtverců v nadpisech objevují diamanty. 
        Vadí ti to? Nevadí? Nám ano. Nechceme být hnidopichy nebo zastánci zaprášeného jazyka předků bez jediné změny, ale pojďme zkusit jazyk udržet alespoň ve stavu, ve kterém si díky němu budeme bez potíží rozumět. Pojďme prosím nejnovější technologické nástroje používat tak, aby opravdu sloužily ony nám, ne my jim.

Jaké texty jsou vhodné pro překladač

Poznámka: V možnostech je třikrát „V žádném případě!”. Odpověď je to sice stejná, někdy bude ale třeba je mezi sebou přehodit, aby se políčko zazelenalo.

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info