4. Strojově přeložené texty pod drobnohledem korektora
Pojď si teď prozkoušet svůj jazykový cit. Co myslíš, bude se ti výsledek strojového překladu líbit? Nebo budeš mít výhrady? Zvykneme si v některých textech na chyby? Nebo snad ve všech? Stanou se anglicismy, nevhodná interpunkce a pokřivený slovosled normou? Co to udělá s naším rodným jazykem? Budeme si ještě rozumět? Tato kapitola bude zkrátka o chybách.
Úvod tématu
3. Co strojový překladač není?
5. Budoucnost strojových překladačů
„Korektor je již poněkud starší označení pro člověka, který se dnes nazývá třeba také proofreader nebo jazykový editor. Tento člověk v textu odhaluje především chyby gramatické, stylistické, někdy i věcné (významové).“
Pojďme se do toho pustit pořádně zostra a hlavně prakticky. Ukážeme ti totiž strojově přeložené texty z různých jazyků. Na první přečtení ti ty texty možná budou připadat úplně v pohodě. Když si je ale přečteš podruhé, pozorně, a pak třeba i s barevně vyznačenými chybami, už ti třeba tak v pohodě připadat nebudou. Zkusíš si pak taky zahrát na korektora nebo korektorku a odhalit chyby v překladovém textu?
Jedna chyba vedle druhé. A vadí to vlastně někomu?
Mrkni se na strojově přeložené úryvky textů, které ti níže ukazujeme. Jde o náhodně vybrané texty, které jsme svěřili do péče překladačům Google, DeepL a Charles Translator for Ukraine.
Strojový překlad z angličtiny
Jako první ti naservírujeme překlad z angličtiny. Nejdřív si přečti originál a potom překlad.
Minecraft is arguably the most influential of sandbox games. The player is dropped into a large randomized open world (actually infinite!) with biomes such as mountains, forests, caves, plains and oceans – with no specific goal or objective. Progression can only be reached through an Achievements system. The world consists of cubes, or blocks, which you can destroy, remove, build or replace. It also has a night/day cycle. Depending on the set difficulty level, players need to eat and defend themselves from hostile mobs during the night.
Minecraft je pravděpodobně nejvlivnější sandboxovou hrou. Hráč se ocitne v rozsáhlém náhodně vybraném otevřeném světě (ve skutečnosti nekonečném!) s biomy, jako jsou hory, lesy, jeskyně, pláně a oceány – bez konkrétního cíle nebo úkolu. Postupu lze dosáhnout pouze prostřednictvím systému úspěchů. Svět se skládá z kostek neboli bloků, které můžete ničit, odstraňovat, stavět nebo nahrazovat. Má také denní a noční cyklus. V závislosti na nastavené obtížnosti musí hráči v noci jíst a bránit se před nepřátelskými moby.
Translated with www.DeepL.com/Translator (free version)
Co na to říkáš? Na první pohled to není vůbec špatné, že? Teď se ale podívej, jaké chyby jsme v textu při podrobnějším zkoumání odhalili. (V textu ti označujeme výrazy, které považujeme za chybné. Pod tabulkou pak najdeš komentář, proč překlad považujeme za chybný. Pozor na to, že nejlépe se ti tabulky zobrazí na větší obrazovce (notebooku, tabletu), kde uvidíš oba texty hned vedle sebe. Na telefonu budou texty zařazeny pod sebou.)
Originál AJ |
Překlad z DeepLu (12-2022) |
Minecraft is arguably the most influential of sandbox games. The player is dropped into a large randomized open world (actually infinite!) with biomes such as mountains, forests, caves, plains and oceans – with no specific goal or objective. Progression can only be reached through an Achievements system. The world consists of cubes, or blocks, which you can destroy, remove, build or replace. It also has a night/day cycle. Depending on the set difficulty level, players need to eat and defend themselves from hostile mobs during the night. |
Minecraft je pravděpodobně nejvlivnější sandboxovou hrou. Hráč se ocitne1 v rozsáhlém náhodně vybraném otevřeném světě (ve skutečnosti nekonečném!) s biomy2 , jako jsou hory, lesy, jeskyně, pláně a oceány – bez konkrétního cíle nebo úkolu3. Postupu lze dosáhnout pouze prostřednictvím systému úspěchů. Svět se skládá z kostek neboli bloků, které můžete ničit, odstraňovat, stavět nebo nahrazovat. Má také denní a noční cyklus. V závislosti na nastavené obtížnosti musí hráči v noci4 jíst a bránit se před nepřátelskými moby. Translated with www.DeepL.com/Translator (free version) |
1 Toto slovo je, na rozdíl od anglického, stylisticky neutrální.
2 Zde je podle nás chyba již v zadání. Biomy jsou např. tundra, tajga, jehličnaté lety, tropické deštné lesy a podobně. To, o čem je řeč, jsou spíše ekosystémy. Kdyby text překládal živý překladatel, mohl by, na rozdíl od stroje, na chybu v zadání klienta upozornit.
3 Takto strukturovaný překlad se nám nelíbí stylisticky a slovosledně. Je to velmi kostrbatý překlad, který kopíruje větnou stavbu angličtiny. V češtině bychom tuto část věty zakomponovali pravděpodobně za slovo hráč (Hráč se bez konkrétního cíle...).
4 Vlivem kopírování anglického slovosledu zde došlo k naprosté změně významu. Hráči nemusí v noci jíst, ale chránit se před nepřátelskými moby.
Otázka: Není to dnes lepší?
Tyto překlady jsou z konce roku 2022, což je pro IT svět už docela pravěk. Zkus si originální úryvky vložit do překladačů dnes. Bude se ti výsledek zdát lepší?
Strojový překlad z ukrajinštiny
Pro srovnání si teď dáme překlad ze slovanského jazyka (ukrajinštiny) a z jiného překladače (Google Translate). Do tabulky s okomentovanými chybami ti vkládáme dokonce srovnání tří různých překladačů.
Серіал «Венздей» встановив новий рекорд для Netflix, набравши 341,23 мільйона годин перегляду за перший тиждень на стримінговому сервісі. Це найкращий результат серед усіх англомовних серіалів на Netflix, пише Deadline.
«Венздей» обійшов за переглядами четвертий сезон «Дивних див», який набрав 335 мільйонів годин перегляду за перший тиждень з моменту релізу. Серіал потрапив до топ-10 у 93 країнах, посівши перше місце у 83 з них. Як повідомляє Netflix, «Венздей» переглянули понад 50 мільйонів користувачів.
Поточним рекордсменом за весь час є серіал «Гра в кальмара». Він набрав 571,8 мільйона годин перегляду в перший тиждень на Netflix.
"Středa" vytvořila nový rekord pro Netflix s 341,23 miliony hodin sledovaných během prvního týdne na streamovací službě. Jde o nejlepší výsledek ze všech anglicky psaných seriálů na Netflixu, píše Deadline.
"Středa" překonala z hlediska zhlédnutí čtvrtou sezónu "Strange Wonders", která za první týden od vydání nasbírala 335 milionů hodin zhlédnutí. Série se dostala do top 10 v 93 zemích, přičemž první místo obsadila v 83 z nich. Podle Netflixu „středu“ sledovalo více než 50 milionů uživatelů.
Aktuálním rekordmanem všech dob je série „Squid Game“. Za první týden na Netflixu nasbíral 571,8 milionu hodin zhlédnutí.
Pořád docela dobrý? Nebo už přituhuje?
Originál UJ |
Překlad z Googlu (12-2022) |
Серіал «Венздей» встановив новий рекорд для Netflix, набравши 341,23 мільйона годин перегляду за перший тиждень на стримінговому сервісі. Це найкращий результат серед усіх англомовних серіалів на Netflix, пише Deadline. «Венздей» обійшов за переглядами четвертий сезон «Дивних див», який набрав 335 мільйонів годин перегляду за перший тиждень з моменту релізу. Серіал потрапив до топ-10 у 93 країнах, посівши перше місце у 83 з них. Як повідомляє Netflix, «Венздей» переглянули понад 50 мільйонів користувачів. Поточним рекордсменом за весь час є серіал «Гра в кальмара». Він набрав 571,8 мільйона годин перегляду в перший тиждень на Netflix. |
"Středa" vytvořila nový rekord pro Netflix s 341,23 miliony hodin sledovaných během prvního týdne na streamovací službě.1 Jde o nejlepší výsledek ze všech anglicky psaných2 seriálů na Netflixu, píše Deadline. "Středa" překonala z hlediska zhlédnutí3 čtvrtou sezónu4 "Strange Wonders "5, která za první týden od vydání nasbírala 335 milionů hodin zhlédnutí. Série se dostala do top 10 v 93 zemích, přičemž první místo obsadila v 83 z nich. Podle Netflixu „středu“ sledovalo více než 50 milionů uživatelů. Aktuálním rekordmanem všech dob je série „Squid Game“6 . Za první týden na Netflixu nasbíral 571,8 milionu hodin zhlédnutí. |
1 Tak tohle je úplně mimo. Google jednak zbytečně přeložil název seriálu, krom toho je i slovosled tak kostrbatý, že výsledku jen stěží porozumíš.
2 anglojazyčných
3 Významově dobrý pokus, ale stylisticky máme mnohem hezčí slovo -- sledovanost.
4 Říkáme přece čtvrtou řadu.
5 Seriál se v angličtině jmenuje úplně jinak – Stranger Things.
6 V češtině názvy nemusí být v uvozovkách, ale aspoň plusový bod za české uvozovky. Navíc existuje v češtině zažitý název Hra na oliheň.
Originál UJ |
Překlad z DeepLu (12-2022) |
Серіал «Венздей» встановив новий рекорд для Netflix, набравши 341,23 мільйона годин перегляду за перший тиждень на стримінговому сервісі. Це найкращий результат серед усіх англомовних серіалів на Netflix, пише Deadline. «Венздей» обійшов за переглядами четвертий сезон «Дивних див», який набрав 335 мільйонів годин перегляду за перший тиждень з моменту релізу. Серіал потрапив до топ-10 у 93 країнах, посівши перше місце у 83 з них. Як повідомляє Netflix, «Венздей» переглянули понад 50 мільйонів користувачів. Поточним рекордсменом за весь час є серіал «Гра в кальмара». Він набрав 571,8 мільйона годин перегляду в перший тиждень на Netflix. |
Seriál "Veep "1 vytvořil nový rekord Netflixu, když za první týden2 na této streamovací službě získal 341,23 milionu hodin sledování. To je nejlepší výsledek mezi všemi anglicky mluvenými3 seriály na Netflixu, píše Deadline. "Seriál Veep překonal (co?) čtvrtou sérii4 seriálu Stranger Things, která v prvním týdnu od svého uvedení získala 335 milionů hodin sledovanosti5 . Seriál se dostal do první desítky v 93 zemích a v 83 z nich obsadil první místo. Podle společnosti Netflix vidělo seriál Veep více než 50 milionů uživatelů. Současným rekordmanem všech dob je seriál "Squid Game "6. Za první týden na Netflixu získal 571,8 milionu hodin sledovanosti7 . Translated with www.DeepL.com/Translator (free version) |
1 Zase vedle! Veep je úplně jiný seriál.
2 Slovosled – toto příslovečné určení času bychom raději viděli až po slově získal.
3 anglojazyčnými
4 řadu
5 sledování, nebo slovo sledovanost přesunout jinam
6 Uvozovky, název Hra na oliheň.
7 zhlédnutí
Originál UJ |
Překlad z Charles Translator for Ukraine (12-2022) |
Серіал «Венздей» встановив новий рекорд для Netflix, набравши 341,23 мільйона годин перегляду за перший тиждень на стримінговому сервісі. Це найкращий результат серед усіх англомовних серіалів на Netflix, пише Deadline. «Венздей» обійшов за переглядами четвертий сезон «Дивних див», який набрав 335 мільйонів годин перегляду за перший тиждень з моменту релізу. Серіал потрапив до топ-10 у 93 країнах, посівши перше місце у 83 з них. Як повідомляє Netflix, «Венздей» переглянули понад 50 мільйонів користувачів. Поточним рекордсменом за весь час є серіал «Гра в кальмара». Він набрав 571,8 мільйона годин перегляду в перший тиждень на Netflix. |
Seriál Wenzdei1 stanovil2 nový rekord pro Netflix, když za první týden na streamovací službě zaznamenal 341,23 milionu hodin sledování. To je nejlepší výsledek ze všech anglicky mluvících3 seriálů na Netflixu, píše Deadline. Wenzdei překonal sledovanost čtvrté řady Podivných divů4 , která za první týden od vydání zaznamenala 335 milionů zhlédnutí. Seriál se dostal do Top 10 v 93 zemích, přičemž první místo obsadil v 83 z nich. Netflix uvádí, že Wenzdei vidělo více než 50 milionů uživatelů. Současným držitelem rekordu po celou dobu5 je seriál Hra na chobotnici6 . Za první týden na Netflixu nasbíral 571,8 milionu hodin sledování. |
1 V češtině používáme anglický název Wednesday.
2 vytvořil
3 anglojazyčných
4 Do češtiny nepřekládáme.
5 významová chyba – všech dob
6 oliheň
Tak co, který z překladačů u tebe vyhrává?
Otázka: Jak hodnotíš strojový překlad?
Z minulých kapitol už máš dost informací o tom, jak strojové překladače vznikly, jak fungují, a hlavně – vyzkoušel/a sis teď práci s reálnými přeloženými texty a vidíš, jakých chyb se překladač dopouští. Bylo to na jedničku s hvězdičkou? Podle nás úplně ne. Zamysli se teď prosím nad tím ty, jestli se ti zdá, že stroje mohou nahradit živé lidské překladače. Můžeme se s takovými chybami smířit?
Odpověď
Tato otázka jasnou odpověď nemá. A hlavně – chybí ti v ní některé zásadní okolnosti. Jde totiž o to, jaké texty a za jakým účelem jsou překládány.
„Chyby se mimochodem nenacházejí pouze v přeložených textech, ale i v textech původních (slovo biomes z prvního textu). Další plusový bod pro živého překladatele.“
Existují texty, ve kterých překladače nechybují?
V minulé kapitole sis vyzkoušel/a odhalit chyby v přeložených textech. A že jich bylo. Existují ale texty, ve kterých překladače nechybují?
Už v 70. letech se překladače podařilo s poměrně dobrými výsledky nasadit na překlady předpovědí počasí mezi angličtinou a francouzštinou. Šlo o texty, které se opakovaly a příliš neměnily, neobsahovaly kontextově neočekávaná slova, a tudíž bylo snadné na ně překladače vytrénovat. Nutnost post-editace byla minimální. Tento krok odstartoval snahu začít překladače nasazovat na další a další odvětví lidské činnosti – usnadnit tak lidem přístup k cizojazyčným textům a podnikům mnohonásobně zlevnit možnost rozšiřovat své služby a výrobky i za hranice národního státu.
Pokud tedy překladači svěříme dostatečně jednoduchý text, bude v určitém případě možné jeho výsledky použít i bez nutnosti post-editace. V případě textů, které však mají mít přidanou hodnotu v podobě estetických kvalit (umělecké texty) nebo textů vysoce kreativních (např. reklamní a publicistické texty), kde nehraje roli referenční funkce (věcnost a informace), ale estetický vjem, a kde se ve výstavbě textu využívá koheze na úrovni nadvětných celků a implicitní sdělení, není využití překladů (zatím a podle nás nikdy) s uspokojivým výsledkem možné.
Existují nějaké komunikáty, kde nám chyby nevadí?
„Komunikát je jakýkoli jazykový projev, zpráva nebo promluva. Někdy jím nahrazujeme slovo text, protože pod pojem komunikát lépe zapadne mluvená psanost, o které se dozvíš níže.“
Úryvky, se kterými jsi teď pracoval/a a hledal/a v nich chyby, jsme na úvod označili jako „náhodně vybrané“. Jenže takové texty v reálném životě neexistují. Vyskytují se většinou jen v jazykových učebnicích a výzkumných studiích. V reálném životě mají komunikáty vždy nějaký konkrétní účel (příležitost použití) a podle toho zvolený stylistický rejstřík slovní zásoby (a také určitou míru tolerance k chybovosti). Nejspíš budeš souhlasit, že jiný typ výrazů použiješ v oficiálním dopise ředitelce školy, ve kterém žádáš o měsíc volna, protože chceš jet s rodiči na Hawai, a jiný v chatu s kamarády. Stejně tak budeš mít v těchto textech jinou toleranci k chybám. V chatu se asi nad psaním čárek, velkých písmen a mně/mě úplně nezamýšlíš, v onom dopise ředitelce školy se nejspíš budeš aspoň pořádně snažit.
„Možná tě to překvapí, ale mají to tak i akademici. Jen se za ty chyby, které nasekají v soukromé komunikaci, někdy sami před sebou docela stydí.“
Mluvená psanost
V dnešní internetové době vzniká obrovské množství komunikátů, které jsou určeny takzvaně pro vlastní spotřebu, což znamená, že si je soukromě přečteš, nebudou nikde veřejně publikovány (otištěny) a po přečtení zmizí v propadlišti dějin. Jde o všechny rychlé zprávy v chatech, smsky atp. Když se na tyto svoje texty podíváš, možná si všimneš, že mají stylisticky docela blízko k mluvenému projevu. Nejsou tak plynulé jako psaný a předem připravený a promyšlený projev, obsahují tak zvané elipsy (výpustky), stylisticky nízké lexikum, slang, výrazivo z obecně češtiny (např. nespisovné koncovky) a – obrovské množství chyb. V rychlých chatech se, tak jako při řeči, jaksi nemáme čas zamýšlet nad tím, kde bude čárka, zda je správné napsat mně či mě, kde bude velké písmeno a kde jaké i/y. V řeči nám to nevadí – ale, když to napíšeme? I když je to napsáno hodně rychle, přece jen, „co je psáno, to je dáno“.
Tento rychlý psaný projev (pro který se v jazykovědě vžil výraz mluvená psanost, někdo ho označuje také jako texting) má výrazný vliv i na projevy, ve kterých by se chybovat nemělo, protože jakmile si jednou zvykáme vidět napsané chyby v neoficiálních projevech (chatech atp.), pokud jsou napsané, začínáme je tolerovat i v těch oficiálních. A úplně stejná situace je se strojovými překlady – jsou chybové, a když chybu vidíš stokrát napsanou, přestaneš ji za chybu považovat a ona se pomalu stane normou.
Typy textů
Pojďme se teď podívat na to, s jakými konkrétními typy textů se setkáváme, ve kterých z nich nám ty chyby budou vadit více a ve kterých méně. Nám jazykovědcům samozřejmě z podstaty věci vadí chyby ve všech typech textů. U některých se nám však otevírá kudla v kapse víc, u některých míň.
Obecně lze komunikáty rozdělit na:
oficiální |
neoficiální |
připravené |
nepřipravené |
monologické |
dialogické |
psané |
mluvené |
veřejné |
soukromé |
Asi budeš souhlasit, že komunikáty z levého sloupce by měly být spíše bezchybné, zatímco ty napravo leckdy chybu snesou. Tím se konečně vracíme k našemu tématu strojových překladů, protože pravý sloupec – to je přesně to pole, kde můžeš strojový překladač bez obav použít. Pro soukromé účely si pomocí překladače úplně klidně přelož jakýkoli nadpis, leták, webovku, článek, úryvek z knížky, pro své potřeby klidně i jakýkoli oficiální projev… Takto vzniklý neoficiální komunikát však spotřebuj, využij a zase nechej zmizet.
A co tedy ty texty oficiální? Dá se i tam nějak určit, ve kterých z nich by se překladač dal využít lépe a úspěšněji? Abys na tuto otázku mohl/a odpovědět, vzpomeň si na tzv. funkční styly, o kterých jste se na hodinách češtiny určitě někdy bavili. Zamýšlená funkce textu ti totiž předurčí, jaké jazykové prostředky (knižní slova, neutrální slova, hovorová slova, neslušná slova…) v textu použiješ.
„Funkční styl je způsob výběru a uspořádání jazykových prostředků zohledňujících funkci textu.“
Základní funkční styly jsou:
- Funkční styl prostěsdělovací,
- funkční styl odborný,
- funkční styl publicistický,
- funkční styl administrativní,
- funkční styl umělecký.
Čím víc typizovaného a bezpříznakového (neutrálního) lexika (a v určitém ohledu i jednoduchých termínů) bude text obsahovat, tím snazší a co do výsledku výhodnější u něj použití strojových jazykových překladačů bude. (Vzpomeň si, že to začalo u předpovědí počasí.) Na rozdíl od minulého odstavce o rozdělení komunikátů na ty oficiální a neoficiální jsou však toto všechno texty, ve kterých není (nebo spíš neměla by být) tolerance k chybám příliš vysoká. Z toho důvodu je velmi nutné, aby po strojovém překladu následovala post-editace.
Post-editace
Post-editace je proces, kdy člověk z masa a kostí (s vysokou pravděpodobností bývalý překladatel) provádí kontrolu a úpravy strojově přeloženého textu, aby co nejlépe odpovídal originálu. Přeložený text by měl upravovat s oporou o text originální (někdy se však provádí i tak zvaná slepá post-editace, kdy zdrojový text není vůbec k dispozici – toto však mnozí překladatelé považují za neprofesionální řešení). Úpravy textu jsou v zásadě dvojího druhu: jednak je potřeba po strojovém překladu najít a opravit věcné chyby – to je přesně úkol pro post-editora, který musí dobře znát jak jazyk originálu, tak jazyk cílový. Druhé kolo úprav je pak na úrovni gramatických chyb, přičemž tyto úpravy je opravdu možné provádět tzv. slepě – bez opory zdrojového textu a je lepší, když je provádí zvlášť najatý korektor/jazykový editor.
Otázka: Potenciál využití strojového překladu
Které z funkčních stylů mají podle tebe nejvyšší potenciál pro využití strojového překladu?
Odpověď
Do jisté míry je samozřejmě možné využit strojový překlad pro všechny styly, podle míry kvality výsledku bychom je však mohli seřadit takto (od nejúspěšnějšího po ten nejméně úspěšný): administrativní, prostěsdělovací, publicistický, odborný, umělecký.
A nyní to zkus sám/sama. Kolik chyb zvládneš odhalit?
Nejdřív na chybné místo přetáhni cedulku, která určuje, o jaký typ chyby se jedná. Následně chybu zkus opravit. Po aktivitě se ti zobrazí správně přeložený text.