Použitelnost softwaru pro strojový překlad - Machine translation software usability
V následujících částech jsou uvedena objektivní kritéria pro hodnocení použitelnosti strojový překlad softwarový výstup.
Stacionárnost nebo kanonická forma
Sbližují se opakované překlady v jednom jazyce v obou jazycích? Tj. ukazuje způsob překladu stacionárnost nebo vyrobit kanonická forma ? Stane se překlad nehybný, aniž by ztratil původní význam? Tato metrika byla kritizována jako nedostatečně korelovaná BLEU (BiLingual Evaluation Understudy) skóre.[1]
Přizpůsobuje se hovorovému slovu, argotu nebo slangu
Je systém adaptivní na hovorovost, hantýrka nebo slang ? The Francouzský jazyk má mnoho pravidel pro vytváření slov v řeči a psaní populární kultura. Dvě taková pravidla jsou: (a) Obrácený pravopis slov jako femme na meuf. (Tomu se říká verlan.) (b) Přípona přípony -ardard k podstatnému jménu nebo slovesu k vytvoření vlastního podstatného jména. Například podstatné jméno faluche znamená „studentský klobouk“. Slovo faluchard vytvořen z faluche hovorově může v závislosti na kontextu znamenat „skupinu studentů“, „shromáždění studentů“ a „chování typické pro studenta“. Překladač Google k 28. prosinci 2006 neodvozuje vytvořená slova, například z pravidla (b), jak je znázorněno zde:
Il y a une chorale falucharde mercredi, venez nombreux, les faluchards chantent des paillardes! ==> Ve středu je sborová společnost falucharde, přijít mnoho, faluchardi zpívají volně žijící ženy!
Francouzský argot má tři úrovně využití:[2]
- familier nebo přátelský, přijatelný mezi přáteli, rodinou a vrstevníky, ale ne v práci
- hrubší nebo nadávky, přijatelné mezi přáteli a vrstevníky, ale ne v práci nebo v rodině
- verlan nebo ghetto slang, přijatelné pro nižší třídy, ale ne pro střední nebo vyšší třídy
Spojené státy Národní institut pro standardy a technologie provádí roční hodnocení [1] z strojový překlad systémy založené na BLEU -4 kritérium [2]. Gimenez a Amigo implementovali kombinovanou metodu nazvanou IQmt, která zahrnuje BLEU a další metriky NIST, GTM, ROUGE a METEOR [3].
Dobře tvarovaný výstup
Je výstup gramatický nebo dobře tvarovaný v cílovém jazyce? Použití interlingua by mělo být v tomto ohledu užitečné, protože s pevnou interlinguou by měl být člověk schopen psát gramatické mapování na cílový jazyk z interlingua. Zvažte následující arabština vstup a anglický jazyk výsledek překladu od překladače Google k 27. prosinci 2006 [4]. Tento výstup překladače Google nelze analyzovat pomocí rozumného anglická gramatika:
وعن حوادث التدافع عند شعيرة رمي الجمرات -التي كثيرا ما يسقط فيها العديد من الضحايا- أشار الأمير نايف إلى إدخال "تحسينات كثيرة في جسر الجمرات ستمنع بإذن الله حدوث أي تزاحم". ==> A incidenty při rituálu házení Carbuncles, které často spadají tam, kde mnoho obětí - princ Nayef poukázal na zavedení „mnoha vylepšení mostu Carbuncles Bůh zastaví výskyt jakéhokoli soutěžení.“
Zachování sémantiky
Opakovanými překlady zachovejte sémantika původní věty? Zvažte například následující vstup do angličtiny předaný několikrát do az francouzštiny pomocí překladače Google k 27. prosinci 2006:
Lepší o den dříve než o den později. ==>
Améliorer un jour plus tôt qu'un jour tard. ==>
Zlepšit se o den dříve než o den později. ==>
Nalijte améliorer un jour plus tôt qu'un jour tard. ==>
Zlepšit se o den dříve než o den později.
Jak je uvedeno výše a v,[1] tento druh obousměrného překladu je velmi nespolehlivá metoda hodnocení.
Důvěryhodnost a bezpečnost
Zajímavá zvláštnost Google Překladač k 24. lednu 2008 (opraveno k 25. lednu 2008) je při překladu z angličtiny do španělštiny následující výsledek, který ukazuje vložený žert v anglicko-španělském slovníku, který má vzhledem k nedávným událostem určitou přidanou důležitost:
Heath Ledger je mrtvý ==>
Tom Cruise está muerto
To vyvolává otázku důvěryhodnosti, když se spoléháme na strojový překladový systém zabudovaný do a Životně důležitý systém ve kterém má překladový systém vstup do a Kritické rozhodování o bezpečnosti proces. Souběžně to vyvolává otázku, zda při daném použití software systému strojového překladu je bezpečný z hackeři.
Není známo, zda tato funkce Překladače Google byla výsledkem vtipu / hacknutí nebo snad neúmyslným důsledkem použití metody, jako je statistický strojový překlad. Reportéři z Sítě CNET 24. ledna 2008 požádal Google o vysvětlení; Google uvedl pouze to, že se jednalo o „interní problém s Překladačem Google“.[3] Chybný překlad byl na internetu předmětem mnoha veselostí a spekulací.[4][5]
Pokud se jedná o nezamýšlený důsledek použití metody, jako je statistický strojový překlad, a nikoli vtip / hack, pak je tato událost ukázkou potenciálního zdroje kritické nespolehlivosti v metodě statistického strojového překladu.
V lidských překladech, zejména na straně tlumočníci „Selektivita překladatele při provádění překladu je často komentována, když jedna ze dvou stran obsluhovaných tlumočníkem zná oba jazyky.
To vede k otázce, zda lze uvažovat o konkrétním překladu ověřitelný. V tomto případě by konvergující zpáteční překlad byl jakýmsi ověřením.
Viz také
Poznámky
- ^ A b Somers, Harold (2005). „Zpáteční překlad: K čemu je to dobré?“. Sborník z Australasian Language Technology Workshop ALTW 2005. Sydney: 127–133.
- ^ „Agony of Argot“, Chitlins & Camembert, 28. října 2005
- ^ „Chyba Google Translate zamíchá Heath Ledger, Tom Cruise“, autor: Caroline McCarthy, Sítě CNET, 24. ledna 2008
- ^ „„ Tom Cruise “je španělština pro„ Heath Ledger ““, gawker.com, 24. ledna 2008 Archivováno 28. Ledna 2008 v Wayback Machine
- ^ „Tom Cruise está muerto“, Ray Leon Blog Project, 24. ledna 2008 Archivováno 29. Října 2008 v Wayback Machine
Reference
- Gimenez, Jesus a Enrique Amigo. (2005) IQmt: Rámec pro hodnocení strojového překladu.
- NIST. Roční hodnocení systému strojového překladu a plán hodnocení.
- Papineni, Kishore, Salim Roukos, Todd Ward a Wei-Jing Zhu. (2002) BLEU: Metoda automatického vyhodnocení strojového překladu. Proc. 40. výroční zasedání ACL, červenec 2002, s. 311–318.