Řízený jazyk ve strojovém překladu - Controlled language in machine translation
![]() | Tento článek obsahuje seznam obecných Reference, ale zůstává z velké části neověřený, protože postrádá dostatečné odpovídající vložené citace.únor 2013) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Použitím řízený jazyk v strojový překlad představuje několik problémů.
V automatizovaném překladu je prvním krokem k pochopení ovládaného jazyka vědět, o co jde, a rozlišovat mezi ním přirozený jazyk a řízený jazyk.
Hlavní problém v strojový překlad je jazykový problém. Jazyk je nejednoznačný a systém se pokouší modelovat a Jazyk lexikálním a gramatickým způsobem. K vyřešení tohoto problému existuje spousta alternativ, např. A glosář lze použít související s tématem textu.
Řízený jazyk s deseti pravidly
Pravidla gramatiky se pro každý jazyk liší. Z tohoto důvodu se pravidla pro kontrolované jazyky liší od jednoho jazyka k druhému. A neexistují žádná pravidla, která mají optimální výsledky pro všechny jazyky. Existují však pravidla, která snižují nejasnosti ve většině textů v mnoha jazycích. Podle článku Uwe Muegge „Controlled Language Optimized for Uniform Translation“ (2002) by mělo být použito následujících deset pravidel:[1]
- Napište věty kratší než 25 slov.
- Buďte struční (dobře strukturovaní)
- Vyvarujte se nejednoznačnosti a podřízenosti
- Vyhodnoťte informace
- Napište věty, které vyjadřují pouze jednu myšlenku.
- Jednoduché věty
- Vyhněte se (gerundům, juxtapozici atd.)
- Pokud chcete vyjádřit stejný obsah, napište stejnou větu.
- Nebojte se opakovat
- Vyhněte se synonymům
- Napište věty, které jsou gramaticky úplné.
- Věty gramaticky a pravopisně správné
- Vyvarujte se elipsy.
- Napište věty, které mají jednoduchou gramatickou strukturu.
- Vyhněte se Juxtapostionu, podřízenosti, relativním zájmenům atd.
- Napište věty v aktivní formě.
- Vyhněte se pasivnímu hlasu
- Místo použití zájmena napište věty, které opakují podstatné jméno.
- Vyhněte se zájmena jako to, jejich, atd.
- Pište věty, které pomocí článků identifikují podstatná jména.
- Použití the, tento, atd.
- Pište věty, které používají slova z obecného slovníku.
- Nepoužívejte technická slova
- Pište věty, které používají pouze slova se správným pravopisem.
- Vyvarujte se chyb
Výhody používání kontrolovaného jazyka
Umožňuje vytvářet texty, které jsou čitelnější, srozumitelnější a snáze se udržují, a také s lepší slovní zásobou a stylem. Důvody pro zavedení kontrolovaného jazyka zahrnují:
- Dokumenty, které jsou čitelnější a srozumitelnější, zlepšují použitelnost produktu.
- Řízený jazyk zaručuje poskytování objektivní a strukturované podpory v typicky spíše subjektivním a nestrukturovaném prostředí.
- Prostředí řízeného jazyka řízeného nástroji umožňují automatizaci mnoha editačních úkolů a poskytují objektivní metriky kvality pro proces vytváření.
- Omezenější a kontrolovanější jazyk, jednotnější a standardizovanější výsledný zdrojový dokument a vyšší míra shody v systému překladové paměti a náklady na překlad jsou levnější.
- Řízený jazyk určený pro strojový překlad výrazně zlepší kvalitu návrhů strojově generovaného překladu a sníží čas a náklady na úpravy lidských překladatelů.
Řízený jazyk a překlad
Jednou z největších výzev, kterým čelí organizace, které chtějí snížit náklady a čas na jejich překlady, je skutečnost, že i v prostředích, která kombinují systémy pro správu obsahu s technologií překladové paměti, procento nepřeložených segmentů na nový dokument zůstává poměrně vysoké. I když je jistě možné spravovat obsah na úrovni věty / segmentu, zdá se, že současným osvědčeným postupem je blokovat na úrovni tématu. Což znamená, že k opětovnému použití dochází na poměrně vysoké úrovni podrobnosti.
Reference
- ^ Muegge, Uwe: "Řízený jazyk optimalizovaný pro jednotný překlad (CLOUT) ", nepublikovaný rukopis, 2002.
Zdroje
- AMORES CARREDANO, Jose Javier. Systémy automatického překladu [online]. K dispozici v: http://quark.prbb.org/19/019046.htm [Datum zobrazení: 29. května 2011]
- AECMA: AECMA Simplified English: A Guide for the Preparation of Aircraft Maintenance Documentation in the International Aerospace Maintenance Language, Bruselas, 1995.
- Grimaila, A .; Chandioux, J .: „Řešení šitá na míru“. In: John Newton, ed .: Počítače v překladu: praktické hodnocení, Londres, Routledge, 1992: 33-45.
- Hartley, A.F .; Paris, C.L .: «Produkce vícejazyčných dokumentů: od podpory překladu po podporu autorství», Strojový překlad (zvláštní vydání o nových nástrojích pro lidské překladatele) 1997; 12 (12): 109-129.
- Ide, já; Véronis, J .: «Úvod do zvláštního vydání o disambiguaci slovních smyslů: Nejmodernější», Computational Linguistics 1998; 24 (1): 1-40.
- Lehrberger, L .; Bourbeau, L .: Strojový překlad: Jazykové charakteristiky jazyka strojový překlad Systémy a obecná metodika hodnocení, Amsterdam / Filadelfia, John Benjamins, 1988.