Příkladový strojový překlad - Example-based machine translation
![]() | tento článek potřebuje další citace pro ověření.Červen 2012) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Příkladový strojový překlad (EBMT) je metoda strojový překlad je často charakterizováno dvojjazyčným použitím korpus s paralelní texty jako jeho hlavní znalostní báze za běhu. Je to v podstatě překlad od analogie a lze jej považovat za implementaci a uvažování na základě jednotlivých případů přístup k strojové učení.
Analogický překlad
Základem strojového překladu založeného na příkladech je myšlenka analogického překladu. Při aplikaci na proces lidského překladu je myšlenka, že překlad probíhá analogicky, odmítnutím myšlenky, že lidé překládají věty hlubokou lingvistickou analýzou. Místo toho je založen na víře, že lidé se překládají tak, že nejprve rozloží větu na určité fráze, poté tyto fráze přeloží a nakonec tyto fragmenty řádně složí do jedné dlouhé věty. Frázové překlady se překládají analogicky k předchozím překladům. Princip analogického překladu je zakódován do strojového překladu založeného na příkladech prostřednictvím příkladových překladů, které se používají k trénování takového systému.
Další přístupy ke strojovému překladu, včetně statistický strojový překlad, naučit se proces překladu také pomocí dvojjazyčných korpusů.
Dějiny
Příkladový strojový překlad jako první navrhl Makoto Nagao v roce 1984.[1] Poukázal na to, že je speciálně přizpůsoben překladu mezi dvěma zcela odlišnými jazyky, jako je angličtina a japonština. V tomto případě lze jednu větu přeložit do několika dobře strukturovaných vět v jiném jazyce, proto není užitečné provádět hloubkovou lingvistickou analýzu charakteristickou pro strojový překlad založený na pravidlech.
Příklad
Angličtina | japonský | |
---|---|---|
Kolik to je červený deštník? | Ano akai kasa wa ikura desu ka. | |
Kolik to je malý fotoaparát? | Ano chiisai kamera wa ikura desu ka. |
Systémy strojového překladu založené na příkladech jsou trénovány z dvojjazyčných paralelních korpusů obsahujících páry vět, jako je příklad zobrazený v tabulce výše. Věty páry obsahují věty v jednom jazyce s jejich překlady do jiného. Konkrétní příklad ukazuje příklad a minimální pár, což znamená, že věty se liší pouze o jeden prvek. Tyto věty usnadňují naučení překladů částí věty. Například strojový překladový systém založený na příkladu by se z výše uvedeného příkladu naučil tři jednotky překladu:
- Kolik to je X ? odpovídá Ano X wa ikura desu ka.
- červený deštník odpovídá akai kasa
- malý fotoaparát odpovídá chiisai kamera
Skládání těchto jednotek lze v budoucnu použít k vytvoření nových překladů. Například pokud jsme byli vyškoleni pomocí nějakého textu obsahujícího věty:
Prezident Kennedy byl během přehlídky zastřelen. a Odsouzený unikl 15. července. Mohli bychom větu přeložit Odsouzený byl během přehlídky zastřelen. nahrazením příslušných částí vět.
Frázová slovesa
Příkladový strojový překlad je nejvhodnější pro podjazykové jevy jako frázová slovesa. Frázová slovesa mají vysoce kontextově závislé významy. Jsou běžné v angličtině, kde obsahují sloveso následované znakem příslovce a / nebo a předložka, které se nazývají částice ke slovesu. Frázová slovesa vytvářejí specializované kontextově specifické významy, které nemusí být odvozeny od významu složek. Během překladu slova do slova ze zdrojového do cílového jazyka je téměř vždy nejednoznačnost.
Jako příklad zvažte frázové sloveso „nasadit“ a jeho hindustánský překlad. Lze jej použít některým z následujících způsobů:
- Ram rozsvítil světla. (Zapnuto) (Hindustani translation: Jalana)
- Beran si nasadil čepici. (Wear) (Hindustani překlad: Pahenna)
Viz také
Reference
- ^ Makoto Nagao (1984). „Rámec mechanického překladu mezi japonštinou a angličtinou na principu analogie“ (PDF). V A. Elithorn a R. Banerji (ed.). Umělá a lidská inteligence. Elsevier Science Publishers.
Další čtení
- Carl, Michael; Way, Andy (2003). Nedávné pokroky v strojovém překladu založeném na příkladech. Nizozemsko: Springer. doi:10.1007/978-94-010-0181-6. ISBN 978-1-4020-1400-0.