Caitra - Caitra
Caitra je překlad Computer Assisted Tool, nebo CAT, vyvinutý University of Edinburgh. Caitra je poskytována z online platformy a je založena na AJAX Technologie Web.2 a Mojžíšův dekodér. Webová stránka nástroje je implementována pomocí Ruby on Rails, otevřený webový framework a C ++.
Caitra pomáhá lidským překladatelům tím, že nabízí návrhy a alternativní překlady.
Dějiny
Strojový překlad Systémy (MT) obvykle používají čtenáři, kteří nepotřebují důkladný překlad a chtějí rychlý přístup k cizímu jazyku. Profesionální překladatelé obvykle vyžadují pokročilé nástroje pro strojový překlad, aby jim usnadnili práci a poskytli klientům kvalitnější překlad. Projekt Trans-Type (Langlais et al., 2000) poskytl průkopnický přístup k MT jako pomůcka pro lidské překladatele . Tento překladatelský nástroj by navrhoval různé překlady pro určitý segment, přičemž by překladateli poskytoval příležitost přijmout navrhovaný překlad nebo jej přepsat vlastním překladem, což by následně vyvolalo nové potenciální překlady do nástroje. To však nemusí být nutně vhodné pro profesionální překladatele. Byly také vyvinuty nástroje s post-edičním vybavením jako prostřední pole mezi typickými překladateli MT a člověkem, aby bylo možné integrovat překlad MT a člověka a dosáhnout požadovaných výsledků. Škola informatiky a skupina strojového překladu univerzity v Edinburghu vytvořila výzkumný program CAITRA, který analyzuje výhody různých typů MT a zkoumá interakci mezi strojem a uživatelem za účelem vývoje nových CAT nástroje.
Vlastnosti
Caitra je naprogramována pomocí open-source webového rámce Ruby on Rails (Thomasand Hansson, 2008). Online platforma používá Technologie Web 2.0 ve stylu Ajax (Raymond, 2007) připojený k a MySQL back-end založený na databázi. Back-end strojového překladu je napájen z statistická věta založená na MT, Mojžíš (Koehn et al., 2007). C ++ je integrován s cílem zlepšit rychlost procesu návrhů překladů. Tento nástroj poskytuje Škola informatiky online jako studii interakce uživatele s tímto nástrojem, stejně jako schopnost členů navrhovat další funkce a opravy programu. .
Uživatel zadá text do zadaného textového pole. Caitra zpracovává text, když uživatel klikne na ikonu „Nahrát“. Proces může trvat několik minut a Caitra najde různé možnosti překladu, jedna z nich je převzata ve výchozím nastavení. Po dokončení procesu mají překladatelé k dispozici několik možností pomoci, které jsou uvedeny v rozhraní. Segment pro překlad je věta, takže Caitra pracuje pouze s jednou větou současně.
Interaktivní strojový překlad
Projekt Trans-Type (Langlais et al., 2000) provedl šetření o Interaktivní strojový překlad, skládající se z překladu větného segmentu podporovaného Nástroj CAT, který navrhuje několik různých možností překladu. Lidští překladatelé si mohou vybrat jednu z nich nebo poskytnout vlastní překlad, pokud se jim nabízené překlady nelíbí. Tento proces je podobný automatické dokončování nástroj používaný v několika kancelářských programech.
The statistický překladový systém následuje generování předpovědí pro překlad. Tyto předpovědi jsou poskytovány v krátkých frázích, podle statistický překladový model založený na frázích. Tento model také uživateli usnadňuje čtení předpovědí. Návrhy a akce uživatelů jsou uloženy ve velké databázi. Během interakce s uživatelem Caitra rychle porovná vstupy uživatele s grafem pomocí míry vzdálenosti úprav řetězce. Predikce je optimální cesta dokončení, která odpovídá vstupu uživatele s (a) minimální vzdáleností pro úpravu řetězce a (b) nejvyšší pravděpodobností překladu věty. Tento výpočet probíhá na serveru a je implementován v C ++, jak vysvětluje Philipp Koehn.[1]Jakmile uživatel přijme návrh, zobrazí se nový a také zadání nového segmentu. Přijetí návrhů závisí na dvojici jazyků a složitosti textu. Předběžné studie o modelu CAITRA naznačují, že uživatelé obvykle přijímají 50–80% předpovědí generovaných systémem.
Proces překladu
Jakmile je text nahrán, uživatelé mohou vidět výsledek strojového překladu a upravit text na základě předpovědí. Tabulka predikcí se zobrazí kliknutím na ikonu úprav. Text je rozdělen na věty, které jsou také rozděleny na menší jednotky. Předpovědi pro tyto jednotky se zobrazí v rámečku a nejpravděpodobnější návrh má jinou barvu v nejvyšší části tabulky. Předpovědi se přijímají kliknutím na ně a systém aktualizuje volbu na vstup uživatele. Databáze je tvořena množstvím párů přeložených textů a překladů. Nejpravděpodobnější předpověď je výsledkem předchozích shod v databázi. Volby uživatele jsou hodnoceny v databázi, která bude použita v budoucích překladech. Tyto předpovědi pomáhají nejen profesionálním překladatelům, ale i začínajícím překladatelům, kteří neznají slovní zásobu, a lidem bez znalosti cizího jazyka.
Proces strojového překladu po úpravě
Uživatelé mohou Posouzení jejich překlad a provést jakoukoli změnu k nápravě možných chyb. Změny se objeví na výstupním displeji.
Aktivita uživatele
Caitra ukládá přidělený čas, ve kterém uživatelé přijmou predikci nebo vytvoří vlastní překlad. Akce mají pro budoucí předpovědi různý význam v závislosti na akcích uživatele a v čase, který potřebují k provedení svého překladu. Každá akce, pauza nebo pohyb jsou relevantní, aby se zlepšily budoucí překlady.
Reference
- ^ Koehn, Phillip. „Webový interaktivní počítačový překladatelský nástroj“ (PDF). Škola informatiky, University of Edinburgh.
- Philipp Koehn, Hieu Hoang, Alexandra Birch, Chris Callison-Burch, Marcello Federico, Nicola Bertoldi, Brooke Cowan, Wade Shen, Christine Moran, Richard Zens, Chris Dyer, Ondrej Bojar, Alexandra Constantin, Evan Herbst. (2007) „Moses: Open Source Toolkit pro statistický strojový překlad“. Výroční zasedání Asociace pro výpočetní lingvistiku (ACL), demonstrační zasedání, Praha, červen 2007.
- Olivia Craciunescu, „Strojový překlad a počítačový překlad: nový způsob překladu?“
externí odkazy
- Caitra Oficiální stránky
- Statistická skupina strojového překladu na univerzitě v Edinburghu
- Oficiální web Mojžíše. University of Edinburgh