Synchronní bezkontextová gramatika - Synchronous context-free grammar - Wikipedia
Synchronní bezkontextové gramatiky (SynCFG nebo SCFG; nesmí být zaměňována s stochastické CFG ) jsou typem formální gramatika určen pro použití v strojový překlad založený na přenosu. Pravidla v těchto gramatikách platí pro dva jazyky současně, přičemž zachycují gramatické struktury, které jsou překlady toho druhého.
Teorie SynCFGs si půjčuje od syntaxí řízená transdukce a strojový překlad založený na syntaxi, modelování přeskupení vět, ke kterému dochází při překladu věty pomocí korespondence mezi pravidly frázové struktury ve zdrojovém a cílovém jazyce. Bylo zjištěno, že výkon systémů MT založených na SCFG je srovnatelný nebo dokonce lepší než současný stav techniky frázový strojový překlad systémy.[1]Existuje několik algoritmů, které provádějí překlad pomocí SynCFG.[2]
Formalismus
Pravidla v SynCFG jsou povrchně podobná pravidlům CFG, kromě toho, že specifikují strukturu dvou frází současně; jeden ve zdrojovém jazyce (v překládaném jazyce) a jeden v cílovém jazyce. Numerické indexy označují korespondenci mezi neterminály v obou základních stromech. Chiang[1] uvádí čínský / anglický příklad:
- X → (yu X1 vy X2, mít X2 s X1)
Toto pravidlo označuje, že X fráze může být vytvořena v čínštině se strukturou "yu X1 vy X2„, kde X1 a X2 jsou proměnné, které stojí za subfrázemi; a že odpovídající struktura v angličtině je „mít X2 s X1„kde X1 a X2 jsou samostatně přeloženy do angličtiny.
Software
- cdec, MT dekódovací balíček, který podporuje SynCFG
- Joshua, systém dekódování strojového překladu napsaný v Javě
Reference
- ^ A b Chiang, David (2007). „Hierarchický frázový překlad“. Výpočetní lingvistika. 33 (2): 201–228. doi:10.1162 / coli.2007.33.2.201.
- ^ Venugopal, Ashish; Zollmann, Andreas; Vogel, Stephan (2007). „Efektivní dvouprůchodový přístup ke statistickému MT řízenému synchronně-CFG“. Proc. NAACL HLT. 500–507.