Zobecněná bezkontextová gramatika - Generalized context-free grammar

Zobecněná bezkontextová gramatika (GCFG) je gramatický formalizmus, který se rozšiřuje bezkontextové gramatiky přidáním potenciálně bezkontextových funkcí kompozice k přepsání pravidel.[1] Hlava gramatiky (a jeho slabé ekvivalenty) je příkladem takového GCFG, o kterém je známo, že je obzvláště zběhlý v manipulaci s celou řadou přirozených jazyků bez CF vlastností.

Popis

GCFG se skládá ze dvou komponent: sady funkcí kompozice, které kombinují řetízkové n-tice, a sady pravidel přepisování. Všechny funkce složení mají formu , kde je buď jediná řazená řazená kolekce členů, nebo nějaké použití (potenciálně odlišné) funkce kompozice, která se redukuje na řetízkovou řazenou kolekci členů. Pravidla pro přepis vypadají , kde , , ... jsou řetězcové n-tice nebo nekoncové symboly.

Sémantika přepisu GCFG je poměrně přímočará. Výskyt neterminálního symbolu je přepsán pomocí pravidel přepisu jako v bezkontextové gramatice, přičemž nakonec vzniknou pouze kompozice (funkce kompozice aplikované na řetízkové n-tice nebo jiné kompozice). Potom se použijí funkce kompozice, které postupně redukují n-tice na jednu n-tici.

Příklad

Jednoduchý překlad bezkontextové gramatiky do GCFG lze provést následujícím způsobem. Vzhledem k gramatice v (1), který generuje jazyk palindromu , kde je řetězec obráceně , můžeme definovat funkci složení konc jako v (2a) a pravidla přepsání jako v (2b).

 

 

 

 

(1)

 

 

 

 

(2a)

 

 

 

 

(2b)

Produkce CF z abbbba je

S
jako
abSba
abbSbba
abbbba

a odpovídající produkce GCFG je

Lineární bezkontextové přepisovací systémy (LCFRS)

Weir (1988)[1] popisuje dvě vlastnosti kompozičních funkcí, linearitu a pravidelnost. Funkce definovaná jako je lineární právě tehdy, když se každá proměnná objeví nejvýše jednou na obou stranách =, tvorba lineární, ale ne . Funkce definovaná jako je normální, pokud má levá a pravá strana přesně stejné proměnné, takže pravidelné, ale ne nebo .

Gramatika, ve které jsou všechny kompoziční funkce lineární i pravidelné, se nazývá Lineární bezkontextový přepisovací systém (LCFRS). LCFRS je a správná podtřída GCFG, tj. má přísně menší výpočetní výkon než GCFG jako celek.

Na druhou stranu jsou LCFRS přísně výraznější než lineárně indexované gramatiky a jejich slabě ekvivalentní varianta strom sousední gramatiky (ZNAČKY).[2] Hlava gramatiky je dalším příkladem LCFRS, který je přísně méně výkonný než třída LCFRS jako celek.

LCFRS jsou slabě ekvivalentní (set-local) vícesložkový ZNAČKY (MCTAG ) a také s vícekontextová gramatika (MCFG [1] ).[3] a minimalistické gramatiky (MG). Jazyky generované LCFRS (a jejich slabě ekvivalentní) lze analyzovat polynomiální čas.[4]

Viz také

Reference

  1. ^ A b Weir, David Jeremy (září 1988). Charakterizace gramatických formalizmů mírně citlivých na kontext (PDF) (Ph.D.). Papír. AAI8908403. University of Pennsylvania Ann Arbor.
  2. ^ Laura Kallmeyer (2010). Analýza nad rámec bezkontextových gramatik. Springer Science & Business Media. p. 33. ISBN  978-3-642-14846-0.
  3. ^ Laura Kallmeyer (2010). Analýza nad rámec bezkontextových gramatik. Springer Science & Business Media. p. 35-36. ISBN  978-3-642-14846-0.
  4. ^ Johan F.A.K. van Benthem; Alice ter Meulen (2010). Příručka logiky a jazyka (2. vyd.). Elsevier. p. 404. ISBN  978-0-444-53727-0.