Gramatika struktury fráze řízené hlavou - Head-driven phrase structure grammar
Gramatika struktury fráze řízené hlavou (HPSG) je vysoce lexikalizovaný, gramatika založená na omezeních[1] vyvinutý uživatelem Carl Pollard a Ivan Sag.[2][3] Je to typ frázová struktura gramatiky, na rozdíl od a závislost gramatiky a je jeho bezprostředním nástupcem zobecněná frázová struktura gramatiky. HPSG čerpá z jiných polí, jako je počítačová věda (teorie datových typů a reprezentace znalostí ) a použití Ferdinand de Saussure pojetí podepsat. Využívá jednotný formalismus a je organizován modulárním způsobem, díky kterému je atraktivní zpracování přirozeného jazyka.
HPSG gramatika zahrnuje principy a pravidla gramatiky a Lexikon položky, které se obvykle nepovažují za gramatiku. Formalismus je založen na lexikalismu. To znamená, že lexikon není jen seznamem záznamů; je samo o sobě bohatě strukturované. Jednotlivé položky jsou označeny typy. Typy tvoří hierarchii. Rané verze gramatiky byly velmi lexikalizovány s několika gramatickými pravidly (schématem). Novější výzkum má tendenci přidávat další a bohatší pravidla a stává se více podobným stavební gramatika.[4]
Základní typ, se kterým se HPSG zabývá, je znaménko. Slova a fráze jsou dva různé podtypy znaménka. Slovo má dvě funkce: [PHON] (zvuk, fonetický formulář) a [SYNSEM] (dále jen syntaktický a sémantický informace), které jsou rozděleny do dílčích funkcí. Značky a pravidla jsou formalizována jako napsaný strukturní struktury.
Ukázková gramatika
HPSG generuje řetězce kombinací znaků, které jsou definovány jejich umístěním v hierarchii typů a jejich vnitřní strukturou funkcí, představovanou matice hodnot atributů (AVM).[3][5] Funkce berou jako své hodnoty typy nebo seznamy typů a tyto hodnoty mohou mít zase svou vlastní strukturu funkcí. Gramatická pravidla jsou do značné míry vyjádřena vzájemně umístěnými znaky omezení. Struktura vlastností znaménka popisuje jeho fonologické, syntaktické a sémantické vlastnosti. V běžném zápisu jsou AVM psány s funkcemi velkými písmeny a typy psanými malými písmeny. Očíslované indexy v AVM představují token identické hodnoty.
Ve zjednodušeném AVM pro slovo (v tomto případě sloveso, nikoli podstatné jméno jako v „pěkných procházkách na víkend“) „procházky“ níže, je kategorická informace slovesa (CAT) rozdělena na prvky, které jej popisují (HEAD) a funkce, které popisují jeho argumenty (VALENCE).
„Procházky“ jsou znamením typu slovo s hlavou typu sloveso. Jako nepřechodné sloveso nemá „procházky“ žádný doplněk, ale vyžaduje předmět, který je podstatným jménem jednotného čísla třetí osoby. Sémantická hodnota subjektu (OBSAH) je indexována společně s jediným slovesným argumentem (jednotlivec, který chodí). Následující AVM pro „she“ představuje znaménko s hodnotou SYNSEM, které by tyto požadavky mohlo splnit.
Známky typu fráze sjednotit se s jedním nebo více dětmi a šířit informace nahoru. Následující AVM kóduje pravidlo okamžité dominance pro head-subj-phrase, který vyžaduje dvě děti: dítě hlavy (sloveso) a dítě bez hlavy, které splňuje omezení SUBJ slovesa.
Konečným výsledkem je znaménko s hlavicí slovesa, prázdnými funkcemi podkategorizace a fonologickou hodnotou, která objedná dvě děti.
Ačkoli skutečná gramatika HPSG je složena výhradně z struktur rysů, lingvisté často používají stromy, aby představovali sjednocení znaků, kde by ekvivalentní AVM bylo nepraktické.
Implementace
Rozličný analyzátory na základě HPSG formalismu byly napsány a optimalizace jsou v současné době vyšetřovány. Příklad analýzy systému Němec věty poskytuje Freie Universität Berlin.[6] Kromě toho CoreGram[7] projekt gramatické skupiny Freie Universität Berlin poskytuje open source gramatiky, které byly implementovány v systému TRALE. V současné době existují gramatiky pro Němec,[8] dánština,[9] Mandarinská čínština,[10] maltština,[11] a Peršan[12] které sdílejí společné jádro a jsou veřejně dostupné.
Velké HPSG gramatiky různých jazyků jsou vyvíjeny v rámci Deep Linguistic Processing with HPSG Initiative (DELPH-IN ).[13] Gramatiky širokého pokrytí angličtiny,[14] Němec,[15] a japonský[16] jsou k dispozici pod licencí open-source. Tyto gramatiky lze použít s řadou vzájemně kompatibilních open-source analyzátorů HPSG: LKB, PET,[17] Eso,[18] a souhlasit.[19] Všechny tyto produkty produkují sémantické reprezentace ve formátu „Minimal Recursion Semantics“, MRS.[20] Deklarativní povaha formalismu HPSG znamená, že tyto výpočetní gramatiky lze obvykle použít pro obě analýza a generace (výroba povrchových řetězců ze sémantických vstupů). Stromy, také distribuovány uživatelem DELPH-IN, se používají k vývoji a testování gramatik, stejně jako k trénování hodnotících modelů pro rozhodování o věrohodných interpretacích při analýze (nebo realizacích při generování).
Enju je volně dostupný pravděpodobnostní analyzátor HPSG se širokým pokrytím pro angličtinu vyvinutý laboratoří Tsujii v Tokijská univerzita v Japonsko.[21]
Viz také
- Lexikálně funkční gramatika
- Sémantika minimální rekurze
- Relační gramatika
- Situační sémantika
- Syntax
- Transformační gramatika
- Typ Popis Jazyk
Reference
- ^ "HPSG".
- ^ Pollard, Carl a Ivan A. Sag. 1987. Syntax a sémantika založená na informacích. Svazek 1. Základy. Poznámky k přednášce CLSI 13.
- ^ A b Pollard, Carl; Ivan A. Sag. (1994). Gramatika struktury fráze řízené hlavou. Chicago: University of Chicago Press.
- ^ Sag, Ivan A. 1997. Konstrukce s relativní klauzí v angličtině[trvalý mrtvý odkaz ]. Lingvistický žurnál. 33,2: 431-484
- ^ Sag, Ivan A .; Thomas Wasow; & Emily Bender. (2003). Syntaktická teorie: formální úvod. 2. vyd. Chicago: University of Chicago Press.
- ^ Systém Babel: HPSG Interactive
- ^ Projekt CoreGram
- ^ Berligram
- ^ DanGram
- ^ čínština
- ^ maltština
- ^ Peršan
- ^ DELPH-IN: Hluboké zpracování open-source
- ^ English Resource Grammar and Lexicon
- ^ Berthold Crysmann
- ^ JacyTop - Hluboké lingvistické zpracování s HPSG (DELPH-IN)
- ^ Analyzátor DELPH-IN PET
- ^ Eso: Omezovač odpovědí Engine
- ^ souhlasím s gramatickým inženýrstvím
- ^ Copestake, A., Flickinger, D., Pollard, C., & Sag, I. A. (2005). Sémantika minimální rekurze: Úvod. Výzkum jazyků a výpočtů, 3 (2–3), 281–332.
- ^ Tsuji Lab: Domovská stránka analyzátoru Enju Archivováno 07.03.2010 na Wayback Machine (vyvoláno 24. listopadu 2009)
Další čtení
- Carl Pollard, Ivan A. Sag (1987): Informační syntax a sémantika. Svazek 1: Základy. Stanford: Publikace CSLI.
- Carl Pollard, Ivan A. Sag (1994): Hlava řízená gramatická struktura fráze. Chicago: University of Chicago Press. ([1] )
- Ivan A. Sag, Thomas Wasow, Emily M. Benderová (2003): Syntaktická teorie: formální úvod, druhé vydání. Chicago: University of Chicago Press. ([2] )
- Levine, Robert D.; W. Detmar Meurers (2006). „Fráze strukturované fráze podle hlavy: lingvistický přístup, formální základy a výpočetní realizace“ (PDF). V Keith Brown (ed.). Encyklopedie jazyka a lingvistiky (druhé vydání). Oxford: Elsevier. Archivovány od originál (PDF) dne 2008-09-05. Citováno 2008-03-07.
- Müller, Stefan (2013). „Unifying Everything: Some Remarks on Simpler Syntax, Construction Grammar, Minimalism and HPSG“. Jazyk. 89 (4): 920–950. doi:10.1353 / lan.2013.0061.
externí odkazy
- Domovská stránka Stanford HPSG - zahrnuje online sborník z výroční konference HPSG
- Domovská stránka státu HPSG v Ohiu
- Mezinárodní konference o gramatice struktury frází na základě hlavy
- Síť DELPH-IN pro vývoj gramatiky HPSG
- Základní přehled HPSG
- Srovnání HPSG s alternativami a historická perspektiva
- Bibliografie publikací HPSG
- Balíček LaTeX pro kreslení AVM - zahrnuje dokumentaci