Tekutinová konstrukce gramatiky - Fluid construction grammar
Tento článek má několik problémů. Prosím pomozte vylepši to nebo diskutovat o těchto otázkách na internetu diskusní stránka. (Zjistěte, jak a kdy tyto zprávy ze šablony odebrat) (Zjistěte, jak a kdy odstranit tuto zprávu šablony)
|
Tekutinová konstrukce gramatiky (FCG) je open-source výpočetní stavební gramatika formalismus, který umožňuje výpočetním lingvistům formálně zapsat soupis lexikálních a gramatických konstrukcí a experimentovat s učením jazyků a vývojem jazyků.[1] FCG je otevřený nástroj, který mohou používat stavební gramatici, kteří chtějí přesně formulovat své intuice a data a chtějí otestovat důsledky svých návrhů gramatiky pro analýzu jazyka, produkci a učení. Formalismus lze otestovat prostřednictvím interaktivního webového rozhraní na adrese web FCG.
FCG integruje mnoho pojmů ze současnosti výpočetní lingvistika jako struktura funkcí a na sjednocení založené zpracování jazyka, ale používá je novým způsobem k operacionalizaci poznatků z teorie konstrukční gramatiky. Konstrukce jsou považovány za obousměrné, a proto jsou použitelné jak pro analýzu, tak pro výrobu. Zpracování je flexibilní v tom smyslu, že FCG poskytuje zpracování metavrstev pro zvládnutí nových, částečně negramatických nebo neúplných vět. FCG se nazývá „tekutý“, protože uznává předpoklad, že uživatelé jazyka neustále mění a aktualizují své gramatiky. Výzkum FCG provádí především Luc Steels a jeho týmy na Laboratoř VÚB AI v Bruselu a Laboratoř jazykové evoluce v Barceloně a Sony Computer Science Laboratories v Paříži. Kromě společností Steels patří i současní a bývalí přispěvatelé k formalizmu FCG Katrien Beuls, Paul Van Eecke, Remi van Trijp, Joris Bleys, Joachim De Beule, Martin Loetzsch, Nicolas Neubauer, Michael Spranger, Wouter Van den Broeck, Pieter Wellens a další.
Přechodná struktura
FCG zachází s analýzou a produkcí jako s problémem vyhledávání, ve kterém vyhledávač FCG hledá nejlepší výrok k verbalizaci významu (jazyková produkce) nebo nejlepšího sémantická síť (nebo významová reprezentace) k analýze výpovědi (parsování). Každá reprezentace stavu v procesu hledání se nazývá přechodná struktura. Přechodnou strukturu lze považovat za rozšířenou strukturu prvků, protože se skládá z (plochého) seznamu „jednotek“, které se skládají z názvu jednotky (jedinečný konstantní symbol) a těla jednotky (sada hodnoty prvku). páry). Starší verze FCG (před rokem 2011) slouží k rozdělení přechodné struktury na dva samostatné póly pro sémantiku a syntaxi, ale aktuální verze implementuje jedinou reprezentaci pro všechny jazykové informace.
Stavby
Stavby FCG (nebo technicky vzato: konstrukční schémata) jsou považovány za operátory procesu vyhledávání. To znamená, že použitím konstrukce na přechodnou strukturu lze vytvořit novou přechodnou strukturu (nebo stavovou reprezentaci) ve vyhledávacím prostoru. Stejně jako přechodné struktury se konstrukce většinou skládají z jednotek dvojic vlastností a hodnot. Konstrukce jsou však strukturovanější, protože obsahují dvě odlišné části:
- Podmíněná část: Tato část stavby specifikuje podmínky, za kterých může stavba platit. Kromě toho jsou jednotky prvků, které se objevují v podmíněné části, rozděleny na „zámek porozumění“ a „zámek formulace“. Toto rozdělení je důležité pro zajištění obousměrného použití konstrukce FCG (viz níže).
- Přispívající část: Tato část konstrukce specifikuje informace, které může stavba přidat do přechodové struktury, pokud jsou splněny podmínky pro použití.
Jazykové zpracování
Aby bylo možné rozhodnout, zda lze konstrukci použít, je podmíněná součást „porovnána“ s aktuální přechodnou strukturou pomocí algoritmu založeného na sjednocení. Ve výrobě musí být proti přechodové struktuře porovnány pouze prvky, které jsou součástí zámků konstrukce. zatímco při analýze budou brány v úvahu pouze funkce, které jsou součástí zámků porozumění. Pokud je shoda úspěšná, modul FCG "spojí" všechny jednotky párů vlastností a hodnot s přechodnou strukturou v podobném procesu založeném na sjednocení.
Flexibilita
FCG obsahuje metavrstvy diagnostiky, oprav a konsolidačních strategií, které umožňují návrháři gramatiky implementovat způsoby zpracování novinek, chyb a neočekávaných vstupů během zpracování. Tyto diagnostiky a opravy lze také použít k průzkumu (automatizovaného) pořizování nových staveb.
Reference
- ^ Steels, Luc (ed.) (2011). Návrhové vzory v gramatice konstrukce tekutin. Amsterdam: John Benjamins.CS1 maint: další text: seznam autorů (odkaz)
- Luc Steels (ed.) (2011). Návrhové vzory v gramatice konstrukce tekutin. John Benjamins, Amsterdam.
- Luc Steels (ed.) (v tisku). Výpočtové problémy v konstrukci tekutin. Springer, New York.
- Remi van Trijp, Luc Steels, Katrien Beuls a Pieter Wellens. Fluid Construction Grammar: The New Kid on the Block. Sborník příspěvků ze 13. konference evropské kapitoly Asociace pro počítačovou lingvistiku, Avignon, 2012. ACL.
- Luc Steels a Joachim De Beule (2006) (Velmi) stručný úvod do gramatiky konstrukce tekutin Třetí mezinárodní seminář o škálovatelném porozumění přirozenému jazyku (ScaNaLU 2006) 8. června 2006, po HLT / NAACL, New York City
externí odkazy
- http://www.fcg-net.org/ (web komunity FCG, s online ukázkami a kapitolami nejnovější knihy FCG)
- http://www.emergent-languages.org/ (web o gramatických experimentech, které používají FCG).