Filtrovaná praskající rekurzivní přechodová síť - Filtered-popping recursive transition network - Wikipedia
A filtrovaná praskající rekurzivní přechodová síť (FPRTN),[1] nebo jednoduše filtrovaná síť (FPN), je rekurzivní přechodová síť (RTN )[2] rozšířen o mapu států ke klíčům, kde se vrací z a podprogram skok vyžaduje, aby byly akceptor a návratové stavy mapovány na stejný klíč. RTN jsou stroje konečného stavu které lze vidět jako konečné automaty prodloužena o a zásobník návratových států; stejně jako náročné přechody a - přechody, RTN může definovat přechody hovorů. Tyto přechody provádějí a podprogram skok zatlačením cílového stavu přechodu na zásobník a přivedením stroje do volaného stavu. Pokaždé, když je dosažen stav akceptoru, je vrácen stav návratu v horní části zásobníku, za předpokladu, že zásobník není prázdný, a stroj je uveden do tohoto stavu.
V celém tomto článku označujeme rekurzivní přechodové sítě s filtrovaným vyskakováním jako FPN, i když tato zkratka je nejednoznačná (např .: fuzzy Petriho sítě ). Filtrované sítě a FPRTN jsou jednoznačné alternativy.
Formální definice
FPN je struktura kde
- je konečná množina států,
- je konečná sada klíčů,
- je abeceda konečných vstupů,
- je funkce částečného přechodu, jako prázdný symbol,
- je mapa států ke klíčům,
- je množina počátečních stavů a
- je sada stavů přijetí.
Přechody
Přechody představují možnost přenést FPN ze zdrojového stavu do cílového stavu případně provedením další akce. V závislosti na této akci rozlišujeme následující typy výslovně-definované přechody:
- - přechody jsou přechody formuláře a neprovádět žádnou další akci,
- náročné přechody jsou přechody formuláře a spotřebují vstupní symbol , a
- přechody hovorů jsou přechody formuláře a proveďte a podprogram skočit do volaného stavu před dosažením .
Chování přechodů hovorů se řídí dvěma druhy implicitně-definované přechody:
- pro každý přechod hovoru FPN implicitně definuje a push přechod , ze kterého stroj pochází na tlačením na zásobník, a
- pro každou dvojici států FPN implicitně definuje a pop přechod , který přináší stroj z na praskáním ze zásobníku iff je stav v horní části zásobníku a .
Inicializace přechodů push podprogram skoky a popové přechody jsou ekvivalentní návratové příkazy.
Účel
A (přirozený jazyk ) text lze obohatit o metainformace aplikací a RTN s výstupem; například vložení RTN XML značky lze použít pro transformaci a prostý text do strukturovaného dokumentu XML. RTN s výstupem představujícím a přirozený jazyk gramatika by vymezil a přidal syntaktickou strukturu každé věty textu (viz analýza ). Ostatní RTN s výstupem mohou jednoduše označit textové segmenty obsahující relevantní informace (viz extrakce informací ). Aplikace RTN s výstupem představujícím nejednoznačná gramatika vede k souboru možných překladů nebo interpretací vstupu. Výpočet této sady má exponenciál náklady v nejhorším případě, dokonce i pro Earley parser pro RTN s výstupem,[3] kvůli případům, kdy počet překladů exponenciálně roste w.r.t. vstupní délka; například počet interpretací a přirozený jazyk věta se exponenciálně zvyšuje w.r.t. počet nevyřešených předložková fráze přílohy:[4][5]
- ve větě dívka uviděla opici dalekohledem, není známo, zda dívka použila dalekohled nebo ji opice držela (21 interpretace),
- ve větě dívka zahlédla opici s dalekohledem v zahradě, není také známo, zda byla opice na zahradě nebo se akce odehrála na zahradě (22 interpretace),
- ve větě dívka zahlédla opici s dalekohledem v zahradě pod stromem, není také známo, zda byla opice pod stromem nebo se akce odehrála pod stromem (23 interpretace),
- atd.
FPN slouží jako kompaktní reprezentace této sady překladů a umožňují ji vypočítat v kubickém čase pomocí analyzátoru podobného Earleymu.[1] Stavy FPN odpovídají stavům provádění (viz instrukční kroky ) analyzátoru Earley pro RTN bez výstup a přechody FPN odpovídají možným překladům vstupních symbolů. The mapa výsledného FPN dává korespondenci mezi reprezentovanými výstupními segmenty a rozpoznanými vstupními segmenty: vzhledem k rozpoznané vstupní posloupnosti a cestu FPN počínaje stavem a končí ve stavu , představuje možný překlad vstupního segmentu . Funkce filtrovaného vyskakování je nutná, aby se zabránilo cestám FPN, které představují překlady odpojen nebo překrývající se vstupní segmenty: volání FPN může obsahovat několik překladových cest ze stavu volání do stavu akceptoru, kde vstupní segmenty, které odpovídají, sdílejí stejný počáteční bod, ale nemusí mít nutně stejnou délku. Pouze návratové stavy odpovídající stejnému vstupnímu bodu, než je stav přijímajícího, který ukončí hovor platný návratové státy.
Reference
- ^ A b Javier M. Sastre, „Efektivní analýza pomocí filtrovaných rekurzivních přechodových sítí“, Poznámky k přednášce v umělé inteligenci, 5642:241-244, 2009
- ^ William A. Woods, „Přechodové síťové gramatiky pro analýzu přirozeného jazyka“, Komunikace ACM, Stiskněte ACM, 13:10:591-606, 1970
- ^ Javier M. Sastre & Mikel L. Forcada, "Efektivní analýza pomocí rekurzivních přechodových sítí s výstupem", Přednášky z informatiky, 5603:192-204, 2009
- ^ Adwait Ratnaparkhi, "Statistické modely pro přílohu bez předložené fráze", ACL-36: Sborník z 36. výročního zasedání Asociace pro počítačovou lingvistiku a ze 17. mezinárodní konference o počítačové lingvistice, s. 1079-1085, 1998
- ^ Miriam Butt, "Chunk / Shallow parsing", skripta, 2002