Analyzovat houštinu - Parse thicket

A analyzovat houští je graf, který představuje syntaktický struktura odstavce textu ve Windows zpracování přirozeného jazyka. Analýza houští zahrnuje analyzovat strom pro každou větu pro tento odstavec plus několik oblouků pro jiné vztahy mezi jinými slovy než syntaktickými.^[1] Analyzovat houštiny lze konstruovat jak pro parsovací stromy volebních obvodů, tak pro parsovací stromy závislostí. Vztahy, které spojují analyzované stromy v analyzované houštině, jsou:^[2]

Koreference;
Stejná entita / sub-entita / super-entita;
Rétorická struktura a další diskurzní vztah;
Řečový akt -založené vztahy.

K posouzení podobnosti mezi texty, jako je otázka a její kandidátské odpovědi, lze analyzovat houštiny zobecnit ^[3]

Na obrázku syntaktické analýzy jsou houštiny koreference a odkazy mezi entitami zobrazeny červeně a vztahy rétoriky a řeči jsou zobrazeny červeně tečkovaně. Používá se analyzátor ETAP a software pro vizualizaci stromů.^[4]

Analyzovat houští

Chcete-li vypočítat zobecnění dvou analyzovaných houštin, musíte najít jejich maximální společný dílčí graf (dílčí houští).^[5]

Zobecnění dvou analyzovaných houštin

Fragment ukazující konkrétní případy zobecnění

Reference

^ Galitsky B, Kuznetsov SO, Usikov DA. Analyzujte zastoupení houštiny pro vyhledávání více vět. Přednášky z informatiky. 2013;7735:1072-1091. doi:10.1007/978-3-642-35786-2_12.
^ Galitsky B, Ilvovsky D, Kuznetsov SO, mrtvice F. Odpovídající sady analyzovaných stromů pro zodpovězení více větných otázek. Nedávné pokroky ve zpracování přirozeného jazyka. 2013.
^ Galitsky B. Strojové učení syntaktických parse stromů pro vyhledávání a klasifikaci textu. Inženýrské aplikace umělé inteligence. 2013;26(3):153-172. doi:10.1016 / j.engappai.2012.09.017.
^ Boguslavsky, I., Iomdin, L., Sizov V .. Interaktivní konverze pomocí systému ETAP-3. Kultura, jazyk a informační technologie. 2003.
^ Galitsky B, Ilvovsky D, Kuznetsov SO, Strok F. Nalezení maximálních společných sub-parsehustek pro vyhledávání více vět. Poznámky k přednášce v umělé inteligenci. 2013;8323.

externí odkazy

[Kódová stránka Google https://code.google.com/p/relevance-based-on-parse-trees/ ]
[Stanford NLP http://nlp.stanford.edu/ ]
[Součást podobnosti OpenNLP https://issues.apache.org/jira/browse/OPENNLP/component/12316412 ]

[1] Galitsky B, Kuznetsov SO, Usikov DA. Analyzujte zastoupení houštiny pro vyhledávání více vět. Přednášky z informatiky. 2013;7735:1072-1091. doi:10.1007/978-3-642-35786-2_12.

[2] Galitsky B, Ilvovsky D, Kuznetsov SO, mrtvice F. Odpovídající sady analyzovaných stromů pro zodpovězení více větných otázek. Nedávné pokroky ve zpracování přirozeného jazyka. 2013.

[3] Galitsky B. Strojové učení syntaktických parse stromů pro vyhledávání a klasifikaci textu. Inženýrské aplikace umělé inteligence. 2013;26(3):153-172. doi:10.1016 / j.engappai.2012.09.017.

[4] Boguslavsky, I., Iomdin, L., Sizov V .. Interaktivní konverze pomocí systému ETAP-3. Kultura, jazyk a informační technologie. 2003.

[5] Galitsky B, Ilvovsky D, Kuznetsov SO, Strok F. Nalezení maximálních společných sub-parsehustek pro vyhledávání více vět. Poznámky k přednášce v umělé inteligenci. 2013;8323.

[1]

[2]

[3]

[4]

[5]