Mělká analýza - Shallow parsing - Wikipedia
![]() | tento článek potřebuje další citace pro ověření.Únor 2016) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Mělká analýza (taky kouskování nebo světlo analýza) je analýza a věta který nejprve identifikuje základní části vět (podstatná jména, slovesa, přídavná jména atd.) a poté je spojuje s jednotkami vyššího řádu, které mají diskrétní gramatické významy (podstatné jméno skupiny nebo fráze, skupiny sloves atd.). Zatímco nejzákladnější blokové algoritmy jednoduše propojují jednotlivé součásti na základě elementárních vzorů vyhledávání (např. regulární výrazy ), přístupy, které používají techniky strojového učení (klasifikátory, modelování témat atd.) mohou brát v úvahu kontextové informace, a tak skládat bloky takovým způsobem, aby lépe odrážely sémantické vztahy mezi základními složkami.[1] To znamená, že tyto pokročilejší metody obcházejí problém, že kombinace elementárních složek mohou mít různé významy na vyšší úrovni v závislosti na kontextu věty.
Je to technika široce používaná v zpracování přirozeného jazyka. Je to podobné jako koncept lexikální analýza pro počítačové jazyky. Pod názvem „hypotéza mělké struktury“ se také používá jako vysvětlení proč druhý jazyk studenti často nedokážou správně analyzovat složité věty.[2]
Reference
Citace
- ^ Jurafsky, Daniel; Martin, James H. (2000). Zpracování řeči a jazyka. Singapur: Pearson Education Inc. str. 577–586.
- ^ Clahsen, Felser, Harald, Claudia (2006). "Gramatické zpracování u studentů jazyků". Aplikovaná psycholingvistika. 27: 3–42. doi:10.1017 / S0142716406060024.
Zdroje
- „NP Chunking (stav techniky)“. Sdružení pro výpočetní lingvistiku. Citováno 2016-01-30.
- Abney, Steven (1991), Analyzovat kousky (PDF), Kluwer Academic Publishers, s. 257–278.
externí odkazy
- Apache OpenNLP OpenNLP zahrnuje chunker.
- GATE Obecná architektura pro textové inženýrství BRÁNA zahrnuje chunker.
- NLTK kouskování
- Illinois mělký analyzátor Mělký analyzátor Ukázka
Viz také
![]() | Tento výpočetní lingvistika související článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |