Značkovač trigramů - Trigram tagger
v výpočetní lingvistika, a označovač trigramů je statistická metoda pro automaticky identifikovat slova jako podstatná jména, slovesa, přídavná jména, příslovce atd. na základě druhého řádu Markovovy modely které berou v úvahu trojnásobek po sobě jdoucích slov. Je vyškolen na a textový korpus jako metoda k předpovídání dalšího slova, přičemž je součin pravděpodobností unigram, bigram a trigram. V rozpoznávání řeči jsou algoritmy využívající trigram-tagger skóre lepší než algoritmy využívající IIMM tagger, ale méně dobře než Net tagger.
Popis tagu trigramů poskytuje Brants (2000).
Reference
- Kempe Andre (1993). "Náhodný tagger a analýza chyb při označování". Interní papír. Institute for Computational Linguistics, Universität Stuttgart.
- Brants, T. (2000) TnT - statistická část řeči, Proc 6th Applied Natural Language Processing Conference, ANLP-200
externí odkazy
- TnT - statistické značení části řeči autor: Thorsten Brants
Tento výpočetní lingvistika související článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |