Faktorový jazykový model - Factored language model
The faktorizovaný jazykový model (FLM) je rozšířením konvenčního jazykový model představili Jeff Bilmes a Katrin Kirchoff v roce 2003. Ve formátu FLM je každé slovo považováno za vektor k faktory: FLM poskytuje pravděpodobnostní model kde predikce faktoru je založeno na rodiče . Například pokud představuje token slova a představuje a Část mluvy značka pro angličtinu, výraz poskytuje model pro předpovídání aktuálního slovního tokenu na základě tradičního Ngram model i model Část mluvy značka předchozího slova.
Hlavní výhodou faktorových jazykových modelů je, že umožňují uživatelům specifikovat jazykové znalosti, jako je vztah mezi slovními tokeny a Část mluvy v angličtině nebo morfologické informace (stonky, kořen atd.) v arabštině.
Jako N-gram modely, vyhlazovací techniky jsou nezbytné při odhadu parametrů. Zejména se při výcviku FLM používá generalizované back-off.
Reference
- J. Bilmes a K. Kirchhoff (2003). "Faktorové jazykové modely a zobecněné paralelní zpětné posunutí" (PDF). Konference o technologii lidského jazyka. Archivovány od originál (PDF) dne 17. července 2012.
![]() | Tento umělá inteligence související článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |