Převodník konečných stavů - Finite-state transducer

A převodník konečných stavů (FST) je konečný stavový stroj se dvěma pamětí páskypodle terminologie pro Turingovy stroje: vstupní páska a výstupní páska. To kontrastuje s obyčejným konečný stavový automat, který má jednu pásku. FST je typ automatu konečného stavu, který mapuje mezi dvěma sadami symbolů.[1] FST je obecnější než konečný automat (FSA). FSA definuje formální jazyk definováním sady přijatých řetězců, zatímco FST definuje vztahy mezi sadami řetězců.

FST přečte sadu řetězců na vstupní pásce a vygeneruje sadu vztahů na výstupní pásce. FST lze považovat za překladač nebo relater mezi řetězci v sadě.

V morfologické analýze by příkladem bylo zadání řetězce písmen do FST, FST by pak vydal řetězec morfémy.

Přehled

Externí video
ikona videa Převodníky konečných stavů // Technologický institut v Karlsruhe Video na YouTube

An automat dá se říci uznat řetězec, pokud jako vstup zobrazíme obsah jeho pásky. Jinými slovy, automat vypočítá funkci, která mapuje řetězce do množiny {0,1}. Alternativně můžeme říci, že automat generuje strings, což znamená prohlížení jeho pásky jako výstupní pásky. V tomto pohledu automat generuje a formální jazyk, což je sada řetězců. Dva pohledy na automaty jsou ekvivalentní: funkce, kterou automat počítá, je přesně ta funkce indikátoru sady řetězců, které generuje. Třída jazyků generovaných konečnými automaty je známá jako třída běžné jazyky.

Dvě pásky měniče jsou obvykle považovány za vstupní pásku a výstupní pásku. Z tohoto pohledu se říká, že snímač transduce (tj. přeložit) obsah své vstupní pásky na výstupní pásku tím, že přijme řetězec na své vstupní pásce a vygeneruje další řetězec na své výstupní pásce. Může to tak být nedeterministicky a může produkovat více než jeden výstup pro každý vstupní řetězec. Převodník také nemusí produkovat žádný výstup pro daný vstupní řetězec, v takovém případě se o něm říká odmítnout vstup. Převodník obecně počítá a vztah mezi dvěma formálními jazyky.

Každý převodník konečných stavů mezi řetězci spojuje vstupní abecedu Σ s výstupní abecedou Γ. Vztahy R na Σ * × Γ *, které lze implementovat, protože se nazývají snímače konečného stavu racionální vztahy. Racionální vztahy, které jsou dílčí funkce, tj. které se týkají každého vstupního řetězce od Σ * do maximálně jednoho Γ *, jsou volány racionální funkce.

Převodníky v konečném stavu se často používají fonologický a morfologická analýza v zpracování přirozeného jazyka výzkum a aplikace. Mezi průkopníky v této oblasti patří Ronald Kaplan, Lauri Karttunen, Martin Kay a Kimmo Koskenniemi.[2][není nutný primární zdroj ]Běžný způsob použití měničů je v takzvané „kaskádě“, kde se měniče pro různé operace kombinují do jediného měniče opakovanou aplikací operátoru složení (definovaného níže).

Formální konstrukce

Formálně konečný převodník T je n-tice (Q, Σ, Γ, , F, 8) takové, že:

  • Q je konečná množina, soubor státy;
  • Σ je konečná množina zvaná vstupní abeceda;
  • Γ je konečná množina zvaná výstupní abeceda;
  • je podmnožina z Q, soubor počáteční stavy;
  • F je podmnožinou Q, soubor konečné stavy; a
  • (kde ε je prázdný řetězec ) je přechodový vztah.

Můžeme zobrazit (Q, δ) jako označený řízený graf, známý jako přechodový graf z T: sada vrcholů je Q, a znamená, že od vrcholu jde označená hrana q na vrchol r. Také to říkáme A je vstupní štítek a b the výstupní štítek té hrany.

POZNÁMKA: Tato definice konečného převodníku se také nazývá převodník písmen (Roche a Schabes 1997); alternativní definice jsou možné, ale lze je všechny převést na snímače následující po tomto.

Definujte rozšířený přechodový vztah jako nejmenší sada taková, že:

  • ;
  • pro všechny ; a
  • kdykoli a pak .

Rozšířený přechodový vztah je v podstatě reflexivní přechodné uzavření přechodového grafu, který byl rozšířen, aby zohledňoval okrajové štítky. Prvky jsou známé jako cesty. Okrajové štítky cesty se získají zřetězením okrajových štítků jejích základních přechodů v pořadí.

The chování snímače T je racionální vztah [T] definováno takto: kdyby a jen kdyby tady existuje a takhle . To znamená T převádí řetězec do řetězce pokud existuje cesta z počátečního stavu do konečného stavu, jehož vstupní štítek je X a jehož výstupní štítek je y.

Vážené automaty

Převaděče konečných stavů lze vážit, přičemž každý přechod je kromě vstupních a výstupních štítků označen také váhou. Vážený převodník konečných stavů (WFST) přes sadu K. váh lze definovat podobně jako nevážený jako 8-n-tici T=(Q, Σ, Γ, , F, E, λ, ρ), kde:

  • Q, Σ, Γ, , F jsou definovány výše;
  • (kde ε je prázdný řetězec ) je konečná sada přechodů;
  • mapuje počáteční stavy na váhy;
  • mapuje konečné stavy na váhy.

Aby byly určité operace na WFST dobře definované, je vhodné požadovat sadu vah k vytvoření a semiring.[3] V praxi se používají dva typické semiringsy semiring logů a tropický semiring: nedeterministické automaty lze považovat za závaží v Booleovský semiring.[4]


Stochastic FST

Stochastické FST (známé také jako pravděpodobnostní FST nebo statistické FST) jsou pravděpodobně formou váženého FST.[Citace je zapotřebí ]

Operace s převodníky konečných stavů

Následující operace definované na konečných automatech platí také pro konečné převodníky:

  • svaz. Dané převodníky T a Sexistuje převodník takhle kdyby a jen kdyby nebo .
  • Zřetězení. Dané převodníky T a Sexistuje převodník takhle jen kdyby existovaly s a
  • Kleene uzavření. Dostal měnič Texistuje převodník s následujícími vlastnostmi:
;

 

 

 

 

(k1)

-li a , pak ;

 

 

 

 

(k2)

a nedrží, pokud nařízeno (k1) nebo (k2).
  • Složení. Dostal měnič T na abecedách Σ a Γ a převodníku S na abecedách Γ a Δ existuje převodník na Σ a Δ takové, že právě když existuje řetězec takhle a . Tato operace se vztahuje i na vážený případ.[5]
Tato definice používá stejný zápis, jaký se používá v matematice pro relační složení. Konvenční čtení pro kompozici relací je však opačné: vzhledem ke dvěma relacím T a S, když nějaké existují y takhle a
  • Projekce automatu. Existují dvě projekční funkce: zachová vstupní pásku a zachovává výstupní pásku. První projekce, je definována takto:
Dostal měnič Texistuje konečný automat takhle přijímá X právě když existuje řetězec y pro který
Druhá projekce, je definován podobně.
  • Stanovení. Dostal měnič T, chceme vytvořit ekvivalentní převodník, který má jedinečný počáteční stav a takový, aby žádné dva přechody opouštějící jakýkoli stát nesdílely stejný vstupní štítek. The konstrukce výkonové sady lze rozšířit na snímače nebo dokonce vážené snímače, ale někdy se nezastaví; skutečně některé nedeterministické měniče nepřipouštějí ekvivalentní deterministické měniče.[6] Charakterizace bylo navrženo stanovitelných měničů[7] spolu s účinnými algoritmy pro jejich testování:[8] spoléhají na semiring použitý ve váženém případě i obecná vlastnost struktury měniče ( majetek dvojčat ).
  • Zatížení váhy u váženého pouzdra.[9]
  • Minimalizace pro vážený případ.[10]
  • Odstranění epsilon-přechody.

Další vlastnosti převodníků konečných stavů

  • to je rozhodnutelné zda vztah [T] měniče T je prázdný.
  • Je rozhodující, zda existuje řetězec y takhle X[T]y pro daný řetězec X.
  • to je nerozhodnutelný zda jsou dva snímače rovnocenné.[11] Rovnocennost je však rozhodnutelná ve zvláštním případě, kdy vztah [T] měniče T je (částečná) funkce.
  • Pokud jeden definuje abecedu štítků , snímače konečného stavu jsou izomorfní NDFA přes abecedu , a lze je tedy určit (proměnit v deterministické konečné automaty přes abecedu ) a následně minimalizovány tak, aby měly minimální počet států.[Citace je zapotřebí ]

Aplikace

Kontextová pravidla přepisování formuláře Ab / C _ d, použito v lingvistika modelovat fonologická pravidla a změna zvuku, jsou výpočtově ekvivalentní převodníkům konečných stavů za předpokladu, že aplikace není rekurzivní, tj. pravidlo nesmí přepsat dvakrát stejný podřetězec.[12]

Vážené FST nalezené aplikace v zpracování přirozeného jazyka, počítaje v to strojový překlad a v strojové učení.[13][14] Implementace pro značení části řeči lze najít jako jednu součást OpenGrm[15] knihovna.

Viz také

Poznámky

  1. ^ Jurafsky, Daniel (2009). Zpracování řeči a jazyka. Pearson. ISBN  9789332518414.
  2. ^ Koskenniemi 1983
  3. ^ Berstel, Jean; Reutenauer, Christophe (2011). Nekomutativní racionální řady s aplikacemi. Encyklopedie matematiky a její aplikace. 137. Cambridge: Cambridge University Press. str. 16. ISBN  978-0-521-19022-0. Zbl  1250.68007.
  4. ^ Lothaire, M. (2005). Aplikovaná kombinatorika na slova. Encyklopedie matematiky a její aplikace. 105. Kolektivní dílo Jean Berstel, Dominique Perrin, Maxime Crochemore, Eric Laporte, Mehryar Mohri, Nadia Pisanti, Marie-France Sagot, Gesine Reinert, Sophie Schbath Michael Waterman, Philippe Jacquet, Wojciech Szpankowski, Dominique Poulalhon, Gilles Schaeffer, Roman Kolpakov, Gregory Koucherov, Jean-Paul Allouche a Valérie Berthé. Cambridge: Cambridge University Press. str.211. ISBN  0-521-84802-4. Zbl  1133.68067.
  5. ^ Mohri 2004, str. 3–5
  6. ^ [1]
  7. ^ Mohri 2004, s. 5–6
  8. ^ Allauzen 2003
  9. ^ Mohri 2004, s. 7–9
  10. ^ Mohri 2004, s. 9–11
  11. ^ Griffiths 1968
  12. ^ „Pravidelné modely systémů fonologických pravidel“ (PDF). Archivovány od originál (PDF) 11. října 2010. Citováno 25. srpna 2012.
  13. ^ Kevin Knight a Jonathan May (2009). "Aplikace vážených automatů ve zpracování přirozeného jazyka". V Manfred Droste; Werner Kuich; Heiko Vogler (eds.). Příručka vážených automatů. Springer Science & Business Media. ISBN  978-3-642-01492-5.CS1 maint: používá parametr autoři (odkaz)
  14. ^ „Učení s váženými převodníky“ (PDF). Citováno 29. dubna 2017.
  15. ^ OpenGrm

Reference

externí odkazy

  • OpenFst, knihovna open-source pro operace FST.
  • Stuttgartské konečné převodníky, další sada nástrojů FST s otevřeným zdrojovým kódem
  • java FST Framework, open-source java FST Framework schopný zpracovávat textový formát OpenFst.
  • Vcsn, platforma open-source platformy (C ++ a IPython) pro vážené automaty a racionální výrazy.
  • Konečná státní morfologie - kniha XFST / LEXC, popis implementace převodníků konečných stavů určených pro jazykové aplikace společností Xerox.
  • FOMA, open-source implementace většiny schopností implementace Xerox XFST / LEXC.

Další čtení