Zmatená síť - Confusion network - Wikipedia

A zmatená síť (někdy nazývané a slovo zmatek síť nebo neformálně známý jako klobása) je zpracování přirozeného jazyka metoda, která kombinuje výstupy z více automatické rozpoznávání řeči nebo strojový překlad systémy.[1][2] Zmatené sítě jsou jednoduché lineární směrované acyklické grafy s vlastností, že každá cesta od počátečního uzlu ke koncovému uzlu prochází všemi ostatními uzly. Sada slov představovaných hranami mezi dvěma uzly se nazývá zmatená sada. Ve strojovém překladu je charakteristickou vlastností záměnových sítí to, že umožňují více nejednoznačných vstupů a odkládají rozhodnutí o závazném překladu až do pozdějších fází zpracování.[3][4] Tento přístup se používá v otevřený zdroj strojový překlad software Mojžíš[5] a proprietární překladové API ve Windows IBM Bluemix Watson.[6]

Příklad záměny sítě

Reference

  1. ^ Rosti, Antti-Veikko I .; Zhang, Bing; Matsoukas, Spyros; Schwartz, Richard (2008). „Inkrementální sladění hypotéz pro budování sítí záměny s kombinací systémů překladu aplikací na stroje“. Sborník třetího semináře o statistickém strojovém překladu. StatMT '08. Stroudsburg, PA, USA: Association for Computational Linguistics: 183–186. ISBN  9781932432091.
  2. ^ Matusov, Evgeny; Ueffing, Nicola; Ney, Hermann (2006). Msgstr "Výpočet konsensuálního překladu z více systémů strojového překladu pomocí vylepšeného vyrovnání hypotéz". V Proc. EACL. CiteSeerX  10.1.1.483.5417.
  3. ^ Hoang, Hieu (2007). Msgstr "Faktorové překladové modely". Ve sborníku ze společné konference 2007 o empirických metodách ve zpracování přirozeného jazyka a výpočetním učení přirozeného jazyka (EMNLP-CoNLL: 868–876. CiteSeerX  10.1.1.80.3572.
  4. ^ Koehn, Philipp; Hoang, Hieu; Birch, Alexandra; Callison-Burch, Chris; Federico, Marcello; Bertoldi, Nicola; Cowan, Brooke; Shen, Wade; Moran, Christine (2007). „Mojžíš: Open Source Toolkit pro statistický strojový překlad“. Sborník ze 45. výročního zasedání ACL o interaktivních plakátových a demonstračních zasedáních. ACL '07. Stroudsburg, PA, USA: Association for Computational Linguistics: 177–180. doi:10.3115/1557769.1557821. S2CID  794019.
  5. ^ „Mojžíš - Mojžíš / ConfusionNetworks“. www.statmt.org. Citováno 2017-11-09.
  6. ^ „Služba IBM® Speech to Text poskytuje referenční příručku API | IBM Watson Developer Cloud“. www.ibm.com. Archivováno od originálu dne 2017-11-09. Citováno 2017-11-09. Hodnota spolehlivosti, která je dolní mezí pro identifikaci hypotézy jako možné alternativy slova (také známá jako „Confusion Networks“). Je uvažováno alternativní slovo, pokud je jeho spolehlivost větší nebo rovna prahové hodnotě. Určete pravděpodobnost mezi 0 a 1 včetně. Pokud parametr vynecháte, nebudou vypočítána žádná alternativní slova.