Dialogový systém - Dialogue system

A dialogový systémnebo konverzační agent (CA), je počítačový systém určený k konverzaci s člověkem. Systémy dialogu používaly pro komunikaci na vstupním i výstupním kanálu jeden nebo více režimů textu, řeči, grafiky, haptiky, gest a dalších režimů.
Prvky dialogového systému nejsou definovány[Citace je zapotřebí ], avšak liší se od chatbot.[1] Typický GUI kouzelník používá určitý druh dialogu, ale obsahuje jen velmi málo běžných komponent systému dialogového okna a stav dialogu je triviální.
Pozadí
Po dialogových systémech založených pouze na zpracování psaného textu od počátku šedesátých let[2] první mluvení systém dialogu byl vydán DARPA Projekt v USA v roce 1977.[3] Po skončení tohoto pětiletého projektu vydaly některé evropské projekty první dialogový systém schopný mluvit mnoha jazyky (také francouzsky, německy a italsky).[4] Tyto první systémy byly použity v telekomunikačním průmyslu k poskytování telefonních různých služeb v konkrétních doménách, např. automatizovaná služba agendy a školení stolů.
Součásti
Jaké sady komponent jsou součástí dialogového systému a jak tyto komponenty rozdělují odpovědnosti, se u jednotlivých systémů liší. Principem každého dialogového systému je správce dialogů, což je součást, která spravuje stav dialogu a strategii dialogu. Typický cyklus činnosti v dialogovém systému obsahuje následující fáze:[5]
- Uživatel mluví a vstup je systémem převeden na prostý text rozpoznávač vstupu / dekodér, které mohou zahrnovat:
- Text je analyzován a Porozumění přirozenému jazyku jednotka (NLU), která může zahrnovat:
- Správná identifikace jména
- část mluvy označování
- Syntaktický / sémantický analyzátor
- Sémantické informace analyzuje správce dialogů, který udržuje historii a stav dialogu a řídí obecný průběh konverzace.
- Správce dialogových oken obvykle kontaktuje jednoho nebo více Správce úlohs, kteří mají znalosti o konkrétní doméně úkolu.
- Správce dialogů vytváří výstup pomocí výstupní generátor, které mohou zahrnovat:
- Nakonec je výstup vykreslen pomocí výstupní renderer, které mohou zahrnovat:
- text na řeč motor (TTS)
- mluvící hlava
- robot nebo avatar
Systémy dialogu založené na textovém rozhraní (např. Textový chat) obsahují pouze fáze 2–5.
Typy systémů
Systémy dialogu spadají do následujících kategorií, které jsou zde uvedeny v několika dimenzích. Mnoho kategorií se překrývá a rozdíly nemusí být dobře zavedeny.
- podle modalita
- podle zařízení
- telefonní systémy
- PDA systémy
- automobilové systémy
- robot systémy
- plocha počítače /notebook systémy
- rodák
- v-prohlížeč systémy
- v-virtuální stroj
- v-virtuální prostředí
- roboti
- podle stylu
- na příkaz
- Jídelní lístek -driven
- přirozený jazyk
- řečové graffiti
- z iniciativy
- systémová iniciativa
- iniciativa uživatele
- smíšená iniciativa
Systémy přirozeného dialogu
![]() | Tato část může půjčovat nepřiměřená hmotnost k určitým myšlenkám, incidentům nebo polemikám. Prosím pomozte vytvořit vyváženější prezentaci. Diskutujte a odhodlání tento problém před odstraněním této zprávy. (Květen 2017) |
„Systém přirozeného dialogu je forma dialogového systému, který se snaží zlepšit použitelnost a spokojenost uživatelů napodobováním lidského chování“ [6] (Berg, 2014). Zabývá se rysy dialogu člověk-člověk (např. Dílčí dialogy a změny témat) a jeho cílem je integrovat je do systémů dialogů pro interakci člověk-stroj. Často, (mluvené) systémy dialogu vyžadovat, aby se uživatel přizpůsobil systému, protože systém je schopen porozumět pouze velmi omezené slovní zásobě, není schopen reagovat na změny témat a neumožňuje uživateli ovlivňovat tok dialogů. Smíšená iniciativa je způsob, jak uživateli umožnit aktivní účast v dialogu, nikoli pouze jeho odpovídání na otázky. Pouhá existence smíšené iniciativy však nestačí k tomu, aby mohla být klasifikována jako systém přirozeného dialogu. Mezi další důležité aspekty patří:[6]
- Adaptivita systému
- Podpora implicitního potvrzení
- Použití ověřovacích otázek
- Možnost opravit již poskytnuté informace
- Over-informativita (poskytnout více informací, než bylo požadováno)
- Podporujte negace
- Pochopte odkazy analýzou diskurzu a anafory
- Generování přirozeného jazyka, aby se zabránilo monotónním a opakujícím se výzvám
- Adaptivní formulace zohledňující situaci
- Sociální chování (pozdravy, stejná úroveň formality jako uživatel, zdvořilost)
- Kvalita rozpoznávání a syntézy řeči
Ačkoli většina z těchto aspektů je záležitostí mnoha různých výzkumných projektů, chybí nástroje, které by podporovaly rozvoj systémů dialogu zabývajících se těmito tématy.[7] Na rozdíl od VoiceXML který se zaměřuje na interaktivní systémy hlasové odezvy a je základem mnoha systémů mluveného dialogu v průmyslu (aplikace zákaznické podpory) a AIML který je známý pro A.L.I.C.E. chatbot, žádný z nich integruje jazykové funkce, jako jsou dialogové akty nebo generování jazyků. Proto, NADIA (prototyp výzkumu) dává nápad, jak tuto mezeru zaplnit, a kombinuje některé z výše zmíněných aspektů, jako je generování přirozeného jazyka, adaptivní formulace a dílčí dialogy.
Výkon
Někteří autoři měří výkon dialogového systému z hlediska procenta vět úplně správně porovnáním modelu vět (toto opatření se nazývá Koncept věty přesnost[8] nebo Věta porozumění[4]).
Aplikace
Systémy dialogu mohou podporovat širokou škálu aplikací v obchodních podnicích, školství, státní správě, zdravotnictví a zábavě.[9] Například:
- Odpověď na dotazy zákazníků ohledně produktů a služeb prostřednictvím webových stránek společnosti nebo intranetový portál
- Pracovník zákaznické podpory znalostní báze: Umožňuje agentům zadat otázku zákazníka a vést jej s odpovědí
- Řízený prodej: Usnadnění transakcí poskytnutím odpovědí a pokynů v procesu prodeje, zejména u komplexních produktů prodávaných začínajícím zákazníkům
- Podpora: Odpověď na interní otázky zaměstnanců, např. Na HR otázky
- Navigace na webu: Vedení zákazníků k příslušným částem složitých webů - recepční webu
- Technická podpora: Reakce na technické problémy, jako je diagnostika problému s produktem nebo zařízením
- Personalizovaná služba: Konverzační agenti mohou využívat interní a externí databáze k personalizaci interakcí, například odpovídání na otázky týkající se zůstatků účtů, poskytování informací o portfoliu, poskytování častých letáků nebo informací o členství, například
- Školení nebo vzdělávání: Mohou poskytovat rady při řešení problémů, zatímco se uživatel učí
- Ke snížení lidské pracovní zátěže jsou široce používány jednoduché dialogové systémy call centra. V této a dalších aplikacích průmyslové telefonie je funkce poskytovaná dialogovými systémy známá jako Interaktivní hlasová odpověď nebo IVR.
V některých případech mohou konverzační agenti komunikovat s uživateli pomocí umělých znaků. Tito agenti jsou pak označováni jako ztělesnění agenti.
Sady nástrojů a architektury
Průzkum současných rámců, jazyků a technologií pro definování dialogových systémů.
Jméno a odkazy | Typ systému | Popis | Přidružení | Prostředí | Komentáře |
---|---|---|---|---|---|
AIML | Chatterbot Jazyk | XML dialekt pro vytváření softwarových agentů v přirozeném jazyce | Richard Wallace, Pandorabots, Inc. | ||
ChatScript | Chatterbot Jazyk | Language / Engine pro vytváření softwarových agentů v přirozeném jazyce | Bruce Wilcox | ||
Sada nástrojů CSLU | stavové prototypové prostředí řečového rozhraní | OGI School of Science and Engineering M. McTear Ron Cole | publikace jsou z roku 1999. | ||
Server NLUI | Sada nástrojů nezávislá na doméně | kompletní vícejazyčný rámec pro budování přirozené uživatelské rozhraní systémy | LinguaSys | out-of-box podpora smíšených iniciativních dialogů | |
Olympus | kompletní rámec pro implementaci systémů mluveného dialogu | Univerzita Carnegie Mellon | [1] | ||
Nextnova | Multimodální platforma | Platforma pro vývoj multimodálních softwarových aplikací. Na základě stavového grafu XML (SCXML) | Ponvia Technology, Inc. | ||
VXML Hlasové XML | Mluvený dialog | značkovací jazyk multimodálního dialogu | původně vyvinut AT&T poté spravuje průmyslové konsorcium a nakonec a W3C Specifikace | Příklad | primárně pro telefonování. |
SŮL | značkovací jazyk | značkovací jazyk multimodálního dialogu | Microsoft | "nedosáhla úrovně vyspělosti VoiceXML v procesu standardů". | |
Quack.com - QXML | Vývojové prostředí | společnost koupil AOL | |||
OpenDial | Sada nástrojů nezávislá na doméně | hybridní symbolický / statistický rámec pro systémy mluveného dialogu implementovaný v Javě | University of Oslo | ||
NADIA | dialogový modul a modelování dialogů | Vytváření přirozených dialogů / dialogových systémů. Podporuje jednání v dialogu, smíšenou iniciativu, NLG. Implementováno v Javě. | Markus M. Berg | vytváření dialogových souborů založených na XML, není třeba specifikovat gramatiky, publikace jsou z roku 2014 |
Viz také
Reference
- ^ Klüwer, Tina. „Od chatbotů po dialogové systémy.“ Konverzační agenti a interakce v přirozeném jazyce: Techniky a efektivní postupy. IGI Global, 2011. 1-22.
- ^ McTear, Michael, Zoraida Callejas a David Griol, Konverzační rozhraní: Mluvení s chytrými zařízeními, Springer, 2016.
- ^ Giancarlo Pirani (ed), Pokročilé algoritmy a architektury pro porozumění řeči, Sv. 1. Springer Science & Business Media, 2013.
- ^ A b Alberto Ciaramella, Protokol o hodnocení výkonu prototypu, Pracovní balíček slunečních hodin 8000 (1993).
- ^ Jurafsky & Martin (2009), Speech and language processing. Pearsonovo mezinárodní vydání, ISBN 978-0-13-504196-3, Kapitola 24
- ^ A b Berg, Markus M. (2014), Modelování přirozených dialogů v kontextu řečových informačních a řídicích systémů, Akademische Verlagsgesellschaft AKA, ISBN 978-3-89838-508-4
- ^ Berg, Markus M. (2015), „NADIA: Zjednodušený přístup k rozvoji systémů přirozeného dialogu“, Zpracování přirozeného jazyka a informační systémy, Přednášky v informatice, 9103, str. 144–150, doi:10.1007/978-3-319-19581-0_12, ISBN 978-3-319-19580-3
- ^ Bangalore, Srinivas a Michael Johnston. „Robustní porozumění v multimodálních rozhraních.“ Computational Linguistics 35.3 (2009): 345-397.
- ^ Lester, J .; Branting, K .; Mott, B. (2004), „Konverzační agenti“ (PDF), Praktická příručka pro práci na internetu, Chapman & Hall
Další čtení
- Will, Thomas (2007). Vytvoření dynamického dialogu řeči. VDM Verlag Dr. Müller. ISBN 978-3-8364-4990-8.