Nepůvodní databáze řeči - Non-native speech database
A nepůvodní databáze řeči je databáze řeči z nepůvodní výslovnosti angličtiny. Takové databáze jsou nezbytné pro pokračující vývoj vícejazyčného automatu rozpoznávání řeči systémy, text na řeč systémy, trenéry výslovnosti nebo dokonce plně funkční systémy výuky druhého jazyka. Kvůli srovnatelně malé velikosti databází však mnoho z nich není k dispozici prostřednictvím běžných distributorů databází řeči. To vede ke skutečnosti, že pro vědce v oblasti rozpoznávání řeči je těžké udržet si přehled o tom, jaké databáze již byly shromážděny a pro jaké účely dosud neexistují žádné sbírky.[1]
Legenda
V tabulce nepůvodních databází jsou použity některé zkratky pro názvy jazyků. Jsou uvedeny v tabulce 1. Tabulka 2 uvádí následující informace o každém korpusu: Název korpusu, instituce, kde lze korpus získat, nebo by měly být k dispozici alespoň další informace, jazyk, kterým mluvčí skutečně mluvili , počet mluvčích, rodný jazyk mluvčích, celkový počet nepůvodních promluv, které korpus obsahuje, doba trvání nepůvodní části v hodinách, datum prvního veřejného odkazu na tento korpus, nějaký volný text zdůraznění zvláštních aspektů této databáze a odkaz na jinou publikaci. Odkaz v posledním poli se ve většině případů týká článku, který se věnuje zejména popisu tohoto korpusu původními sběrateli. V některých případech nebylo možné takový papír identifikovat. V těchto případech se odkazuje na článek, který tento korpus používá.
Některé položky zůstávají prázdné a jiné jsou označeny neznámým. Rozdíl je v tom, že prázdné položky odkazují na atributy, u nichž hodnota není známa. Neznámé položky však naznačují, že v samotné databázi nejsou k dispozici žádné informace o tomto atributu. Například v databázi počasí Jupiteru[2] nejsou uvedeny žádné informace o původu mluvčích. Proto by tato data byla méně užitečná pro ověření detekce přízvuků nebo podobných problémů.
Pokud je to možné, je název standardním názvem korpusu, u některých menších korpusů však neexistoval ustálený název, a proto musel být vytvořen identifikátor. V takových případech se používá kombinace instituce a sběratele databáze.
V případě, že databáze obsahují nativní a nepůvodní řeč, jsou uvedeny pouze atributy nepůvodní části korpusu. Většina korpusů jsou sbírky čtení řeči. Pokud se korpus místo toho skládá buď částečně, nebo zcela ze spontánních promluv, je to uvedeno ve sloupci Specials.
Přehled nepůvodních databází
|
Aktuální tabulka s informacemi o různých databázích je uvedena v tabulce 2.
|
Reference
- ^ M. Raab, R. Gruhn a E. Noeth, Nenativní databáze řeči, v Proc. ASRU, Kjóto, Japonsko, 2007.
- ^ K. Livescu, Analýza a modelování nepůvodní řeči pro automatické rozpoznávání řeči, SLEČNA. diplomová práce, Massachusetts Institute of Technology, Cambridge, MA, 1999.
- ^ Projekt AMI, „AMI Meeting Corpus“ [1].
- ^ R. Gruhn, T. Cincarek a S. Nakamura, „Multiakcentní nepůvodní anglická databáze“, ASJ, 2004.
- ^ Univerzita v Mnichově, „bavorský archiv řeči signalizuje podivný korpus“, [2].
- ^ Jurafsky a kol., „The Berkeley Restaurant Project“, Proc. ICSLP 1994.
- ^ L. Tomokiyo, Rozpoznávání nepůvodní řeči: Charakterizace a přizpůsobení nepůvodnímu použití v rozpoznávání řeči, Ph.D. diplomová práce, Carnegie Mellon University, Pensylvánie, 2001.
- ^ S. Witt, Využití rozpoznávání řeči ve výuce jazyků podporovaných počítačem, Ph.D. práce, Cambridge University Engineering Department, UK, 1999.
- ^ H. Ye a S. Young, Zlepšení výkonu rozpoznávání řeči začátečníků v mluvené konverzační interakci při výuce jazyků, v Proc. Interspeech, Lisabon, Portugalsko, 2005.
- ^ L. Tomokiyo, Rozpoznávání nepůvodní řeči: Charakterizace a přizpůsobení nepůvodnímu použití v rozpoznávání řeči, Ph.D. diplomová práce, Carnegie Mellon University, Pensylvánie, 2001.
- ^ T. P. Tan a L. Besacier, Francouzský nepůvodní korpus pro automatické rozpoznávání řeči, v LREC, Janov, Itálie, 2006.
- ^ T. Lander, CSLU: Zahraniční anglické vydání 1.2, Tech. Rep., LDC, Philadelphia, Pensylvánie, 2007.
- ^ Z. Wang, T. Schultz a A. Waibel, Porovnání technik přizpůsobení akustického modelu na nepůvodní řeči, v Proc. ICASSP, 2003.
- ^ S. Schaden, Regelbasierte Modellierung fremdsprachlich akzentbehafteter Aussprachevarianten, Ph.D. diplomová práce, University Duisburg-Essen, 2006.
- ^ L. M. Arslan a J. H. Hansen, Frekvenční charakteristiky řeči s cizím přízvukem, v Proc. z ICASSP, Mnichov, Německo, 1997, s. 1123-1126.
- ^ N. Minematsu a kol., Vývoj databáze řeči v angličtině čtené Japonci na podporu výzkumu CALL, v ICA, Kjóto, Japonsko, 2004, str. 577-560.
- ^ Christopher Cieri, David Miller, Kevin Walker, Fisher Corpus: zdroj pro další generace řeči na text, Proc. LREC 2004
- ^ S. Fitt, Výslovnost neznámých rodných a nepůvodních názvů měst, v Proc. Eurospeech, 1995, s. 2227-2230.
- ^ G. Stemmer, E. Noeth a H. Niemann, Akustické modelování cizích slov v německém systému rozpoznávání řeči, v Proc. Eurospeech, P. Dalsgaard, B. Lindberg a H. Benner, Eds., 2001, sv. 4, str. 2745-2748.
- ^ W. Byrne, E. Knodt, S. Khudanpur a J. Bernstein, Je automatické rozpoznávání řeči připraveno na nepůvodní řeč? Úsilí o sběr dat a počáteční experimenty v modelování konverzační hispánské angličtiny, STiLL, Marholmen, Švédsko, 1998, s. 37-40.
- ^ Y. Li, P. Fung, P. Xu a Y. Liu, Asymetrické akustické modelování pro rozpoznávání řeči ve smíšeném jazyce, in ICASSP, Prague, Czech, 2011, pp. 37-40.
- ^ V. Fischer, E. Janke a S. Kunzmann, Nedávný pokrok v dekódování nepůvodní řeči pomocí vícejazyčných akustických modelů, v Proc. Eurospeech, 2003, s. 3105-3108.
- ^ Nancy F. Chen, Rong Tong, Darren Wee, Peixuan Lee, Bin Ma, Haizhou Li, iCALL Corpus: Mandarínská čínština mluvená nepůvodními mluvčími evropského původu, v Proc. of Interspeech, 2015.
- ^ Nancy F. Chen, Vivaek Shivakumar, Mahesh Harikumar, Bin Ma, Haizhou Li. Rozsáhlá charakterizace chyb výslovnosti mandarínů vytvořená rodilými mluvčími evropských jazyků, v Proc. of Interspeech, 2013.
- ^ W. Menzel, E. Atwell, P. Bonaventura, D. Herron, P. Howarth, R. Morton a C. Souter, Korpus ISLE nepůvodní mluvené angličtiny, v LREC, Atény, Řecko, 2000, str. 957-963.
- ^ K. Livescu, Analýza a modelování nepůvodní řeči pro automatické rozpoznávání řeči, SLEČNA. diplomová práce, Massachusetts Institute of Technology, Cambridge, MA, 1999.
- ^ S-C. Rhee a S-H. Lee a SK. Kang a Y-J. Závětří, Návrh a konstrukce korejského mluveného anglického korpusu (K-SEC), Proc. ICSLP 2004
- ^ L. Tomokiyo, Rozpoznávání nepůvodní řeči: Charakterizace a přizpůsobení nepůvodnímu použití v rozpoznávání řeči, Ph.D. diplomová práce, Carnegie Mellon University, Pensylvánie, 2001.
- ^ Gut, U., Nepůvodní řeč. Korpusová analýza fonologických a fonetických vlastností L2 angličtiny a němčiny, Frankfurt nad Mohanem: Peter Lang, 2009.
- ^ TNO Ústav pro výzkum lidských faktorů, Mlha vícejazyčná interoperabilita v databázi řečových technologií, Tech. Rep., ELRA, Paříž, Francie, 2007, ELRA Catalog Reference S0238.
- ^ J. C. Segura a kol., Databáze HIWIRE, hlučný a nepůvodní anglický řečový korpus pro komunikaci v kokpitu, 2007, [3].
- ^ S. Pigeon, W. Shen a D. van Leeuwen, Návrh a charakterizace nepůvodní vojenské komunikační komunikační databáze, v ICSLP, Antverpy, Belgie, 2007.
- ^ L. Benarousse a kol., Korpus nativní a nepůvodní (n4) NATO, v Proc. workshopu MIST (ESCA-NATO), Leusden, září 1999.
- ^ Konsorcium Onomastica, Lexikon ONOMASTICA mezi jazyky, v Proc. Eurospeech, Madrid, Španělsko, 1995, s. 829-832.
- ^ C. Hacker, T. Cincarek, A. Maier, A. Hessler a E. Noeth, Posílení prozodických a výslovnostních funkcí k detekci chybných výslovností nepůvodních dětí, v Proc. ICASSP, Honolulu, Hawai, 2007, s. 197-200.
- ^ C. Teixeira, I. Trancoso a A. Serralheiro, Uznání nepůvodních přízvuků, v Proc. Eurospeech, Rhodos, Řecko, 1997, str. 2375-2378.
- ^ H. Heuvel, K. Choukri, C. Gollan, A. Moreno a D. Mostefa, TC-STAR: Nové jazykové zdroje pro účely ASR a SLT, v LREC, Janov, 2006, s. 2570-2573.
- ^ L.F. Lamel, F. Schiel, A. Fourcin, J. Mariani a H. Tillmann, Translanguage anglická databáze TED, v ICSLP, Jokohama, Japonsko, září 1994.
- ^ N. Mote, L. Johnson, A. Sethy, J. Silva a S. Narayanan, Detekce taktického jazyka a modelování chyb řeči žáka: Případ arabského taktického jazykového školení pro mluvčí americké angličtiny, v Proc. InSTIL, červen 2004.
- ^ K. Nishina, Vývoj japonské databáze řeči čtené nepůvodními mluvčími pro konstrukci systému CALL, v ICA, Kjóto, Japonsko, 2004, str. 561-564.
- ^ Univerzita Mnichov, Projekt Verbmobil, [4].
- ^ I. Trancoso, C. Viana, I. Mascarenhas a C. Teixeira, O odvozování pravidel pro nativizovanou výslovnost v navigačních dotazech, v Proc. Eurospeech, 1999.
- ^ A. LaRocca a R. Chouairi, Korpus arabské řeči západního bodu, Tech. Rep., LDC, Philadelphia, Pensylvánie, 2002.
- ^ A. LaRocca a C. Tomei, Korpus ruského řeči západního bodu, Tech. Rep., LDC, Philadelphia, Pensylvánie, 2003.
- ^ J. Morgan, Španělský projev heroico západního bodu, Tech. Rep., LDC, Philadelphia, Pensylvánie, 2006.
- ^ I. Amdal, F. Korkmazskiy a A. C. Surendran, Společné modelování výslovnosti nepůvodních mluvčích pomocí metod založených na datech, v ICSLP, Peking, Čína, 2000, str. 622-625.