Nepůvodní databáze řeči - Non-native speech database

A nepůvodní databáze řeči je databáze řeči z nepůvodní výslovnosti angličtiny. Takové databáze jsou nezbytné pro pokračující vývoj vícejazyčného automatu rozpoznávání řeči systémy, text na řeč systémy, trenéry výslovnosti nebo dokonce plně funkční systémy výuky druhého jazyka. Kvůli srovnatelně malé velikosti databází však mnoho z nich není k dispozici prostřednictvím běžných distributorů databází řeči. To vede ke skutečnosti, že pro vědce v oblasti rozpoznávání řeči je těžké udržet si přehled o tom, jaké databáze již byly shromážděny a pro jaké účely dosud neexistují žádné sbírky.^[1]

Legenda

V tabulce nepůvodních databází jsou použity některé zkratky pro názvy jazyků. Jsou uvedeny v tabulce 1. Tabulka 2 uvádí následující informace o každém korpusu: Název korpusu, instituce, kde lze korpus získat, nebo by měly být k dispozici alespoň další informace, jazyk, kterým mluvčí skutečně mluvili , počet mluvčích, rodný jazyk mluvčích, celkový počet nepůvodních promluv, které korpus obsahuje, doba trvání nepůvodní části v hodinách, datum prvního veřejného odkazu na tento korpus, nějaký volný text zdůraznění zvláštních aspektů této databáze a odkaz na jinou publikaci. Odkaz v posledním poli se ve většině případů týká článku, který se věnuje zejména popisu tohoto korpusu původními sběrateli. V některých případech nebylo možné takový papír identifikovat. V těchto případech se odkazuje na článek, který tento korpus používá.

Některé položky zůstávají prázdné a jiné jsou označeny neznámým. Rozdíl je v tom, že prázdné položky odkazují na atributy, u nichž hodnota není známa. Neznámé položky však naznačují, že v samotné databázi nejsou k dispozici žádné informace o tomto atributu. Například v databázi počasí Jupiteru^[2] nejsou uvedeny žádné informace o původu mluvčích. Proto by tato data byla méně užitečná pro ověření detekce přízvuků nebo podobných problémů.

Pokud je to možné, je název standardním názvem korpusu, u některých menších korpusů však neexistoval ustálený název, a proto musel být vytvořen identifikátor. V takových případech se používá kombinace instituce a sběratele databáze.

V případě, že databáze obsahují nativní a nepůvodní řeč, jsou uvedeny pouze atributy nepůvodní části korpusu. Většina korpusů jsou sbírky čtení řeči. Pokud se korpus místo toho skládá buď částečně, nebo zcela ze spontánních promluv, je to uvedeno ve sloupci Specials.

Přehled nepůvodních databází

Stůl 1: Zkratky pro jazyky použité v tabulce 2

arabština	A	japonský	J
čínština	C	korejština	K.
čeština	Cze	Malajský	M
dánština	D	Norština	N
holandský	Dut	portugalština	P
Angličtina	E	ruština	R
francouzština	F	španělština	S
Němec	G	švédský	Swe
řecký	Gre	Thai	T
indonéština	Ind	vietnamština	PROTI
italština	Já

Aktuální tabulka s informacemi o různých databázích je uvedena v tabulce 2.

Tabulka 2: Přehled nepůvodních databází

Korpus	Autor	Dostupné v	Jazyky	#Řečníci	Rodný jazyk	#Utt.	Doba trvání	datum	Poznámky
AMI ^[3]		EU	E		Dut a další		100h		záznamy z jednání
ATR-Gruhn ^[4]	Gruhn	ATR	E	96	C G F J Ind	15000		2004	hodnocení odborné způsobilosti
BAS Strange Corpus 1 + 10 ^[5]		ELRA	G	139	50 zemí	7500		1998
Berkeley Restaurant ^[6]		ICSI	E	55	G I H C F S J	2500		1994
Broadcast News ^[7]		LDC	E					1997
Cambridge-Witt ^[8]	Witt	U. Cambridge	E	10	J I K S	1200		1999
Cambridge-Ye ^[9]	Vy	U. Cambridge	E	20	C	1600		2005
Zprávy pro děti ^[10]	Tomokiyo	CMU	E	62	J C.	7500		2000	částečně spontánní
KLIPY-IMAG ^[11]	Opálení	KLIPY-IMAG	F	15	ŽIVOTOPIS		6h	2006
CLSU ^[12]		LDC	E		22 zemí	5000		2007	telefon, spontánní
CMU ^[13]		CMU	E	64	G	452	0,9 h		není dostupný
Cross Towns ^[14]	Schaden	U. Bochum	E F G I Cze Dut	161	E F G I S	72000	133h	2006	názvy měst
Vévoda-Arslan ^[15]	Arslan	Duke University	E	93	15 zemí	2200		1995	částečně telefonický projev
ERJ ^[16]	Minematsu	U. Tokio	E	200	J	68000		2002	hodnocení odborné způsobilosti
Fischer ^[17]		LDC	E		mnoho		200h		telefonický projev
Fitt ^[18]	Fitt	U. Edinburgh	F I N Gre	10	E	700		1995	názvy měst
Fraenki ^[19]		U. Erlangen	E	19	G	2148
hispánský ^[20]	Byrne		E	22	S		20h	1998	částečně spontánní
HLTC ^[21]		HKUST	E	44	C		3h	2010	dostupné na vyžádání
IBM-Fischer ^[22]		IBM	E	40	S F G I	2000		2002	číslice
iCALL ^[23]^[24]	Chen	Já²R, A * STAR	C	305	24 zemí	90841	142h	2015	fonetické a tonální transkripce (v pchin-jin), hodnocení způsobilosti
OSTRŮVEK ^[25]	Atwell	EU / ELDA	E	46	G já	4000	18h	2000
Jupiter ^[26]	Zue	MIT	E	neznámý	neznámý	5146		1999	telefonický projev
K-SEC ^[27]	Rhee	SiTEC	E	neznámý	K.			2004
LDC WSJ1 ^[28]		LDC		10		800	1 hod	1994
Skok ^[29]	Střevo	University of Münster	Např	127	41 různých	73,941 slov	12h	2003
MLHA ^[30]		ELRA	E F G	75	Dut	2200		1996
NATO VYSOKÁ DATA ^[31]		NATO	E	81	F Gre I S	8100		2007	čistá řeč
NATO M-ATC ^[32]	Holub	NATO	E	622	F G I S	9833	17h	2007	silný hluk pozadí
NATO N4 ^[33]		NATO	E	115	neznámý		7,5 hodiny	2006	silný hluk pozadí
Onomastica ^[34]			D Dut E F G Gre I N P S Swe			(121000)		1995	pouze lexikon
PF-STAR ^[35]		U. Erlangen	E	57	G	4627	3,4 h	2005	dětská řeč
Sunstar ^[36]		EU	E	100	G S I P D	40000		1992	projev parlamentu
TC-STAR ^[37]	Heuvel	ELDA	E S	neznámý	Země EU		13h	2006	více datových sad
TED ^[38]	Lamel	ELDA	E	40(188)	mnoho		10h (47h)	1994	eurospeech 93
TLTS ^[39]		DARPA	A		E		1 hod	2004
Tokio-Kikuko ^[40]		U. Tokio	J	140	10 zemí	35000		2004	hodnocení odborné způsobilosti
Verbmobil ^[41]		U. Mnichov	E	44	G		1,5 hodiny	1994	velmi spontánní
VODIS ^[42]		EU	F G	178	F G	2500		1998	o automobilové navigaci
WP arabština ^[43]	Rocca	LDC	A	35	E	800	1 hod	2002
WP ruština ^[44]	Rocca	LDC	R	26	E	2500	2h	2003
WP španělsky ^[45]	Morgan	LDC	S		E			2006
Mluvil WSJ ^[46]			E	10	neznámý	800		1993

Reference

^ M. Raab, R. Gruhn a E. Noeth, Nenativní databáze řeči, v Proc. ASRU, Kjóto, Japonsko, 2007.
^ K. Livescu, Analýza a modelování nepůvodní řeči pro automatické rozpoznávání řeči, SLEČNA. diplomová práce, Massachusetts Institute of Technology, Cambridge, MA, 1999.
^ Projekt AMI, „AMI Meeting Corpus“ [1].
^ R. Gruhn, T. Cincarek a S. Nakamura, „Multiakcentní nepůvodní anglická databáze“, ASJ, 2004.
^ Univerzita v Mnichově, „bavorský archiv řeči signalizuje podivný korpus“, [2].
^ Jurafsky a kol., „The Berkeley Restaurant Project“, Proc. ICSLP 1994.
^ L. Tomokiyo, Rozpoznávání nepůvodní řeči: Charakterizace a přizpůsobení nepůvodnímu použití v rozpoznávání řeči, Ph.D. diplomová práce, Carnegie Mellon University, Pensylvánie, 2001.
^ S. Witt, Využití rozpoznávání řeči ve výuce jazyků podporovaných počítačem, Ph.D. práce, Cambridge University Engineering Department, UK, 1999.
^ H. Ye a S. Young, Zlepšení výkonu rozpoznávání řeči začátečníků v mluvené konverzační interakci při výuce jazyků, v Proc. Interspeech, Lisabon, Portugalsko, 2005.
^ L. Tomokiyo, Rozpoznávání nepůvodní řeči: Charakterizace a přizpůsobení nepůvodnímu použití v rozpoznávání řeči, Ph.D. diplomová práce, Carnegie Mellon University, Pensylvánie, 2001.
^ T. P. Tan a L. Besacier, Francouzský nepůvodní korpus pro automatické rozpoznávání řeči, v LREC, Janov, Itálie, 2006.
^ T. Lander, CSLU: Zahraniční anglické vydání 1.2, Tech. Rep., LDC, Philadelphia, Pensylvánie, 2007.
^ Z. Wang, T. Schultz a A. Waibel, Porovnání technik přizpůsobení akustického modelu na nepůvodní řeči, v Proc. ICASSP, 2003.
^ S. Schaden, Regelbasierte Modellierung fremdsprachlich akzentbehafteter Aussprachevarianten, Ph.D. diplomová práce, University Duisburg-Essen, 2006.
^ L. M. Arslan a J. H. Hansen, Frekvenční charakteristiky řeči s cizím přízvukem, v Proc. z ICASSP, Mnichov, Německo, 1997, s. 1123-1126.
^ N. Minematsu a kol., Vývoj databáze řeči v angličtině čtené Japonci na podporu výzkumu CALL, v ICA, Kjóto, Japonsko, 2004, str. 577-560.
^ Christopher Cieri, David Miller, Kevin Walker, Fisher Corpus: zdroj pro další generace řeči na text, Proc. LREC 2004
^ S. Fitt, Výslovnost neznámých rodných a nepůvodních názvů měst, v Proc. Eurospeech, 1995, s. 2227-2230.
^ G. Stemmer, E. Noeth a H. Niemann, Akustické modelování cizích slov v německém systému rozpoznávání řeči, v Proc. Eurospeech, P. Dalsgaard, B. Lindberg a H. Benner, Eds., 2001, sv. 4, str. 2745-2748.
^ W. Byrne, E. Knodt, S. Khudanpur a J. Bernstein, Je automatické rozpoznávání řeči připraveno na nepůvodní řeč? Úsilí o sběr dat a počáteční experimenty v modelování konverzační hispánské angličtiny, STiLL, Marholmen, Švédsko, 1998, s. 37-40.
^ Y. Li, P. Fung, P. Xu a Y. Liu, Asymetrické akustické modelování pro rozpoznávání řeči ve smíšeném jazyce, in ICASSP, Prague, Czech, 2011, pp. 37-40.
^ V. Fischer, E. Janke a S. Kunzmann, Nedávný pokrok v dekódování nepůvodní řeči pomocí vícejazyčných akustických modelů, v Proc. Eurospeech, 2003, s. 3105-3108.
^ Nancy F. Chen, Rong Tong, Darren Wee, Peixuan Lee, Bin Ma, Haizhou Li, iCALL Corpus: Mandarínská čínština mluvená nepůvodními mluvčími evropského původu, v Proc. of Interspeech, 2015.
^ Nancy F. Chen, Vivaek Shivakumar, Mahesh Harikumar, Bin Ma, Haizhou Li. Rozsáhlá charakterizace chyb výslovnosti mandarínů vytvořená rodilými mluvčími evropských jazyků, v Proc. of Interspeech, 2013.
^ W. Menzel, E. Atwell, P. Bonaventura, D. Herron, P. Howarth, R. Morton a C. Souter, Korpus ISLE nepůvodní mluvené angličtiny, v LREC, Atény, Řecko, 2000, str. 957-963.
^ K. Livescu, Analýza a modelování nepůvodní řeči pro automatické rozpoznávání řeči, SLEČNA. diplomová práce, Massachusetts Institute of Technology, Cambridge, MA, 1999.
^ S-C. Rhee a S-H. Lee a SK. Kang a Y-J. Závětří, Návrh a konstrukce korejského mluveného anglického korpusu (K-SEC), Proc. ICSLP 2004
^ L. Tomokiyo, Rozpoznávání nepůvodní řeči: Charakterizace a přizpůsobení nepůvodnímu použití v rozpoznávání řeči, Ph.D. diplomová práce, Carnegie Mellon University, Pensylvánie, 2001.
^ Gut, U., Nepůvodní řeč. Korpusová analýza fonologických a fonetických vlastností L2 angličtiny a němčiny, Frankfurt nad Mohanem: Peter Lang, 2009.
^ TNO Ústav pro výzkum lidských faktorů, Mlha vícejazyčná interoperabilita v databázi řečových technologií, Tech. Rep., ELRA, Paříž, Francie, 2007, ELRA Catalog Reference S0238.
^ J. C. Segura a kol., Databáze HIWIRE, hlučný a nepůvodní anglický řečový korpus pro komunikaci v kokpitu, 2007, [3].
^ S. Pigeon, W. Shen a D. van Leeuwen, Návrh a charakterizace nepůvodní vojenské komunikační komunikační databáze, v ICSLP, Antverpy, Belgie, 2007.
^ L. Benarousse a kol., Korpus nativní a nepůvodní (n4) NATO, v Proc. workshopu MIST (ESCA-NATO), Leusden, září 1999.
^ Konsorcium Onomastica, Lexikon ONOMASTICA mezi jazyky, v Proc. Eurospeech, Madrid, Španělsko, 1995, s. 829-832.
^ C. Hacker, T. Cincarek, A. Maier, A. Hessler a E. Noeth, Posílení prozodických a výslovnostních funkcí k detekci chybných výslovností nepůvodních dětí, v Proc. ICASSP, Honolulu, Hawai, 2007, s. 197-200.
^ C. Teixeira, I. Trancoso a A. Serralheiro, Uznání nepůvodních přízvuků, v Proc. Eurospeech, Rhodos, Řecko, 1997, str. 2375-2378.
^ H. Heuvel, K. Choukri, C. Gollan, A. Moreno a D. Mostefa, TC-STAR: Nové jazykové zdroje pro účely ASR a SLT, v LREC, Janov, 2006, s. 2570-2573.
^ L.F. Lamel, F. Schiel, A. Fourcin, J. Mariani a H. Tillmann, Translanguage anglická databáze TED, v ICSLP, Jokohama, Japonsko, září 1994.
^ N. Mote, L. Johnson, A. Sethy, J. Silva a S. Narayanan, Detekce taktického jazyka a modelování chyb řeči žáka: Případ arabského taktického jazykového školení pro mluvčí americké angličtiny, v Proc. InSTIL, červen 2004.
^ K. Nishina, Vývoj japonské databáze řeči čtené nepůvodními mluvčími pro konstrukci systému CALL, v ICA, Kjóto, Japonsko, 2004, str. 561-564.
^ Univerzita Mnichov, Projekt Verbmobil, [4].
^ I. Trancoso, C. Viana, I. Mascarenhas a C. Teixeira, O odvozování pravidel pro nativizovanou výslovnost v navigačních dotazech, v Proc. Eurospeech, 1999.
^ A. LaRocca a R. Chouairi, Korpus arabské řeči západního bodu, Tech. Rep., LDC, Philadelphia, Pensylvánie, 2002.
^ A. LaRocca a C. Tomei, Korpus ruského řeči západního bodu, Tech. Rep., LDC, Philadelphia, Pensylvánie, 2003.
^ J. Morgan, Španělský projev heroico západního bodu, Tech. Rep., LDC, Philadelphia, Pensylvánie, 2006.
^ I. Amdal, F. Korkmazskiy a A. C. Surendran, Společné modelování výslovnosti nepůvodních mluvčích pomocí metod založených na datech, v ICSLP, Peking, Čína, 2000, str. 622-625.

[1] M. Raab, R. Gruhn a E. Noeth, Nenativní databáze řeči, v Proc. ASRU, Kjóto, Japonsko, 2007.

[2] K. Livescu, Analýza a modelování nepůvodní řeči pro automatické rozpoznávání řeči, SLEČNA. diplomová práce, Massachusetts Institute of Technology, Cambridge, MA, 1999.

[3] Projekt AMI, „AMI Meeting Corpus“ [1].

[4] R. Gruhn, T. Cincarek a S. Nakamura, „Multiakcentní nepůvodní anglická databáze“, ASJ, 2004.

[5] Univerzita v Mnichově, „bavorský archiv řeči signalizuje podivný korpus“, [2].

[6] Jurafsky a kol., „The Berkeley Restaurant Project“, Proc. ICSLP 1994.

[7] L. Tomokiyo, Rozpoznávání nepůvodní řeči: Charakterizace a přizpůsobení nepůvodnímu použití v rozpoznávání řeči, Ph.D. diplomová práce, Carnegie Mellon University, Pensylvánie, 2001.

[8] S. Witt, Využití rozpoznávání řeči ve výuce jazyků podporovaných počítačem, Ph.D. práce, Cambridge University Engineering Department, UK, 1999.

[9] H. Ye a S. Young, Zlepšení výkonu rozpoznávání řeči začátečníků v mluvené konverzační interakci při výuce jazyků, v Proc. Interspeech, Lisabon, Portugalsko, 2005.

[10] L. Tomokiyo, Rozpoznávání nepůvodní řeči: Charakterizace a přizpůsobení nepůvodnímu použití v rozpoznávání řeči, Ph.D. diplomová práce, Carnegie Mellon University, Pensylvánie, 2001.

[11] T. P. Tan a L. Besacier, Francouzský nepůvodní korpus pro automatické rozpoznávání řeči, v LREC, Janov, Itálie, 2006.

[12] T. Lander, CSLU: Zahraniční anglické vydání 1.2, Tech. Rep., LDC, Philadelphia, Pensylvánie, 2007.

[13] Z. Wang, T. Schultz a A. Waibel, Porovnání technik přizpůsobení akustického modelu na nepůvodní řeči, v Proc. ICASSP, 2003.

[14] S. Schaden, Regelbasierte Modellierung fremdsprachlich akzentbehafteter Aussprachevarianten, Ph.D. diplomová práce, University Duisburg-Essen, 2006.

[15] L. M. Arslan a J. H. Hansen, Frekvenční charakteristiky řeči s cizím přízvukem, v Proc. z ICASSP, Mnichov, Německo, 1997, s. 1123-1126.

[16] N. Minematsu a kol., Vývoj databáze řeči v angličtině čtené Japonci na podporu výzkumu CALL, v ICA, Kjóto, Japonsko, 2004, str. 577-560.

[17] Christopher Cieri, David Miller, Kevin Walker, Fisher Corpus: zdroj pro další generace řeči na text, Proc. LREC 2004

[18] S. Fitt, Výslovnost neznámých rodných a nepůvodních názvů měst, v Proc. Eurospeech, 1995, s. 2227-2230.

[19] G. Stemmer, E. Noeth a H. Niemann, Akustické modelování cizích slov v německém systému rozpoznávání řeči, v Proc. Eurospeech, P. Dalsgaard, B. Lindberg a H. Benner, Eds., 2001, sv. 4, str. 2745-2748.

[20] W. Byrne, E. Knodt, S. Khudanpur a J. Bernstein, Je automatické rozpoznávání řeči připraveno na nepůvodní řeč? Úsilí o sběr dat a počáteční experimenty v modelování konverzační hispánské angličtiny, STiLL, Marholmen, Švédsko, 1998, s. 37-40.

[21] Y. Li, P. Fung, P. Xu a Y. Liu, Asymetrické akustické modelování pro rozpoznávání řeči ve smíšeném jazyce, in ICASSP, Prague, Czech, 2011, pp. 37-40.

[22] V. Fischer, E. Janke a S. Kunzmann, Nedávný pokrok v dekódování nepůvodní řeči pomocí vícejazyčných akustických modelů, v Proc. Eurospeech, 2003, s. 3105-3108.

[23] Nancy F. Chen, Rong Tong, Darren Wee, Peixuan Lee, Bin Ma, Haizhou Li, iCALL Corpus: Mandarínská čínština mluvená nepůvodními mluvčími evropského původu, v Proc. of Interspeech, 2015.

[24] Nancy F. Chen, Vivaek Shivakumar, Mahesh Harikumar, Bin Ma, Haizhou Li. Rozsáhlá charakterizace chyb výslovnosti mandarínů vytvořená rodilými mluvčími evropských jazyků, v Proc. of Interspeech, 2013.

[25] W. Menzel, E. Atwell, P. Bonaventura, D. Herron, P. Howarth, R. Morton a C. Souter, Korpus ISLE nepůvodní mluvené angličtiny, v LREC, Atény, Řecko, 2000, str. 957-963.

[26] K. Livescu, Analýza a modelování nepůvodní řeči pro automatické rozpoznávání řeči, SLEČNA. diplomová práce, Massachusetts Institute of Technology, Cambridge, MA, 1999.

[27] S-C. Rhee a S-H. Lee a SK. Kang a Y-J. Závětří, Návrh a konstrukce korejského mluveného anglického korpusu (K-SEC), Proc. ICSLP 2004

[28] L. Tomokiyo, Rozpoznávání nepůvodní řeči: Charakterizace a přizpůsobení nepůvodnímu použití v rozpoznávání řeči, Ph.D. diplomová práce, Carnegie Mellon University, Pensylvánie, 2001.

[29] Gut, U., Nepůvodní řeč. Korpusová analýza fonologických a fonetických vlastností L2 angličtiny a němčiny, Frankfurt nad Mohanem: Peter Lang, 2009.

[30] TNO Ústav pro výzkum lidských faktorů, Mlha vícejazyčná interoperabilita v databázi řečových technologií, Tech. Rep., ELRA, Paříž, Francie, 2007, ELRA Catalog Reference S0238.

[31] J. C. Segura a kol., Databáze HIWIRE, hlučný a nepůvodní anglický řečový korpus pro komunikaci v kokpitu, 2007, [3].

[32] S. Pigeon, W. Shen a D. van Leeuwen, Návrh a charakterizace nepůvodní vojenské komunikační komunikační databáze, v ICSLP, Antverpy, Belgie, 2007.

[33] L. Benarousse a kol., Korpus nativní a nepůvodní (n4) NATO, v Proc. workshopu MIST (ESCA-NATO), Leusden, září 1999.

[34] Konsorcium Onomastica, Lexikon ONOMASTICA mezi jazyky, v Proc. Eurospeech, Madrid, Španělsko, 1995, s. 829-832.

[35] C. Hacker, T. Cincarek, A. Maier, A. Hessler a E. Noeth, Posílení prozodických a výslovnostních funkcí k detekci chybných výslovností nepůvodních dětí, v Proc. ICASSP, Honolulu, Hawai, 2007, s. 197-200.

[36] C. Teixeira, I. Trancoso a A. Serralheiro, Uznání nepůvodních přízvuků, v Proc. Eurospeech, Rhodos, Řecko, 1997, str. 2375-2378.

[37] H. Heuvel, K. Choukri, C. Gollan, A. Moreno a D. Mostefa, TC-STAR: Nové jazykové zdroje pro účely ASR a SLT, v LREC, Janov, 2006, s. 2570-2573.

[38] L.F. Lamel, F. Schiel, A. Fourcin, J. Mariani a H. Tillmann, Translanguage anglická databáze TED, v ICSLP, Jokohama, Japonsko, září 1994.

[39] N. Mote, L. Johnson, A. Sethy, J. Silva a S. Narayanan, Detekce taktického jazyka a modelování chyb řeči žáka: Případ arabského taktického jazykového školení pro mluvčí americké angličtiny, v Proc. InSTIL, červen 2004.

[40] K. Nishina, Vývoj japonské databáze řeči čtené nepůvodními mluvčími pro konstrukci systému CALL, v ICA, Kjóto, Japonsko, 2004, str. 561-564.

[41] Univerzita Mnichov, Projekt Verbmobil, [4].

[42] I. Trancoso, C. Viana, I. Mascarenhas a C. Teixeira, O odvozování pravidel pro nativizovanou výslovnost v navigačních dotazech, v Proc. Eurospeech, 1999.

[43] A. LaRocca a R. Chouairi, Korpus arabské řeči západního bodu, Tech. Rep., LDC, Philadelphia, Pensylvánie, 2002.

[44] A. LaRocca a C. Tomei, Korpus ruského řeči západního bodu, Tech. Rep., LDC, Philadelphia, Pensylvánie, 2003.

[45] J. Morgan, Španělský projev heroico západního bodu, Tech. Rep., LDC, Philadelphia, Pensylvánie, 2006.

[46] I. Amdal, F. Korkmazskiy a A. C. Surendran, Společné modelování výslovnosti nepůvodních mluvčích pomocí metod založených na datech, v ICSLP, Peking, Čína, 2000, str. 622-625.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]