CereProc - CereProc

CereProc
Vývojáři	CereProc Ltd., Velká Británie
První vydání	2006; Před 14 lety
Napsáno	C / Python
Operační systém	Cross-platform
K dispozici v	Angličtina, němčina, francouzština, španělština, italština, holandština, katalánština, rumunština, japonština, portugalština, skotská gaelština, švédština, polština, irština
Typ	Text na řeč
Licence	Komerční
webová stránka	www.cereproc.com

CereProc je syntéza řeči společnost se sídlem v Edinburghu ve Skotsku, založená v roce 2005. Společnost se specializuje na vytváření přirozeného a expresivně znějícího text na řeč hlasy, syntetické hlasy s regionálními akcenty a in klonování hlasu.

Technologie budování hlasu

CereProc vytváří hlasy pomocí dvou různých technologií budování hlasu: syntéza výběru jednotek a parametrické modelování.

Hlasy pro výběr jednotek CereProc jsou sestaveny z velkých databáze zaznamenané řeči. Během vytváření databáze je každá zaznamenaná promluva rozdělena na některé nebo všechny následující: individuální telefony, slabiky, morfémy, slova, fráze, a věty. Rozdělení na segmenty se provádí pomocí speciálně upravené rozpoznávač řeči.^[1] An index jednotek v databázi řeči se poté vytvoří na základě segmentace a akustických parametrů, jako je základní frekvence (hřiště ), trvání, poloha v slabice a sousední telefony. Na runtime, je požadovaný cílový výrok vytvořen určením nejlepšího řetězce kandidátských jednotek z databáze (výběr jednotek). Výběr jednotek poskytuje největší přirozenost, protože platí zpracování digitálních signálů (DSP) k zaznamenané řeči pouze v zřetězených bodech. Díky DSP je zvuk zaznamenané řeči často méně přirozený.

CereProcovy parametrické hlasy produkují syntézu řeči na základě metodik statistického modelování. V tomto systému je frekvenční spektrum (hlasový trakt ), základní frekvence (hlasový zdroj) a doba trvání (prozódie ) řeči jsou modelovány současně. Mluvený projev křivky jsou generovány z těchto parametrů pomocí a vokodér. Kriticky lze tyto hlasy sestavit z výrazně méně zaznamenané řeči než hlasy pro výběr jednotek a při instalaci mají mnohem menší stopu, protože se používají pro soukromé hlasové klonování.^[2]

Hlasy a jazyky

CereProc má čtyřicet šest obecně dostupných hlasů, které mluví čtrnácti jazyky v mnoha různých regionálních akcentech:

Americká angličtina: Isabella, Katherine, Hannah, Megan, Adam, Nathan, Andy (dětský hlas), Jordan (dětský hlas), Carolyn
Britská angličtina: Sarah, William, Jack, Lauren, Giles, Amy
Severní angličtina: Jess
Skotská angličtina: Heather, Kirsty, Stuart, Andrew (dětský hlas), Mairi (dětský hlas)
Glasgow anglicky: Dodo
Lancashire anglicky: Claire
Irská angličtina: Caitlin
West Midlands anglicky: Sue
Speciální FX hlasy: Demon, Ghost, Goblin, Pixie, Robot
Metropolitní francouzština: Suzanne, Laurent
Kanadská francouzština: Florencie
Katalánština: Rita
Kastilská španělština: Sara
Latinskoamerická španělština: Ana
Italská: Laura
Irština: Peig
Holandsky: Ada
Němec: Gudrun, Alex
Rakouská němčina: Leopold
Portugalština: Lúcia
Brazilská portugalština: Gabriel
Japonština: Yuki
Skotská gaelština: Ceitidh
Švédsky: Ylva
Polsky: Pola
Rumunsky: Daria
Angličtina s francouzským přízvukem: Nicole
Rusky: Avrora
Mandarín: Mailin

Kromě toho společnost vyvinula řadu hlasů celebrit, které nejsou obecně dostupné veřejnosti. Tyto zahrnují George W. Bush, Barack Obama a Arnold Schwarzenegger.^[3]

Klonování hlasu

V roce 2009 filmový kritik Roger Ebert zaměstnal CereProca k vytvoření syntetické verze jeho hlasu. Ebert po chirurgickém zákroku ztratil sílu řeči rakovina štítné žlázy. CereProc těžil pásky a DVD komentáře představující Ebertův hlas, aby vytvořil hlas převodu textu na řeč, který zněl spíš jako jeho vlastní.^[4] Roger Ebert použil hlas při svém vystoupení 2. března 2010 Show Oprah Winfreyové.

NFL hráč Steve Gleason nechal jeho hlas klonovat CereProc po jeho diagnóze s MND. Gleason se objevil Microsoft je Super Bowl XLVIII komerční chválí sílu technologie a používá svůj syntetický hlas k vyprávění.

Technologie klonování hlasu CereProc je v současné době ve Velké Británii využívána osobami trpícími MND k vytváření hlasů syntézy dříve, než ztratí sílu řeči. Tento proces byl uveden v a BBC Radio 4 dokumentární, Dává kritikovi zpět jeho hlas, vysílán v srpnu 2011.^[5]

Kompatibilita systému

Hlasy CereProc lze nasadit na různé operační systémy a na různých typech zařízení. Hlasy CereProc pro stolní počítače jsou kompatibilní s Microsoft Windows a Apple Mac OS X. Instalují se jako systémové hlasy a lze je použít v jiných aplikacích podporujících řeč. CereProc klient-server systém cServer, zaměřený hlavně na firemní trh IVR, lze provozovat na Windows a Windows Linux. Lze nasadit mobilní hlasy CereProc Android a Apple iOS. Sada SDK je k dispozici pro Android, Linux, MacOS, iOS a Windows. SDK má vazby pro C / C ++, C #, Java a Python.

Viz také

Reference

^ Alan W. Black, Dokonalá syntéza pro všechny lidi po celou dobu. Workshop IEEE TTS 2002.
^ "Cerevoice Me".
^ „CereProc Voices“.
^ Roger Ebert: The Essential Man „Esquire“, 16. února 2010. Přístup: 21. 9. 2011
^ „Dát kritikovi zpět jeho hlas“. BBC Programy Radio Scotland. Citováno 26. října 2011.

externí odkazy

[1] Alan W. Black, Dokonalá syntéza pro všechny lidi po celou dobu. Workshop IEEE TTS 2002.

[2] "Cerevoice Me".

[3] „CereProc Voices“.

[4] Roger Ebert: The Essential Man „Esquire“, 16. února 2010. Přístup: 21. 9. 2011

[5] „Dát kritikovi zpět jeho hlas“. BBC Programy Radio Scotland. Citováno 26. října 2011.

[1]

[2]

[3]

[4]

[5]