CereProc - CereProc
![]() | |
Vývojáři | CereProc Ltd., Velká Británie |
---|---|
První vydání | 2006 |
Napsáno | C / Python |
Operační systém | Cross-platform |
K dispozici v | Angličtina, němčina, francouzština, španělština, italština, holandština, katalánština, rumunština, japonština, portugalština, skotská gaelština, švédština, polština, irština |
Typ | Text na řeč |
Licence | Komerční |
webová stránka | www |
CereProc je syntéza řeči společnost se sídlem v Edinburghu ve Skotsku, založená v roce 2005. Společnost se specializuje na vytváření přirozeného a expresivně znějícího text na řeč hlasy, syntetické hlasy s regionálními akcenty a in klonování hlasu.
Technologie budování hlasu
CereProc vytváří hlasy pomocí dvou různých technologií budování hlasu: syntéza výběru jednotek a parametrické modelování.
Hlasy pro výběr jednotek CereProc jsou sestaveny z velkých databáze zaznamenané řeči. Během vytváření databáze je každá zaznamenaná promluva rozdělena na některé nebo všechny následující: individuální telefony, slabiky, morfémy, slova, fráze, a věty. Rozdělení na segmenty se provádí pomocí speciálně upravené rozpoznávač řeči.[1] An index jednotek v databázi řeči se poté vytvoří na základě segmentace a akustických parametrů, jako je základní frekvence (hřiště ), trvání, poloha v slabice a sousední telefony. Na runtime, je požadovaný cílový výrok vytvořen určením nejlepšího řetězce kandidátských jednotek z databáze (výběr jednotek). Výběr jednotek poskytuje největší přirozenost, protože platí zpracování digitálních signálů (DSP) k zaznamenané řeči pouze v zřetězených bodech. Díky DSP je zvuk zaznamenané řeči často méně přirozený.
CereProcovy parametrické hlasy produkují syntézu řeči na základě metodik statistického modelování. V tomto systému je frekvenční spektrum (hlasový trakt ), základní frekvence (hlasový zdroj) a doba trvání (prozódie ) řeči jsou modelovány současně. Mluvený projev křivky jsou generovány z těchto parametrů pomocí a vokodér. Kriticky lze tyto hlasy sestavit z výrazně méně zaznamenané řeči než hlasy pro výběr jednotek a při instalaci mají mnohem menší stopu, protože se používají pro soukromé hlasové klonování.[2]
Hlasy a jazyky
CereProc má čtyřicet šest obecně dostupných hlasů, které mluví čtrnácti jazyky v mnoha různých regionálních akcentech:
- Americká angličtina: Isabella, Katherine, Hannah, Megan, Adam, Nathan, Andy (dětský hlas), Jordan (dětský hlas), Carolyn
- Britská angličtina: Sarah, William, Jack, Lauren, Giles, Amy
- Severní angličtina: Jess
- Skotská angličtina: Heather, Kirsty, Stuart, Andrew (dětský hlas), Mairi (dětský hlas)
- Glasgow anglicky: Dodo
- Lancashire anglicky: Claire
- Irská angličtina: Caitlin
- West Midlands anglicky: Sue
- Speciální FX hlasy: Demon, Ghost, Goblin, Pixie, Robot
- Metropolitní francouzština: Suzanne, Laurent
- Kanadská francouzština: Florencie
- Katalánština: Rita
- Kastilská španělština: Sara
- Latinskoamerická španělština: Ana
- Italská: Laura
- Irština: Peig
- Holandsky: Ada
- Němec: Gudrun, Alex
- Rakouská němčina: Leopold
- Portugalština: Lúcia
- Brazilská portugalština: Gabriel
- Japonština: Yuki
- Skotská gaelština: Ceitidh
- Švédsky: Ylva
- Polsky: Pola
- Rumunsky: Daria
- Angličtina s francouzským přízvukem: Nicole
- Rusky: Avrora
- Mandarín: Mailin
Kromě toho společnost vyvinula řadu hlasů celebrit, které nejsou obecně dostupné veřejnosti. Tyto zahrnují George W. Bush, Barack Obama a Arnold Schwarzenegger.[3]
Klonování hlasu
V roce 2009 filmový kritik Roger Ebert zaměstnal CereProca k vytvoření syntetické verze jeho hlasu. Ebert po chirurgickém zákroku ztratil sílu řeči rakovina štítné žlázy. CereProc těžil pásky a DVD komentáře představující Ebertův hlas, aby vytvořil hlas převodu textu na řeč, který zněl spíš jako jeho vlastní.[4] Roger Ebert použil hlas při svém vystoupení 2. března 2010 Show Oprah Winfreyové.
NFL hráč Steve Gleason nechal jeho hlas klonovat CereProc po jeho diagnóze s MND. Gleason se objevil Microsoft je Super Bowl XLVIII komerční chválí sílu technologie a používá svůj syntetický hlas k vyprávění.
Technologie klonování hlasu CereProc je v současné době ve Velké Británii využívána osobami trpícími MND k vytváření hlasů syntézy dříve, než ztratí sílu řeči. Tento proces byl uveden v a BBC Radio 4 dokumentární, Dává kritikovi zpět jeho hlas, vysílán v srpnu 2011.[5]
Kompatibilita systému
Hlasy CereProc lze nasadit na různé operační systémy a na různých typech zařízení. Hlasy CereProc pro stolní počítače jsou kompatibilní s Microsoft Windows a Apple Mac OS X. Instalují se jako systémové hlasy a lze je použít v jiných aplikacích podporujících řeč. CereProc klient-server systém cServer, zaměřený hlavně na firemní trh IVR, lze provozovat na Windows a Windows Linux. Lze nasadit mobilní hlasy CereProc Android a Apple iOS. Sada SDK je k dispozici pro Android, Linux, MacOS, iOS a Windows. SDK má vazby pro C / C ++, C #, Java a Python.
Viz také
Reference
- ^ Alan W. Black, Dokonalá syntéza pro všechny lidi po celou dobu. Workshop IEEE TTS 2002.
- ^ "Cerevoice Me".
- ^ „CereProc Voices“.
- ^ Roger Ebert: The Essential Man „Esquire“, 16. února 2010. Přístup: 21. 9. 2011
- ^ „Dát kritikovi zpět jeho hlas“. BBC Programy Radio Scotland. Citováno 26. října 2011.