CereProc - CereProc

CereProc
CereProcLogo 2.png
VývojářiCereProc Ltd., Velká Británie
První vydání2006; Před 14 lety (2006)
NapsánoC / Python
Operační systémCross-platform
K dispozici vAngličtina, němčina, francouzština, španělština, italština, holandština, katalánština, rumunština, japonština, portugalština, skotská gaelština, švédština, polština, irština
TypText na řeč
LicenceKomerční
webová stránkawww.cereproc.com

CereProc je syntéza řeči společnost se sídlem v Edinburghu ve Skotsku, založená v roce 2005. Společnost se specializuje na vytváření přirozeného a expresivně znějícího text na řeč hlasy, syntetické hlasy s regionálními akcenty a in klonování hlasu.

Technologie budování hlasu

CereProc vytváří hlasy pomocí dvou různých technologií budování hlasu: syntéza výběru jednotek a parametrické modelování.

Hlasy pro výběr jednotek CereProc jsou sestaveny z velkých databáze zaznamenané řeči. Během vytváření databáze je každá zaznamenaná promluva rozdělena na některé nebo všechny následující: individuální telefony, slabiky, morfémy, slova, fráze, a věty. Rozdělení na segmenty se provádí pomocí speciálně upravené rozpoznávač řeči.[1] An index jednotek v databázi řeči se poté vytvoří na základě segmentace a akustických parametrů, jako je základní frekvence (hřiště ), trvání, poloha v slabice a sousední telefony. Na runtime, je požadovaný cílový výrok vytvořen určením nejlepšího řetězce kandidátských jednotek z databáze (výběr jednotek). Výběr jednotek poskytuje největší přirozenost, protože platí zpracování digitálních signálů (DSP) k zaznamenané řeči pouze v zřetězených bodech. Díky DSP je zvuk zaznamenané řeči často méně přirozený.

CereProcovy parametrické hlasy produkují syntézu řeči na základě metodik statistického modelování. V tomto systému je frekvenční spektrum (hlasový trakt ), základní frekvence (hlasový zdroj) a doba trvání (prozódie ) řeči jsou modelovány současně. Mluvený projev křivky jsou generovány z těchto parametrů pomocí a vokodér. Kriticky lze tyto hlasy sestavit z výrazně méně zaznamenané řeči než hlasy pro výběr jednotek a při instalaci mají mnohem menší stopu, protože se používají pro soukromé hlasové klonování.[2]

Hlasy a jazyky

CereProc má čtyřicet šest obecně dostupných hlasů, které mluví čtrnácti jazyky v mnoha různých regionálních akcentech:

  • Americká angličtina: Isabella, Katherine, Hannah, Megan, Adam, Nathan, Andy (dětský hlas), Jordan (dětský hlas), Carolyn
  • Britská angličtina: Sarah, William, Jack, Lauren, Giles, Amy
  • Severní angličtina: Jess
  • Skotská angličtina: Heather, Kirsty, Stuart, Andrew (dětský hlas), Mairi (dětský hlas)
  • Glasgow anglicky: Dodo
  • Lancashire anglicky: Claire
  • Irská angličtina: Caitlin
  • West Midlands anglicky: Sue
  • Speciální FX hlasy: Demon, Ghost, Goblin, Pixie, Robot
  • Metropolitní francouzština: Suzanne, Laurent
  • Kanadská francouzština: Florencie
  • Katalánština: Rita
  • Kastilská španělština: Sara
  • Latinskoamerická španělština: Ana
  • Italská: Laura
  • Irština: Peig
  • Holandsky: Ada
  • Němec: Gudrun, Alex
  • Rakouská němčina: Leopold
  • Portugalština: Lúcia
  • Brazilská portugalština: Gabriel
  • Japonština: Yuki
  • Skotská gaelština: Ceitidh
  • Švédsky: Ylva
  • Polsky: Pola
  • Rumunsky: Daria
  • Angličtina s francouzským přízvukem: Nicole
  • Rusky: Avrora
  • Mandarín: Mailin

Kromě toho společnost vyvinula řadu hlasů celebrit, které nejsou obecně dostupné veřejnosti. Tyto zahrnují George W. Bush, Barack Obama a Arnold Schwarzenegger.[3]

Klonování hlasu

V roce 2009 filmový kritik Roger Ebert zaměstnal CereProca k vytvoření syntetické verze jeho hlasu. Ebert po chirurgickém zákroku ztratil sílu řeči rakovina štítné žlázy. CereProc těžil pásky a DVD komentáře představující Ebertův hlas, aby vytvořil hlas převodu textu na řeč, který zněl spíš jako jeho vlastní.[4] Roger Ebert použil hlas při svém vystoupení 2. března 2010 Show Oprah Winfreyové.

NFL hráč Steve Gleason nechal jeho hlas klonovat CereProc po jeho diagnóze s MND. Gleason se objevil Microsoft je Super Bowl XLVIII komerční chválí sílu technologie a používá svůj syntetický hlas k vyprávění.

Technologie klonování hlasu CereProc je v současné době ve Velké Británii využívána osobami trpícími MND k vytváření hlasů syntézy dříve, než ztratí sílu řeči. Tento proces byl uveden v a BBC Radio 4 dokumentární, Dává kritikovi zpět jeho hlas, vysílán v srpnu 2011.[5]

Kompatibilita systému

Hlasy CereProc lze nasadit na různé operační systémy a na různých typech zařízení. Hlasy CereProc pro stolní počítače jsou kompatibilní s Microsoft Windows a Apple Mac OS X. Instalují se jako systémové hlasy a lze je použít v jiných aplikacích podporujících řeč. CereProc klient-server systém cServer, zaměřený hlavně na firemní trh IVR, lze provozovat na Windows a Windows Linux. Lze nasadit mobilní hlasy CereProc Android a Apple iOS. Sada SDK je k dispozici pro Android, Linux, MacOS, iOS a Windows. SDK má vazby pro C / C ++, C #, Java a Python.

Viz také

Reference

  1. ^ Alan W. Black, Dokonalá syntéza pro všechny lidi po celou dobu. Workshop IEEE TTS 2002.
  2. ^ "Cerevoice Me".
  3. ^ „CereProc Voices“.
  4. ^ Roger Ebert: The Essential Man „Esquire“, 16. února 2010. Přístup: 21. 9. 2011
  5. ^ „Dát kritikovi zpět jeho hlas“. BBC Programy Radio Scotland. Citováno 26. října 2011.

externí odkazy