Momeli - Momel - Wikipedia
tento článek potřebuje další citace pro ověření.Listopad 2007) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Momeli (Moprodávat melody) je algoritmus vyvinutý Danielem Hirstem a Robertem Espesserem v CNRS Laboratoire Parole et Langage,[1] Aix-en-Provence:[1] pro analýzu a syntézu intonačních vzorců.
Účel
Analýza surového základní frekvence křivky pro studium intonace musí brát v úvahu skutečnost, že reproduktory současně vytvářejí intonační vzor a posloupnost slabik složených ze segmentových telefonů. Skutečné hrubé základní frekvenční křivky, které lze akusticky analyzovat, jsou výsledkem interakce mezi těmito dvěma složkami, což ztěžuje srovnání intonačních vzorů, pokud jsou vytvářeny s různými segmentovými materiály. Porovnejte například intonační vzory na promluvách Je to pro tátu a Je to pro matku.
Algoritmus
Algoritmus Momel se pokouší vyřešit tento problém rozložením surových křivek na dvě složky:
- A makromelodická složka - po vzoru a kvadratický funkce spline . Předpokládá se, že to odpovídá globálnímu obrys hřiště výpovědi a která je nezávislá na povaze základních fonémů. Základní hypotéza je, že tato makromelodická složka je, na rozdíl od hrubých křivek základní frekvence, obě kontinuální a hladký. Odpovídá přibližně tomu, co produkujeme, pokud namluvíme místo toho řeč.
- A mikromelodická složka skládající se z odchylek od makromelodické křivky - zvané a mikromelodický profil. Předpokládá se, že tato zbytková křivka je zcela určena segmentovými složkami promluvy a je nezávislá na makromelodické složce.
Kvadratická spline funkce použitá k modelování makromelodické složky je definována posloupností cílových bodů (páry , z nichž každý pár je spojen dvěma monotónními parabolický křivky s spline uzel vyskytující se (ve výchozím nastavení) ve středu mezi dvěma cíli. The první derivace takto definované křivky je v každém cílovém bodě nula a dvě paraboly mají stejnou hodnotu a stejnou derivaci v uzlu spline. To ve skutečnosti definuje nejjednodušší matematickou funkci, pro kterou jsou křivky spojité i hladké.
Dopady
Na jedné straně dvě promluvy „Pro matku!“ a „Pro tátu!“ lze tedy modelovat se stejnými cílovými body (tedy se stejnou makromelodickou složkou), zatímco „For Mama?“ a „Pro tátu?“ by také měl stejné cílové body, ale které by se pravděpodobně lišily od bodů prvního páru.
Na druhou stranu výroky „Pro matku!“ a „Pro matku?“ lze modelovat se stejným mikromelodickým profilem, ale s jiným cílovým bodem, zatímco „For Papa!“ a „Pro tátu?“ by také měl stejný mikromelodický profil, ale který by se lišil od profilu prvního páru.
Algoritmus Momel odvozuje to, co jeho autoři nazývají a fonetická reprezentace intonačního vzorce, který je neutrální, pokud jde o produkci řeči a vnímání řeči, protože i když není výslovně odvozen z modelu produkce nebo vnímání, obsahuje dostatečné informace, aby bylo možné jej použít jako vstup do modelů kteréhokoli procesu. Relativně teoreticky neutrální povaha algoritmu umožnila jeho použití jako prvního kroku při odvozování reprezentací, jako jsou Model Fujisaki (Mixdorff 1999), ToBI (Maghbouleh 1999, Wightman a kol. 2000) nebo INTSINT (Hirst & Espesser 1993, Hirst et al. 2000).
Reference
- ^ A b Lpl: Laboratoire Parole Et Langage Archivováno 07.01.2013 v Archiv. Dnes
- Hirst, Daniel & Robert Espesser 1993. Automatické modelování základní frekvence pomocí kvadratické spline funkce. Travaux de l'Institut de Phonétique d'Aix 15, 71-85.
- Hirst, Daniel, Albert Di Cristo a Robert Espesser 2000. Úrovně zastoupení a úrovně analýzy pro intonaci. v M. Horne (ed) Prozodie: Teorie a experiment. Kluwer Academic Publishers, Dordrecht. 51-87
- Maghbouleh, A., 1998. Rozpoznávání přízvuků typu ToBI. V: Sborník ICSLP 98.
- Mixdorff, H., 1999. Nový přístup k plně automatické extrakci parametrů modelu Fujisaki. v Sborník ICASSP 1999.
- Wightman, C. & Campbell, N., 1995. Vylepšené označení prozodické struktury. IEEE Trans. o zpracování řeči a zvuku.
externí odkazy
Automatickou anotaci Momel může provádět uživatel SPPAS