Lineární predikce se smíšeným buzením - Mixed-excitation linear prediction
![]() | tento článek potřebuje další citace pro ověření.Února 2018) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Lineární predikce se smíšeným buzením (MELP) je Ministerstvo obrany Spojených států kódování řeči standard používaný hlavně v válečný aplikace a satelit komunikace, bezpečný hlas a zabezpečte rádiová zařízení. Jeho standardizaci a pozdější vývoj vedly a podporovaly NSA a NATO.
Dějiny
Počáteční MELP vynalezl Alan McCree kolem roku 1995 [1] zatímco postgraduální student v Centru pro zpracování signálu a obrazu (CSIP) na Georgia Tech a původní patenty související s MELP již vypršely. Tento počáteční kodér řeči byl standardizován v roce 1997 a byl známý jako MIL-STD-3005.[2] Předčil ostatní kandidáty vokodérů v americké soutěži DoD, včetně: (a) Frekvenčně selektivní harmonický kodér (FSHC), (b) Pokročilé vícepásmové buzení (AMBE), (c) Vylepšené vícepásmové buzení (EMBE), (d) Kodér transformace sinusoidů (STC) a (e) Kodér subpásmového LPC (SBC). Vzhledem ke své nižší složitosti[Citace je zapotřebí ] než kodér Waveform Interpolative (WI) zvítězil vokodér MELP v soutěži DoD a byl vybrán pro MIL-STD -3005.
MIL-STD-3005
V letech 1998 až 2001 byl nový vokodér založený na MELP vytvořen poloviční rychlostí (tj. 1 200 bit / s) a do MIL-STD-3005 byla přidána podstatná vylepšení SignalCom (později získaný Microsoft ) a AT&T Corporation, který zahrnoval (a) další nový vokodér s poloviční rychlostí (tj. 1 200 bit / s), (b) podstatně vylepšené kódování (analýza), (c) podstatně vylepšené dekódování (syntéza), (d) předběžné zpracování šumu pro odstranění pozadí šum, (e) transkódování mezi bitovými toky 2400 bit / s a 1200 bit / s a (f) nový postfilter. Cílem tohoto poměrně významného vývoje bylo vytvořit nový kodér s poloviční rychlostí a zajistit jeho interoperabilitu se starým standardem MELP. Tato vylepšená MELP (známá také jako MELPe) byla přijata jako nová MIL-STD-3005 v roce 2001 ve formě příloh a doplňků k původní MIL-STD-3005, což umožňuje stejnou kvalitu jako staré MELP s rychlostí 2400 bit / s poloviční rychlostí. Jednou z největších výhod nového 2400 bit / s MELPe je to, že sdílí stejný bitový formát jako MELP, a proto může spolupracovat se staršími systémy MELP, ale přinesl by lepší kvalitu na obou koncích. MELPe poskytuje mnohem lepší kvalitu než všechny starší vojenské standardy, zejména v hlučném prostředí, jako jsou bitevní pole a vozidla a letadla.
STANAG-4591 (NATO)
V roce 2002, po rozsáhlé konkurenci a testování, byla 2400 a 1 200 bit / s US DoD MELPe přijata také jako NATO standard, známý jako STANAG -4591.[3] V rámci testování NATO na nový standard NATO byl testován MELPe proti jiným kandidátům, jako např Francie HSX (harmonické stochastické povzbuzování) a krocan SB-LPC (Split-Band Linear Predictive Coding), stejně jako staré zabezpečené hlasové standardy, jako je FS1015 LPC-10e (2,4 kbit / s), FS1016 CELP (4,8 kbit / s) a CVSD (16 kbit / s). MELPe následně zvítězil také v soutěži NATO, čímž předčil kvalitu všech ostatních kandidátů i kvalitu všech starých zabezpečených hlasových standardů (CVSD, CELP a LPC-10e ). The NATO Soutěž dospěla k závěru, že MELPe podstatně zlepšil výkon (z hlediska kvality řeči, srozumitelnosti a odolnosti proti šumu) a současně snížil požadavky na propustnost. Testování NATO zahrnovalo také testy interoperability, použilo více než 200 hodin dat řeči a bylo provedeno 3 testovacími laboratořemi po celém světě.
V roce 2005 došlo k nové změně MELPe s rychlostí 600 bit / s Skupina Thales (Francie ) byl přidán (bez rozsáhlé konkurence a testování prováděného pro MELPe 2400/1200 bit / s) [4] podle standardu NATO STANAG-4591.
300 bit / s MELP
V roce 2010 Lincoln Labs., BBN a General Dynamics také vyvinuly pro DARPA zařízení MELP s rychlostí 300 bit / s.[5] Jeho kvalita byla lepší než 600 bit / s MELPe, ale jeho zpoždění bylo delší.
Implementace
MELPe byl implementován v mnoha aplikacích, včetně zabezpečených rádiových zařízení, satelitní komunikace, VoIP a aplikací pro mobilní telefony. V takových aplikacích je vyžadována další odbornost v boji proti chybám kanálu, ztrátě paketů a ztrátě synchronizace. Taková odbornost vyžaduje pochopení citlivosti bitů MELPe na chyby. 2 400 bit / s a 1 200 bit / s MELPe obsahují synchronizační bit, který je užitečný při sériové komunikaci.
Úroveň komprese
MELPe je určen pro kompresi řeči. Vzhledem k audio vstupu vzorkovanému na 8 kHz poskytuje kodek MELPe následující kompresní poměry nad datovým tokem μ-Law G.711 64 kbit / s, bez vlivu režijních nákladů protokolu:
Přenosová rychlost | Kompresní poměr přes G.711 | Velikost užitečného zatížení | Interval užitečného zatížení |
---|---|---|---|
2400 bit / s | 26,7 X | 54 bitů | 22,5 ms |
1200 bit / s | 53,3 X | 81 bitů | 67,5 ms |
600 bit / s | 106,7 X | 54 bitů | 90 ms |
Obecně řečeno kódování řeči zahrnuje kompromis různých aspektů, včetně bitové rychlosti, kvality řeči, zpoždění (velikost rámce a vzhled), výpočetní složitosti, robustnosti pro různé reproduktory a jazyky, odolnosti vůči různým zvukům pozadí, robustnosti chyby kanálu a také obnova stavu kodeku tváří v tvář ztrátě paketů. Vzhledem k tomu, že nižší rychlosti MELPe (600 a 1200 bit / s) jsou nadmnožinami rychlosti 2400 bit / s, je složitost algoritmu (např. V MIPS) přibližně stejná pro všechny rychlosti. Nižší sazby používají zvětšené rámce a vzhled, stejně jako velikost číselníku, proto vyžadují více paměti.
Práva k duševnímu vlastnictví
Upozorňujeme, že společnost MELPe (a / nebo její deriváty) podléhá licenci IPR od následujících společností, Texas Instruments (Algoritmus MELP / zdrojový kód 2400 bit / s), Microsoft (Transkodér 1200 bit / s), Skupina Thales (Rychlost 600 bit / s) a AT&T (NPP pro zpracování šumu).
Viz také
Reference
- ^ Mixed Excitation LPC Vocoder Model for Low Bit Rate Speech Coding, Alan V. McCree, Thomas P. Barnweell, 1995 in IEEE Trans. Zpracování řeči a zvuku (původní MELP)
- ^ Analogově-digitální převod hlasu 2400 bit / sekundu smíšené budicí lineární predikce (MELP), US DoD (MIL_STD-3005, původní MELP)
- ^ 1200 A 2400 BIT / S INTEROPEROVATELNÝ HLASOVÝ KÓDER ÚZKÉHO PÁSMA NATO, STANAG-4591, NATO
- ^ MELPE VARIATION PRO 600 BIT / S NATO NARROW BAND VOICE CODER, STANAG-4591, NATO
- ^ Alan McCree, „Škálovatelný rámec fonetického vokodéru využívající společnou prediktivní vektorovou kvantizaci parametrů MELP,“ v Proc. IEEE Int. Konf. Acoust., Speech, Signal Processing, 2006, str. I 705–708, Toulouse, Francie