ECMA-407 - ECMA-407
![]() | |
![]() Mezinárodní standard ECMA-407 schválený v červnu 2014. | |
Typ | Mezinárodní standard |
---|---|
Právní status | Schváleno (25. června 2014) |
Účel | Vícekanálová komprese |
Hlavní sídlo | Ženeva |
Obsluhovaný region | Celosvětově |
Svolávač TG22 | Pan Clemens Par |
Mateřská organizace | Ecma International |
webová stránka | www |
ECMA-407 je první schválený mezinárodní zvukový standard 3D na světě pro neomezené doručování signálů založených na kanálech, objektech a scénách až do NHK 22.2 vyvinutý uživatelem Ecma TC32-TG22 v úzké spolupráci s France Télévisions, Rádio Francie, École Polytechnique Fédérale de Lausanne a McGill University v Montrealu.
ECMA-407 používá inverzní kódování v časová doména, vynález švýcarsko-rakouského matematika Clemensa Para, a ukazuje nejnižší dosažené prostorové přenosové rychlosti (například několik minut NHK 22,2 může představovat zapouzdřený datový balíček 100 bajtů). Byl vybrán pro Světová organizace duševního vlastnictví Cena v roce 2009.[1] Inverzní kódování se vrací zpět k Victor Ambartsumian vědecké dědictví inverzních problémů a představuje první řešení svého druhu v oblasti zvuku oddělením zdrojů zvuku na stejné frekvenci modelem na časové úrovni.[2]


Rodina standardů Ecma S5
S5 („Scalable Sparse Spatial Sound System“) je škálovatelný vícekanálový kódovací systém, který může zahrnovat širokou škálu základních zvukové kodeky, nejlépe s další zapouzdřovací kapacitou pro externí data, např. MPEG-4 nebo MPEG-D. Kompatibilní bitový proud může tak být zachována syntaxe a ECMA-407 se během přenosu stane „neviditelným“.
Kodek S5 může být určen funkčními blokovými diagramy kodéru S5 a dekodéru S5. Podle normy musí kodér S5 sestávat alespoň ze základního kodéru S5; a dekodér S5 musí sestávat alespoň ze základního dekodéru S5.[je zapotřebí objasnění ]


Základní systém S5
Základní kodér S5 komprimuje vícekanálový zvuk informace downmixováním signálu f kanálu na g kanálů a vytváří řídká prostorová data podle inverzního kódovacího modelu, který přistupuje k lokalizaci a prostředí původního signálu. Model inverzního kódování přímo konstruuje upmix h kanálů z audio downmixu a jeho přidružených prostorových dat.
Komprese zvuku downmix základním zvukovým kodérem dále zvyšuje účinnost kódování S5. Různé bitové toky produkované funkčními jednotkami kodéru S5 mohou být zapouzdřeny do jediného bitového toku funkční jednotkou „Multiplexer“.
Pomocná data mohou být přenášena z kodéru S5 do dekodéru S5. Tato pomocná data mohou být použita k zapouzdření dat jiných než kódovacích parametrů, například parametrů hlasitosti podle ITU-R nebo Evropská vysílací unie, kterou lze použít k úpravě vnímané úrovně zvukových signálů.
ECMA-407 specifikuje pouze základní kodér / dekodér S5 a jejich rozhraní. Všechny ostatní komponenty a jejich rozhraní nejsou specifikovány, protože na takové konkrétní kodeky S5 se vztahují samostatné normy. Protože základní kodér S5 a základní dekodér S5 jsou vůči ostatním systémovým komponentám agnostické, představuje EMCA-407 společnou základnu pro všechny specifické standardy S5.
S5 Shoda
ECMA-407 specifikuje základní kodér a dekodér S5, pokud jde o konfigurační data, downmix, data parametrů inverzního kódování a upmix. Kromě toho poskytuje reference a pokyny, jak začlenit další komponenty k vytvoření škálovatelného vícekanálového kódovacího systému pro kompresi zvukových dat.
Shoda S5 je stanovena podle zadaných toků dat.
Analýza signálu S5 a neměnná teorie


S5 „Analýza signálu“ není specifikována. Může to být buď založeno na statistických metodách, které vyžadují rozsáhlou výpočetní sílu, nebo na objevu algebraických invariants s Gaussovými procesy Clemensem Parem v roce 2010 (poté, co byl odvrácen od tohoto klasického problému Rudolf E. Kálmán ), založený na německém matematikovi David Hilbert Publikovaný důkaz invariantního pole v roce 1893 a apolaritního chování algebraických kuželů, jak to rozsáhle studoval Grace and Young v roce 1903.[3][4][5][6]
Výpočetní složitost lze snadno eliminovat, když se analýza signálu S5 zakládá na algebraických invariantech.
Rozšíření S5
Inverzní kódování v časové doméně najde svůj přívěsek s inverzním kódováním ve frekvenční doméně, což je další vynález Clemens Par v letech 2013 a 2014, který na rozdíl od parametrického kódování nevyžaduje vůbec žádné vedlejší informace. Toto upmixování v Fourierově poli může zdvojnásobit počet výstupních kanálů bez změny syntaxe bitového toku.
Hlasitost S5 a elektronický otisk prstu
ECMA-407 používá moderní nástroje, jako je hlasitost podle ITU-R nebo Evropská vysílací unie a elektronický otisk prstu, který umožňuje interní a externí synchronizaci, například s videem, s dalšími službami nebo s „druhými obrazovkami“.
První implementace a vysílání ECMA-407
ECMA-407 byl poprvé implementován společností Swissaudec v roce 2014 ve spolupráci s výzkumnou skupinou Marca Mattavelliho na adrese École Polytechnique Fédérale de Lausanne a byl vyladěn Swissaudec a Wieslaw Woszczyk Výzkumná skupina v McGill University „Studio 22“.
Ecma S5 byl poprvé představen veřejnosti svolavatelem Ecma TC32-TG22 na adrese Mezinárodní konsorcium pro multimediální telekomunikace v portugalském Portu 8. října 2013.
Jeho světovou premiérou byl satelitní testovací nosič ECMA-407, který byl založen ve spolupráci s France Télévisions, SES, Ecma International a další partneři pro „Future Zone“ IBC v Amsterdamu v září 2014. ECMA-407 přilákal více než 1 500 odborníků na vysílání a těšil se z mezinárodního zpravodajství (např. FKT, Studio Magazin).

Reference
- ^ Par, C. Dva neobjevené poklady pro průlomovou technologii 3D audio kódování při nejnižších bitrate: inverzní problémy a invariantní teorie. Sborník příspěvků z 27. mezinárodní úmluvy VDT, 11/2012. ISBN 978-3-9812830-3-7.
- ^ Ambartsumian, R. V. (1998). Život v astrofyzice: Vybrané statě Viktora Ambartsumiana. Allerton Press.
- ^ Hilbert, D. (1893). Über die vollen Invariantensysteme. Mathematische Annalen, Bd. 42.
- ^ Grace, J. H .; Young, A. (1903). Algebra invariants. Cambridge University Press.
- ^ Ahmad, J. J .; Alberti, C .; Hong, J .; Leonard, B .; Mattavelli, M .; Par, C .; Quackenbush, S .; Woszczyk, W. „ECMA-407: Nové přístupy ke snížení rychlosti datového obsahu 3D zvukového obsahu pomocí RVC-CAL“. Papír AES 9218.
- ^ Ahmad, J. J .; Hong, J .; Leonard, B .; Mattavelli, M .; Par, C .; Quackenbush, S .; Woszyzk, W. ECMA-407: Nová implementace 3D audio kodeku až do NHK 22.2 s RVC-CAL. Sborník z 28. mezinárodní úmluvy VDT, 11/2014.
externí odkazy
- Ecma TC32-TG22 (v angličtině)
- 20. výroční fórum (v angličtině)
- France Télévisions (francouzsky)
- [1](v němčině)
- [2] (v němčině)
- [3](v němčině)
Další čtení
- Clemens Par. Stereo- und Surroundsound mit nur einem Kanal. Elektronik Informationen, 9/2010.
- Clemens Par. Dreidimensionaler Klang aus einem Kanal - die sanfte Revolution der Audiocodierung. FKT, 12/2010.
- Clemens Par. Revoluční 3D filtr pro audio, satelity, automobily, lékařská zařízení a průmyslová měření. Svět elektroniky, 1/2011.
- [4] (v němčině)
Recenze
- „Erste professionalelle 1-Kanallösung für Stereo, Surround, Dolby- und DTS-Formate und SDDS“, Elektronik Industrie, 2/2009 a 6/2009.
- „Clemens Par“. CE Markt, 4/2009.
- „Gorodissky-Preis für einkanaliges Stereo-System“, Aktuelle Technik, 8/2009.
- K. Koch. Der Erfinder. Finanz und Wirtschaft, 9/2009.
- „Erfinderpreis für einkanalige Stereolösung“, Mechatronik, 9/2009.
- „Clemens Par erhält internationale Auszeichnung“, Swiss IT Reseller, 9/2009.
- „Ein-Kanal-Stereo“, Elektrohändler, 10/2009.
- S. Buss. Générer des signaux stéréó à partir d'un signal mono. La Revue Polytechnique, 4/2010.
- „Neue Perspektiven“. Studio Magazin, 9/2010.
- „Immersiver 3D-Sound auf mobilen Endgeräten“. FKT, 10/2012.
- K. Koch. Raumklang. Finanz und Wirtschaft, 10/2012.
- „Weiterentwickelte 3D-Audiotechnologien“. FKT, 2/2013.