MPEG-4 část 3 - MPEG-4 Part 3
MPEG-4 část 3 nebo Zvuk MPEG-4 (formálně ISO /IEC 14496-3) je třetí část ISO /IEC MPEG-4 mezinárodní standard vyvinutý Skupina odborníků na pohyblivý obraz.[1] Určuje zvukové kódování metody. První verze ISO / IEC 14496-3 byla zveřejněna v roce 1999.[2]
MPEG-4 část 3 se skládá z různých technologií kódování zvuku - od ztrátový kódování řeči (HVXC, CELP ), obecné zvukové kódování (AAC, TwinVQ, BSAC), bezztrátový audio komprese (MPEG-4 SLS, Bezztrátové kódování zvuku, MPEG-4 DST ), a Text na řeč Rozhraní (TTSI), Strukturovaný zvuk (použitím SAOL, SASL, MIDI ) a mnoho dalších technik zvukové syntézy a kódování.[3][4][5][6][7][8][9][10][11]
MPEG-4 Audio necílí na jednu aplikaci, jako je telefonování v reálném čase nebo vysoce kvalitní komprese zvuku. Platí pro všechny aplikace, které vyžadují použití pokročilé zvukové komprese, syntézy, manipulace nebo přehrávání. MPEG-4 Audio je nový typ zvukového standardu, který integruje řadu různých typů zvukového kódování: přirozený zvuk a syntetický zvuk, nízká přenosová rychlost a vysoce kvalitní doručení, řeč a hudba, komplexní zvukové stopy a jednoduché, tradiční obsah a interaktivní obsah.[7]
Verze
Edice | Datum vydání | Poslední pozměňovací návrh | Standard | Popis |
---|---|---|---|---|
První vydání | 1999 | 2001 | ISO / IEC 14496-3: 1999[2] | také známý jako „MPEG-4 Audio verze 1“ |
2000 | ISO / IEC 14496-3: 1999 / Amd 1: 2000[13] | také známý jako „MPEG-4 Audio verze 2“, dodatek k prvnímu vydání[7][8] | ||
Druhé vydání | 2001 | 2005 | ISO / IEC 14496-3: 2001[14] | |
Třetí edice | 2005 | 2008 | ISO / IEC 14496-3: 2005[15] | |
Čtvrté vydání | 2009 | 2015 a ve vývoji[12] | ISO / IEC 14496-3: 2009[1][16] | |
Páté vydání | 2019 | ISO / IEC 14496-3: 2019[17] | Současná verze |
Části
MPEG-4 část 3 obsahuje následující části:[16]
- Hlava 1: Hlavní (seznam typů zvukových objektů, profilů, úrovní, rozhraní k ISO / IEC 14496-1, přenosový proud zvuku MPEG-4 atd.)
- Hlava 2: Kódování řeči - HVXC (Harmonické vektorové eXcitační kódování)
- Hlava 3: Kódování řeči - CELP (Line Excited Lineární predikce)
- Hlava 4: Obecné kódování zvuku (GA) (kódování času / frekvence) - AAC, TwinVQ, BSAC
- Hlava 5: Strukturovaný zvuk (SA)
- Hlava 6: Text na řeč Rozhraní (TTSI)
- Hlava 7: Parametrické kódování zvuku - HILN (Harmonická a individuální linka plus šum)
- Hlava 8: Technický popis parametrického kódování pro vysoce kvalitní zvuk (SSC, Parametrické stereo )
- Hlava 9: MPEG-1 /MPEG-2 Zvuk v MPEG-4
- Hlava 10: Technický popis bezztrátového kódování převzorkovaného zvuku (MPEG-4 DST - Přímý přenos dat )
- Hlava 11: Bezztrátové kódování zvuku (ALS)
- Hlava 12: Škálovatelné bezztrátové kódování (SLS)
Typy zvukových objektů MPEG-4
MPEG-4 Audio obsahuje systém pro jednotné zpracování různých skupin zvukových formátů. Každému formátu je přiřazen jedinečný typ zvukového objektu, který jej reprezentuje.[18][19] Typ objektu se používá k rozlišení mezi různými metodami kódování. Přímo určuje podmnožinu nástrojů MPEG-4 potřebnou k dekódování konkrétního objektu. Profily MPEG-4 jsou založeny na typech objektů a každý profil podporuje jiný seznam typů objektů.[19]
ID typu objektu | Typ zvukového objektu | Datum prvního veřejného vydání | Popis |
---|---|---|---|
1 | Hlavní AAC | 1999 | obsahuje AAC LC |
2 | AAC LC (Nízká složitost) | 1999 | Používá se v „profilu AAC“. Typ zvukového objektu MPEG-4 AAC LC je založen na profilu MPEG-2 část 7 s nízkou složitostí (LC) v kombinaci s Perceptual Noise Substitution (PNS) (definováno v MPEG-4 část 3, hlava 4).[4][22] |
3 | AAC SSR (škálovatelná vzorkovací frekvence) | 1999 | Typ zvukového objektu MPEG-4 AAC SSR je založen na profilu škálovatelného vzorkovacího kmitočtu (SSR) MPEG-2 část 7 v kombinaci s náhradou šumu (Perceptual Noise Substitution) (definovanou v MPEG-4 část 3 hlava 4).[4][22] |
4 | AAC LTP (Dlouhodobá předpověď ) | 1999 | obsahuje AAC LC |
5 | SBR (Replikace spektrálního pásma ) | 2003[23] | používá se s AAC LC v „vysoce účinném AAC profilu“ (HE-AAC v1) |
6 | Škálovatelné AAC | 1999 | |
7 | TwinVQ | 1999 | kódování zvuku při velmi nízkých přenosových rychlostech |
8 | CELP (Lineární predikce nadšená kódem ) | 1999 | kódování řeči |
9 | HVXC (Kódování harmonického vektorového excitace) | 1999 | kódování řeči |
10 | (Rezervováno) | ||
11 | (Rezervováno) | ||
12 | TTSI (Text na řeč Rozhraní) | 1999 | |
13 | Hlavní syntéza | 1999 | obsahuje 'wavetable ' syntéza založená na vzorcích[24] a algoritmická syntéza a zvukové efekty |
14 | 'wavetable ' syntéza založená na vzorcích | 1999 | na základě SoundFont a DownLoadable Sounds,[24] obsahuje General MIDI |
15 | Obecné MIDI | 1999 | |
16 | Algoritmická syntéza a zvukové efekty | 1999 | |
17 | ER AAC LC | 2000 | Chyba odolná |
18 | (Vyhrazeno) | ||
19 | ER AAC LTP | 2000 | Chyba odolná |
20 | ER AAC škálovatelné | 2000 | Chyba odolná |
21 | ER TwinVQ | 2000 | Chyba odolná |
22 | ER BSAC (bitové řezy aritmetické kódování) | 2000 | Je také známý jako „Fine Granule Audio“ nebo nástroj pro škálovatelnost jemného zrna. Používá se v kombinaci s nástroji pro kódování AAC a nahrazuje bezhlučné kódování a bitstreamové formátování kodéru MPEG-4 verze 1 GA. Chyba odolná |
23 | ER AAC LD (Nízké zpoždění) | 2000 | Odolný proti chybám, používaný s CELP, ER CELP, HVXC, ER HVXC a TTSI v „profilu s nízkým zpožděním“ (běžně používaný pro aplikace konverzace v reálném čase) |
24 | ER CELP | 2000 | Chyba odolná |
25 | ER HVXC | 2000 | Chyba odolná |
26 | ER HILN (Harmonické a individuální linky plus šum) | 2000 | Chyba odolná |
27 | ER parametrické | 2000 | Chyba odolná |
28 | SSC (SinuSoidal Coding) | 2004[25][26] | |
29 | PS (Parametrické stereo ) | 2004[27] a 2006[28][29] | používá se s AAC LC a SBR v „profilu HE-AAC v2“. Nástroj pro kódování PS byl definován v roce 2004 a typ objektu definován v roce 2006. |
30 | MPEG Surround | 2007[30] | také známý jako MPEG Spatial Audio Coding (SAC), je to typ kódování prostorového zvuku[31][32] (MPEG Surround byl také definován v ISO / IEC 23003-1 v roce 2007[33]) |
31 | (Rezervováno) | ||
32 | MPEG-1/2 Layer-1 | 2005[34] | |
33 | MPEG-1/2 Layer-2 | 2005[34] | |
34 | MPEG-1/2 Layer-3 | 2005[34] | také známý jako „MP3onMP4“ |
35 | DST (Přímý přenos dat ) | 2005[35] | bezztrátové zvukové kódování, používané na disku Super Audio CD |
36 | ALS (Bezztrátové kódování zvuku ) | 2006[29] | bezztrátové kódování zvuku |
37 | SLS (Škálovatelné bezztrátové kódování ) | 2006[36] | dvouvrstvé zvukové kódování s bezztrátovou vrstvou a ztrátovým jádrem / vrstvou General Audio (např.AAC) |
38 | SLS ne-jádro | 2006 | bezztrátové kódování zvuku bez ztráty General Audio jádro / vrstva (např.AAC) |
39 | ER AAC ELD (Enhanced Low Delay) | 2008[37] | Chyba odolná |
40 | SMR (Symbolická hudební reprezentace) Jednoduché | 2008 | poznámka: Symbolická hudební reprezentace je také MPEG-4 Část 23 standard (ISO / IEC 14496-23: 2008)[38][39] |
41 | Hlavní SMR | 2008 | |
42 | USAC (Unified Speech and Audio Coding ) | 2012 | Unified Speech and Audio Coding je definováno v MPEG-D Část 3 (ISO / IEC 23003-3: 2012)[40] |
43 | SAOC (kódování prostorových zvukových objektů) | 2010[41][42] | poznámka: Spatial Audio Object Coding je také MPEG-D Část 2 standard (ISO / IEC 23003-2: 2010)[43] |
44 | LD MPEG Surround | 2010[44] | Tento typ objektu přenáší boční informace o kódování MPEG Surround Low Delay (definované v MPEG-D část 2 - ISO / IEC 23003-2.[43] ) v rámci MPEG-4 Audio. |
45 | SAOC-DE | 2013 | Vylepšení dialogu pro kódování prostorových zvukových objektů |
46 | Synchronizace zvuku | 2015 | Nástroj pro synchronizaci zvuku poskytuje možnost synchronizace více obsahu na více zařízeních. |
Profily zvuku

Standard MPEG-4 Audio definuje několik profilů. Tyto profily jsou založeny na typech objektů a každý profil podporuje jiný seznam typů objektů. Každý profil může mít také několik úrovní, které omezují některé parametry nástrojů přítomných v profilu. Těmito parametry jsou obvykle vzorkovací frekvence a počet dekódovaných zvukových kanálů současně.
Zvukový profil | Typy zvukových objektů | Datum prvního veřejného vydání |
---|---|---|
Profil AAC | AAC LC | 2003 |
Vysoce efektivní profil AAC | AAC LC, SBR | 2003 |
Profil HE-AAC v2 | AAC LC, SBR, PS | 2006 |
Hlavní zvukový profil | AAC hlavní, AAC LC, AAC SSR, AAC LTP, AAC škálovatelné, TwinVQ, CELP, HVXC, TTSI, hlavní syntéza | 1999 |
Škálovatelný zvukový profil | AAC LC, AAC LTP, AAC škálovatelné, TwinVQ, CELP, HVXC, TTSI | 1999 |
Profil řeči zvuku | CELP, HVXC, TTSI | 1999 |
Syntetický zvukový profil | TTSI, Hlavní syntéza | 1999 |
Vysoce kvalitní zvukový profil | AAC LC, AAC LTP, AAC škálovatelné, CELP, ER AAC LC, ER AAC LTP, ER AAC škálovatelné, ER CELP | 2000 |
Zvukový profil s nízkým zpožděním | CELP, HVXC, TTSI, ER AAC LD, ER CELP, ER HVXC | 2000 |
Přirozený zvukový profil | AAC Main, AAC LC, AAC SSR, AAC LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI, ER AAC LC, ER AAC LTP, ER AAC Scalable, ER TwinVQ, ER BSAC, ER AAC LD, ER CELP, ER HVXC , ER HILN, ER Parametrické | 2000 |
Mobilní audio profil v síti | ER AAC LC, ER AAC škálovatelné, ER TwinVQ, ER BSAC, ER AAC LD | 2000 |
HD-AAC profil | AAC LC, SLS[45] | 2009[46] |
ALS jednoduchý profil | ALS | 2010[42][47] |
Ukládání a přeprava zvuku
Standard | Popis | |
---|---|---|
Multiplex | ISO / IEC 14496-1 | Multiplexní schéma MPEG-4 (M4Mux)[48] |
Multiplex | ISO / IEC 14496-3 | Multiplexní přenos zvuku s nízkou režií (LATM) |
Úložný prostor | ISO / IEC 14496-3 (informativní) | Formát výměny zvukových dat (ADIF) - pouze pro AAC |
Úložný prostor | ISO / IEC 14496-12 | Formát souboru MPEG-4 (MP4 ) / Formát základního mediálního souboru ISO |
Přenos | ISO / IEC 14496-3 (informativní) | Stream přenosu zvukových dat (ADTS) - pouze pro AAC |
Přenos | ISO / IEC 14496-3 | Nízký režijní zvukový tok (LOAS), založený na LATM |
Neexistuje žádný standard pro přepravu základní proudy přes kanál, protože široká škála aplikací MPEG-4 má požadavky na dodání, které jsou příliš široké na to, aby je bylo možné snadno charakterizovat pomocí jediného řešení.
Schopnosti transportní vrstvy a komunikace mezi transportními, multiplexními a demultiplexovými funkcemi jsou popsány v Rámec pro integraci doručování multimédií (DMIF) v ISO / IEC 14496-6.[16] Pod tímto rozhraním existuje široká škála doručovacích mechanismů, např. MPEG transportní proud, Transportní protokol v reálném čase (RTP) atd.
Transport in Real-time Transport Protocol je definován v RFC 3016 (RTP formát užitečného zatížení pro audio / vizuální streamy MPEG-4), RFC 3640 (RTP Payload Format for Transport of MPEG-4 Elementary Streams), RFC 4281 (Parametr kodeky pro typy médií "Bucket") a RFC 4337 (Registrace typu MIME pro MPEG-4).
LATM a LOAS byly definovány pro přirozené zvukové aplikace, které nevyžadují sofistikované objektové kódování ani jiné funkce poskytované systémy MPEG-4.
Bifurkace v technické normě AAC
The Pokročilé kódování zvuku v MPEG-4 Část 3 (MPEG-4 Audio) Hlava 4 byla vylepšena ve srovnání s předchozím standardem MPEG-2 Část 7 (Advanced Audio Coding), aby poskytovala lepší výsledky kvalita zvuku pro danou bitovou rychlost kódování.
Předpokládá se, že veškeré rozdíly v částech 3 a 7 budou orgánem norem ISO v blízké budoucnosti odstraněny, aby se zabránilo možnosti budoucí nekompatibility bitového toku. V současné době nejsou známy žádné nekompatibility přehrávačů nebo kodeků kvůli novosti standardu.
Standard MPEG-2 část 7 (Advanced Audio Coding) byl poprvé publikován v roce 1997 a nabízí tři výchozí profily:[49][50] Profil nízké složitosti (LC), hlavní profil a profil škálovatelné vzorkovací frekvence (SSR).
MPEG-4 Part 3 Subpart 4 (General Audio Coding) kombinoval profily z MPEG-2 Part 7 s Perceptual Noise Substitution (PNS) a definoval je jako typy audio objektů (AAC LC, AAC Main, AAC SSR).[4]
HE-AAC
Vysoce efektivní pokročilé kódování zvuku je příponou AAC LC použitím replikace spektrálního pásma (SBR) a Parametrické stereo (PS). Je navržen tak, aby zvýšil účinnost kódování při nízkých bitratech pomocí částečné parametrické reprezentace zvuku.
AAC-SSR
Škálovatelná vzorkovací frekvence AAC Společnost Sony představila standardy MPEG-2 část 7 a MPEG-4 část 3.[Citace je zapotřebí ] Poprvé byl publikován v ISO / IEC 13818-7, část 7: Advanced Audio Coding (AAC) v roce 1997.[49][50] Audio signál je nejprve rozdělen do 4 pásem pomocí 4 pásma vícefázový kvadraturní filtr banka. Pak se tyto 4 pásma dále dělí pomocí MDCT s velikostí k 32 nebo 256 vzorků. Je to podobné jako u běžného AAC LC, který používá MDCT s velikostí k 128 nebo 1024 přímo na zvukový signál.
Výhodou této techniky je, že přepínání krátkých bloků lze provést samostatně pro každého PQF kapela. Takže vysoké frekvence lze kódovat pomocí krátkého bloku ke zvýšení časového rozlišení, nízké frekvence lze stále kódovat s vysokým spektrálním rozlišením. Avšak díky aliasingu mezi 4 PQF pásmy je účinnost kódování kolem (1,2,3) * fs / 8 horší než u běžného MPEG-4 AAC LC.[Citace je zapotřebí ]
MPEG-4 AAC-SSR je velmi podobný ATRAC a ATRAC-3.
Proč byl zaveden AAC-SSR
Myšlenkou AAC-SSR byla nejen výše uvedená výhoda, ale také možnost snížení datové rychlosti odstraněním 1, 2 nebo 3 horních pásem PQF. Velmi jednoduchý rozdělovač bitového proudu může tato pásma odstranit a tím snížit bitrate a vzorkovací frekvenci.
Příklad:
- 4 dílčí pásma: bitrate = 128 kbit / s, vzorkovací frekvence = 48 kHz, f_lowpass = 20 kHz
- 3 dílčí pásma: datový tok ~ 120 kbit / s, vzorkovací frekvence = 48 kHz, f_lowpass = 18 kHz
- 2 dílčí pásma: datový tok ~ 100 kbit / s, vzorkovací frekvence = 24 kHz, f_lowpass = 12 kHz
- 1 subband: bitrate ~ 65 kbit / s, sample rate = 12 kHz, f_lowpass = 6 kHz
Poznámka: i když je to možné, výsledná kvalita je mnohem horší, než je typické pro tento datový tok. Pro normální AAC LC 64 kbit / s je tedy šířka pásma 14–16 kHz dosažena pomocí stereofonní intenzity a redukovaných NMR. To zhoršuje kvalitu zvuku bez přenosu než přenos šířky pásma 6 kHz s dokonalou kvalitou.
BSAC
Bitové řezy aritmetické kódování je standard MPEG-4 (ISO / IEC 14496-3 část 4) pro škálovatelné zvukové kódování. BSAC používá alternativní bezhlučné kódování k AAC, přičemž zbytek zpracování je identický s AAC. Tato podpora škálovatelnosti umožňuje téměř transparentní kvalitu zvuku při 64 kbit / s a půvabná degradace při nižších přenosových rychlostech. BSAC kódování se nejlépe provádí v rozsahu 40 kbit / s až 64 kbit / s, i když pracuje v rozsahu 16 kbit / s až 64 kbit / s. Kodek AAC-BSAC se používá v Digitální multimediální vysílání (DMB) aplikace.
Licencování
V roce 2002 Výbor pro licencování zvuku MPEG-4 vybral společnost Via Licensing Corporation jako správce licencí pro MPEG-4 Audio patentový fond.[3][51][52]
Viz také
- TwinVQ - jeden z typů objektů definovaných v MPEG-4 Audio verze 1
- MPEG-4 část 2
- MPEG-4 část 14 formát kontejneru (MP4)
- Správa digitálních práv
- Pokročilé kódování zvuku (AAC)
- ISO / IEC JTC 1 / SC 29
Reference
- ^ A b ISO (2009). „ISO / IEC 14496-3: 2009 - Informační technologie - Kódování audiovizuálních objektů - Část 3: Zvuk“. ISO. Citováno 2009-10-06.
- ^ A b ISO (1999). „ISO / IEC 14496-3: 1999 - Informační technologie - Kódování audiovizuálních objektů - Část 3: Zvuk“. ISO. Citováno 2009-10-06.
- ^ A b Business Wire (02.12.2002). „Výbor pro licencování zvuku MPEG-4 vybírá prostřednictvím společnosti Licensing Corporation jako správce; Výbor pro licencování zvuku MPEG-4 dokončuje podmínky pro licencování zvukového profilu“. Svobodná knihovna. Citováno 2009-10-06.
- ^ A b C d Karlheinz Brandenburg; Oliver Kunz; Akihiko Sugiyama (1999). „MPEG-4 Natural Audio Coding - zvukové profily a úrovně“. chiariglione.org. Archivovány od originál dne 17. 7. 2010. Citováno 2009-10-06.
- ^ Karlheinz Brandenburg; Oliver Kunz; Akihiko Sugiyama. „Kódování přirozeného zvuku MPEG-4 - škálovatelnost přirozeného zvuku MPEG-4“. chiariglione.org. Archivovány od originál dne 28. 2. 2010. Citováno 2009-10-06.
- ^ D. Thom, H. Purnhagen a podskupina MPEG Audio (říjen 1998). „MPEG Audio FAQ - MPEG-4“. chiariglione.org. Citováno 2009-10-06.CS1 maint: více jmen: seznam autorů (odkaz)
- ^ A b C d ISO /IEC JTC 1 / SC 29 / WG 11 (červenec 1999), ISO / IEC 14496-3: / Amd.1 - Konečný návrh výboru - MPEG-4 Audio verze 2 (PDF), archivovány z originál (PDF) dne 01.08.2012, vyvoláno 2009-10-07
- ^ A b Heiko Purnhagen (07.06.1999), Přehled audio MPEG-4 verze 2 (PDF), Heiko Purnhagen, vyvoláno 2009-10-07[trvalý mrtvý odkaz ]
- ^ A b Heiko Purnhagen (01.06.2001). „Zvukový standard MPEG-4: Přehled a aplikace“. Heiko Purnhagen. Citováno 2009-10-07.[mrtvý odkaz ]
- ^ Heiko Purnhagen (07.11.2001). „Webová stránka MPEG Audio - MPEG-4 Audio (ISO / IEC 14496-3)“. Citováno 2009-10-07.[mrtvý odkaz ]
- ^ Rob Koenen, ISO / IEC JTC1 / SC29 / WG11 (březen 2002). "Přehled standardu MPEG-4". chiariglione.org. Citováno 2009-10-06.
- ^ A b MPEG. „Standardy MPEG - Úplný seznam standardů vyvinutých nebo vyvíjených“. chiariglione.org. Archivovány od originál 20. dubna 2010. Citováno 2009-10-31.
- ^ ISO (2000). „ISO / IEC 14496-3: 1999 / Amd 1: 2000 - Audio extensions“. ISO. Citováno 2009-10-07.
- ^ ISO (2001). „ISO / IEC 14496-3: 2001 - Informační technologie - Kódování audiovizuálních objektů - Část 3: Zvuk“. ISO. Citováno 2009-10-14.
- ^ ISO (2005). „ISO / IEC 14496-3: 2005 - Informační technologie - Kódování audiovizuálních objektů - Část 3: Zvuk“. ISO. Citováno 2009-10-14.
- ^ A b C d ISO /IEC (2009-09-01), ISO / IEC 14496-3: 2009 - Informační technologie - Kódování audiovizuálních objektů - Část 3: Zvuk (PDF), IEC, vyvoláno 2009-10-07
- ^ ISO /IEC (2019-12-01), ISO / IEC 14496-3: 2019 - Informační technologie - Kódování audiovizuálních objektů - Část 3: Zvuk, IEC, vyvoláno 2020-06-02
- ^ A b MultimediaWiki (2009). „MPEG-4 Audio“. MultimediaWiki. Citováno 2009-10-09.
- ^ A b C Bernhard Grill; Stefan Geyersberger; Johannes Hilpert; Bodo Teichmann (červenec 2004), Implementace zvukových komponent MPEG-4 na různých platformách (PDF), Fraunhofer Gesellschaft, archivovány z originál (PDF) dne 10.06.2007, vyvoláno 2009-10-09
- ^ ISO / IEC JTC1 / SC29 / WG11 N2203 (březen 1998). „Zvuk MPEG-4 (návrh závěrečného výboru 14496-3)“. Heiko Purnhagen. Citováno 2009-10-07.[mrtvý odkaz ]
- ^ A b C ISO / IEC JTC1 / SC29 / WG11 / N7016 (2005-01-11), Text ISO / IEC 14496-3: 2001 / FPDAM 4, Audio Lossless Coding (ALS), nové zvukové profily a rozšíření BSAC, archivovány z originál (DOC) dne 2014-05-12, vyvoláno 2009-10-09
- ^ A b Karlheinz Brandenburg; Oliver Kunz; Akihiko Sugiyama (1999). „Přirozené zvukové kódování MPEG-4 - obecné zvukové kódování (na základě AAC)“. chiariglione.org. Archivovány od originál dne 19. 2. 2010. Citováno 2009-10-06.
- ^ ISO (2003). „Rozšíření šířky pásma, ISO / IEC 14496-3: 2001 / Amd 1: 2003“. ISO. Citováno 2009-10-13.
- ^ A b Scheirer, Eric D .; Ray, Lee (1998). „Algoritmická a wavetovatelná syntéza v multimediálním standardu MPEG-4“. Konvence společnosti Audio Engineering Society 105, 1998. CiteSeerX 10.1.1.35.2773.
2.2 Wavetableová syntéza se SASBF: Formát wavetable bank SASBF měl poněkud složitou historii vývoje. K původní specifikaci přispěly systémy E-Mu a byla založena na jejich formátu „SoundFont“ [15]. Po dokončení integrace této komponenty do referenčního softwaru MPEG-4 se sdružení MIDI Manufacturers Association (MMA) obrátilo na MPEG a požadovalo kompatibilitu MPEG-4 SASBF s jejich formátem „Stažené zvuky“ [13]. E-Mu souhlasil s tím, že tato kompatibilita je žádoucí, a proto všechny strany vyjednaly a společně navrhly nový formát.
- ^ ISO (2004). „Parametrické kódování vysoce kvalitního zvuku, ISO / IEC 14496-3: 2001 / Amd 2: 2004“. ISO. Citováno 2009-10-13.
- ^ ISO / IEC JTC1 / SC29 / WG11 (2003-07-25). „Text ISO / IEC 14496-3: 2001 / FPDAM2 (Parametric Audio) - N5713“. Archivovány od originál (DOC) dne 2014-05-12. Citováno 2009-10-13.
- ^ 3GPP (2004-09-30). „3GPP TS 26.401 V6.0.0 (2004-09), funkce zpracování zvuku General Audio Codec; Vylepšený obecný zvukový kodek aacPlusVšeobecné Popis (vydání 6) " (DOC). 3GPP. Citováno 2009-10-13.
- ^ 3GPP (04.01.2005). „ETSI TS 126 401 V6.1.0 (2004–12) - Univerzální mobilní telekomunikační systém (UMTS)Všeobecné funkce zpracování zvukového kodeku; Vylepšený obecný zvukový kodek aacPlusVšeobecné description (3GPP TS 26.401 verze 6.1.0 Release 6) ". 3GPP. Citováno 2009-10-13.
- ^ A b ISO (2006). „Audio Lossless Coding (ALS), new audio profiles and BSAC extensions, ISO / IEC 14496-3: 2005 / Amd 2: 2006“. ISO. Citováno 2009-10-13.
- ^ ISO (2007). „Rozšíření BSAC a přenos MPEG Surround, ISO / IEC 14496-3: 2005 / změna 5: 2007“. ISO. Citováno 2009-10-13.
- ^ ISO / IEC JTC1 / SC29 / WG11 (červenec 2005). „Výukový program pro kódování prostorového zvuku MPEG“. Archivovány od originál dne 2010-04-30. Citováno 2010-02-09.
- ^ ISO / IEC JTC1 / SC29 / WG11 (červenec 2005). „Výukový program pro kódování prostorového zvuku MPEG“. Archivovány od originál dne 2008-03-24. Citováno 2010-02-09.
- ^ ISO (2007-01-29). „ISO / IEC 23003-1: 2007 - Informační technologie - MPEG audio technologie - Část 1: MPEG Surround“. ISO. Citováno 2009-10-24.
- ^ A b C ISO (2005). „Zvuk MPEG-1/2 v MPEG-4, ISO / IEC 14496-3: 2001 / Amd 3: 2005“. ISO. Citováno 2009-10-13.
- ^ ISO (2005). „Bezztrátové kódování převzorkovaného zvuku, ISO / IEC 14496-3: 2001 / Amd 6: 2005“. ISO. Citováno 2009-10-13.
- ^ ISO (2006). „Scalable Lossless Coding (SLS), ISO / IEC 14496-3: 2005 / Amd 3: 2006“. ISO. Citováno 2009-10-13.
- ^ ISO (2008). „Enhanced low delay AAC, ISO / IEC 14496-3: 2005 / Amd 9: 2008“. ISO. Citováno 2009-10-13.
- ^ ISO (2008). „ISO / IEC 14496-23: 2008, Informační technologie - Kódování audiovizuálních objektů - Část 23: Symbolická hudební reprezentace“. ISO. Citováno 2009-10-13.
- ^ ISO (2008). „Shoda symbolické hudební reprezentace, ISO / IEC 14496-4: 2004 / změna 29: 2008“. ISO. Citováno 2009-10-13.
- ^ ISO (2012). „ISO / IEC 23003-3: 2012 - Informační technologie - MPEG audio technologie - Část 3: Jednotné kódování řeči a zvuku“. ISO. Citováno 2019-11-07.
- ^ ISO (2009). „ISO / IEC 14496-3: 2009 / Amd 2: 2010, ALS simple profile and transport of SAOC“. ISO. Citováno 2009-10-13.
- ^ A b ISO / IEC JTC1 / SC29 / WG11 (2009-07-03), ISO / IEC 14496-3: 200X / PDAM 2 - ALS Simple Profile and Transport of SAOC, N10826, archivovány z originál (DOC) dne 2014-07-29, vyvoláno 2009-10-13
- ^ A b ISO (2010). „ISO / IEC 23003-2: 2010 - Informační technologie - MPEG audio technologie - Část 2: Spatial Audio Object Coding (SAOC)“. ISO. Citováno 2010-12-27.
- ^ AES Convention Paper 8099 - Nové parametrické stereo a vícekanálové rozšíření pro MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF), vyvoláno 2019-11-07
- ^ ISO / IEC JTC1 / SC29 / WG11 (2008-10-17), ISO / IEC 14496-3: 2005 / PDAM 10: 200X HD-AAC profil, MPEG2008 / N10188, archivovány z originál (DOC) dne 2014-05-12, vyvoláno 2009-10-19
- ^ ISO (2009-09-11). „ISO / IEC 14496-3: 2009 / Amd 1: 2009 - HD-AAC profile and MPEG Surround signaling“. ISO. Citováno 2009-10-15.
- ^ ISO (2009-10-08). „ISO / IEC 14496-3: 2009 / Amd 2: 2010 - ALS simple profile and transport of SAOC“. ISO. Citováno 2009-10-15.
- ^ ISO (2004-11-15), ISO / IEC 14496-1, třetí vydání 2004-11-15, část 1: Systémy (PDF), ISO, archivovány z originál (PDF) dne 14. června 2011, vyvoláno 2009-10-14
- ^ A b ISO (2004-10-15), ISO / IEC 13818-7, třetí vydání, část 7 - Advanced Audio Coding (AAC) (PDF), str. 32, archivovány od originál (PDF) dne 13.7.2011, vyvoláno 2009-10-19
- ^ A b ISO (1997). „ISO / IEC 13818-7: 1997, Informační technologie - Generické kódování pohyblivých obrazů a souvisejících zvukových informací - Část 7: Advanced Audio Coding (AAC)“. Citováno 2009-10-19.
- ^ Business Wire (05.01.2009). „Prostřednictvím licencování oznamuje licenci MPEG-4 SLS Patent Pool“. Reuters. Archivovány od originál dne 04.01.2013. Citováno 2009-10-09.
- ^ Přes Licensing Corporation (2009-05-12). „Via Licensing ohlašuje dostupnost společného licenčního programu MPEG-4 SLS Patent“. Obchodní drát. Citováno 2009-10-09.
externí odkazy
- Apple: MPEG-4: AAC
- „AAC“ (VideoLAN WIKI)
- Subjektivní poslechové testy EBU na zvukových kodekech s nízkou přenosovou rychlostí
- Rozhlasové stanice AAC - Online rozhlasové stanice ve formátu AAC
- Tuner2 - Adresář rozhlasových stanic ve formátu AAC + při různých přenosových rychlostech
- RadioFeeds UK a Irsko - Stránka obsahující spoustu pozemských stanic webového vysílání ve formátu AAC +.
- [1] Stránka porovnávající kodeky včetně HE-AAC @ 64 kbit / s poslechovými testy. (Stránka je offline)
- Oficiální web MPEG
- RFC 3016 - Formát RTP užitečné zátěže pro zvukové / vizuální toky MPEG-4
- RFC 3640 - Formát RTP užitečné zátěže pro transport základních streamů MPEG-4
- RFC 4281 - Parametr kodeky pro typy médií „Bucket“
- RFC 4337 - Registrace typu MIME pro MPEG-4