Komprese dat - Data compression - Wikipedia
v zpracování signálu, komprese dat, zdrojové kódování,[1] nebo snížení bitové rychlosti je proces kódování informace používat méně bity než původní vyobrazení.[2] Jakákoli konkrétní komprese je buď ztrátový nebo bezztrátový. Bezztrátová komprese redukuje bity identifikací a eliminací statistická redundance. Při bezztrátové kompresi nejsou ztraceny žádné informace. Ztrátová komprese redukuje bity odstraněním nepotřebných nebo méně důležitých informací.[3] Typicky se zařízení, které provádí kompresi dat, označuje jako kodér a zařízení, které provádí obrácení procesu (dekomprese) jako dekodér.
Proces zmenšování velikosti a datový soubor se často označuje jako komprese dat. V kontextu přenos dat, nazývá se zdrojové kódování; kódování provedené u zdroje dat před jejich uložením nebo přenosem.[4] Zdrojové kódování by nemělo být zaměňováno kódování kanálu, pro detekci a opravu chyb nebo kódování linky, prostředky pro mapování dat na signál.
Komprese je užitečná, protože snižuje zdroje potřebné k ukládání a přenosu dat. Výpočetní zdroje jsou spotřebovány v kompresních a dekompresních procesech. Na kompresi dat se vztahuje a kompromis časoprostorové složitosti. Například, kompresní schéma pro video může vyžadovat drahé Hardware aby se video dekomprimovalo dostatečně rychle, aby bylo možné jej sledovat při jeho dekomprimaci, a možnost dekomprimovat video před jeho sledováním může být nepohodlné nebo vyžadovat další úložiště. Návrh schémat komprese dat zahrnuje kompromisy mezi různými faktory, včetně stupně komprese, množství zavedeného zkreslení (při použití ztrátová komprese dat ) a výpočetní zdroje potřebné ke kompresi a dekompresi dat.[5][6]
Bezztrátový
Bezztrátová komprese dat algoritmy obvykle vykořisťovat statistická redundance reprezentovat data bez ztráty informace, takže proces je reverzibilní. Bezztrátová komprese je možná, protože většina dat v reálném světě vykazuje statistickou redundanci. Například obrázek může mít barevné oblasti, které se nemění na několika pixelech; namísto kódování „červený pixel, červený pixel, ...“ mohou být data kódována jako „279 červených pixelů“. Toto je základní příklad kódování délky běhu; existuje mnoho schémat pro zmenšení velikosti souboru odstraněním nadbytečnosti.
The Lempel – Ziv Metody komprese (LZ) patří mezi nejoblíbenější algoritmy pro bezztrátové ukládání.[7] DEFLATE je variace na LZ optimalizovaná pro rychlost dekomprese a kompresní poměr, ale komprese může být pomalá. V polovině 80. let po práci Terry Welch, Lempel – Ziv – Welch Algoritmus (LZW) se rychle stal metodou volby pro většinu kompresních systémů pro všeobecné použití. LZW se používá v GIF obrázky, programy jako PKZIP a hardwarová zařízení jako modemy.[8] Metody LZ používají komprimační model založený na tabulce, kde jsou položky tabulky nahrazeny opakovanými řetězci dat. U většiny metod LZ je tato tabulka generována dynamicky z dřívějších dat ve vstupu. Samotný stůl je často Huffman zakódován. Gramatické kódy takto lze extrémně efektivně komprimovat vysoce opakující se vstupy, například sběr biologických dat stejného nebo blízce příbuzného druhu, obrovský sběr verzí dokumentů, internetový archiv atd. Základním úkolem kódů založených na gramatice je konstrukce bezkontextových gramatika odvozující jeden řetězec. Mezi další praktické algoritmy komprese gramatiky patří Sequitur a znovu spárovat.
Nejsilnější moderní bezztrátové kompresory pravděpodobnostní modely, jako např predikce částečným párováním. The Burrows – Wheelerova transformace lze také považovat za nepřímou formu statistického modelování.[9] V dalším upřesnění přímého použití pravděpodobnostní modelování, statistické odhady lze spojit s volaným algoritmem aritmetické kódování. Aritmetické kódování je modernější technika kódování, která využívá matematické výpočty a konečný stavový stroj k produkci řetězce kódovaných bitů ze série vstupních datových symbolů. Může dosáhnout vynikající komprese ve srovnání s jinými technikami, jako je známější Huffmanův algoritmus. Využívá stav vnitřní paměti, aby se vyhnul potřebě provádět individuální mapování jednotlivých vstupních symbolů na odlišné reprezentace, které používají celočíselný počet bitů, a vymaže vnitřní paměť až po zakódování celého řetězce datových symbolů . Aritmetické kódování platí zvláště dobře pro úlohy adaptivní komprese dat, kde se statistiky liší a jsou závislé na kontextu, protože je lze snadno spojit s adaptivním modelem rozdělení pravděpodobnosti vstupních údajů. Prvním příkladem použití aritmetického kódování byla volitelná (ale ne široce používaná) funkce JPEG standard kódování obrazu.[10] Od té doby byl použit v různých jiných designech včetně H.263, H.264 / MPEG-4 AVC a HEVC pro kódování videa.[11]
Ztrátový
Na konci 80. let se digitální obrazy staly běžnějšími a standardy pro bezztrátové komprese obrazu vynořil se. Na počátku 90. let se začaly široce používat metody ztrátové komprese.[8] V těchto schématech je přijata určitá ztráta informací, protože odstranění nepodstatných detailů může ušetřit úložný prostor. Existuje odpovídající kompromis mezi uchováním informací a zmenšením velikosti. Ztrátová schémata komprese dat jsou navržena výzkumem toho, jak lidé vnímají příslušná data. Například lidské oko je citlivější na jemné variace jas než je tomu u barevných variací. JPEG komprese obrazu částečně funguje zaokrouhlováním nepodstatných bitů informací.[12] Řada populárních kompresních formátů využívá tyto vnímavé rozdíly, včetně psychoakustika pro zvuk a psychovizuálové pro obrázky a video.
Většina forem ztrátové komprese je založena na transformovat kódování, zejména diskrétní kosinová transformace (DCT). Poprvé to bylo navrženo v roce 1972 Nasir Ahmed, kteří poté vyvinuli pracovní algoritmus s T. Natarajanem a K. R. Rao v roce 1973, před zavedením v lednu 1974.[13][14] DCT je nejrozšířenější metoda ztrátové komprese a používá se v multimediálních formátech pro snímky (jako JPEG a HEIF ),[15] video (jako MPEG, AVC a HEVC ) a zvuk (např MP3, AAC a Vorbis ).
Ztrátový komprese obrazu se používá v digitální fotoaparáty, ke zvýšení úložných kapacit. Podobně, DVD, Modrý paprsek a streamování videa použijte ztrátové formáty kódování videa. Ztrátová komprese se ve videu hojně používá.
Při ztrátové kompresi zvuku se používají metody psychoakustiky k odstranění neslyšitelných (nebo méně slyšitelných) komponent zvukový signál. Komprese lidské řeči se často provádí ještě specializovanějšími technikami; kódování řeči se odlišuje jako samostatná disciplína od všeobecné zvukové komprese. Kódování řeči se používá v internetová telefonie, například, komprese zvuku se používá pro kopírování CD a je dekódována zvukovými přehrávači.[9]
Ztrátová komprese může způsobit generační ztráta.
Teorie
Teoretický základ pro kompresi poskytuje teorie informace a konkrétněji teorie algoritmických informací pro bezztrátovou kompresi a teorie zkreslení rychlosti pro ztrátovou kompresi. Tyto oblasti studia byly v podstatě vytvořeny Claude Shannon, který na konci 40. a počátku 50. let publikoval zásadní příspěvky na toto téma. Mezi další témata spojená s kompresí patří teorie kódování a statistická inference.[16]
Strojové učení
Existuje úzké spojení mezi nimi strojové učení a komprese. Systém, který předpovídá zadní pravděpodobnosti sekvence vzhledem k celé její historii lze použít pro optimální kompresi dat (pomocí aritmetické kódování o distribuci výstupu). Pro predikci lze použít optimální kompresor (vyhledáním symbolu, který nejlépe komprimuje vzhledem k předchozí historii). Tato rovnocennost byla použita jako ospravedlnění pro použití komprese dat jako měřítka pro „obecnou inteligenci“.[17][18][19]
Alternativní zobrazení může zobrazit kompresní algoritmy implicitně mapovat řetězce na implicitní vektory prostorových prvků, a podobnost na základě komprese měří výpočet podobnosti v těchto prostorech funkcí. Pro každý kompresor C (.) Definujeme přidružený vektorový prostor ℵ, takže C (.) Mapuje vstupní řetězec x, odpovídá vektorové normě || ~ x ||. Vesmír vylučuje vyčerpávající prozkoumání prostorů funkcí, které jsou základem všech kompresních algoritmů; místo toho se vektory funkcí rozhodnou prozkoumat tři reprezentativní metody bezeztrátové komprese, LZW, LZ77 a PPM.[20]
Podle AIXI teorie, spojení přímo vysvětleno v Hutterova cena, nejlepší možná komprese x je nejmenší možný software, který generuje x. Například v tomto modelu zahrnuje komprimovaná velikost souboru zip soubor zip i software pro rozbalení, protože jej nelze rozbalit bez obou, ale může existovat ještě menší kombinovaná forma.
Diferenciace dat
Na kompresi dat lze pohlížet jako na zvláštní případ diferenciace dat.[21][22] Diferenciace dat spočívá ve vytvoření a rozdíl daný a zdroj a a cílová, s opravou reprodukcí cílová daný a zdroj a a rozdíl. Protože v kompresi dat neexistuje žádný samostatný zdroj a cíl, lze komprimaci dat považovat za datovou diferenciaci s prázdnými zdrojovými daty, přičemž komprimovaný soubor odpovídá rozdílu od ničeho. To je stejné jako s ohledem na absolutní entropie (odpovídající kompresi dat) jako speciální případ relativní entropie (odpovídá rozdílu dat) bez počátečních dat.
Termín diferenciální komprese se používá k zdůraznění datového rozdílového spojení.
Použití
obraz
Entropické kódování vznikl ve 40. letech 20. století zavedením Shannon – Fano kódování,[23] základ pro Huffmanovo kódování který byl vyvinut v roce 1950.[24] Transformujte kódování sahá až do konce šedesátých let, kdy byl zaveden rychlá Fourierova transformace (FFT) kódování v roce 1968 a Hadamardova transformace v roce 1969.[25]
Důležitý komprese obrazu technika je diskrétní kosinová transformace (DCT), technika vyvinutá na začátku 70. let.[13] DCT je základem pro JPEG, a ztrátová komprese formát, který byl zaveden Společná skupina fotografických odborníků (JPEG) v roce 1992.[26] JPEG výrazně snižuje množství dat potřebných k reprezentaci obrazu za cenu relativně malého snížení kvality obrazu a stal se nejpoužívanějším formát obrazového souboru.[27][28] Jeho vysoce efektivní kompresní algoritmus založený na DCT byl do značné míry zodpovědný za široké šíření digitální obrázky a digitální fotografie.[29]
Lempel – Ziv – Welch (LZW) je a bezztrátová komprese algoritmus vyvinutý v roce 1984. Používá se v GIF formátu, který byl zaveden v roce 1987.[30] DEFLATE, bezeztrátový kompresní algoritmus specifikovaný v roce 1996, se používá v Přenosná síťová grafika (PNG).[31]
Vlnková komprese, použití vlnky v kompresi obrazu začala po vývoji kódování DCT.[32] The JPEG 2000 standard byl představen v roce 2000.[33] Na rozdíl od algoritmu DCT používaného v původním formátu JPEG místo toho používá JPEG 2000 diskrétní vlnková transformace (DWT) algoritmy.[34][35][36] Technologie JPEG 2000, která zahrnuje Motion JPEG 2000 přípona, byla vybrána jako standard kódování videa pro digitální kino v roce 2004.[37]
Zvuk
Nezaměňujte s kompresí zvukových dat komprese dynamického rozsahu, má potenciál snížit přenos šířka pásma a požadavky na ukládání zvukových dat. Algoritmy komprese zvuku jsou implementovány v software jako zvuk kodeky. Ve ztrátové i bezztrátové kompresi redundance informací je snížena pomocí metod, jako je kódování, kvantování diskrétní kosinová transformace a lineární predikce ke snížení množství informací použitých k reprezentaci nekomprimovaných dat.
Ztrátové algoritmy komprese zvuku poskytují vyšší kompresi a používají se v mnoha zvukových aplikacích včetně Vorbis a MP3. Na tyto algoritmy se téměř všichni spoléhají psychoakustika vyloučit nebo snížit věrnost méně slyšitelných zvuků, čímž se zmenší prostor potřebný k jejich uložení nebo přenosu.[2][38]
Přijatelné kompromisy mezi ztrátou kvality zvuku a velikostí přenosu nebo úložiště závisí na aplikaci. Například jeden 640 MB kompaktní disk (CD) obsahuje přibližně jednu hodinu nekomprimovaného vysoká kvalita reprodukce zvuku hudba, méně než 2 hodiny bezztrátově komprimované hudby nebo 7 hodin hudby komprimované v MP3 formát na médiu přenosová rychlost. Digitální zvukový záznamník může obvykle uložit přibližně 200 hodin jasně srozumitelné řeči v 640 MB.[39]
Bezztrátová komprese zvuku vytváří reprezentaci digitálních dat, která lze dekódovat na přesný digitální duplikát originálu. Kompresní poměry se pohybují kolem 50–60% původní velikosti,[40] který je podobný těm pro generickou bezztrátovou kompresi dat. Bezztrátové použití kodeků přizpůsobení křivky nebo lineární predikce jako základ pro odhad signálu. Parametry popisující odhad a rozdíl mezi odhadem a skutečným signálem jsou kódovány samostatně.[41]
Existuje řada bezztrátových formátů komprese zvuku. Vidět seznam bezztrátových kodeků pro výpis. Některé formáty jsou spojeny s odlišným systémem, například Přímý přenos dat, použito v Super audio CD a Balení Meridian Lossless, použito v DVD-Audio, Dolby TrueHD, Modrý paprsek a HD DVD.
Nějaký formáty zvukových souborů mají kombinaci ztrátového formátu a bezztrátové korekce; to umožňuje odstranění opravy pro snadné získání ztrátového souboru. Mezi takové formáty patří MPEG-4 SLS (Scalable to Lossless), WavPack, a OptimFROG DualStream.
Pokud mají být zvukové soubory zpracovány, buď další kompresí, nebo pro editace, je žádoucí pracovat z nezměněného originálu (nekomprimovaný nebo bezztrátově komprimovaný). Zpracování ztrátově komprimovaného souboru pro nějaký účel obvykle vede ke konečnému výsledku horšímu než vytvoření stejného komprimovaného souboru z nekomprimovaného originálu. Kromě úprav nebo míchání zvuku se bezztrátová komprese zvuku často používá pro archivaci nebo jako hlavní kopie.
Ztráta komprese zvuku
Ztrátová komprese zvuku se používá v široké škále aplikací. Kromě samostatných zvukových aplikací pro přehrávání souborů v přehrávačích MP3 nebo počítačích se digitálně komprimované zvukové toky používají ve většině video DVD, digitální televizi, streamovaných médiích na Internet, satelitní a kabelové rádio a stále častěji v pozemském rozhlasovém vysílání. Ztrátová komprese obvykle dosahuje mnohem větší komprese než bezeztrátové komprese vyřazením méně kritických dat na základě psychoakustické optimalizace.[42]
Psychoakustika uznává, že ne všechna data ve zvukovém proudu může člověk vnímat sluchový systém. Většina ztrátové komprese snižuje redundanci tím, že nejprve identifikuje percepčně irelevantní zvuky, tj. Zvuky, které je velmi těžké slyšet. Typické příklady zahrnují vysoké frekvence nebo zvuky, které se vyskytují současně s hlasitějšími zvuky. Tyto irelevantní zvuky jsou kódovány se sníženou přesností nebo vůbec.
Vzhledem k povaze ztrátových algoritmů kvalita zvuku trpí ztráta digitální generace když je soubor dekomprimován a znovu komprimován. Díky tomu je ztrátová komprese nevhodná pro ukládání přechodných výsledků v profesionálních aplikacích zvukového inženýrství, jako jsou úpravy zvuku a vícestopé nahrávání. Ztrátové formáty jako např MP3 jsou u koncových uživatelů velmi oblíbené, protože velikost souboru je snížena na 5–20% původní velikosti a megabajt dokáže uložit hudbu za minutu v odpovídající kvalitě.
Metody kódování
K určení, jaké informace ve zvukovém signálu jsou percepčně irelevantní, používá většina ztrátových kompresních algoritmů transformace, jako například modifikovaná diskrétní kosinová transformace (MDCT) převést časová doména vzorkované průběhy do transformační domény, obvykle frekvenční doména. Po transformaci je možné upřednostnit frekvence komponent podle toho, jak jsou slyšitelné. Slyšitelnost spektrálních složek se hodnotí pomocí absolutní práh sluchu a principy simultánní maskování - jev, kdy je signál maskovaný jiným signálem odděleným frekvencí - a v některých případech časové maskování —Kde je signál maskovaný jiným signálem odděleným časem. Obrysy stejné hlasitosti lze také použít k vážení vjemové důležitosti složek. Často se nazývají modely kombinace lidského ucha a mozku, které tyto účinky zahrnují psychoakustické modely.[43]
Jiné typy ztrátových kompresorů, například lineární prediktivní kódování (LPC) používané s řečí jsou zdrojové kodéry. LPC používá model lidského hlasového traktu k analýze zvuků řeči a odvození parametrů použitých modelem k jejich produkci z okamžiku na okamžik. Tyto měnící se parametry se přenášejí nebo ukládají a používají k řízení jiného modelu v dekodéru, který reprodukuje zvuk.
Ztrátové formáty se často používají pro distribuci streamovaného zvuku nebo interaktivní komunikaci (například v sítích mobilních telefonů). V takových aplikacích musí být data dekomprimována jako datové toky, nikoli po přenosu celého datového proudu. Pro streamování aplikací nelze použít všechny zvukové kodeky.[42]
Latence je výsledkem metod použitých ke kódování a dekódování dat. Některé kodeky analyzují delší segment dat, aby optimalizovaly účinnost, a poté je kódují způsobem, který k dekódování vyžaduje větší segment dat najednou. (Kodeky často vytvářejí segmenty zvané „rámce“, které vytvářejí diskrétní datové segmenty pro kódování a dekódování.) Vlastní latence kódovacího algoritmu může být kritická; například při obousměrném přenosu dat, například při telefonickém rozhovoru, mohou významná zpoždění vážně snížit vnímanou kvalitu.
Na rozdíl od rychlosti komprese, která je úměrná počtu operací požadovaných algoritmem, se zde latence týká počtu vzorků, které musí být analyzovány před zpracováním zvukového bloku. V minimálním případě je latence nula vzorků (např. Pokud kodér / dekodér jednoduše sníží počet bitů použitých ke kvantování signálu). Algoritmy časové domény, jako je LPC, také často mají nízkou latenci, a tudíž jejich popularitu v kódování řeči pro telefonování. V algoritmech, jako je MP3, je však pro analýzu psychoakustického modelu ve frekvenční doméně nutné analyzovat velké množství vzorků a latence je řádově 23 ms (u obousměrné komunikace 46 ms).
Kódování řeči
Kódování řeči je důležitá kategorie komprese zvukových dat. Percepční modely používané k odhadu toho, co může lidské ucho slyšet, se obecně poněkud liší od modelů používaných pro hudbu. Rozsah frekvencí potřebných k přenosu zvuků lidského hlasu je obvykle mnohem užší než rozsah potřebný pro hudbu a zvuk je obvykle méně složitý. Výsledkem je, že řeč může být kódována ve vysoké kvalitě s použitím relativně nízké přenosové rychlosti.
Pokud jsou data, která mají být komprimována, analogová (například napětí, které se mění s časem), použije se kvantizace k digitalizaci na čísla (obvykle celá čísla). Toto se označuje jako analogově-digitální (A / D) převod. Pokud jsou celá čísla generovaná kvantizací každá 8 bitů, pak je celý rozsah analogového signálu rozdělen do 256 intervalů a všechny hodnoty signálu v intervalu jsou kvantovány na stejné číslo. Pokud jsou generována 16bitová celá čísla, pak je rozsah analogového signálu rozdělen na 65 536 intervalů.
Tento vztah ilustruje kompromis mezi vysokým rozlišením (velký počet analogových intervalů) a vysokou kompresí (generována malá celá čísla). Tuto aplikaci kvantizace využívá několik metod komprese řeči. Toho je obecně dosaženo nějakou kombinací dvou přístupů:
- Pouze kódování zvuků, které bylo možné vydat jediným lidským hlasem.
- Vyhodit více dat v signálu - ponechat jen tolik, aby bylo možné rekonstruovat „srozumitelný“ hlas, spíše než celý frekvenční rozsah člověka sluch.
Možná nejčasnější algoritmy používané v kódování řeči (a kompresi zvukových dat obecně) byly Algoritmus A-zákona a Algoritmus μ-zákona.
Dějiny
V roce 1950 Bell Labs podal patent dne diferenciální pulzní kódová modulace (DPCM).[44] Adaptivní DPCM (ADPCM) představil P. Cummiskey, Nikil S. Jayant a James L. Flanagan na Bell Labs v roce 1973.[45][46]
Percepční kódování byl poprvé použit pro kódování řeči komprese, s lineární prediktivní kódování (LPC).[47] Počáteční koncepty pro LPC sahají až do práce Fumitada Itakura (Nagojská univerzita ) a Shuzo Saito (Nippon telegraf a telefon ) v roce 1966.[48] V 70. letech Bishnu S.Atal a Manfred R. Schroeder na Bell Labs vyvinuli formu LPC s názvem adaptivní prediktivní kódování (APC), percepční kódovací algoritmus, který využíval maskovací vlastnosti lidského ucha, následoval na začátku 80. let s kódově vzrušená lineární předpověď (CELP) algoritmus, který dosáhl významného kompresní poměr na svou dobu.[47] Percepční kódování používají moderní formáty komprese zvuku, jako je MP3[47] a AAC.
Diskrétní kosinová transformace (DCT), vyvinutý společností Nasir Ahmed, T. Natarajan a K. R. Rao v roce 1974,[14] poskytla základ pro modifikovaná diskrétní kosinová transformace (MDCT) používaný moderními formáty komprese zvuku, jako je MP3[49] a AAC. MDCT navrhli J. P. Princen, A. W. Johnson a A. B. Bradley v roce 1987,[50] po dřívější práci Princen a Bradley v roce 1986.[51] MDCT používají moderní formáty komprese zvuku, jako je Dolby digital,[52][53] MP3,[49] a Pokročilé kódování zvuku (AAC).[54]
První komerční reklama na světě automatizace vysílání audiokompresní systém vyvinul Oscar Bonello, profesor inženýrství na University of Buenos Aires.[55] V roce 1983 byl psychoakustický princip maskování kritických pásem poprvé publikován v roce 1967,[56] začal vyvíjet praktickou aplikaci založenou na nedávno vyvinuté IBM PC počítač a systém automatizace vysílání byl spuštěn v roce 1987 pod názvem Audicom. O dvacet let později téměř všechny rozhlasové stanice na světě používaly podobnou technologii vyráběnou řadou společností.
V IEEE byl vydán literární výtah pro širokou škálu zvukových kódovacích systémů Deník o vybraných oblastech v komunikaci (JSAC), v únoru 1988. I když existovaly některé články z doby před touto dobou, tato sbírka dokumentovala celou řadu hotových, pracujících zvukových kodérů, téměř všechny pomocí technik vnímání (tj. maskování) a jakési frekvenční analýzy a back-endu bezhlučné kódování.[57] Některé z těchto článků poukazovaly na obtížnost získání dobrého a čistého digitálního zvuku pro výzkumné účely. Většina, ne-li všichni, autorů v JSAC vydání byli také aktivní v MPEG-1 Audio výbor, který vytvořil formát MP3.
Video
Komprese videa je praktická implementace zdrojového kódování v teorii informací. V praxi se většina video kodeků používá spolu s technikami komprese zvuku k ukládání samostatných, ale doplňkových datových toků jako jeden kombinovaný balíček pomocí tzv. formáty kontejnerů.[58]
Nekomprimované video vyžaduje velmi vysokou rychlost přenosu dat. Ačkoli bezztrátová komprese videa kodeky pracují s typickým kompresním faktorem 5 až 12 H.264 ztrátové kompresní video má kompresní faktor mezi 20 a 200.[59]
Dvě klíčové techniky komprese videa používané v standardy kódování videa jsou diskrétní kosinová transformace (DCT) a kompenzace pohybu (MC). Většina standardů pro kódování videa, například H.26x a MPEG formáty obvykle používají kódování videa DCT s kompenzací pohybu (bloková kompenzace pohybu).[60][61]
Teorie kódování
Video data mohou být reprezentována jako série snímků statických obrázků. Taková data obvykle obsahují velké množství prostorových a časových nadbytek. Algoritmy komprese videa se snaží snížit redundanci a ukládat informace kompaktněji.
Většina formáty komprese videa a kodeky využívat jak prostorovou, tak časovou redundanci (např. pomocí rozdílového kódování s kompenzace pohybu ). Podobnosti lze kódovat pouze ukládáním rozdílů mezi např. dočasně sousedící snímky (kódování mezi snímky) nebo prostorově sousedící pixely (kódování uvnitř snímků).Inter-snímek komprese (dočasná delta kódování ) je jednou z nejsilnějších kompresních technik. Používá (znovu) k popisu aktuálního snímku data z jednoho nebo více dřívějších nebo pozdějších snímků v sekvenci. Intra-frame kódování na druhé straně používá pouze data z aktuálního rámce, což je stálekomprese obrazu.[43]
A třída specializovaných formátů používané ve videokamerách a při editaci videa používají méně složitá komprimační schémata, která omezují jejich predikční techniky na predikci uvnitř snímku.
Obvykle se navíc používá komprese videa ztrátová komprese techniky jako kvantování které snižují aspekty zdrojových dat, které jsou (víceméně) pro lidské vizuální vnímání irelevantní využitím percepčních rysů lidského vidění. Například malé rozdíly v barvě jsou obtížněji vnímatelné než změny jasu. Kompresní algoritmy mohou průměrovat barvu napříč těmito podobnými oblastmi a zmenšit tak prostor podobným způsobem, jaký se používá v JPEG komprese obrazu.[10] Stejně jako ve všech ztrátových kompresích existuje i kompromis mezi kvalita videa a přenosová rychlost, náklady na zpracování komprese a dekomprese a systémové požadavky. Vysoce komprimované video může být viditelné nebo rušivé artefakty.
Jiné metody než převládající formáty transformace založené na DCT, například fraktální komprese, odpovídající pronásledování a použití a diskrétní vlnková transformace (DWT), byly předmětem některých výzkumů, ale v praktických výrobcích se obvykle nepoužívají (s výjimkou použití kódování waveletů jako kodéry statických snímků bez kompenzace pohybu). Zdá se, že zájem o fraktální kompresi klesá, kvůli nedávné teoretické analýze, která ukazuje srovnávací nedostatek účinnosti těchto metod.[43]
Mezisnímkové kódování
Mezisnímkové kódování funguje porovnáním každého snímku ve videu s předchozím. Jednotlivé snímky video sekvence jsou porovnávány z jednoho snímku na další a kodek pro kompresi videa posílá pouze rozdíly do referenčního rámce. Pokud rámeček obsahuje oblasti, kde se nic nepohnulo, může systém jednoduše vydat krátký příkaz, který zkopíruje tuto část předchozího rámečku do dalšího. Pokud se části rámu pohybují jednoduchým způsobem, může kompresor vydat (mírně delší) povel, který dekompresoru říká, aby kopii posunul, otočil, zesvětlil nebo ztmavil. Tento delší příkaz stále zůstává mnohem kratší než komprese uvnitř rámce. Kodér obvykle vysílá také zbytkový signál, který popisuje zbývající jemnější rozdíly oproti referenčním snímkům. Pomocí entropického kódování mají tyto zbytkové signály kompaktnější zastoupení než plný signál. V oblastech videa s větším pohybem musí komprese kódovat více dat, aby udržovala krok s větším počtem pixelů, které se mění. Běžně během výbuchů, plamenů, stád zvířat a při některých panoramatických výstřelech vede vysokofrekvenční detail ke snížení kvality nebo ke zvýšení variabilní datový tok.
Hybridní blokové transformační formáty
Dnes jsou téměř všechny běžně používané metody komprese videa (např. Ty, které jsou v normách schválených ITU-T nebo ISO ) sdílejí stejnou základní architekturu, která sahá až do H.261 který byl standardizován v roce 1988 ITU-T. Většinou se spoléhají na DCT, aplikované na obdélníkové bloky sousedních pixelů, a časovou předpověď pomocí pohybové vektory, stejně jako dnes také krok filtrování ve smyčce.
Ve fázi predikce různé deduplikace a jsou použity techniky rozdílového kódování, které pomáhají dekorovat data a popisovat nová data na základě již přenesených dat.
Pak obdélníkové bloky (zbytku) pixel data jsou transformována do frekvenční domény, aby se usnadnilo zacílení na irelevantní informace v kvantizaci a pro určité snížení prostorové redundance. The diskrétní kosinová transformace (DCT), který je v tomto ohledu široce používán, představil N. Ahmed, T. Natarajan a K. R. Rao v roce 1974.[14]
V hlavní ztrátové fázi zpracování se data kvantifikují, aby se snížily informace, které jsou pro lidské vizuální vnímání irelevantní.
V poslední fázi je statistická redundance z velké části eliminována pomocí kodér entropie který často používá nějakou formu aritmetického kódování.
V dalším stupni filtrování ve smyčce lze na rekonstruovaný obrazový signál aplikovat různé filtry. Výpočtem těchto filtrů také uvnitř kódovací smyčky mohou pomoci kompresi, protože je lze použít na referenční materiál, než se použije v procesu predikce, a mohou být vedeny pomocí původního signálu. Nejoblíbenějším příkladem jsou deblokovací filtry které rozmazávají blokující artefakty z kvantizačních diskontinuit na hranicích transformačních bloků.
Dějiny
V roce 1967 A.H. Robinson a C. Cherry navrhli a kódování délky běhu schéma komprese šířky pásma pro přenos analogových televizních signálů.[62] Diskrétní kosinová transformace (DCT), který je základem moderní komprese videa,[63] byl představen Nasir Ahmed, T. Natarajan a K. R. Rao v roce 1974.[14][64]
H.261, který debutoval v roce 1988, komerčně představil převládající základní architekturu technologie komprese videa.[65] Bylo to první formát kódování videa na základě komprese DCT, která by se následně stala standardem pro všechny hlavní formáty kódování videa, které následovaly.[63] H.261 byl vyvinut řadou společností, včetně Hitachi, PictureTel, NTT, BT a Toshiba.[66]
Nejpopulárnější standardy kódování videa používané pro kodeky byly MPEG standardy. MPEG-1 byl vyvinut Skupina odborníků na filmy (MPEG) v roce 1991 a byl navržen pro kompresi VHS - kvalitní video. To bylo následováno v roce 1994 MPEG-2 /H.262,[65] který byl vyvinut především řadou společností Sony, Thomson a Mitsubishi Electric.[67] MPEG-2 se stal standardním formátem videa pro DVD a SD digitální televize.[65] V roce 1999 následovala MPEG-4 /H.263, což byl velký krok vpřed v oblasti technologie komprese videa.[65] Byl vyvinut řadou společností, především Mitsubishi Electric, Hitachi a Panasonic.[68]
Nejpoužívanější formát kódování videa je H.264 / MPEG-4 AVC. Byl vyvinut v roce 2003 řadou organizací, zejména společností Panasonic, Godo Kaisha IP Bridge a LG Electronics.[69] AVC komerčně představilo moderní kontextově binární aritmetické kódování (CABAC) a kontextově adaptivní kódování s proměnnou délkou (CAVLC) algoritmy. AVC je hlavní standard kódování videa pro Blu-ray disky, a je široce používán streamováním internetových služeb, jako je Youtube, Netflix, Vimeo, a iTunes store, webový software jako Adobe Flash Player a Microsoft Silverlight a různé HDTV vysílá přes pozemní a satelitní televizi.
Genetika
Genetické kompresní algoritmy jsou nejnovější generací bezztrátových algoritmů, které komprimují data (obvykle sekvence nukleotidů) pomocí konvenčních kompresních algoritmů i genetických algoritmů přizpůsobených konkrétnímu datovému typu. V roce 2012 tým vědců z Johns Hopkins University zveřejnil algoritmus genetické komprese, který pro kompresi nepoužívá referenční genom. HAPZIPPER byl šitý na míru HapMap dat a dosahuje více než 20násobné komprese (95% zmenšení velikosti souboru), poskytuje 2- až 4krát lepší kompresi a v mnohem rychlejším čase než přední univerzální nástroje pro kompresi. Za tímto účelem Chanda, Elhaik a Bader představili kódování založené na MAF (MAFE), které snižuje heterogenitu datové sady tříděním SNP podle jejich frekvence menších alel, čímž homogenizuje datovou sadu.[70] Jiné algoritmy v letech 2009 a 2013 (DNAZip a GenomeZip) mají kompresní poměry až 1200násobné - což umožňuje uložení 6 miliard diploidních lidských genomů s párem párů bází v 2,5 megabajtech (ve srovnání s referenčním genomem nebo v průměru u mnoha genomů).[71][72] Srovnávací test v kompresorech dat o genetice / genomice viz [73]
Výhled a aktuálně nevyužitý potenciál
Odhaduje se, že celkové množství dat, která jsou uložena na světových úložných zařízeních, lze dále komprimovat pomocí stávajících kompresních algoritmů se zbývajícím průměrným faktorem 4,5: 1.[74] Odhaduje se, že kombinovaná technologická kapacita světa pro ukládání informací poskytuje 1300 exabajty hardwarových číslic v roce 2007, ale když je odpovídající obsah optimálně komprimován, představuje to pouze 295 exabajtů Shannon informace.[75]
Viz také
Reference
- ^ Wade, Graham (1994). Kódování a zpracování signálu (2. vyd.). Cambridge University Press. str. 34. ISBN 978-0-521-42336-6. Citováno 2011-12-22.
Obecným cílem kódování zdroje je využít nebo odstranit „neefektivní“ nadbytečnost v systému PCM zdroje a tím dosáhnout snížení celkové rychlosti zdroje R.
- ^ A b Mahdi, O.A.; Mohammed, M.A .; Mohamed, A.J. (Listopad 2012). „Implementace nového přístupu k převodu zvukové komprese na kódování textu pomocí hybridní techniky“ (PDF). International Journal of Computer Science Issues. 9 (6, č. 3): 53–59. Citováno 6. března 2013.
- ^ Pujar, J.H .; Kadlaskar, L.M. (květen 2010). „Nová bezztrátová metoda komprese a dekomprese obrazu pomocí technik kódování Huffman“ (PDF). Journal of Theoretical and Applied Information Technology. 15 (1): 18–23.
- ^ Salomon, David (2008). Stručný úvod do komprese dat. Berlín: Springer. ISBN 9781848000728.
- ^ S. Mittal; J. Vetter (2015), „An Survey of Architectural Approaches for Data Compression in Cache and Main Memory Systems“, Transakce IEEE na paralelních a distribuovaných systémech, IEEE, 27 (5): 1524–1536, doi:10.1109 / TPDS.2015.2435788, S2CID 11706516
- ^ Tank, M.K. (2011). "Implementace algoritmu Lempel-ZIV pro bezztrátovou kompresi pomocí VHDL". Implementace Limpel-Zivova algoritmu pro bezztrátovou kompresi pomocí VHDL. Thinkquest 2010: Sborník z první mezinárodní konference o konturách výpočetní techniky. Berlín: Springer. str. 275–283. doi:10.1007/978-81-8489-989-4_51. ISBN 978-81-8489-988-7.
- ^ Navqi, Saud; Naqvi, R .; Riaz, R.A .; Siddiqui, F. (duben 2011). „Optimalizovaný návrh RTL a implementace algoritmu LZW pro aplikace s velkou šířkou pásma“ (PDF). Elektrická revize. 2011 (4): 279–285.
- ^ A b Wolfram, Stephen (2002). Nový druh vědy. Wolfram Media, Inc. str.1069. ISBN 978-1-57955-008-0.
- ^ A b Mahmud, Salauddin (březen 2012). „Vylepšená metoda komprese dat pro obecná data“ (PDF). International Journal of Scientific & Engineering Research. 3 (3): 2. Citováno 6. března 2013.
- ^ A b Lane, Tom. „Časté dotazy ke kompresi obrázků JPEG, část 1“. Archivy častých dotazů na internetu. Nezávislá skupina JPEG. Citováno 6. března 2013.
- ^ G. J. Sullivan; J.-R. Ohm; W.-J. Han; T. Wiegand (Prosinec 2012). „Přehled standardu vysoce účinného kódování videa (HEVC)“. Transakce IEEE na obvodech a systémech pro videotechniku. IEEE. 22 (12): 1649–1668. doi:10.1109 / TCSVT.2012.2221191.
- ^ Arcangel, Cory. „Při kompresi“ (PDF). Citováno 6. března 2013.
- ^ A b Ahmed, Nasire (Leden 1991). „Jak jsem přišel s diskrétní kosinovou transformací“. Zpracování digitálních signálů. 1 (1): 4–5. doi:10.1016 / 1051-2004 (91) 90086-Z.
- ^ A b C d Nasir Ahmed; T. Natarajan; Kamisetty Ramamohan Rao (leden 1974). „Diskrétní kosinová transformace“ (PDF). Transakce IEEE na počítačích. C-23 (1): 90–93. doi:10.1109 / T-C.1974.223784.
- ^ CCITT Study Group VIII und die Joint Photographic Experts Group (JPEG) von ISO / IEC Joint Technical Commite 1 / Subcommission 29 / Working Group 10 (1993), "Annex D - Arithmetic coding", Doporučení T.81: Digitální komprese a kódování statických snímků se spojitým tónem - požadavky a pokyny (PDF), str. 54 a násl, vyvoláno 2009-11-07
- ^ Marak, Laszlo. „Při kompresi obrazu“ (PDF). University of Marne la Vallee. Archivovány od originál (PDF) dne 28. května 2015. Citováno 6. března 2013.
- ^ Mahoney, Matt. „Odůvodnění velkého měřítka komprese textu“. Florida Institute of Technology. Citováno 5. března 2013.
- ^ Shmilovici A .; Kahiri Y .; Ben-Gal I .; Hauser S. (2009). „Měření efektivity vnitrodenního devizového trhu pomocí algoritmu univerzální komprese dat“ (PDF). Výpočetní ekonomie. 33 (2): 131–154. CiteSeerX 10.1.1.627.3751. doi:10.1007 / s10614-008-9153-3. S2CID 17234503.
- ^ Ben-Gal (2008). „O použití opatření pro kompresi dat k analýze robustních návrhů“ (PDF). Transakce IEEE na spolehlivost. 54 (3): 381–388. doi:10.1109 / TR.2005.853280. S2CID 9376086.
- ^ D. Scullyová; Carla E. Brodley (2006). "Komprese a strojové učení: nový pohled na vektory prostoru funkcí". Konference o kompresi dat, 2006: 332. doi:10.1109 / DCC.2006.13. ISBN 0-7695-2545-8. S2CID 12311412.
- ^ Korn, D .; et al. „RFC 3284: Obecný formát rozdílových a kompresních dat VCDIFF“. Pracovní skupina pro internetové inženýrství. Citováno 5. března 2013.
- ^ Korn, D.G .; Vo, K.P. (1995). B. Krishnamurthy (ed.). Vdelta: Rozdíly a komprese. Praktický opakovaně použitelný unixový software. New York: John Wiley & Sons, Inc.
- ^ Claude Elwood Shannon (1948). Alcatel-Lucent (ed.). „Matematická teorie komunikace“ (PDF). Technický deník Bell System. 27 (3–4): 379–423, 623–656. doi:10.1002 / j.1538-7305.1948.tb01338.x. hdl:11858 / 00-001M-0000-002C-4314-2. Citováno 2019-04-21.
- ^ David Albert Huffman (Září 1952), „Metoda pro konstrukci kódů minimální redundance“ (PDF), Sborník IRE, 40 (9), s. 1098–1101, doi:10.1109 / JRPROC.1952.273898
- ^ William K. Pratt, Julius Kane, Harry C. Andrews: "Hadamard transformuje kódování obrazu ", Proceedings of the IEEE 57.1 (1969): Seiten 58–68
- ^ „T.81 - DIGITÁLNÍ STLAČENÍ A KÓDOVÁNÍ STÁLE SNÍMKŮ TISKOVÝCH TÓNŮ - POŽADAVKY A POKYNY (PDF). CCITT. Září 1992. Citováno 12. července 2019.
- ^ „Vysvětlení formátu obrázku JPEG“. BT.com. BT Group. 31. května 2018. Citováno 5. srpna 2019.
- ^ Baraniuk, Chris (15. října 2015). „Ochrana proti kopírování může přijít na soubory JPEG“. BBC novinky. BBC. Citováno 13. září 2019.
- ^ „Co je JPEG? Neviditelný objekt, který vidíte každý den“. Atlantik. 24. září 2013. Citováno 13. září 2019.
- ^ „Kontroverze GIF: Perspektiva vývojáře softwaru“. Citováno 26. května 2015.
- ^ L. Peter Deutsch (Květen 1996). DEFLATE Specifikace formátu komprimovaných dat verze 1.3. IETF. str. 1. s Abstraktní. doi:10.17487 / RFC1951. RFC 1951. Citováno 2014-04-23.
- ^ Hoffman, Roy (2012). Komprese dat v digitálních systémech. Springer Science & Business Media. str. 124. ISBN 9781461560319.
Basically, wavelet coding is a variant on DCT-based transform coding that reduces or eliminates some of its limitations. (...) Another advantage is that rather than working with 8 × 8 blocks of pixels, as do JPEG and other block-based DCT techniques, wavelet coding can simultaneously compress the entire image.
- ^ Taubman, David; Marcellin, Michael (2012). JPEG2000 Základy komprese obrazu, standardy a praxe: Základy komprese obrazu, standardy a praxe. Springer Science & Business Media. ISBN 9781461507994.
- ^ Unser, M.; Blu, T. (2003). "Mathematical properties of the JPEG2000 wavelet filters". Transakce IEEE na zpracování obrazu. 12 (9): 1080–1090. Bibcode:2003ITIP...12.1080U. doi:10.1109/TIP.2003.812329. PMID 18237979. S2CID 2765169.
- ^ Sullivan, Gary (8–12 December 2003). "General characteristics and design considerations for temporal subband video coding". ITU-T. Skupina odborníků na kódování videa. Citováno 13. září 2019.
- ^ Bovik, Alan C. (2009). Základní průvodce zpracováním videa. Akademický tisk. str. 355. ISBN 9780080922508.
- ^ Swartz, Charles S. (2005). Pochopení digitálního kina: Profesionální příručka. Taylor & Francis. str. 147. ISBN 9780240806174.
- ^ Cunningham, Stuart; McGregor, Iain (2019). "Subjective Evaluation of Music Compressed with the ACER Codec Compared to AAC, MP3, and Uncompressed PCM". International Journal of Digital Multimedia Broadcasting. 2019: 1–16. doi:10.1155/2019/8265301.
- ^ The Olympus WS-120 digital speech recorder, according to its manual, can store about 178 hours of speech-quality audio in .WMA format in 500 MB of flash memory.
- ^ Coalson, Josh. "FLAC Comparison". Citováno 2020-08-23.
- ^ "Format overview". Citováno 2020-08-23.
- ^ A b Jaiswal, R.C. (2009). Audio-video inženýrství. Pune, Maharashtra: Nirali Prakashan. str. 3.41. ISBN 9788190639675.
- ^ A b C Faxin Yu; Hao Luo; Zheming Lu (2010). Three-Dimensional Model Analysis and Processing. Berlín: Springer. str.47. ISBN 9783642126512.
- ^ US patent 2605361, C. Chapin Cutler, "Differential Quantization of Communication Signals", issued 1952-07-29
- ^ P. Cummiskey, Nikil S. Jayant, and J. L. Flanagan, "Adaptive quantization in differential PCM coding of speech", Bell Syst. Tech. J., sv. 52, pp. 1105—1118, Sept. 1973
- ^ Cummiskey, P.; Jayant, Nikil S .; Flanagan, J. L. (1973). "Adaptive quantization in differential PCM coding of speech". The Bell System Technical Journal. 52 (7): 1105–1118. doi:10.1002/j.1538-7305.1973.tb02007.x. ISSN 0005-8580.
- ^ A b C Schroeder, Manfred R. (2014). "Bell Laboratories". Acoustics, Information, and Communication: Memorial Volume in Honor of Manfred R. Schroeder. Springer. str. 388. ISBN 9783319056609.
- ^ Gray, Robert M. (2010). "A History of Realtime Digital Speech on Packet Networks: Part II of Linear Predictive Coding and the Internet Protocol" (PDF). Nalezeno. Trends Signal Process. 3 (4): 203–303. doi:10.1561/2000000036. ISSN 1932-8346.
- ^ A b Guckert, John (jaro 2012). „Použití FFT a MDCT při kompresi zvuku MP3“ (PDF). University of Utah. Citováno 14. července 2019.
- ^ J. P. Princen, A. W. Johnson und A. B. Bradley: Subband/transform coding using filter bank designs based on time domain aliasing cancellation, IEEE Proc. Mezinárodní Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2161–2164, 1987.
- ^ John P. Princen, Alan B. Bradley: Analysis/synthesis filter bank design based on time domain aliasing cancellation, IEEE Trans. Akust. Speech Signal Processing, ASSP-34 (5), 1153–1161, 1986.
- ^ Luo, Fa-Long (2008). Mobile Multimedia Broadcasting Standards: Technology and Practice. Springer Science & Business Media. str. 590. ISBN 9780387782638.
- ^ Britanak, V. (2011). "On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards". Transakce IEEE na zpracování zvuku, řeči a jazyka. 19 (5): 1231–1241. doi:10.1109/TASL.2010.2087755. S2CID 897622.
- ^ Brandenburg, Karlheinz (1999). „Vysvětlení MP3 a AAC“ (PDF). Archivováno (PDF) od originálu na 2017-02-13.
- ^ "Summary of some of Solidyne's contributions to Broadcast Engineering". Brief History of Solidyne. Buenos Aires: Solidyne. Archivovány od originál dne 8. března 2013. Citováno 6. března 2013.
- ^ Zwicker, Eberhard; et al. (1967). The Ear As A Communication Receiver. Melville, NY: Acoustical Society of America. Archivovány od originál dne 2000-09-14. Citováno 2011-11-11.
- ^ "File Compression Possibilities". A Brief guide to compress a file in 4 different ways.
- ^ "Video Coding". CSIP website. Center for Signal and Information Processing, Georgia Institute of Technology. Archivovány od originál dne 23. května 2013. Citováno 6. března 2013.
- ^ Dmitriy Vatolin; et al. (Graphics & Media Lab Video Group) (March 2007). Lossless Video Codecs Comparison '2007 (PDF) (Zpráva). Moskevská státní univerzita.
- ^ Chen, Jie; Koc, Ut-Va; Liu, KJ Ray (2001). Design of Digital Video Coding Systems: A Complete Compressed Domain Approach. CRC Press. str. 71. ISBN 9780203904183.
- ^ Li, Jian Ping (2006). Sborník mezinárodní počítačové konference 2006 o technologiích Wavelet Active Media a zpracování informací: Chongqing, Čína, 29. – 31. Srpna 2006. World Scientific. str. 847. ISBN 9789812709998.
- ^ Robinson, A. H.; Cherry, C. (1967). "Results of a prototype television bandwidth compression scheme". Sborník IEEE. IEEE. 55 (3): 356–364. doi:10.1109/PROC.1967.5493.
- ^ A b Ghanbari, Mohammed (2003). Standardní kodeky: komprese obrazu až po pokročilé kódování videa. Instituce inženýrství a technologie. s. 1–2. ISBN 9780852967102.
- ^ Reader, Cliff (2016-08-31). "Patent landscape for royalty-free video coding". In Tescher, Andrew G (ed.). Applications of Digital Image Processing XXXIX. 9971. San Diego, California: Society of Photo-Optical Instrumentation Engineers. pp. 99711B. Bibcode:2016SPIE.9971E..1BR. doi:10.1117/12.2239493. Lecture recording, from 3:05:10.
- ^ A b C d http://www.real.com/resources/digital-video-file-formats/
- ^ „Prohlášení o patentu zaregistrováno jako H261-07“. ITU. Citováno 11. července 2019.
- ^ „Seznam patentů MPEG-2“ (PDF). MPEG LA. Citováno 7. července 2019.
- ^ "MPEG-4 Visual - Patent List" (PDF). MPEG LA. Citováno 6. července 2019.
- ^ „AVC / H.264 - Seznam patentů“ (PDF). MPEG LA. Citováno 6. července 2019.
- ^ Chanda P, Bader JS, Elhaik E (27 Jul 2012). "HapZipper: sharing HapMap populations just got easier" (PDF). Výzkum nukleových kyselin. 40 (20): e159. doi:10.1093/nar/gks709. PMC 3488212. PMID 22844100.
- ^ Christley S, Lu Y, Li C, Xie X (Jan 15, 2009). "Human genomes as email attachments". Bioinformatika. 25 (2): 274–5. doi:10.1093/bioinformatics/btn582. PMID 18996942.
- ^ Pavlichin DS, Weissman T, Yona G (September 2013). "The human genome contracts again". Bioinformatika. 29 (17): 2199–202. doi:10.1093/bioinformatics/btt362. PMID 23793748.
- ^ M. Hosseini, D. Pratas, and A. Pinho. 2016. A survey on data compression methods for biological sequences. Informace 7(4):(2016): 56
- ^ "Data Compression via Logic Synthesis" (PDF).
- ^ Hilbert, Martin; López, Priscila (1 April 2011). „Světová technologická kapacita pro ukládání, komunikaci a výpočet informací“. Věda. 332 (6025): 60–65. Bibcode:2011Sci ... 332 ... 60H. doi:10.1126 / science.1200970. PMID 21310967. S2CID 206531385.
externí odkazy
- Data Compression Basics (Video)
- Video compression 4:2:2 10-bit and its benefits
- Why does 10-bit save bandwidth (even when content is 8-bit)?
- Which compression technology should be used
- Wiley – Introduction to Compression Theory
- Subjektivní poslechové testy EBU na zvukových kodekech s nízkou přenosovou rychlostí
- Audio Archiving Guide: Music Formats (Guide for helping a user pick out the right codec)
- MPEG 1&2 video compression intro (pdf format) na Wayback Machine (archivováno 28. září 2007)
- hydrogenaudio wiki comparison
- Introduction to Data Compression by Guy E Blelloch from CMU
- HD Greetings – 1080p Uncompressed source material for compression testing and research
- Explanation of lossless signal compression method used by most codecs
- Interaktivní testy naslouchání zvukových kodeků přes internet
- TestVid – 2,000+ HD and other uncompressed source video clips for compression testing
- Videsignline – Intro to Video Compression
- Data Footprint Reduction Technology
- What is Run length Coding in video compression.