Entropické kódování - Entropy encoding
Tento článek obsahuje a seznam doporučení, související čtení nebo externí odkazy, ale jeho zdroje zůstávají nejasné, protože mu chybí vložené citace.prosinec 2013) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
v teorie informace an kódování entropie je bezztrátová komprese dat schéma, které je nezávislé na specifických vlastnostech média.
Jeden z hlavních typů kódování entropie vytváří a přiřadí jedinečný kód bez předpony ke každému jedinečnému symbol který se vyskytuje na vstupu. [1] Tyto entropie kodéry pak komprimují data nahrazením každého vstupního symbolu pevné délky odpovídajícím výstupním kódovým slovem bez předpony s proměnnou délkou. Délka každého kódového slova je přibližně úměrný negativní logaritmus z pravděpodobnost výskytu tohoto kódového slova. Nejběžnější symboly proto používají nejkratší kódy.[2]
Podle Shannon věta o zdrojovém kódování, optimální délka kódu pro symbol je −logbP, kde b je počet symbolů použitých k výrobě výstupních kódů a P je pravděpodobnost vstupního symbolu.
Dvě z nejběžnějších technik kódování entropie jsou Huffmanovo kódování a aritmetické kódování.[3]Pokud jsou přibližné entropické charakteristiky datového proudu známy předem (zejména pro komprese signálu ), může být užitečný jednodušší statický kód. Mezi tyto statické kódy patří univerzální kódy (jako Eliasovo gama kódování nebo Fibonacciho kódování ) a Golomb kódy (jako unární kódování nebo Rýže kódování ).
Od roku 2014 začaly datové kompresory používat Asymetrické číselné systémy rodina technik kódování entropie, která umožňuje kombinaci kompresního poměru aritmetické kódování s náklady na zpracování podobné Huffmanovo kódování.
Entropie jako míra podobnosti
Kromě použití kódování entropie jako způsobu komprese digitálních dat lze k měření množství použít také kodér entropie podobnost mezi toky dat a již existující třídy dat. To se provádí generováním kodéru / kompresoru entropie pro každou třídu dat; neznámé údaje jsou pak klasifikovaný přiváděním nekomprimovaných dat ke každému kompresoru a sledováním toho, který kompresor poskytuje nejvyšší kompresi. Kodér s nejlepší kompresí je pravděpodobně kodér trénovaný na datech, která se nejvíce podobala neznámým datům.
Viz také
Reference
- ^ „Education - Entropy Encoding“. www.pcs-ip.eu. Citováno 2020-10-13.
- ^ „Co je to entropické kódování | IGI Global“. www.igi-global.com. Citováno 2020-10-13.
- ^ Huffman, David (1952). „Metoda pro konstrukci kódů minimální redundance“. Sborník IRE. Institute of Electrical and Electronics Engineers (IEEE). 40 (9): 1098–1101. doi:10.1109 / jrproc.1952.273898. ISSN 0096-8390.
externí odkazy
- Informační teorie, odvození a výukové algoritmy tím, že David MacKay (2003) uvádí úvod do Shannonovy teorie a komprese dat, včetně Huffmanovo kódování a aritmetické kódování.
- Kódování zdroje, T. Wiegand a H. Schwarz (2011).