Inkrementální kódování - Incremental encoding
Inkrementální kódování, také známý jako přední komprese, zadní kompresenebo přední kódování, je typ delta kódování kompresní algoritmus přičemž běžné předpony nebo přípony a jejich délky jsou zaznamenávány, takže je není třeba duplikovat. Tento algoritmus je zvláště vhodný pro kompresi tříděny data např. seznam slova od a slovník.
Například:
Vstup | Společná předpona | Komprimovaný výstup |
---|---|---|
myxamyxophytamyxopodnabnabbednabbingnabitnabknabobnacaratnacelle | žádné předchozí slovo'myx''myxop'ne běžná předpona'nab''nabb''nab''nab''nab''na''nac ' | 0 myxa3 ophyta5 od0 nab3 postel4 ing3 it3 k3 ob2 karát3 elle |
64 bytů | 46 bytů |
Samotné kódování použité k uložení společné délky předpony se u jednotlivých aplikací liší. Typickými technikami jsou ukládání hodnoty do jednoho bajtu; delta kódování, který ukládá pouze změnu běžné délky předpony; a různé univerzální kódy. Může být kombinován s jinými obecnými bezztrátová komprese dat techniky jako kódování entropie a kódovací slovníky komprimovat zbývající přípony.
Aplikace
Inkrementální kódování se široce používá při získávání informací ke kompresi lexikonů používaných v vyhledávací indexy; tyto seznam všech slov nalezených ve všech dokumentech a ukazatel každého z nich na seznam míst. Obvykle tyto indexy komprimuje přibližně o 40%.[1]
Jako jeden příklad se inkrementální kódování používá jako výchozí bod pro Vyhledejte GNU nástroj, v indexu názvů souborů a adresářů. The Vyhledejte GNU nástroj dále používá bigram kódování k dalšímu zkrácení populárních předpon souborové cesty.
Reference
![]() | Tento ukládání dat v počítači -příbuzný software článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |