Hammingův kód - Hamming code
Tento článek obsahuje seznam obecných Reference, ale zůstává z velké části neověřený, protože postrádá dostatečné odpovídající vložené citace.Březen 2013) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Binární Hammingovy kódy | |
---|---|
Hammingův (7,4) kód (s r = 3) | |
Pojmenoval podle | Richard W. Hamming |
Klasifikace | |
Typ | Lineární kód bloku |
Délka bloku | 2r − 1 kde r ≥ 2 |
Délka zprávy | 2r − r − 1 |
Hodnotit | 1 − r/(2r − 1) |
Vzdálenost | 3 |
Velikost abecedy | 2 |
Zápis | [2r − 1, 2r − r − 1, 3]2-kód |
Vlastnosti | |
perfektní kód | |
v počítačová věda a telekomunikace, Hammingovy kódy jsou rodina lineární kódy opravující chyby. Hammingovy kódy dokážou detekovat až dvoubitové chyby nebo opravit jednobitové chyby bez detekce neopravených chyb. Naproti tomu jednoduché paritní kód nemůže opravit chyby a může detekovat pouze lichý počet bitů omylem. Hammingovy kódy jsou perfektní kódy, tj. dosahují toho nejvyššího možného hodnotit pro kódy s jejich délka bloku a minimální vzdálenost ze tří.[1]Richard W. Hamming vynalezl Hammingovy kódy v roce 1950 jako způsob automatické opravy chyb zavedených děrný štítek čtenáři. Ve svém původním článku Hamming rozvinul svou obecnou myšlenku, ale konkrétně se zaměřil na Hamming (7,4) kód, který přidá tři paritní bity ke čtyřem bitům dat.[2]
v matematický termíny, Hammingovy kódy jsou třídou binárních lineárních kódů. Pro každé celé číslo r ≥ 2 existuje kód s délka bloku n = 2r − 1 a délka zprávy k = 2r − r − 1. Proto je míra Hammingových kódů R = k / n = 1 − r / (2r − 1), což je nejvyšší možný pro kódy s minimální vzdáleností tří (tj. minimální počet bitových změn potřebných k přechodu z libovolného kódového slova na jakékoli jiné kódové slovo jsou tři) a délka bloku 2r − 1. The matice kontroly parity Hammingova kódu je vytvořeno vypsáním všech sloupců délky r které jsou nenulové, což znamená, že duální kód Hammingova kódu je zkrátil Hadamardův kód. Matice kontroly parity má vlastnost, že libovolné dva sloupce jsou párové lineárně nezávislé.
Kvůli omezené redundanci, kterou Hammingovy kódy přidávají k datům, mohou detekovat a opravovat chyby pouze při nízké míře chyb. To je případ paměti počítače (ECC paměť ), kde jsou bitové chyby extrémně vzácné a Hammingovy kódy jsou široce používány. V této souvislosti se často používá rozšířený Hammingův kód mající jeden paritní bit navíc. Rozšířené Hammingovy kódy dosahují Hammingovy vzdálenosti čtyři, což umožňuje dekodéru rozlišovat mezi tím, kdy nastane nejvýše jedna jednobitová chyba, a kdy dojde k jakékoli dvoubitové chybě. V tomto smyslu jsou rozšířené Hammingovy kódy opravou jedné chyby a detekcí dvojité chyby, zkráceně jako ODCHYLKY.[3]
Dějiny
Richard Hamming, vynálezce Hammingových kódů, pracoval v Bell Labs v pozdních 1940s na Bell Model V počítač, an elektromechanické reléový stroj s dobami cyklu v sekundách. Vstup byl napájen děrovaná papírová páska, široký sedm osmin palce, který měl až šest otvorů v řadě. Během pracovních dnů, kdy byly zjištěny chyby v relé, se stroj zastavil a rozsvítil světla, aby operátoři mohli problém odstranit. V době mimo pracovní dobu a o víkendech, kdy nebyli žádní operátoři, se stroj jednoduše přesunul k další práci.
Hamming pracoval o víkendech a byl stále více frustrovaný tím, že kvůli zjištěným chybám musel restartovat své programy od nuly. V nahraném rozhovoru Hamming řekl: „A tak jsem řekl:‚ Sakra, pokud stroj dokáže detekovat chybu, proč nedokáže lokalizovat polohu chyby a opravit ji? '“.[4] Během několika příštích let pracoval na problému opravy chyb a vyvinul stále výkonnější řadu algoritmů. V roce 1950 publikoval takzvaný Hammingův kód, který se dodnes používá v aplikacích jako např ECC paměť.
Kódy předcházející Hammingovi
Před Hammingovými kódy byla použita řada jednoduchých kódů pro detekci chyb, ale žádný nebyl tak účinný jako Hammingovy kódy ve stejné režii vesmíru.
Parita
Parita přidává singl bit , který označuje, zda počet jednotek (bitové pozice s hodnotami jedné) v předchozích datech byl dokonce nebo zvláštní. Pokud se při přenosu změní lichý počet bitů, změní se zpráva paritu a v tomto bodě může být detekována chyba; bitem, který se změnil, však mohl být samotný paritní bit. Nejběžnější konvence spočívá v tom, že paritní hodnota jednoho znamená, že v datech je lichý počet jedniček, a paritní hodnota nula označuje, že existuje sudý počet jedniček. Pokud je počet změněných bitů sudý, bude kontrolní bit platný a chyba nebude detekována.
Parita navíc neindikuje, který bit obsahoval chybu, i když ji dokáže detekovat. Data musí být zcela vyřazena a znovu přenesena od nuly. Na hlučném přenosovém médiu může úspěšný přenos trvat dlouho nebo se nemusí nikdy objevit. I když je kvalita kontroly parity špatná, protože používá pouze jeden bit, výsledkem této metody je nejmenší režie.
Kód dva z pěti
Kód dva z pěti je kódovací schéma, které používá pět bitů skládajících se přesně ze tří 0 a dvou 1 s. To poskytuje deset možných kombinací, dost na to, aby představovaly číslice 0–9. Toto schéma dokáže detekovat všechny jednotlivé bitové chyby, všechny liché bitové chyby a některé sudé bitové chyby (například převrácení obou 1 bitů). Stále však nemůže opravit žádnou z těchto chyb.
Opakování
Jiný kód, který se v té době používal, opakoval každý datový bit několikrát, aby se zajistilo jeho správné odeslání. Například pokud je datový bit, který má být odeslán, 1, an n = 3 opakovací kód pošle 111. Pokud nejsou tři přijaté bity identické, došlo během přenosu k chybě. Pokud je kanál dostatečně čistý, v každé trojici se většinou změní pouze jeden bit. Proto 001, 010 a 100 odpovídají 0 bitům, zatímco 110, 101 a 011 odpovídají 1 bitu, přičemž větší počet stejných číslic („0“ nebo „1“) označuje, co datový bit by měl být. Kód s touto schopností rekonstruovat původní zprávu za přítomnosti chyb je znám jako oprava chyb kód. Tento trojitý opakovací kód je Hammingův kód s m = 2, protože existují dva paritní bity a 22 − 2 − 1 = 1 datový bit.
Tyto kódy však nemohou správně opravit všechny chyby. V našem příkladu, pokud kanál převrátí dva bity a přijímač získá 001, systém detekuje chybu, ale dojde k závěru, že původní bit je 0, což je nesprávné. Pokud zvětšíme velikost bitového řetězce na čtyři, můžeme detekovat všechny dvoubitové chyby, ale nemůžeme je opravit (množství paritních bitů je sudé); na pět bitů můžeme detekovat a opravit všechny dvoubitové chyby, ale ne všechny tříbitové chyby.
Kromě toho je zvětšení velikosti paritního bitového řetězce neefektivní, což v našem původním případě snižuje propustnost třikrát a účinnost drasticky klesá, protože zvyšujeme počet duplikování každého bitu, abychom zjistili a opravili více chyb.
Hammingovy kódy
Pokud je ve zprávě zahrnuto více bitů opravujících chyby a pokud lze tyto bity uspořádat tak, že různé nesprávné bity produkují různé chybové výsledky, mohly by být identifikovány špatné bity. V sedmbitové zprávě je sedm možných jednobitových chyb, takže tři bity řízení chyb mohou potenciálně specifikovat nejen to, že došlo k chybě, ale také který bit chybu způsobil.
Hamming studoval stávající schémata kódování, včetně dvou z pěti, a zobecnil jejich koncepty. Nejprve vyvinul a nomenklatura popsat systém, včetně počtu datových bitů a bitů pro opravu chyb v bloku. Například parita zahrnuje jeden bit pro jakékoli datové slovo, tedy za předpokladu ASCII slova se sedmi bity, Hamming to popsal jako (8,7) kód s celkem osmi bity, z toho sedm dat. Příklad opakování by byl (3,1)podle stejné logiky. The kódová rychlost je druhé číslo děleno prvním, pro náš příklad opakování 1/3.
Hamming si také všiml problémů s převrácením dvou nebo více bitů a popsal to jako „vzdálenost“ (nyní se tomu říká Hammingova vzdálenost, po něm). Parita má vzdálenost 2, takže lze detekovat jedno převrácení bitů, ale neopravit je a jakékoli dva převrácení bitů budou neviditelné. Opakování (3,1) má vzdálenost 3, protože je třeba převrátit tři bity ve stejné trojici, aby se získalo další kódové slovo bez viditelných chyb. Může opravit jednobitové chyby nebo může detekovat - ale ne opravit - dvoubitové chyby. Opakování (4,1) (každý bit se opakuje čtyřikrát) má vzdálenost 4, takže převrácení tří bitů lze detekovat, ale neopravit. Když se ve stejné skupině převrátí tři bity, mohou nastat situace, kdy pokus o opravu způsobí nesprávné kódové slovo. Obecně platí, že kód se vzdáleností k může detekovat, ale není správné k − 1 chyby.
Hamming se zajímal o dva problémy najednou: co největší zvětšení vzdálenosti a zároveň co největší zvýšení kódové rychlosti. Během čtyřicátých let vyvinul několik kódovacích schémat, která byla dramatickým vylepšením stávajících kódů. Klíčem ke všem jeho systémům bylo překrývání paritních bitů, takže se dokázali navzájem kontrolovat, stejně jako data.
Obecný algoritmus
Následující obecný algoritmus generuje kód opravující jednu chybu (SEC) pro libovolný počet bitů. Hlavní myšlenkou je zvolit bity opravující chyby tak, aby index-XOR ( XOR všech bitových pozic obsahujících 1) je 0. Jako bity opravující chyby používáme pozice 1, 10, 100 atd. (v binárních), což zaručuje, že je možné nastavit bity opravující chyby tak, aby index -XOR celé zprávy je 0. Pokud přijímač obdrží řetězec s indexem-XOR 0, může dojít k závěru, že nedošlo k žádnému poškození, a jinak index-XOR označuje index poškozeného bitu.
Algoritmus lze odvodit z následujícího popisu:
- Počet bitů od 1: bit 1, 2, 3, 4, 5, 6, 7 atd.
- Čísla bitů zapište binárně: 1, 10, 11, 100, 101, 110, 111 atd.
- Všechny bitové pozice, které jsou mocninami dvou (mají jeden 1 bit v binární formě své pozice), jsou paritní bity: 1, 2, 4, 8 atd. (1, 10, 100, 1000)
- Všechny ostatní bitové pozice se dvěma nebo více 1 bity v binární formě jejich polohy jsou datové bity.
- Každý datový bit je zahrnut v jedinečné sadě 2 nebo více paritních bitů, jak je určeno binárním tvarem jeho bitové pozice.
- Paritní bit 1 pokrývá všechny bitové pozice, které mají nejméně významná sada bitů: bit 1 (samotný paritní bit), 3, 5, 7, 9 atd.
- Paritní bit 2 pokrývá všechny bitové pozice, které mají druhý nejméně významná sada bitů: bit 2 (samotný paritní bit), 3, 6, 7, 10, 11 atd.
- Paritní bit 4 pokrývá všechny pozice bitů, které mají Třetí nejméně významná sada bitů: bity 4–7, 12–15, 20–23 atd.
- Paritní bit 8 pokrývá všechny pozice bitů, které mají Čtvrtý nejméně významná sada bitů: bity 8–15, 24–31, 40–47 atd.
- Obecně každý paritní bit pokrývá všechny bity, kde bitové AND paritní pozice a bitová poloha jsou nenulové.
Pokud je bajt dat, která mají být kódována, 10011010, pak datové slovo (pomocí _ k reprezentaci paritních bitů) bude __1_001_1010 a kódové slovo je 011100101010.
Volba parity, sudá nebo lichá, je irelevantní, ale pro kódování i dekódování musí být použita stejná volba.
Toto obecné pravidlo lze zobrazit vizuálně:
Pozice bitu 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 … Zakódované datové bity p1 p2 d1 p4 d2 d3 d4 p8 d5 d6 d7 d8 d9 d10 d11 p16 d12 d13 d14 d15 Parita
bit
Dosahp1 p2 p4 p8 p16
Zobrazeno je pouze 20 kódovaných bitů (5 parita, 15 dat), ale vzor pokračuje neomezeně dlouho. Klíčovou věcí Hammingových kódů, kterou lze vidět z vizuální kontroly, je to, že jakýkoli daný bit je zahrnut v jedinečné sadě paritních bitů. Chcete-li zkontrolovat chyby, zkontrolujte všechny paritní bity. Vzor chyb, nazývaný syndrom chyby, identifikuje bit omylem. Pokud jsou všechny paritní bity správné, nedojde k žádné chybě. V opačném případě součet pozic chybných paritních bitů identifikuje chybný bit. Například pokud paritní bity na pozicích 1, 2 a 8 indikují chybu, pak je bit 1 + 2 + 8 = 11 chybný. Pokud pouze jeden paritní bit označuje chybu, je paritní bit sám o sobě chybný.
Jak vidíte, pokud máte m paritní bity, může pokrývat bity od 1 do . Pokud odečteme paritní bity, zůstane nám bity, které můžeme použít pro data. Tak jako m liší se, dostaneme všechny možné Hammingovy kódy:
Paritní bity | Celkem bitů | Datové bity | název | Hodnotit |
---|---|---|---|---|
2 | 3 | 1 | Hamming (3,1) (Trojnásobný opakovací kód ) | 1/3 ≈ 0.333 |
3 | 7 | 4 | Hamming (7,4) | 4/7 ≈ 0.571 |
4 | 15 | 11 | Hamming (15,11) | 11/15 ≈ 0.733 |
5 | 31 | 26 | Hamming (31,26) | 26/31 ≈ 0.839 |
6 | 63 | 57 | Hamming (63,57) | 57/63 ≈ 0.905 |
7 | 127 | 120 | Hamming (127 120) | 120/127 ≈ 0.945 |
8 | 255 | 247 | Hamming (255 247) | 247/255 ≈ 0.969 |
… | ||||
m | Hamming |
Hammingovy kódy s další paritou (SECDED)
Hammingovy kódy mají minimální vzdálenost 3, což znamená, že dekodér dokáže detekovat a opravit jednu chybu, ale nedokáže rozlišit dvojbitovou chybu některého kódového slova od jediné bitové chyby jiného kódového slova. Některé dvoubitové chyby budou tedy nesprávně dekódovány, jako by to byly jednobitové chyby, a proto zůstanou nezjištěné, pokud se nepokusíte o žádnou opravu.
K nápravě tohoto nedostatku lze Hammingovy kódy rozšířit o další paritní bit. Tímto způsobem je možné zvýšit minimální vzdálenost Hammingova kódu na 4, což umožňuje dekodéru rozlišovat mezi jednobitovými chybami a dvoubitovými chybami. Dekodér tak může detekovat a opravit jednu chybu a současně detekovat (ale ne opravit) dvojitou chybu.
Pokud se dekodér nepokusí opravit chyby, může spolehlivě detekovat trojité bitové chyby. Pokud dekodér opraví chyby, některé trojité chyby budou zaměněny za jednotlivé chyby a „opraveny“ na nesprávnou hodnotu. Oprava chyb je tedy kompromisem mezi jistotou (schopnost spolehlivě detekovat trojité bitové chyby) a odolností (schopnost nadále fungovat tváří v tvář jednobitovým chybám).
Tento rozšířený Hammingův kód je populární v počítačových paměťových systémech[Citace je zapotřebí ], kde je znám jako ODPADOVÁNO (zkráceně z oprava jedné chyby, detekce dvojité chyby)[Citace je zapotřebí ]. Obzvláště populární je (72,64) kód, zkrácený (127 120) Hammingův kód plus další paritní bit[Citace je zapotřebí ], který má stejnou režii prostoru jako paritní kód (9,8).
[7,4] Hammingův kód
V roce 1950 Hamming představil [7,4] Hammingův kód. Kóduje čtyři datové bity do sedmi bitů přidáním tří paritních bitů. Dokáže detekovat a opravit jednobitové chyby. S přidáním celkového paritního bitu může také detekovat (ale ne opravit) dvojbitové chyby.
Konstrukce G a H
Matice se nazývá (kanonická) matice generátoru lineárního (n,k) kód,
a se nazývá a matice kontroly parity.
Toto je konstrukce G a H ve standardní (nebo systematické) formě. Bez ohledu na formu, G a H pro lineární blokové kódy musí vyhovovat
, matice všech nul.[5]
Protože [7, 4, 3] = [n, k, d] = [2m − 1, 2m−1−m, 3]. The matice kontroly parity H Hammingova kódu je vytvořeno vypsáním všech sloupců délky m které jsou párově nezávislé.
Tím pádem H je matice, jejíž levá strana jsou všechny nenulové n-tice, kde na pořadí n-tic ve sloupcích matice nezáleží. Pravá strana je pouze (n − k)-matice identity.
Tak G lze získat z H převzetím transpozice na levé straně H s identitou k-matice identity na levé straně G.
Kód matice generátoru a matice kontroly parity jsou: