Šestibitový znakový kód - Six-bit character code
A šestibitový znakový kód je Kódování znaků určené pro použití na počítačích s délky slov násobek 6. Šest bitů může kódovat pouze 64 odlišných znaků, takže tyto kódy obvykle obsahují pouze velká písmena, číslice, některé interpunkční znaky a někdy i řídicí znaky. Tyto kódy s dalšími paritní bit byly přirozeným způsobem ukládání dat 7-track magnetická páska.
Typy šestibitových kódů
Byl použit raný šestibitový binární kód Braillovo písmo, čtecí systém pro nevidomé, který byl vyvinut ve 20. letech 20. století.
Nejstarší počítače se zabývaly pouze číselnými údaji a neposkytly žádné údaje o znakových datech. Šestibitový BCD byl používán uživatelem IBM na starších počítačích, jako je IBM 704 v roce 1954.[1]:str.35 Toto kódování bylo nahrazeno 8bitovým EBCDIC kód, když Systém / 360 standardizováno na 8-bit bajtů. Existuje několik variant tohoto typu kódu (viz níže ).
Šestibitové kódy znaků obecně nahradily pětibitové Baudotův kód a předcházel sedmibitovým ASCII. Jedna populární varianta byla DEC SIXBIT. Jedná se jednoduše o kódy znaků ASCII od 32 do 95 kódované jako 0 až 63 odečtením 32 (tj. Sloupců 2, 3, 4 a 5 tabulky ASCII (16 znaků na sloupec), posunutých do sloupců 0 až 3, odečtením 2 od vysokých bitů); zahrnuje mezeru, interpunkční znaky, čísla a velká písmena, ale žádné kontrolní znaky. Vzhledem k tomu, že neobsahoval žádné řídicí znaky, dokonce ani konec řádku, nebyl použit pro obecné zpracování textu. Šestimístná jména jako např názvy souborů a assembler symboly lze uložit do jednoho 36-bit slovo o PDP-10, a tři znaky se vejdou do každého slova PDP-1 a do každého slova souboru se vejdou dva znaky PDP-8.
Šestibitové kódy mohou pomocí kódu kódovat více než 64 znaků Shift Out a Shift In znaky v podstatě obsahuje dvě odlišné sady 62 znaků a přepíná mezi nimi. Například populární IBM 2741 komunikační terminál podporoval celou řadu znakových sad až 88 tiskových znaků plus kontrolní znaky.
A UTF-6 bylo navrženo kódování pro Unicode[2] ale byl nahrazen Punycode.
Šestibitový kód BCD
Šestibitový BCD kód byl adaptací kód děrné karty na binární kód. IBM použil podmínky binárně kódované desetinné místo a BCD k variantám BCD alphamerics používaný ve většině časných počítačů IBM, včetně IBM 1620, Řada IBM 1400 adesítková architektura členové Řada IBM 700/7000.
COBOL databáze šestibitový kód
Šestibitový kód byl také použit v databázích COBOL, kde byly informace o konci záznamu ukládány samostatně.[Citace je zapotřebí ]
Šestibitový kód karty s magnetickým proužkem
Šestibitový kód s přidaným lichým paritní bit, se používá na trati 1 ze dne karty s magnetickým proužkem, jak je uvedeno v ISO / IEC 7811 -2.
Šestibitový kód DEC
Kód DEC SIXBIT obsahující několik řídicích znaků - spolu s SO / SI, umožňující rozšíření kódu - bylo zadáno jako ECMA -1 v roce 1963 (viz níže ). Další, méně běžná varianta se získá pouhým odizolováním vysokého bitu kódu ASCII v rozsahu 32 - 95 (kódy 32 - 63 zůstanou na svých pozicích, vyšší hodnoty od nich odečtou 64). Taková varianta byla někdy používána na DEC PDP-8 (1965).
Šestibitový kód FIELDATA
FIELDATA byl sedmbitový kód (s volitelnou paritou), z nichž bylo formálně definováno pouze 64 pozic kódu (zabírajících šest bitů).[3] Varianta byla použita UNIVAC Počítače řady 1100.[4] Zacházení s kódem jako s šestibitovým kódem, tyto systémy používaly 36bitové slovo (schopné uložit šest takto redukovaných znaků FIELDATA).[5]
Braillský šestibitový kód
Braillovo písmo znaky jsou reprezentovány pomocí šesti pozic teček, uspořádaných do obdélníku. Každá pozice může obsahovat vyvýšenou tečku nebo ne, takže Braillovo písmo lze považovat za šestibitový binární kód. Některé modernější systémy v Braillově písmu přidávají další dvě tečky, což z nich dělá osmibitový kód.
Šestibitové kódy pro binární kódování textu
Přenos binárních dat přes systémy určené pouze pro text může někdy způsobit problémy. Například, e-mailem historicky podporoval pouze 7bitové kódy ASCII a odstranil by 8. bit, čímž by poškodil binární data odesílaná přímo přes jakýkoli problémový poštovní server. Jiné systémy mohou způsobovat problémy nesprávnou interpretací řídicích znaků během ukládání nebo přenosu. Existuje řada schémat pro zabalení 8bitových dat do textových reprezentací, které mohou procházet systémy textové pošty a dekódovat je v cíli. Mezi příklady 6bitových podmnožin znaků používaných pro balení binárních dat patří Uuencode a Base64. Tyto sady neobsahují žádné řídicí znaky (pouze tisknutelná čísla, písmena, interpunkci a možná mezeru) a umožňují přenos dat na jakékoli médium, které je také schopné přenášet text čitelný člověkem.
Příklady šestibitových kódů BCD
Znaky jsou zobrazeny s jejich Unicode ekvivalenty.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | 0 0030 | # 0023 | @ 0040 | PÁSKA OZNAČIT | |||
1_ | SP 0020 | / 002F | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | ZÁZNAM OZNAČIT | , 002C | % 0025 | |||
2_ | - 002D | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F | P 0050 | Q 0051 | R 0052 | -0 002D 0030 | $ 0024 | * 002A | |||
3_ | & 0026 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | +0 002B 0030 | . 002E | ¤ 00A4 | SKUPINA OZNAČIT |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | 0 0030 | = 003D | − 2212 | ||||
1_ | SP 0020 | / 002F | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | , 002C | ( 0028 | ||||
2_ | — 2014 | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F | P 0050 | Q 0051 | R 0052 | -0 002D 0030 | $ 0024 | * 002A | |||
3_ | + 002B | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | +0 002B 0030 | . 002E | ) 0029 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | : 003A | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | 0 0030 | = 003D | ≠ 2260 | ≤ 2264 | ! 0021 | [ 005B |
1_ | SP 0020 | / 002F | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | ] 005D | , 002C | ( 0028 | → 2192 | ≡ 2261 | ~ 007E |
2_ | − 2212 | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F | P 0050 | Q 0051 | R 0052 | % 0025 | $ 0024 | * 002A | ↑ 2191 | ↓ 2193 | > 003E |
3_ | + 002B | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | < 003C | . 002E | ) 0029 | ≥ 2265 | ? 003F | ; 003B |
Příklady šestibitových variant ASCII
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
1_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
2_ | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F |
3_ | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | 005C | ] 005D | ^ 005E | _ 005F |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | SP 0020 | HT 0009 | LF 000A | VT 000B | FF 000C | ČR 000D | TAK 000E | SI 000F | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
1_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
2_ | NUL 0000 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F |
3_ | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | 005C | ] 005D | ESC 001B | DEL 007F |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
1_ | SP 0020 | ! 0021 | " 0022 | # 0023 | £ 00A3 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
2_ | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F |
3_ | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | $ 0024 | ] 005D | ↑ 2191 | ← 2190 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F |
1_ | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | 005C | ] 005D | ^ 005E | _ 005F |
2_ | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
6bitový kód GOST
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | + 002B | - 002D | / 002F | , 002C | . 002E | SP 0020 |
1_ | ⏨ 23E8 | ↑ 2191 | ( 0028 | ) 0029 | × 00D7 | = 003D | ; 003B | [ 005B | ] 005D | * 002A | ‘ 2018 | ’ 2019 | ≠ 2260 | < 003C | > 003E | : 003A |
2_ | А 0410 | Б 0411 | В 0412 | Г 0413 | Д 0414 | Е 0415 | Ж 0416 | З 0417 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E | П 041F |
3_ | Р 0420 | С 0421 | Т 0422 | У 0423 | Ф 0424 | Х 0425 | Ц 0426 | Ч 0427 | Ш 0428 | Щ 0429 | Ы 042B | Ь 042C | Э 042D | Ю 042E | Я 042F | DEL 007F |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
Příklad šestibitových kódů Braillova písma
Následující tabulka ukazuje uspořádání znaků s hexadecimální hodnotou, odpovídající znaky ASCII, Braillovo šestibitové kódy (kombinace teček), Braillovo písmo Unicode glyf a obecný význam (skutečný význam se může měnit v závislosti na kontextu).[7][8]
|
|
Viz také
- Binárně kódované desetinné místo
- BCD (kódování znaků)
- Zobrazovací kód CDC
- DEC RADIX 50 / MOD40
- IBM SQUOZE
- IBM Transcode
- ASCII
- Baudotův kód
- EBCDIC
- Unicode
- ANSI X3.64
- UTF-8
- UTF-16
Reference
- ^ IBM Corporation (1954). 704 stroj na elektronické zpracování dat: návod k obsluze (PDF).
- ^ Welter, Mark; Spolarich, Brian W. (2000-11-16). „UTF-6 - ještě další ASCII kompatibilní kódování pro ID“. Pracovní skupina pro internetové inženýrství. Archivováno od originálu 2016-05-23. Citováno 2016-04-09.
- ^ Mackenzie, Charles E. (1980). Kódované znakové sady, historie a vývoj. Řada programovacích systémů (1. vyd.). Addison-Wesley Publishing Company, Inc. p. 64. ISBN 0-201-14460-3. LCCN 77-90165. ISBN 978-0-201-14460-4. Citováno 2016-05-22.
- ^ Walker, John (06.06.1996). „Kód FIELDATA řady UNIVAC 1100“. Vzpomínky UNIVAC. Archivováno od originálu 2016-05-22. Citováno 2016-05-22.
- ^ Jennings, Thomas Daniel (2016-04-20) [1999]. „Anotovaná historie některých kódů znaků nebo ASCII: Americký standardní kód pro infiltraci informací“. Světové energetické systémy (WPS). Archivováno od originálu 2016-05-22. Citováno 2016-05-22.
- ^ Raymond, Eric S. (2017-08-29). „Datové typy AIS datového zatížení“. catb.org. Citováno 2017-11-16.
- ^ „Reprezentace a zobrazení Braillova písma“. DotlessBraille.org. 2002-02-20. Citováno 2009-08-09.
- ^ Halleck, John (2000-08-24). „braille-ascii.ads“. Braille.Ascii. Citováno 2009-08-10.
externí odkazy
- „Referenční příručka k počítači Control Data 1604-C“ (PDF). (7,44 MB)
- „Standard ECMA pro 6bitový kód vstupu / výstupu znaků“ (PDF). (1,53 MB)
- Odkaz na kód znaků SIXBIT Systém kódování znaků SIXBIT společnosti Digital Equipment Corporation