ISO 2033 - ISO 2033
The ISO 2033: 1983 Standard ("Kódování strojově čitelných znaků (MICR a OCR)")[1] definuje znakové sady pro použití s Optické rozpoznávání znaků nebo Rozpoznávání znaků magnetického inkoustu systémy. Japonský standard JIS X 9010: 1984 ("Kódování strojově čitelných znaků (OCR a MICR)", původně určený JIS C 6229-1984) úzce souvisí.[2]
Sada znaků pro OCR-A
Verze kódování pro Písmo OCR-A registrován u ISO-IR registrovat jako ISO-IR-91 je japonská verze (JIS X 9010 / JIS C 6229), která se liší od kódování definovaného normou ISO 2033 pouze přidáním Yen znamení (zobrazeno níže šedě).[2]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | ČR 000D | TAK 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | NAK 0015 | SYN 0016 | ETB 0017 | UMĚT 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | NÁS 001F |
2_ 32 | SP 0020 | " 0022 | £ 00A3 | $ 0024 | % 0025 | & 0026 | ' 0027 | { 007B | } 007D | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F | |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | ⑀ 2440 | = 003D | ⑁ 2441 | ? 003F |
4_ 64 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F | |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | ¥ 00A5 | ⑂ 2442 | |||
6_ 96 | ||||||||||||||||
7_ 112 | | 007C | DEL 007F |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno Předefinováno ve srovnání s JIS-Roman
Sada znaků pro OCR-B
Verze Sada G0 pro Písmo OCR-B registrován u ISO-IR registrovat jako ISO-IR-92 je japonská (JIS X 9010 / JIS C 6229) verze, která se liší od kódování definovaného ISO 2033 pouze v tom, že je založena na JIS-Roman (s znak dolaru v 0x24 a a Yen znamení při 0x5C) spíše než na ISO 646 IRV (s a obrácené lomítko při 0x5C a v té době a univerzální měna znamení (¤) v 0x24).[3] Kromě těchto kódových bodů se liší od ASCII pouze při vynechání zavináč (@) a vlkodlak (~).[3] Další doplňková sada registrovaná jako ISO-IR-93 přiřadí znak libry (£), znak univerzální měny (¤) a sekce znamení (§) jejich ISO-8859-1 kódové body a zpětné lomítko k kódovému bodu ISO-8859-1 pro znak jenu.[4]
Sada znaků pro JIS X 9008 (JIS C 6257)
JIS X 9010 (JIS C 6229) také definuje znakové sady pro „ručně tištěné“ písmo OCR JIS X 9008: 1981 (dříve JIS C 6257-1981).[5]:fn1 Patří sem podmnožiny souboru JIS X 0201 Roman set (registrován jako ISO-IR-94 a vynechání zavináč (@), malá písmena, složené závorky ({,}) a overline (‾)),[5] a kana set (registrováno jako ISO-IR-96 a vynechání čárky (、) ve východoasijském stylu a tečky (。), interpunktní (・) A malá kana),[6] kromě sady (registrovaná jako ISO-IR-95) obsahující pouze zpětné lomítko, které je přiřazeno ke stejnému bodu kódu jako v ISO-IR-93.[7]
Písmo JIS C 6527 stylizuje lomítko[5] a zpětné lomítko[7] znaky se zdvojnásobeným vzhledem. Jména postav jsou „Solidus“[5] a „Reverzní Solidus“,[7] shoda názvů znaků Unicode pro lomítko a zpětné lomítko ASCII.[8] Unicode Optické rozpoznávání znaků blok obsahuje další kódový bod pro „OCR Double Backslash“ (⑊), i když ne pro dvojité (přední) lomítko.[9]
Sada znaků pro E-13B

The ISO-IR-98 kódování definované normou ISO 2033 kóduje znakový repertoár souboru Písmo E13B, jak se používá s rozpoznávání znaků magnetickým inkoustem.[10] Ačkoli ISO 2033 specifikuje i další kódování, kódování pro E-13B je kódování označované jako ISO_2033_1983
podle Perl libintl,[11] a jako ISO_2033-1983
nebo csISO2033
podle IANA.[12] Mezi další registrované štítky patří iso-ir-98
, své ISO-IR registrační číslo a jednoduše e13b
.[12]
Číslice jsou zachovány v jejich ASCII umístění. Písmena a symboly, které nejsou v písmu E13B k dispozici, jsou vynechány, zatímco specializovaná interpunkce pro bankovní šeky přidáno písmo E13B. Stejné symboly jsou k dispozici v Unicode v Blok optického rozpoznávání znaků.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | ČR 000D | TAK 000E | SI 000F |
1_ | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | NAK 0015 | SYN 0016 | ETB 0017 | UMĚT 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | NÁS 001F |
2_ | SP 0020 | |||||||||||||||
3_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | ⑆ 2446 | ⑇ 2447 | ⑈ 2448 | ⑉ 2449 | ||
4_ | ||||||||||||||||
5_ | ||||||||||||||||
6_ | ||||||||||||||||
7_ | DEL 007F |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno Předefinováno ve srovnání s ASCII
Reference
- ^ ISO / IEC JTC 1 / SC 2 (1983). Zpracování informací - kódování strojově čitelných znaků (MICR a OCR). ISO. ISO 2033: 1983.
- ^ A b ISO / TC97 / SC2 (1985-08-01). ISO-IR-91: Japonská sada grafických znaků OCR-A (PDF). ITSCJ /IPSJ.
- ^ A b ISO / TC97 / SC2 (1985-08-01). ISO-IR-92: Japonská základní sada grafických znaků OCR-B (PDF). ITSCJ /IPSJ.
- ^ ISO / TC97 / SC2 (1985-08-01). ISO-IR-93: Japonský OCR-B - další sada grafických znaků (PDF). ITSCJ /IPSJ.
- ^ A b C d ISO / TC97 / SC2 (1985-08-01). ISO-IR-94: Japonská základní ručně tištěná sada grafických znaků pro OCR (PDF). ITSCJ /IPSJ.
- ^ ISO / TC97 / SC2 (1985-08-01). ISO-IR-96: Sada ručně kreslených grafických znaků Katakana pro OCR (PDF). ITSCJ /IPSJ.
- ^ A b C ISO / TC97 / SC2 (1985-08-01). ISO-IR-95: Japonská doplňková ručně tištěná sada grafických znaků pro OCR (PDF). ITSCJ /IPSJ.
- ^ Konsorcium Unicode. „Ovládací prvky C0 a základní latinka“ (PDF). Standard Unicode.
- ^ Konsorcium Unicode. "Optické rozpoznávání znaků" (PDF). Standard Unicode.
- ^ ISO / TC97 / SC2 (1985-08-01). ISO-IR-98: Sada 14 grafických znaků písma E13B (PDF). ITSCJ /IPSJ.
- ^ A b Flohr, Guido. "Konverzní rutiny pro ISO_2033_1983". libintl. Národní prostředí :: RecodeData :: ISO_2033_1983.
- ^ A b „Sady znaků“. IANA.
externí odkazy
- ISO 2033 distribuováno ISO
- JIS X 9010 distribuovány AFNOR