Optické rozpoznávání znaků (blok Unicode) - Optical Character Recognition (Unicode block) - Wikipedia
Optické rozpoznávání znaků | |
---|---|
Rozsah | U + 2440..U + 245F (32 kódových bodů) |
Letadlo | BMP |
Skripty | Běžný |
Sady symbolů | Ovládací prvky OCR |
Přiřazeno | 11 kódových bodů |
Nepoužitý | 21 vyhrazených kódových bodů |
Historie verzí Unicode | |
1.0.0 | 11 (+11) |
Poznámka: [1][2] |
Optické rozpoznávání znaků je Blok Unicode obsahující signální znaky pro OCR a MICR standardy.
Blok
Optické rozpoznávání znaků[1][2] Oficiální tabulka kódů konsorcia Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U + 244x | ⑀ | ⑁ | ⑂ | ⑃ | ⑄ | ⑅ | ⑆ | ⑇ | ⑈ | ⑉ | ⑊ | |||||
U + 245x | ||||||||||||||||
Poznámky |
Podnadpisy
Blok optického rozpoznávání znaků má ve své kolekci znaků tři neformální podnadpisy (seskupení): OCR-A, MICR a OCR.[3]
OCR-A
Podnadpis OCR-A obsahuje šest znaků převzatých z OCR-A písmo popsané v normě ISO 1073-1: 1976: U + 2440 ⑀ OCR HÁČEK, U + 2441 ⑁ OCR ŽIDLE, U + 2442 ⑂ OCR VIDLICE, U + 2443 ⑃ OCR INVERTOVANÁ VIDLICE, U + 2444 ⑄ OCR BUCKLE, a U + 2445 ⑅ OCR BOW TIE. OCR motýlek je uveden informativní alias "jedinečná hvězdička".
MICR
Podnadpis MICR obsahuje čtyři interpunkční znaky pro bankovní šek identifikátory převzaté z rozpoznávání znaků magnetickým inkoustem Písmo E-13B (kodifikováno v normě ISO 1004: 1995): U + 2446 ⑆ IDENTIFIKACE BANKOVNÍ BANKY OCR, U + 2447 ⑇ OCR ČÁSTKA ŠEKU, U + 2448 ⑈ OCR DASH, a U + 2449 ⑉ ČÍSLO ÚČTU ZÁKAZNÍKA OCR.
Poslední dva znaky jsou nesprávně pojmenovány: jejich jména byla nechtěně přepnuta, když byly pojmenovány v (prvním) vydání z roku 1993 ISO / IEC 10646,[4] chyba, která existovala od Unicode 1.0.0.[5] Ačkoli jejich formální názvy zůstávají nezměněny kvůli zásadám stability Unicode, oba byly opraveny normativní aliasy: U + 2448 ⑈ je MICR NA NÁS SYMBOLa U + 2449 ⑉ je SYMBOL MICR DASH[6] (standardní poznámky, že "jména znaků Unicode obsahují několik nesprávných jmen").
Tyto symboly byly dříve kódovány kódováním ISO-IR-98 definovaným ISO 2033: 1983, ve kterém byli jednoduše pojmenováni SYMBOL JEDEN přes SYMBOL ČTYŘI.[7] Všechny čtyři znaky mají v grafech Unicode informativní aliasy: „tranzit“, „částka“, „na nás“ a „pomlčka“.
OCR
Podnadpis OCR se skládá z jednoho znaku: U + 244A ⑊ OCR DOUBLE BACKSLASH.
Dějiny
Následující dokumenty související s Unicode zaznamenávají účel a proces definování konkrétních znaků v bloku Optical Character Recognition:
Verze | Konečné body kódu[A] | Počet | L2 ID | WG2 ID | Dokument |
---|---|---|---|---|---|
1.0.0 | U + 2440..244A | 11 | (být odhodlán) | ||
L2 / 10-416R | Moore, Lisa (09.11.2010), „Consensus 125-C39“, UTC # 125 / L2 # 222 minut, Vytvořte dva formální aliasy, U + 2448 MICR ON US SYMBOL a U + 2449 MICR DASH SYMBOL pro Unicode 6.1. | ||||
N4103 | "T.3. Optické rozpoznávání znaků", Nepotvrzené zápisy ze schůzky pracovní skupiny 2 58, 2012-01-03 | ||||
|
Reference
- ^ "Databáze znaků Unicode". Standard Unicode. Citováno 2016-07-09.
- ^ „Výčet verzí standardu Unicode“. Standard Unicode. Citováno 2016-07-09.
- ^ "Tabulky kódů Unicode: Optické rozpoznávání znaků" (PDF). Standard Unicode, verze 6.3. Citováno 27. února 2014.
- ^ ISO / IEC JTC 1 / SC 2 / WG 2 (03.01.2012). "T.3. Optické rozpoznávání znaků". Nepotvrzené zápisy ze schůzky pracovní skupiny 2 58 (PDF). str. 29. SC2 N4188 / WG2 N4103.
Tyto symboly rozpoznávání znaků magnetického inkoustu (MICR) používají banky na šeky. Názvy těchto postav byly v edici ISO / IEC 10646 z roku 1993 neúmyslně smíšeny.
- ^ „3.8: Grafy po blocích“ (PDF). Standard Unicode. verze 1.0. Konsorcium Unicode.
- ^ Freytag, Asmus; McGowan, Rick; Whistler, Ken (10.04.2017). Známé anomálie v názvech znaků Unicode (4. vyd.). Konsorcium Unicode. Technická poznámka Unicode č. 27.
- ^ ISO / TC97 / SC2 (1985-08-01). „ISO-IR-98: Sada 14 grafických znaků písma E13B“ (PDF). ITSCJ /IPSJ.