ISO-IR-111 - ISO-IR-111
Alias (y) | ISO-IR-111 |
---|---|
Jazyk (y) | ruština, Běloruský, Makedonština, srbština, ukrajinština (částečný) |
Standard | ECMA-113: 1986 |
Klasifikace | Rozšířené ASCII, KOI |
Rozšiřuje | KOI8-B |
Uspěl | ECMA-113: 1988 (ISO-8859-5 ) |
Další související kódování | KOI8-F |
ISO-IR-111[1] nebo KOI8-E[2] je 8bitová znaková sada. Jedná se o nadnárodní rozšíření KOI-8 pro Běloruský, Makedonština, srbština, a ukrajinština (až na Ґ ґ který je přidán do KOI8-F ). Název „ISO-IR-111“ odkazuje na jeho registrační číslo v ISO-IR registru a označuje jej jako sadu použitelnou pro ISO / IEC 2022.
Byl definován prvním (1986) vydáním ECMA-113,[3] který je Ecma International standard odpovídající ISO / IEC 8859-5, a jako takový také odpovídá verzi ISO-8859-5 z roku 1987.[4] Vydaná vydání ISO / IEC 8859-5 místo toho odpovídají následným vydáním ECMA-113, která definuje odlišné kódování.[5]
Pojmenování zmatek
ISO-IR-111, vydání ECMA-113 z roku 1985 (také nazývané „ECMA-cyrilice“ nebo „KOI8-E“), bylo založeno na vydání GOST 19768 z roku 1974 (tj. KOI-8 ). V roce 1987 byl ECMA-113 přepracován.[5] Tato novější vydání ECMA-113 jsou ekvivalentní ISO-8859-5,[5][6] a nedodržujte rozložení KOI. Tento zmatek vedl k běžné mylné představě, že ISO-8859-5 byla definována v nebo na základě GOST 19768-74.[6]
Možná jako další důsledek toho, RFC 1345 omylem uvádí jinou kódovou stránku pod názvy „ISO-IR-111“ a „ECMA-Cyrillic“, připomínající ISO-8859-5 s přeuspořádanými řádky, a částečně kompatibilní s Windows-1251.[7][6] Vzhledem k obavám, že stávající implementace mohou používat definici RFC 1345 pro tyto dva štítky, bylo navrženo, aby IANA navíc rozpoznat KOI8-E
jako štítek pro obsah ECMA-113: 1985,[7] a IANA v současné době uvádí tento štítek jako alias.[2]
Znaková sada
Následující tabulka ukazuje kódování ISO-IR-111. Každá postava je zobrazena s ekvivalentem Unicode kódový bod.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | A 0061 | b 0062 | C 0063 | d 0064 | E 0065 | F 0066 | G 0067 | h 0068 | i 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | Ó 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | proti 0076 | w 0077 | X 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | |
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | NBSP 00A0 | ђ 0452 | ѓ 0453 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | PLACHÝ 00AD | ў 045E | џ 045F |
B_ 176 | № 2116 | Ђ 0402 | Ѓ 0403 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | ¤ 00A4 | Ў 040E | Џ 040F |
C_ 192 | ю 044E | а 0430 | б 0431 | ц 0446 | д 0434 | е 0435 | ф 0444 | г 0433 | х 0445 | č 0438 | © 0439 | к 043A | л 043B | м 043C | n 043D | о 043E |
D_ 208 | п 043F | я 044F | р 0440 | с 0441 | т 0442 | у 0443 | ж 0436 | в 0432 | ь 044C | ы 044B | з 0437 | ш 0448 | э 044D | щ 0449 | ч 0447 | ъ 044A |
E_ 224 | Ю 042E | А 0410 | Б 0411 | Ц 0426 | Д 0414 | Е 0415 | Ф 0424 | Г 0413 | Х 0425 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E |
F_ 240 | П 041F | Я 042F | Р 0420 | С 0421 | Т 0422 | У 0423 | Ж 0416 | В 0412 | Ь 042C | Ы 042B | З 0417 | Ш 0428 | Э 042D | Щ 0429 | Ч 0427 | Ъ 042A |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
Rozšířená a upravená verze
Upravená verze s názvem KOI8 Unified nebo KOI8-F byl použit v softwaru produkovaném společností Fingertip Software, přidáním Ґ v jeho KOI8-U umístění (nahrazující měkká pomlčka a přemístění univerzální měna znamení ) a přidání některých grafických znaků do souboru Řídicí kódy C1 oblast, hlavně z KOI8-R a Windows-1251.[4][6][8][9]
Nesprávná kódová stránka RFC 1345
Jazyk (y) | ruština, Běloruský, Makedonština, srbština |
---|---|
Standard | RFC 1345 |
Klasifikace | Rozšířené ASCII |
Transformuje / kóduje | ISO-IR-111 |
Další související kódování | ISO-8859-5, Windows-1251 |
RFC 1345 chybně uvádí jinou kódovou stránku pod názvem ISO-IR-111, která kóduje stejné znaky cyrilice, ale s jiným rozložením. Připomíná to směs Windows-1251 a ISO-8859-5.[7] Řádek A_ konkrétně odpovídá ISO-8859-5, řádky C_ až F_ odpovídají Windows-1251[6] (ekvivalent řádků B_ až E_ normy ISO-8859-5) a řádek B_ téměř odpovídá řádku F_ normy ISO-8859-5, s výjimkou § nahrazen a ¤.
Některé kódy připomínají ISO-IR-111 s převráceným velkým písmenem, což mohlo přispět ke zmatku. Většina se liší a je zobrazena níže se silným okrajem.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | NBSP 00A0 | Ё 0401 | Ђ 0402 | Ѓ 0403 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | PLACHÝ 00AD | Ў 040E | Џ 040F |
B_ 176 | № 2116 | ё 0451 | ђ 0452 | ѓ 0453 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | ¤ 00A4 | ў 045E | џ 045F |
C_ 192 | А 0410 | Б 0411 | В 0412 | Г 0413 | Д 0414 | Е 0415 | Ж 0416 | З 0417 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E | П 041F |
D_ 208 | Р 0420 | С 0421 | Т 0422 | У 0423 | Ф 0424 | Х 0425 | Ц 0426 | Ч 0427 | Ш 0428 | Щ 0429 | Ъ 042A | Ы 042B | Ь 042C | Э 042D | Ю 042E | Я 042F |
E_ 224 | а 0430 | б 0431 | в 0432 | г 0433 | д 0434 | е 0435 | ж 0436 | з 0437 | č 0438 | © 0439 | к 043A | л 043B | м 043C | n 043D | о 043E | п 043F |
F_ 240 | р 0440 | с 0441 | т 0442 | у 0443 | ф 0444 | х 0445 | ц 0446 | ч 0447 | ш 0448 | щ 0449 | ъ 044A | ы 044B | ь 044C | э 044D | ю 044E | я 044F |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno Odchylka od ISO-IR-111 (kromě odchylek pouze v případě)
Viz také
Reference
- ^ ECMA (1. srpna 1985). Pravá část cyrilice (PDF). ITSCJ /IPSJ. ISO-IR-111.
- ^ A b „Sady znaků“. IANA.
- ^ ECMA-113. 8bitové jednobajtové kódované sady grafických znaků - latinka / azbuka (1. vydání, červen 1986)
- ^ A b Czyborra, Roman (30. 11. 1998) [1998-05-25]. „Polévka cyrilice“. Archivovány od originál dne 03.12.2016. Citováno 2016-12-03.
- ^ A b C ECMA-113. 8bitové jednobajtové kódované sady grafických znaků - latinka / cyrilice (2. vydání, červen 1988)
- ^ A b C d E Nechayev, Valentin (2013) [2001]. „Recenze 8bitového vesmíru kódování cyrilice“. Archivováno z původního dne 2016-12-05. Citováno 2016-12-05.
- ^ A b C Sokolov, Michael (04.04.2003). "ECMA-cyrilice alias iso-ir-111 bolavý". IETF Seznam adresátů charsetů.
- ^ „KOI8 Unified“. Software pro konečky prstů. Archivovány od originál dne 01.01.1998. Citováno 2020-02-11.
- ^ Leisher, Mark (2008) [03.03.1998]. „KOI8 Unified Cyrillic to Unicode 2.1 mapping table“. Katedra matematických věd, Státní univerzita v Novém Mexiku. Citováno 2020-05-02.