Windows-1253 - Windows-1253
MIME / IANA | Windows-1253 |
---|---|
Alias (y) | cp1253 |
Jazyk (y) | řecký, Angličtina |
Standard | WHATWG Standard kódování |
Klasifikace | Rozšířené ASCII, Windows-125x |
Na základě | ISO / IEC 8859-7, Windows-1252 |
Kódová stránka Windows 1253 („Řecky - ANSI“),[1] běžně známý pod svým registrovaným názvem IANA Windows-1253[2] nebo zkráceně jako cp1253,[3][4] je Microsoft Windows kódová stránka se zvyklo psát moderně řecký. Není schopen podporovat starší polytonická řečtina.
Není plně kompatibilní s ISO 8859-7 protože pár znaků, včetně písmene Ά, jsou umístěny na různých hodnotách bytů:
µ
[A] a¶
jsou přidány na svá místa z Windows-1252 a ISO 8859-1 (0x B5 a 0xB6). To koliduje s umístěním΅
aΆ
v ISO 8859-7.‘
a’
jsou přesunuty ze svých umístění ISO 8859-7 (0xA1 a 0xA2) do svých umístění Windows-1252 (0x91 a 0x92). Přesídlení΅
aΆ
jsou přesunuty do uvolněného prostoru na 0xA1, respektive 0xA2.¤
a¥
jsou přidány na jejich umístění od Windows-1252 a ISO 8859-1 (0xA4 a 0xA5). To koliduje s dodatky k ISO 8859-7 v roce 2003, kdy€
a₯
byly přidány na stejná místa. The€
byl přidán do Windows-1253 v 0x80, ve stejném umístění, do kterého byl přidán v Windows-1252. An iota dolní index (ͺ) byl také přidán do ISO 8859-7 při 0xAA; toto zůstává nepřiděleno v systému Windows-1253.- Několik dalších znaků je přidáno na jejich umístění Windows-1252, i když ostatní nekolidují s ISO 8859-7.
IBM používá kódovou stránku 1253 (CCSID 1253 a znak eura rozšířený CCSID 5349) pro Windows-1253.[5][6][7]
Unicode je preferován pro řečtinu v moderních aplikacích, zejména jako UTF-8 kódování na internetu. Unicode poskytuje mnohem více glyfů pro úplné pokrytí, viz Řecká abeceda v Unicode a Starořecká hudební notace pro stoly.
Znaková sada
Následující tabulka ukazuje Windows-1253. Každá postava je zobrazena s Unicode ekvivalent.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | ČR 000D | TAK 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | NAK 0015 | SYN 0016 | ETB 0017 | UMĚT 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | NÁS 001F |
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | A 0061 | b 0062 | C 0063 | d 0064 | E 0065 | F 0066 | G 0067 | h 0068 | i 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | Ó 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | proti 0076 | w 0077 | X 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | DEL 007F |
8_ 128 | € 20AC | ‚ 201A | ƒ 0192 | „ 201E | … 2026 | † 2020 | ‡ 2021 | ‰ 2030 | ‹ 2039 | |||||||
9_ 144 | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | ™ 2122 | › 203A | |||||||
A_ 160 | NBSP 00A0 | ΅ 0385 | Ά 0386 | £ 00A3 | ¤ 00A4 | ¥ 00A5 | ¦ 00A6 | § 00A7 | ¨ 00A8 | © 00A9 | « 00AB | ¬ 00AC | PLACHÝ 00AD | ® 00AE | ― 2015 | |
B_ 176 | ° 00B0 | ± 00B1 | ² 00B2 | ³ 00B3 | ΄ 0384 | µ 00B5 | ¶ 00B6 | · 00B7 | Έ 0388 | Ή 0389 | Ί 038A | » 00BB | Ό 038C | ½ 00BD | Ύ 038E | Ώ 038F |
C_ 192 | ΐ 0390 | Α 0391 | Β 0392 | Γ 0393 | Δ 0394 | Ε 0395 | Ζ 0396 | Η 0397 | Θ 0398 | Ι 0399 | Κ 039A | Λ 039B | Μ 039C | Ν 039D | Ξ 039E | Ο 039F |
D_ 208 | Π 03A0 | Ρ 03A1 | Σ 03A3 | Τ 03A4 | Υ 03A5 | Φ 03A6 | Χ 03A7 | Ψ 03A8 | Ω 03A9 | Ϊ 03AA | Ϋ 03AB | ά 03AC | έ 03AD | ή 03AE | ί 03AF | |
E_ 224 | ΰ 03B0 | α 03B1 | β 03B2 | y 03B3 | δ 03B4 | ε 03B5 | ζ 03B6 | η 03B7 | θ 03B8 | ι 03B9 | κ 03BA | λ 03BB | μ 03BC | ν 03BD | ξ 03BE | ο 03BF |
F_ 240 | π 03C0 | ρ 03C1 | ς 03C2 | σ 03C3 | τ 03C4 | υ 03C5 | φ 03C6 | χ 03C7 | ψ 03C8 | ω 03C9 | ϊ 03CA | ϋ 03CB | ό 03CC | ύ 03CD | ώ 03CE |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno Rozdíly od ISO 8859-7
Viz také
Poznámky pod čarou
- ^ To je nad rámec existujícího
μ
při 0xEC, která zůstává na místě. Unicode volá ten na 0xB5 "mikro znamení „(U + 00B5) a ten v 0xEC„ řecké malé písmeno Mu “(U + 03BC), ačkoli první je mapováno na druhé pomocí NFKC (i když ne NFC) Normalizace Unicode. Viz také Duplicitní znaky v Unicode § Duplicitní vs. odvozený znak.
Reference
- ^ A b Microsoft. „Codepage 1253: Greek - ANSI“. Konsorcium Unicode.
- ^ Lazhintseva, Katya (03.05.1996). "Registrace nové znakové sady MIME: Windows-1253". IANA.
- ^ A b Steele, Shawn (1998-04-15). „CP1253.TXT: cp1253 do tabulky Unicode, verze 2.01“. Konsorcium Unicode.
- ^ "7.2.3. Standardní kódování". Dokumentace Pythonu 3.6. Softwarová nadace Python.
- ^ "Informační stránka kódové stránky 1253". Archivovány od originál dne 03.03.2016.
- ^ „Informační dokument CCSID 1253“. Archivovány od originál dne 2016-03-27.
- ^ „Informační dokument CCSID 5349“. Archivovány od originál dne 2014-11-29.
- ^ Kódová stránka CPGID 01253 (pdf) (PDF), IBM
- ^ Kódová stránka CPGID 01253 (txt), IBM
- ^ International Components for Unicode (ICU), ibm-1253_P100-1995.ucm, 2002-12-03
- ^ International Components for Unicode (ICU), ibm-5349_P100-1998.ucm, 2002-12-03