Windows-1256 - Windows-1256
Windows-1256 je kódová stránka zvyklý psát arabština (a případně některé další jazyky, které používají Arabské písmo, jako Peršan a Urdu) pod Microsoft Windows. Tato kódová stránka je ne kompatibilní s ISO 8859-6 a MacArabic kódování.
Kóduje všechny abstraktní jedno písmeno základní arabské abecedy, ne každá konkrétní vizuální forma izolovaných, počátečních, středních, konečných nebo ligaturovaných variant tvaru písmene (tj. kóduje znaky, nikoli glyfy). Arabská písmena v rozmezí C0-FF jsou v arabském abecedním pořadí, ale některé znaky latinky jsou mezi nimi rozptýleny. To jsou některé Windows-1252 Latinské znaky používané pro francouzština, protože tento evropský jazyk má historický význam v bývalých francouzských koloniích v severní Africe, jako např Maroko a Alžírsko. To umožnilo směšovat francouzský a arabský text při použití systému Windows 1256 bez nutnosti přepínání kódových stránek (velká písmena s diakritikou však nebyla zahrnuta).
IBM používá kódovou stránku 1256 (CCSID 1256, znak eura rozšířený CCSID 5352 a další rozšířený CCSID 9448) pro Windows-1256.[1][2][3][4]
Unicode je upřednostňován před Windows 1256 v moderních aplikacích, zejména na internetu; což znamená dominantní UTF-8 kódování webových stránek (viz také Arabské písmo v Unicode, pro úplné pokrytí, na rozdíl od např. Windows 1256 nebo ISO-8859-6 které nezahrnují doplňky). Méně než 0,1% všech webových stránek používá Windows-1256 v září 2019.[5][6]
Znaková sada
Od originálu kódová stránka vlevo 9 hodnot (bajtů) označených v původní specifikaci jako „NEPOUŽITO“,[7] tyto bajty byly použity později pro další znaky potřebné pro Perso-arabské písmo (pro Peršan a Urdu jazyky), plus znak eura.[8]
V následující tabulce je uvedena rozšířená verze systému Windows-1256. Každá postava je zobrazena s Unicode ekvivalent a jeho desetinný kód.
Zde je každé arabské písmeno zobrazeno v izolované formě. Skutečné tvary písmen uvnitř arabských slov jsou vykreslovány kombinací softwarových pravidel a vhodné podpory písem.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | ČR 000D | TAK 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | NAK 0015 | SYN 0016 | ETB 0017 | UMĚT 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | NÁS 001F |
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | A 0061 | b 0062 | C 0063 | d 0064 | E 0065 | F 0066 | G 0067 | h 0068 | i 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | Ó 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | proti 0076 | w 0077 | X 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | DEL 007F |
8_ 128 | € 20AC | پ 067E | ‚ 201A | ƒ 0192 | „ 201E | … 2026 | † 2020 | ‡ 2021 | ˆ 02C6 | ‰ 2030 | ٹ 0679 | ‹ 2039 | Œ 0152 | چ 0686 | ژ 0698 | ڈ 0688 |
9_ 144 | گ 06AF | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | ک 06A9 | ™ 2122 | ڑ 0691 | › 203A | - 0153 | ZWNJ 200 ° C | ZWJ 200D | ں 06BA |
A_ 160 | NBSP 00A0 | ، 060C | ¢ 00A2 | £ 00A3 | ¤ 00A4 | ¥ 00A5 | ¦ 00A6 | § 00A7 | ¨ 00A8 | © 00A9 | ھ 06BE | « 00AB | ¬ 00AC | PLACHÝ 00AD | ® 00AE | ¯ 00AF |
B_ 176 | ° 00B0 | ± 00B1 | ² 00B2 | ³ 00B3 | ´ 00B4 | µ 00B5 | ¶ 00B6 | · 00B7 | ¸ 00B8 | ¹ 00B9 | ؛ 061B | » 00BB | ¼ 00BC | ½ 00BD | ¾ 00BE | ؟ 061F |
C_ 192 | ہ 06C1 | ء 0621 | آ 0622 | أ 0623 | ؤ 0624 | إ 0625 | ئ 0626 | ا 0627 | ب 0628 | ة 0629 | ت 062A | ث 062B | ج 062C | ح 062D | خ 062E | د 062F |
D_ 208 | ذ 0630 | ر 0631 | ز 0632 | س 0633 | ش 0634 | ص 0635 | ض 0636 | × 00D7 | ط 0637 | ظ 0638 | ع 0639 | غ 063A | ـ 0640 | ف 0641 | ق 0642 | ك 0643 |
E_ 224 | A 00E0 | ل 0644 | A 00E2 | م 0645 | ن 0646 | ه 0647 | و 0648 | C 00E7 | E 00E8 | E 00E9 | E 00EA | E 00EB | ى 0649 | ي 064A | „ 00EE | ï 00EF |
F_ 240 | ً 064B | ٌ 064C | ٍ 064D | َ 064E | Ó 00F4 | ُ 064F | ِ 0650 | ÷ 00F7 | ّ 0651 | ù 00F9 | ْ 0652 | û 00FB | ü 00FC | LRM 200E | RLM 200F | ے 06D2 |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
Viz také
Reference
- ^ "Informační stránka kódové stránky 1256". Archivovány od originál dne 03.03.2016.
- ^ „Informační dokument CCSID 1256“. Archivovány od originál dne 2016-03-27.
- ^ „Informační dokument CCSID 5352“. Archivovány od originál dne 2014-11-29.
- ^ „Informační dokument CCSID 9448“. Archivovány od originál dne 2014-11-29.
- ^ „Historické trendy v používání kódování znaků pro webové stránky, září 2019“. w3techs.com.
- ^ "Často kladené otázky". w3techs.com.
- ^ Archivované dokumenty. „Kódová stránka 1256 Windows Arabština“. docs.microsoft.com.
- ^ A b „cp1256 do tabulky Unicode“ (PDF). www.unicode.org. Citováno 2019-05-31.
- ^ Unicode mapování systému Windows 1256 s „nejlepším přizpůsobením“
- ^ Kódová stránka CPGID 01256 (pdf) (PDF), IBM
- ^ Kódová stránka CPGID 01256 (txt), IBM
- ^ International Components for Unicode (ICU), ibm-1256_P110-1997.ucm, 2002-12-03
- ^ International Components for Unicode (ICU), ibm-5352_P100-1998.ucm, 2002-12-03
- ^ International Components for Unicode (ICU), ibm-9448_X100-2005.ucm, 2005-11-15