Nadnárodní znaková sada - Multinational Character Set
MIME / IANA | DEC-MCS |
---|---|
Alias (y) | IBM1100, CP1100, WE8DEC, csDECMCS, pros |
Jazyk (y) | Angličtina, různé další |
Rozšiřuje | USA-ASCII |
Uspěl | ISO 8859-1, LICS, BraSCII, Kódování korku |
The Nadnárodní znaková sada (DMCS nebo MCS) je Kódování znaků vytvořil v roce 1983 Digital Equipment Corporation (DEC) pro použití v populárních VT220 terminál. Jednalo se o 8bitové rozšíření ASCII který přidal znaky s diakritikou, symboly měny a další znakové glyfy chybí v 7bitovém ASCII. Je to jen jeden z kódové stránky implementováno pro VT220 Národní náhradní znaková sada (NRCS).[1][2] MCS je registrován jako IBM kódová stránka /CCSID 1100 (Nadnárodní emulace) od roku 1992.[3][4] V závislosti na přidruženém třídění Věštec volá to WE8DEC, N8DEC, DK8DEC, S8DECnebo SF8DEC.[5][6]
Takový "rozšířené ASCII „sady byly běžné (sada národních náhradních znaků poskytovala sady pro více než tucet evropských jazyků), ale MCS se vyznačuje tím, že je předchůdcem ECMA-94 v roce 1985[7] a ISO 8859-1 v roce 1987.[8]
Tabulka kódů MCS s ECMA-94, ISO 8859-1 a prvních 256 kódových bodů z Unicode mají mnohem více podobností než rozdílů. Kromě nepoužitých kódových bodů jsou rozdíly oproti ISO 8859-1:
Kódový bod MCS | Mapování Unicode | Charakter |
---|---|---|
0xA8 | U + 00A4 | ¤ |
0xD7 | U + 0152 | Œ |
0xDD | U + 0178 | Ÿ |
0xF7 | U + 0153 | - |
0xFD | U + 00FF | ÿ |
Znaková sada
Rozdíly od ISO-8859-1 jsou zobrazeny s tmavším stínováním nad jejich barvami legendy.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | ČR 000D | TAK 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | NAK 0015 | SYN 0016 | ETB 0017 | UMĚT 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | NÁS 001F |
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | A 0061 | b 0062 | C 0063 | d 0064 | E 0065 | F 0066 | G 0067 | h 0068 | i 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | Ó 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | proti 0076 | w 0077 | X 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | DEL 007F |
8_ 128 | IND 0084 | NEL 0085 | SSA 0086 | ESA 0087 | HTS 0088 | HTJ 0089 | VTS 008A | PLD 008B | PLU 008C | RI 008D | SS2 008E | SS3 008F | ||||
9_ 144 | DCS 0090 | PU1 0091 | PU2 0092 | STS 0093 | CCH 0094 | MW 0095 | LÁZNĚ 0096 | EPA 0097 | CSI 009B | SVATÝ 009C | OSC 009D | ODPOLEDNE 009E | APC 009F | |||
A_ 160 | ¡ 00A1 | ¢ 00A2 | £ 00A3 | ¥ 00A5 | § 00A7 | ¤ 00A4 | © 00A9 | ª 00AA | « 00AB | |||||||
B_ 176 | ° 00B0 | ± 00B1 | ² 00B2 | ³ 00B3 | µ 00B5 | ¶ 00B6 | · 00B7 | ¹ 00B9 | º 00BA | » 00BB | ¼ 00BC | ½ 00BD | ¿ 00BF | |||
C_ 192 | A 00C0 | A 00C1 | A 00C2 | A 00C3 | A 00C4 | A 00C5 | Æ 00C6 | C 00C7 | E 00C8 | E 00C9 | E 00CA | E 00CB | Ì 00CC | Í 00CD | Î 00CE | Ï 00CF |
D_ 208 | Ñ 00D1 | Ó 00D2 | Ó 00D3 | Ó 00D4 | Ó 00D5 | Ó 00D6 | Œ 0152 | Ó 00D8 | Ù 00D9 | Ú 00DA | Û 00 dB | " 00DC | Ÿ 0178 | ß 00DF | ||
E_ 224 | A 00E0 | A 00E1 | A 00E2 | A 00E3 | A 00E4 | A 00E5 | … 00E6 | C 00E7 | E 00E8 | E 00E9 | E 00EA | E 00EB | ì 00 ES | í 00ED | „ 00EE | ï 00EF |
F_ 240 | - 00F1 | Ó 00F2 | Ó 00F3 | Ó 00F4 | Ó 00F5 | Ó 00F6 | - 0153 | Ó 00F8 | ù 00F9 | ú 00FA | û 00FB | ü 00FC | ÿ 00FF |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
Viz také
- Mezinárodní znaková sada Lotus (LICS), velmi podobná znaková sada
- BraSCII, velmi podobná znaková sada
- 8bitový DEC řecky (Kódová stránka 1287 )
- 8bitový DEC turecký (Kódová stránka 1288 )
- 8bitová DEC hebrejština
- 8bitová DEC cyrilice (KOI-8 cyrilice )
- 8-bit Speciální grafika DEC (Čárový nákres VT100) (DEC-SPECIÁLNÍ )
- 8-bit Sada technických znaků DEC (DEC-TECHNICKÉ )
- DEC Kanji (JIS X 0208 )
Reference
- ^ „Referenční příručka k programátoru VT220“ (2. vyd.). Digital Equipment Corporation (DEC). 1984 [1983].
- ^ „TinyTERM Emulator - National Replacement Character Set (NRCS)“. Software století. Archivováno od originálu 2016-12-01. Citováno 2016-12-01. [sic]
- ^ A b „Informace o kódové stránce SBCS - CPGID: 01100 / Název: Mezinárodní emulace“. Software IBM: Globalizace: Kódované znakové sady a související zdroje: Kódové stránky podle CPGID: Identifikátory kódové stránky. 1. IBM. 1992-10-01. Archivováno z původního dne 2016-12-03. Citováno 2016-12-02. [1] [2] [3]
- ^ „Informační dokument CCSID 1100“. Archivovány od originál dne 01.12.2014.
- ^ Baird, Cathy; Chiba, Dan; Chu, Winson; Fan, Jessica; Ho, Claire; Law, Simon; Lee, Geoff; Linsley, Peter; Matsuda, Keni; Oscroft, Tamzin; Takeda, Shige; Tanaka, Linus; Tozawa, Makoto; Trute, Barry; Tsujimoto, Mayumi; Wu, Ying; Yau, Michael; Yu, Tim; Wang, Chao; Wong, Simon; Zhang, Weiran; Zheng, Lei; Zhu, Yan; Moore, Valarie (2002) [1996]. "Dodatek A: Národní data". Příručka podpory globalizace databáze Oracle9i (PDF) (Vydání 2 (9.2) ed.). Oracle Corporation. Oracle A96529-01. Archivováno (PDF) od originálu na 2017-02-14. Citováno 2017-02-14.
- ^ "Popisy sady znaků Oracle pro verzi 9.2". Chemické informační systémy denního světla. 2017. Archivováno od originálu 2016-06-17. Citováno 2017-02-14.
- ^ Standardní ECMA-94: 8bitová jednobajtová kódovaná sada grafických znaků (PDF) (1. vyd.). Evropská asociace výrobců počítačů (ECMA). Března 1985 [1984-12-14]. Archivováno (PDF) z původního dne 2016-12-02. Citováno 2016-12-01.
Od roku 1982 byla v ECMA i v ANSI / X3L2 rozpoznána naléhavost potřeby 8bitové jednobajtové kódované znakové sady a obě skupiny si vyměnily řadu pracovních dokumentů. V únoru 1984 ECMA TC1 předložila ISO / TC97 / SC2 návrh takové kódované znakové sady. Na svém zasedání v dubnu 1984 se SC rozhodl předložit TC97 návrh nového díla pro toto téma. Technické diskuse během a po tomto setkání vedly TC1 k přijetí kódovacího schématu navrženého X3L2. Část 1 návrhu mezinárodní normy DTS 8859 je založena na tomto společném návrhu ANSI / ECMA .... Přijato jako standard ECMA Valným shromážděním 13. - 14. prosince 1984.
- ^ Czyborra, Roman (1998). „ISO 8859-1 a MCS“. ISO 8859 abecední polévka. Archivováno od originálu 2016-12-01. Citováno 2016-12-01. [4] [5]
- ^ „Referenční příručka k programátoru VT220“. Digital Equipment Corporation (DEC). Tabulka 2-3: Mnohonárodnostní znaková sada DEC (kódy C1 a GR). Citováno 2016-12-02.
- ^ Uživatelská příručka VAX / VMS. Digital Equipment Corporation (DEC). Duben 1986. AI-Y517A-TE.
- ^ DEC (únor 1992) [listopad 1989]. "Kapitola 2: Kódování znaků - DEC doplňková sada grafických znaků". Referenční příručka k programátoru VT420 (PDF) (2. vyd.). Digital Equipment Corporation. str. 24–25. EK – VT420 – RM.002. Archivováno (PDF) z původního dne 2017-01-29. Citováno 2017-01-29.
- ^ Flohr, Guido (2016) [2006]. "Locale :: RecodeData :: DEC_MCS - převodní rutiny pro DEC_MCS". CPAN libintl-perl. 1.0. Archivováno od originálu dne 2017-01-14. Citováno 2017-01-14.
- ^ Kostis, Kosta. „DEC Multinational Character Set (DEC MCS)“. 1.20. Archivováno od originálu dne 2017-01-16. Citováno 2017-01-16.
- ^ Cowan, John Woldemar (1999-07-07). „DEC Multinational Character Set (1987) to Unicode“. 0.1. Unicode, Inc. Archivovány od originál dne 2017-02-18. Citováno 2017-02-18.