Znakové sady západní latiny (výpočetní technika) - Western Latin character sets (computing)
Několik binárních reprezentací 8bitových znakové sady pro běžné Západoevropský jazyky jsou porovnávány v tomto článku. Tato kódování byla navržena pro reprezentaci italština, španělština, portugalština, francouzština, Němec, holandský, Angličtina, dánština, švédský, Norština, a islandský, které používají latinka, několik dalších písmen a těch s předkomponovanými diakritiky, někteří interpunkce a různé symboly (včetně některých řeckých písmen). Ačkoli se jim říká „západoevropský“, mnoho z těchto jazyků se používá po celém světě. Také tyto znakové sady podporují mnoho dalších jazyků, jako je Malajština, Svahilština, a Klasická latina.
Tento materiál je technicky zastaralý a byl funkčně nahrazen Unicode. Stále však má historický zájem.
souhrn
The ISO-8859 řada 8-bit znakové sady kóduje vše latinský znakové sady používané v Evropa, i když to samé kódové body mít více použití, které způsobily určité potíže (včetně mojibake nebo zkomolené znaky a problémy s komunikací). Příchod Unicode s jedinečným kódovým bodem pro každého glyf, tyto problémy vyřešil.
- ISO / IEC 8859-1 nebo Latinka-1 je nejpoužívanější a také definuje prvních 256 kódy v Unicode.
- ISO / IEC 8859-15 upravuje ISO-8859-1 plně podporovat estonština, Finština a francouzština a přidejte znak eura.
- Windows-1252 je nadmnožinou ISO-8859-1 který zahrnuje tisknutelné znaky z ISO / IEC 8859-15 a populární interpunkce například zakřivené uvozovky (také známý jako chytré uvozovky, například v Microsoft Word nastavení a podobné programy). To je běžné nástroje pro webové stránky pro Okna použijte Windows-1252, ale označte webová stránka protože používá ISO-8859-1, toto bylo řešeno v HTML5, který nařizuje, aby stránky označené jako ISO-8859-1 musí být interpretovány jako Windows-1252.
- IBM CP437, které jsou určeny pro Angličtina pouze, má velmi málo v cestě písmena s diakritikou (zejména velká písmena ), ale má mnohem více grafické znaky než ostatní IBM kódové stránky zde uvedené a také některé matematický a Řecké znaky které jsou užitečné jako technické symboly.
- IBM CP850 má všechny tisknutelné znaky že ISO-8859-1 má (i když uspořádáno jinak) a stále dokáže mít dost grafické znaky vybudovat použitelný textový režim uživatelské rozhraní.
- IBM CP858 se liší od CP850 pouze jedním znakem - a dotless i (já ), zřídka používaný mimo Turecko a bez č velká písmena ekvivalent za předpokladu, byl nahrazen znak měny euro (€ ).[1]
- IBM CP859 obsahuje všechny tisknutelné znaky že ISO / IEC 8859-15 má, tak na rozdíl CP850 podporuje znak eura, estonština, Finština a francouzština.
- Kódové stránky IBM 037, 500 a 1047 jsou EBCDIC kódování, která zahrnují všechny ISO-8859-1 postavy.
- The Mac OS Roman znaková sada (často označovaná jako MacRoman a známé pod IANA jak jednoduše MACINTOSH) má většinu, ale ne všechny, stejných znaků jako ISO / IEC 8859-1 ale ve velmi odlišném uspořádání; a také přidává mnoho technických a matematické znaky (ačkoli to postrádá důležité × ) a více diakritiky. Starší Macintosh internetové prohlížeče bylo známo munge těch pár postav, ve kterých bylo ISO / IEC 8859-1 ale ne jejich rodák Macintosh znaková sada při úpravách textu z Webové stránky. Naopak, ve webovém materiálu připraveném na starším počítači Macintosh bylo mnoho znaků zobrazeny nesprávně při čtení jinými operační systémy. The Latinské kódování pro Macintosh, modifikaci Mac OS Roman na podporu ISO / IEC 8859-1, vytvořili tvůrci Kermit (protokol) k vyřešení tohoto problému.
Dějiny
Dřívější sedmbit NÁS. Americký standardní kód pro výměnu informací ('ASCII') kódování má znaky dostatečné k tomu, aby správně reprezentovalo pouze několik jazyků, jako je angličtina, latina, malajština a svahilština. Chybí některá písmena a kombinace písmen a písmen v jiných jazycích latinky a abecedy. Jelikož však na většině počítačových platforem poskytovaných USA neexistovala jiná možnost, použití ASCII bylo nevyhnutelné, kromě případů, kdy existoval silný národní výpočetní průmysl. Tam byl ISO 646 skupina kódování, která nahradila některé symboly v ASCII místními znaky, ale prostor byl velmi omezený a některé nahrazené symboly byly ve věcech, jako jsou programovací jazyky, docela běžné.
Většina počítačů interně používala 8bitové bajty, ale komunikace (považovaná za inherentně nespolehlivou) používala sedm datových bitů plus jeden paritní bit. Časem se stalo běžným používat všech osm bitů pro data, čímž se vytvořil prostor pro dalších 128 znaků. V počátcích byla většina z nich specifická pro systém, ale postupně ISO / IEC 8859 objevily se standardy, které poskytují určitou multiplatformní podobnost umožňující výměnu informací.
Ke konci 20. století, kdy klesly náklady na úložiště a paměť, přestaly být problémy spojené s více významy daného osmibitového kódu (existuje pouze sedm sad kódů ISO-latina) oprávněné. Všechny hlavní operační systémy byly přesunuty do Unicode jako jejich hlavní vnitřní reprezentace. Protože však Windows nepodporoval UTF-8 způsob kódování Unicode (přednost UTF-16 ), mnoho aplikací bylo i nadále omezeno na tyto starší znakové sady.
Symbol měny euro
The euro a jeho znak eura zavedl značný tlak na podporu znaku eura (€) a většina 8bitových znakových sad musela být nějakým způsobem upravena.
- Apple s MacRoman a Sun Microsystems s Solaris OS jednoduše nahradil obecný znak měny (¤ ). To způsobilo značné potíže, protože organizace pro to našly jiné využití, například logo společnosti.
- ISO představilo další variantu ISO 8859, ISO 8859-15, který nahradil obecný znak měny znakem eura a provedl další nahrazení symbolů písmeny s diakritikou. ISO 8859-15 nikdy neobdržela široké přijetí.
- S Windows-1252 Microsoft umístil znak eura do mezery (pozice 80hex) ve stávajícím Řídicí kódy C1.
Všechny tyto problémy byly vyřešeny, protože operační systémy byly upgradovány na podporu Unicode jako standard, který kóduje znak eura na U + 20AC (desítkově 8364).
Srovnávací tabulka
Kódové body U + 0000 na U + 007F se v této tabulce aktuálně nezobrazují, protože jsou přímo mapovány ve všech zde uvedených znakových sadách. The ASCII standard kódování definuje původní specifikaci pro mapování prvních 0-127 znaků.
Tabulka je uspořádána podle Unicode kódový bod. Na znakové sady zde odkazuje jejich IANA jména v velká písmena.
Charakter | Kódový bod | ISO-8859-1 | ISO-8859-15 | OKNA-1252 | IBM437 | IBM850 | MACINTOSH |
---|---|---|---|---|---|---|---|
NBSP | U + 00A0 | A0 | A0 | A0 | FF | FF | CA |
¡ | U + 00A1 | A1 | A1 | A1 | INZERÁT | INZERÁT | C1 |
¢ | U + 00A2 | A2 | A2 | A2 | 9B | BD | A2 |
£ | U + 00A3 | A3 | A3 | A3 | 9C | 9C | A3 |
¤ | U + 00A4 | A4 | A4 | CF | |||
¥ | U + 00A5 | A5 | A5 | A5 | 9D | BÝT | B4 |
¦ | U + 00A6 | A6 | A6 | DD | |||
§ | U + 00A7 | A7 | A7 | A7 | F5 | A4 | |
¨ | U + 00A8 | A8 | A8 | F9 | AC | ||
© | U + 00A9 | A9 | A9 | A9 | B8 | A9 | |
ª | U + 00AA | AA | AA | AA | A6 | A6 | BB |
« | U + 00AB | AB | AB | AB | AE | AE | C7 |
¬ | U + 00AC | AC | AC | AC | AA | AA | C2 |
PLACHÝ | U + 00AD | INZERÁT | INZERÁT | INZERÁT | F0 | ||
® | U + 00AE | AE | AE | AE | A9 | A8 | |
¯ | U + 00AF | AF | AF | AF | EE | F8 | |
Charakter | Kódový bod | ISO-8859-1 | ISO-8859-15 | OKNA-1252 | IBM437 | IBM850 | MACINTOSH |
° | U + 00B0 | B0 | B0 | B0 | F8 | F8 | A1 |
± | U + 00B1 | B1 | B1 | B1 | F1 | F1 | B1 |
² | U + 00B2 | B2 | B2 | B2 | FD | FD | |
³ | U + 00B3 | B3 | B3 | B3 | FC | ||
´ | U + 00B4 | B4 | B4 | EF | AB | ||
µ | U + 00B5 | B5 | B5 | B5 | E6 | E6 | B5 |
¶ | U + 00B6 | B6 | B6 | B6 | F4 | A6 | |
· | U + 00B7 | B7 | B7 | B7 | FA | FA | E1 |
¸ | U + 00B8 | B8 | B8 | F7 | FC | ||
¹ | U + 00B9 | B9 | B9 | B9 | FB | ||
º | U + 00BA | BA | BA | BA | A7 | A7 | před naším letopočtem |
» | U + 00BB | BB | BB | BB | AF | AF | C8 |
¼ | U + 00BC | před naším letopočtem | před naším letopočtem | AC | AC | ||
½ | U + 00BD | BD | BD | AB | AB | ||
¾ | U + 00BE | BÝT | BÝT | F3 | |||
¿ | U + 00BF | BF | BF | BF | A8 | A8 | C0 |
Charakter | Kódový bod | ISO-8859-1 | ISO-8859-15 | OKNA-1252 | IBM437 | IBM850 | MACINTOSH |
A | U + 00C0 | C0 | C0 | C0 | B7 | CB | |
A | U + 00C1 | C1 | C1 | C1 | B5 | E7 | |
A | U + 00C2 | C2 | C2 | C2 | B6 | E5 | |
A | U + 00C3 | C3 | C3 | C3 | C7 | CC | |
A | U + 00C4 | C4 | C4 | C4 | 8E | 8E | 80 |
A | U + 00C5 | C5 | C5 | C5 | 8F | 8F | 81 |
Æ | U + 00C6 | C6 | C6 | C6 | 92 | 92 | AE |
C | U + 00C7 | C7 | C7 | C7 | 80 | 80 | 82 |
E | U + 00C8 | C8 | C8 | C8 | D4 | E9 | |
E | U + 00C9 | C9 | C9 | C9 | 90 | 90 | 83 |
E | U + 00CA | CA | CA | CA | D2 | E6 | |
E | U + 00CB | CB | CB | CB | D3 | E8 | |
Ì | U + 00CC | CC | CC | CC | DE | ED | |
Í | U + 00CD | CD | CD | CD | D6 | EA | |
Î | U + 00CE | CE | CE | CE | D7 | EB | |
Ï | U + 00CF | CF | CF | CF | D8 | ES | |
Charakter | Kódový bod | ISO-8859-1 | ISO-8859-15 | OKNA-1252 | IBM437 | IBM850 | MACINTOSH |
Ð | U + 00D0 | D0 | D0 | D0 | D1 | ||
Ñ | U + 00D1 | D1 | D1 | D1 | A5 | A5 | 84 |
Ó | U + 00D2 | D2 | D2 | D2 | E3 | F1 | |
Ó | U + 00D3 | D3 | D3 | D3 | E0 | EE | |
Ó | U + 00D4 | D4 | D4 | D4 | E2 | EF | |
Ó | U + 00D5 | D5 | D5 | D5 | E5 | CD | |
Ó | U + 00D6 | D6 | D6 | D6 | 99 | 99 | 85 |
× | U + 00D7 | D7 | D7 | D7 | 9E | ||
Ó | U + 00D8 | D8 | D8 | D8 | 9D | AF | |
Ù | U + 00D9 | D9 | D9 | D9 | EB | F4 | |
Ú | U + 00DA | DA | DA | DA | E9 | F2 | |
Û | U + 00 dB | DB | DB | DB | EA | F3 | |
" | U + 00DC | DC | DC | DC | 9A | 9A | 86 |
“ | U + 00DD | DD | DD | DD | ED | ||
Þ | U + 00DE | DE | DE | DE | E8 | ||
ß | U + 00DF | DF | DF | DF | E1 | E1 | A7 |
Charakter | Kódový bod | ISO-8859-1 | ISO-8859-15 | OKNA-1252 | IBM437 | IBM850 | MACINTOSH |
A | U + 00E0 | E0 | E0 | E0 | 85 | 85 | 88 |
A | U + 00E1 | E1 | E1 | E1 | A0 | A0 | 87 |
A | U + 00E2 | E2 | E2 | E2 | 83 | 83 | 89 |
A | U + 00E3 | E3 | E3 | E3 | C6 | 8B | |
A | U + 00E4 | E4 | E4 | E4 | 84 | 84 | 8A |
A | U + 00E5 | E5 | E5 | E5 | 86 | 86 | 8C |
… | U + 00E6 | E6 | E6 | E6 | 91 | 91 | BÝT |
C | U + 00E7 | E7 | E7 | E7 | 87 | 87 | 8D |
E | U + 00E8 | E8 | E8 | E8 | 8A | 8A | 8F |
E | U + 00E9 | E9 | E9 | E9 | 82 | 82 | 8E |
E | U + 00EA | EA | EA | EA | 88 | 88 | 90 |
E | U + 00EB | EB | EB | EB | 89 | 89 | 91 |
ì | U + 00EC | ES | ES | ES | 8D | 8D | 93 |
í | U + 00ED | ED | ED | ED | A1 | A1 | 92 |
„ | U + 00EE | EE | EE | EE | 8C | 8C | 94 |
ï | U + 00EF | EF | EF | EF | 8B | 8B | 95 |
Charakter | Kódový bod | ISO-8859-1 | ISO-8859-15 | OKNA-1252 | IBM437 | IBM850 | MACINTOSH |
ð | U + 00F0 | F0 | F0 | F0 | D0 | ||
- | U + 00F1 | F1 | F1 | F1 | A4 | A4 | 96 |
Ó | U + 00F2 | F2 | F2 | F2 | 95 | 95 | 98 |
Ó | U + 00F3 | F3 | F3 | F3 | A2 | A2 | 97 |
Ó | U + 00F4 | F4 | F4 | F4 | 93 | 93 | 99 |
Ó | U + 00F5 | F5 | F5 | F5 | E4 | 9B | |
Ó | U + 00F6 | F6 | F6 | F6 | 94 | 94 | 9A |
÷ | U + 00F7 | F7 | F7 | F7 | F6 | F6 | D6 |
Ó | U + 00F8 | F8 | F8 | F8 | 9B | BF | |
ù | U + 00F9 | F9 | F9 | F9 | 97 | 97 | 9D |
ú | U + 00FA | FA | FA | FA | A3 | A3 | 9C |
û | U + 00FB | FB | FB | FB | 96 | 96 | 9E |
ü | U + 00FC | FC | FC | FC | 81 | 81 | 9F |
ý | U + 00FD | FD | FD | FD | ES | ||
þ | U + 00FE | FE | FE | FE | E7 | ||
ÿ | U + 00FF | FF | FF | FF | 98 | 98 | D8 |
Charakter | Kódový bod | ISO-8859-1 | ISO-8859-15 | OKNA-1252 | IBM437 | IBM850 | MACINTOSH |
já | U + 0131 | D5 | F5 | ||||
Œ | U + 0152 | před naším letopočtem | 8C | CE | |||
- | U + 0153 | BD | 9C | CF | |||
Š | U + 0160 | A6 | 8A | ||||
š | U + 0161 | A8 | 9A | ||||
Ÿ | U + 0178 | BÝT | 9F | D9 | |||
Ž | U + 017D | B4 | 8E | ||||
ž | U + 017E | B8 | 9E | ||||
ƒ | U + 0192 | 83 | 9F | 9F | C4 | ||
ˆ | U + 02C6 | 88 | F6 | ||||
ˇ | U + 02C7 | FF | |||||
˘ | U + 02D8 | F9 | |||||
˙ | U + 02D9 | FA | |||||
˚ | U + 02DA | FB | |||||
˛ | U + 02 dB | FE | |||||
˜ | U + 02DC | 98 | F7 | ||||
Charakter | Kódový bod | ISO-8859-1 | ISO-8859-15 | OKNA-1252 | IBM437 | IBM850 | MACINTOSH |
˝ | U + 02DD | FD | |||||
Γ | U + 0393 | E2 | |||||
Θ | U + 0398 | E9 | |||||
Σ | U + 03A3 | E4 | |||||
Φ | U + 03A6 | E8 | |||||
Ω | U + 03A9 | EA | BD | ||||
α | U + 03B1 | E0 | |||||
δ | U + 03B4 | EB | |||||
ε | U + 03B5 | EE | |||||
π | U + 03C0 | E3 | B9 | ||||
σ | U + 03C3 | E5 | |||||
τ | U + 03C4 | E7 | |||||
φ | U + 03C6 | ED | |||||
– | U + 2013 | 96 | D0 | ||||
— | U + 2014 | 97 | D1 | ||||
‗ | U + 2017 | F2 | |||||
Charakter | Kódový bod | ISO-8859-1 | ISO-8859-15 | OKNA-1252 | IBM437 | IBM850 | MACINTOSH |
‘ | U + 2018 | 91 | D4 | ||||
’ | U + 2019 | 92 | D5 | ||||
‚ | U + 201A | 82 | E2 | ||||
“ | U + 201C | 93 | D2 | ||||
” | U + 201D | 94 | D3 | ||||
„ | U + 201E | 84 | E3 | ||||
† | U + 2020 | 86 | A0 | ||||
‡ | U + 2021 | 87 | E0 | ||||
• | U + 2022 | 95 | A5 | ||||
… | U + 2026 | 85 | C9 | ||||
‰ | U + 2030 | 89 | E4 | ||||
‹ | U + 2039 | 8B | DC | ||||
› | U + 203A | 9B | DD | ||||
⁄ | U + 2044 | DA | |||||
ⁿ | U + 207F | FC | |||||
₧ | U + 20A7 | 9E | |||||
Charakter | Kódový bod | ISO-8859-1 | ISO-8859-15 | OKNA-1252 | IBM437 | IBM850 | MACINTOSH |
€ | U + 20AC | A4 | 80 | (D5)[poznámka 1][2][3] | DB | ||
™ | U + 2122 | 99 | AA | ||||
∂ | U + 2202 | B6 | |||||
∆ | U + 2206 | C6 | |||||
∏ | U + 220F | B8 | |||||
∑ | U + 2211 | B7 | |||||
∙ | U + 2219 | F9 | |||||
√ | U + 221A | FB | C3 | ||||
∞ | U + 221E | ES | B0 | ||||
∩ | U + 2229 | EF | |||||
∫ | U + 222B | BA | |||||
≈ | U + 2248 | F7 | C5 | ||||
≠ | U + 2260 | INZERÁT | |||||
≡ | U + 2261 | F0 | |||||
≤ | U + 2264 | F3 | B2 | ||||
≥ | U + 2265 | F2 | B3 | ||||
Charakter | Kódový bod | ISO-8859-1 | ISO-8859-15 | OKNA-1252 | IBM437 | IBM850 | MACINTOSH |
⌐ | U + 2310 | A9 | |||||
⌠ | U + 2320 | F4 | |||||
⌡ | U + 2321 | F5 | |||||
─ | U + 2500 | C4 | C4 | ||||
│ | U + 2502 | B3 | B3 | ||||
┌ | U + 250 ° C | DA | DA | ||||
┐ | U + 2510 | BF | BF | ||||
└ | U + 2514 | C0 | C0 | ||||
┘ | U + 2518 | D9 | D9 | ||||
├ | U + 251C | C3 | C3 | ||||
┤ | U + 2524 | B4 | B4 | ||||
┬ | U + 252C | C2 | C2 | ||||
┴ | U + 2534 | C1 | C1 | ||||
┼ | U + 253C | C5 | C5 | ||||
═ | U + 2550 | CD | CD | ||||
║ | U + 2551 | BA | BA | ||||
Charakter | Kódový bod | ISO-8859-1 | ISO-8859-15 | OKNA-1252 | IBM437 | IBM850 | MACINTOSH |
╒ | U + 2552 | D5 | |||||
╓ | U + 2553 | D6 | |||||
╔ | U + 2554 | C9 | C9 | ||||
╕ | U + 2555 | B8 | |||||
╖ | U + 2556 | B7 | |||||
╗ | U + 2557 | BB | BB | ||||
╘ | U + 2558 | D4 | |||||
╙ | U + 2559 | D3 | |||||
╚ | U + 255A | C8 | C8 | ||||
╛ | U + 255B | BÝT | |||||
╜ | U + 255 ° C | BD | |||||
╝ | U + 255D | před naším letopočtem | před naším letopočtem | ||||
╞ | U + 255E | C6 | |||||
╟ | U + 255F | C7 | |||||
╠ | U + 2560 | CC | CC | ||||
╡ | U + 2561 | B5 | |||||
Charakter | Kódový bod | ISO-8859-1 | ISO-8859-15 | OKNA-1252 | IBM437 | IBM850 | MACINTOSH |
╢ | U + 2562 | B6 | |||||
╣ | U + 2563 | B9 | B9 | ||||
╤ | U + 2564 | D1 | |||||
╥ | U + 2565 | D2 | |||||
╦ | U + 2566 | CB | CB | ||||
╧ | U + 2567 | CF | |||||
╨ | U + 2568 | D0 | |||||
╩ | U + 2569 | CA | CA | ||||
╪ | U + 256A | D8 | |||||
╫ | U + 256B | D7 | |||||
╬ | U + 256C | CE | CE | ||||
▀ | U + 2580 | DF | DF | ||||
▄ | U + 2584 | DC | DC | ||||
█ | U + 2588 | DB | DB | ||||
▌ | U + 258C | DD | |||||
▐ | U + 2590 | DE | |||||
Charakter | Kódový bod | ISO-8859-1 | ISO-8859-15 | OKNA-1252 | IBM437 | IBM850 | MACINTOSH |
░ | U + 2591 | B0 | B0 | ||||
▒ | U + 2592 | B1 | B1 | ||||
▓ | U + 2593 | B2 | B2 | ||||
■ | U + 25A0 | FE | FE | ||||
◊ | U + 25CA | D7 | |||||
fi | U + FB01 | DE | |||||
fl | U + FB02 | DF |
- Mapování kódových stránek IBM pochází z Unicode web poskytl Microsoft. Viz dokument konsorcia Unicode na webu rozdíly mezi mapováním IBM a Microsoft pro tyto kódové stránky.
- IBM437 a IBM850 definovaly tisknutelné znaky pro rozsahy řídicích kódů. I když je nelze použít při tisku textu DOS, protože by byly uvězněny před dosažením obrazovky, mohly by být použity aplikacemi, které přímo používaly paměť obrazovky.
- Macintosh má logo Apple ⟨⟩ na 0xF0 a překládá jej na U + F8FF v Oblast pro soukromé použití pro Unicode.
Poznámky
- ^ IBM PC DOS 2000, vydané v roce 1998, změnily svou definici kódové stránky 850 na to, čemu říkaly upravená kódová stránka 850 nyní včetně přidání znaku eura v kódovém bodě 213 místo přidání nové kódová stránka 858. Důvodem pro to mohla být stávající omezení při implementaci logiky přepínání kódových stránek pod MS-DOS /PC DOS, která omezila soubory .CPI na velikost 64 kB nebo maximálně asi šest kódových stránek, omezení, které bylo obcházeno v některých verzích OEM systému MS-DOS, v Windows NT, a také neexistuje v DR-DOS. Analyzátor v systému MS-DOS / PC DOS dále omezuje počet možných záznamů o zemi / kódové stránce COUNTRY.SYS souborů na maximálně 146 nebo 438, omezení v DR-DOS neexistuje. Přidání podpory pro kódovou stránku 858 tedy mohlo znamenat, že se současně vypustí další (např. Kódová stránka 850), což v té době možná nebylo životaschopné řešení, vzhledem k tomu, že některé aplikace používaly kódovou stránku 850 pevně.
Reference
- ^ "00858". Kódové stránky podle CPGID. IBM. Archivováno od originálu 06.06.2016. Citováno 2016-06-06.
- ^ Paul, Matthias R. (2001-08-15). „Změna kódových stránek ve FreeDOS“ (Technická specifikace designu založená na příspěvku fd-dev [1] ). Archivovány od originál dne 06.06.2016. Citováno 2016-06-06.
Nové oficiální ID pro vícejazyčnou „kódovou stránku 850 s EURO SIGN“ je 858, nikoli 850. IBM s budoucími vydáními svých produktů přejde na používání 858 místo 850 variant. [...] Mohu jen hádat, proč k tomu nepřidali 858 EGAx.CPI, COUNTRY.SYS, a KEYBOARD.SYS soubory v PC DOS 2000. Mnoho aplikací třetích stran je navrženo pro práci s 850 a v době vydání PC DOS 2000 nevědělo o 858, takže je to pro všechny jednodušší, ale bohužel není kompatibilní. […] Jak je vysvětleno výše, COUNTRY.SYS a KEYBOARD.SYS obsahují pouze dvě položky kódové stránky pro danou zemi v západních číslech systému DOS. (V arabských a hebrejských číslech může existovat až 8 kódových stránek pro jednu zemi, teoreticky není limit pod rozsahem povolených kódových stránek 1..65534). […] Problém je v tom, že odebrání podpory pro 850 mohlo způsobit problémy s kompatibilitou s aplikacemi, které jsou pevně připojeny k použití 850. Přidání čísla 858 jako třetí volby ke všem souborům by významně zvýšilo velikost souborů a tabulek. Analyzátor souborů COUNTRY.SYS v systému MS-DOS / PC DOS IO.SYS /IBMBIO.COM vyhrazuje poznámkový blok 6 kB (pro DOS 6) k načtení všech informací. To umožňuje přijetí maximálně 438 položek v souboru COUNTRY.SYS, jinak se zobrazí zpráva „COUNTRY.SYS too large.“. The NLSFUNC analyzátor toto omezení nemá a analyzátory souborů v systému DR-DOS (jádro a NLSFUNC) o takovém omezení také nevědí. Starší vydání systému MS-DOS / PC DOS měla dokonce 2 kB vyrovnávací paměť pro maximálně 146 položek.
- ^ Paul, Matthias R. (2001-08-27). „Změna kódových stránek ve FreeDOS (následná kontrola)“. Archivováno od originálu dne 2014-10-01. Citováno 2013-05-08.
[…] Lze také bez potíží vytvořit vlastní soubory .CPI v tradičním stylu FONT, ale do takového souboru byste mohli uložit pouze […] šest kódových stránek, pokud by to mělo být použitelné pro MS-DOS / PC DOS (některé OEM problémy a NT zvládne soubory větší než 64 kB, ale MS-DOS / PC DOS ne).