MIK (znaková sada) - MIK (character set)
MIK (МИК) je 8bitový cyrilice kódová stránka použitý s DOS. Je založen na znakové sadě použité v bulharštině Pravetz 16[1] IBM PC kompatibilní systém. Kermit volá tuto znakovou sadu "BULHARSKO-PC" / "bulharsko-pc".[2][3][4] V Bulharsku byl někdy nesprávně označován jako kódová stránka 856 (což je v rozporu s definicí IBM pro hebrejskou kódovou stránku). Tuto kódovou stránku zná FreeDOS tak jako Kódová stránka 3021.
Toto je nejrozšířenější DOS /OEM kódová stránka použitá v Bulharsko, spíše než CP 808, CP 855, CP 866 nebo CP 872.
Téměř každý program DOS vytvořený v Bulharsku, který má v sobě bulharské řetězce, používal jako kódování MIK a mnoho takových programů se stále používá.
Sada znaků
Každá postava je zobrazena s ekvivalentem Unicode bod kódu a jeho desetinný bod kódu. Je zobrazena pouze druhá polovina tabulky (kódové body 128–255), přičemž první polovina (kódové body 0–127) je stejná jako ASCII.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ | А 0410 128 | Б 0411 129 | В 0412 130 | Г 0413 131 | Д 0414 132 | Е 0415 133 | Ж 0416 134 | З 0417 135 | И 0418 136 | Й 0419 137 | К 041A 138 | Л 041B 139 | М 041C 140 | Н 041D 141 | О 041E 142 | П 041F 143 |
9_ | Р 0420 144 | С 0421 145 | Т 0422 146 | У 0423 147 | Ф 0424 148 | Х 0425 149 | Ц 0426 150 | Ч 0427 151 | Ш 0428 152 | Щ 0429 153 | Ъ 042A 154 | Ы 042B 155 | Ь 042C 156 | Э 042D 157 | Ю 042E 158 | Я 042F 159 |
A_ | а 0430 160 | б 0431 161 | в 0432 162 | г 0433 163 | д 0434 164 | е 0435 165 | ж 0436 166 | з 0437 167 | č 0438 168 | © 0439 169 | к 043A 170 | л 043B 171 | м 043C 172 | n 043D 173 | о 043E 174 | п 043F 175 |
B_ | р 0440 176 | с 0441 177 | т 0442 178 | у 0443 179 | ф 0444 180 | х 0445 181 | ц 0446 182 | ч 0447 183 | ш 0448 184 | щ 0449 185 | ъ 044A 186 | ы 044B 187 | ь 044C 188 | э 044D 189 | ю 044E 190 | я 044F 191 |
C_ | └ 2514 192 | ┴ 2534 193 | ┬ 252C 194 | ├ 251C 195 | ─ 2500 196 | ┼ 253C 197 | ╣ 2563 198 | ║ 2551 199 | ╚ 255A 200 | ╔ 2554 201 | ╩ 2569 202 | ╦ 2566 203 | ╠ 2560 204 | ═ 2550 205 | ╬ 256C 206 | ┐ 2510 207 |
D_ | ░ 2591 208 | ▒ 2592 209 | ▓ 2593 210 | │ 2502 211 | ┤ 2524 212 | № 2116 213 | § 00A7 214 | ╗ 2557 215 | ╝ 255D 216 | ┘ 2518 217 | ┌ 250 ° C 218 | █ 2588 219 | ▄ 2584 220 | ▌ 258C 221 | ▐ 2590 222 | ▀ 2580 223 |
E_ | α 03B1 224 | ß 00DF[poznámka 1] 225 | Γ 0393 226 | π 03C0 227 | Σ 03A3[pozn. 2] 228 | σ 03C3 229 | µ 00B5[pozn. 3] 230 | τ 03C4 231 | Φ 03A6 232 | Θ 0398 233 | Ω 03A9[pozn. 4] 234 | δ 03B4 235 | ∞ 221E 236 | φ 03C6 237 | ε 03B5[pozn. 5] 238 | ∩ 2229 239 |
F_ | ≡ 2261 240 | ± 00B1 241 | ≥ 2265 242 | ≤ 2264 243 | ⌠ 2320 244 | ⌡ 2321 245 | ÷ 00F7 246 | ≈ 2248 247 | ° 00B0 248 | ∙ 2219 249 | · 00B7 250 | √ 221A 251 | ⁿ 207F 252 | ² 00B2 253 | ■ 25A0 254 | NBSP 00A0 255 |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
Poznámky pro implementátory mapovacích tabulek do Unicode
Implementátoři mapovacích tabulek na Unicode by si měli všimnout stránky MIK Code sjednocuje některé znaky:
- ^ 0xE1 je německý jazyk ostrý S. (U + 00DF, ß) a řecká malá písmena beta (U + 03B2, p);
- ^ 0xE4 je jak n-ary součtový znak (U + 2211, ∑) a řecká velká písmena sigma (U + 03A3, Σ);
- ^ 0xE6 je jak mikro znamení (U + 00B5, µ) a řecká malá písmena mu (U + 03BC, μ);
- ^ 0xEA je obojí Ohm znak (U + 2126, Ω) a řecká velká písmena omega (U + 03A9, Ω);
- ^ 0xEE je obojí prvek znak (U + 2208, ∈) a řecká malá písmena epsilon (U + 03B5, ε)!
Manipulace s binárními znaky
The MIK kódová stránka udržuje v abecedním pořadí všechna písmena cyrilice, což umožňuje velmi snadnou manipulaci se znaky v binární podobě:
10xx xxxx - je azbuka
100x xxxx - je velké písmeno cyrilice
101x xxxx - je malá cyrilice
V takovém případě funkce testování a manipulace se znaky jako:
IsAlpha (), IsUpper (), IsLower (), ToUpper () a ToLower (),
jsou bitové operace a řazení probíhá jednoduchým porovnáním hodnot znaků.
Viz také
Reference
- ^ "Pravetz 16". Archivováno od originálu 2016-12-06. Citováno 2016-12-06.
- ^ da Cruz, Frank (02.04.2010). „Názvy znakové sady Kermit a MIME“. Projekt Kermit. Columbia University, New York, USA. Archivováno z původního dne 2016-12-03. Citováno 2016-12-02.
- ^ http://www.kermitproject.org/k95manual/cyrillic.html
- ^ A b http://www.columbia.edu/kermit/ftp/charsets/cp856.txt
- ^ Czyborra, Roman (30. 11. 1998) [1998-05-25]. „Polévka cyrilice“. Archivováno z původního dne 2016-12-03. Citováno 2016-12-03. [1] [2]
- ^ Hohlov, Yu. E. „Reprezentace cyrilice v elektronické podobě - tabulky znakových sad (znaková stránka)“. Archivováno z původního dne 2016-12-05. Citováno 2016-12-05.
externí odkazy
- https://www.unicode.org/Public/MAPPINGS/VENDORS/IBM/IBM_conversions.html Mapování konsorcia Unicode mezi kódovými stránkami IBM a Unicode
- http://www.cl.cam.ac.uk/~mgk25/unicode.html#conv Časté dotazy k UTF-8 a Unicode pro Unix / Linux Markus Kuhn