Kódování korku - Cork encoding - Wikipedia
The Korek (také známý jako T1 nebo ES) kódování je a Kódování znaků používá se pro kódování glyfy v písma.[1] Je pojmenována podle města Korek v Irsko, kde během a Skupina uživatelů TeX (TUG) konference v roce 1990 bylo zavedeno nové kódování pro Latex.[1] Obsahuje 256 znaků podporujících většinu západoevropských a východoevropských jazyků latinka.[2]
Detaily
V 8bitové TeX motory kódování písma musí odpovídat kódování vzory dělení slov kde se toto kódování nejčastěji používá.[3] v Latex lze přepnout na toto kódování pomocí usepackage [T1] {fontenc}
, zatímco v Kontext MkII toto je již výchozí kódování. V moderních motorech, jako je XeTeX a LuaTeX Unicode je plně podporován a 8bitové kódování písem je zastaralé.
Znaková sada
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ` 0060 | ´ 00B4 | ˆ 02C6 | ˜ 02DC | ¨ 00A8 | ˝ 02DD | ˚ 02DA | ˇ 02C7 | ˘ 02D8 | ¯ 00AF | ˙ 02D9 | ¸ 00B8 | ˛ 02DB | ‚ 201A | ‹ 2039 | › 203A |
1_ 16 | “ 201C | ” 201D | „ 201E | « 00AB | » 00BB | – 2013 | — 2014 | ZWSP 200B | ₀[A] 2080 | já[b] 0131 | ȷ[b] 0237 | ff FB00 | fi FB01 | fl FB02 | ffi FB03 | ffl FB04 |
2_ 32 | 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ’ 2019 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ‘ 2018 | A 0061 | b 0062 | C 0063 | d 0064 | E 0065 | F 0066 | G 0067 | h 0068 | i 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | Ó 006F |
7_ 112 | str 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | proti 0076 | w 0077 | X 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | PLACHÝ[C] 00AD |
8_ 128 | A 0102 | A 0104 | C 0106 | C 010C | Ď 010E | E 011A | E 0118 | G 011E | Ĺ 0139 | Ľ 013D | Ł 0141 | Ń 0143 | Ň 0147 | Ŋ 014A | Ó 0150 | Ŕ 0154 |
9_ 144 | Ř 0158 | Ś 015A | Š 0160 | Ş 015E | Ť 0164 | Ţ 0162 | Ű 0170 | Ů 016E | Ÿ 0178 | Ź 0179 | Ž 017D | Ż 017B | IJ 0132 | İ 0130 | đ 0111 | § 00A7 |
A_ 160 | A 0103 | A 0105 | C 0107 | C 010D | ď 010F | E 011B | E 0119 | G 011F | ĺ 013A | ľ 013E | ł 0142 | ń 0144 | ň 0148 | ŋ 014B | Ó 0151 | ŕ 0155 |
B_ 176 | ř 0159 | ś 015B | š 0161 | ş 015F | ť 0165 | ţ 0163 | ű 0171 | ů 016F | ÿ 00FF | ź 017A | ž 017E | ż 017C | ij 0133 | ¡ 00A1 | ¿ 00BF | £ 00A3 |
C_ 192 | A 00C0 | A 00C1 | A 00C2 | A 00C3 | A 00C4 | A 00C5 | Æ 00C6 | C 00C7 | E 00C8 | E 00C9 | E 00CA | E 00CB | Ì 00CC | Í 00CD | Î 00CE | Ï 00CF |
D_ 208 | Ð /Đ[d] 00D0 | Ñ 00D1 | Ó 00D2 | Ó 00D3 | Ó 00D4 | Ó 00D5 | Ó 00D6 | Œ 0152 | Ó 00D8 | Ù 00D9 | Ú 00DA | Û 00 dB | " 00DC | “ 00DD | Þ 00DE | SS[E] 1E9E |
E_ 224 | A 00E0 | A 00E1 | A 00E2 | A 00E3 | A 00E4 | A 00E5 | … 00E6 | C 00E7 | E 00E8 | E 00E9 | E 00EA | E 00EB | ì 00 ES | í 00ED | „ 00EE | ï 00EF |
F_ 240 | ð 00F0 | - 00F1 | Ó 00F2 | Ó 00F3 | Ó 00F4 | Ó 00F5 | Ó 00F6 | - 0153 | Ó 00F8 | ù 00F9 | ú 00FA | û 00FB | ü 00FC | ý 00FD | þ 00FE | ß 00DF |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
Poznámky
- Hexadecimální hodnoty pod znaky v tabulce jsou kódy znaků Unicode.
- Prvních 12 znaků se často používá jako kombinování znaků.
- ^ 0x18 je pouze „koncová nula“, která se používá k vytváření ‰ nebo ‱ (nebo libovolná menší množství) z znak procenta (%).
- ^ A b Dotless i a bezbodový j lze použít k sestavení variant s diakritikou jako já s macronem (ī).
- ^ 0x7F je znak dělení slov (není to opravdu měkký spojovník).
- ^ 0xD0 se používá jak jako Eth (Ð, U + 00D0) a jako D s mrtvicí (Đ, U + 0110), což může být při některých příležitostech problém (například kopírování textu z PDF, dělení slov, ...)
- ^ 0xDF obsahuje SS (dvě písmena S ). Umožňuje TeXu automaticky převádět německá malá písmena ß do velkého formuláře.
Podporované jazyky
Kódování podporuje většinu evropských jazyků psaných latinkou. Pozoruhodné výjimky jsou:
- esperanto (pomocí IL3)
- Lotyšský jazyk a Litevský jazyk (pomocí L7X)
- Welština
Mezi jazyky s mírně neoptimální podporou patří:
- Galicijský jazyk, Portugalský jazyk a španělština - kvůli nedostatku postav ª a º, což jsou ne horní verze malých písmen „a“ a „o“ (horní indexy jsou tenčí) a jsou často podtržené
- Chorvatský jazyk, Bosenský jazyk, Srbský jazyk - kvůli sdílenému používání slotu pro Đ
- turecký jazyk - kvůli dotless i s různými kombinacemi malých a velkých písmen než v jiných jazycích
- Rumunský jazyk - kvůli nedostatku S a T s čárkou níže (tj. Nepřipojeno), ale má je s cedillou (připojeno).
Reference
- ^ A b Petrlik, Lukas (1996-06-19). „Vysvětlil český a slovenský znakový kódovací nepořádek“. CS-encodings-faq. 1.10. Archivováno od původního dne 2016-06-21. Citováno 2016-06-21.
- ^ Ferguson, Michael (1990), „Zpráva o vícejazyčných činnostech“ (PDF), Remorkér, Díl 11 (číslo 4): 514–516
- ^ Rozdělovací vzory TeX