Doplněk Latin-1 (blok Unicode) - Latin-1 Supplement (Unicode block)
Ovládací prvky C1 a doplněk Latin-1 | |
---|---|
Rozsah | U + 0080..U + 00FF (128 kódových bodů) |
Letadlo | BMP |
Skripty | latinský (64 znaků) Běžný (64 znaků) |
Hlavní abecedy | francouzština Němec islandský španělština |
Sady symbolů | Interpunkce Matematika Měna |
Přiřazeno | 128 kódových bodů 33 Ovládání nebo formátování |
Nepoužitý | 0 vyhrazených kódových bodů |
Zdrojové standardy | ISO / IEC 8859-1 |
Historie verzí Unicode | |
1.0.0 | 128 (+128) |
Poznámka: [1][2] |
The Doplněk latinky-1 (také zvaný Ovládací prvky C1 a doplněk Latin-1) je druhý Blok Unicode v Unicode Standard. Kóduje horní rozsah ISO 8859-1: 80 (U + 0080) - FF (U + 00FF). Ovládá C1 (0080–009F) nejsou grafické. Tento blok se pohybuje od U + 0080 do U + 00FF, obsahuje 128 znaků a obsahuje Ovládací prvky C1, Latinka-1 interpunkce a symboly, 30 párů majuskula a nepatrný s přízvukem Latinské znaky a 2 matematické operátory.
Ovládací prvky C1 a blok doplňku Latin-1 byly zahrnuty do současné podoby se stejným repertoárem znaků od verze 1.0 Standard Unicode.[3] Jeho název bloku v Unicode 1.0 byl prostě Latinka1.[4]
Tabulka znaků
Podnadpisy
Blok C1 Controls and Latin-1 Supplement má ve své kolekci znaků čtyři podnadpisy: ovládací prvky C1, interpunkční znaménka Latin-1 a symboly, písmena a matematické operátory.[5]
Ovládací prvky C1
Podnadpis ovládacích prvků C1 obsahuje 32 doplňkových řídicích kódů zděděných od ISO / IEC 8859-1 a mnoho dalších 8bitových standardů znaků. Názvy aliasů pro řídicí kódy C0 a C1 jsou převzaty z ISO / IEC 6429: 1992.[5]
Interpunkční znaménka a symboly latinky-1
Podnadpis interpunkčních znamének a symbolů Latin-1 obsahuje 32 znaků běžných mezinárodních interpunkčních znaků, jako je obrácený vykřičník a otazníky, a střední tečka; a symboly, jako jsou měnové znaky, mezery mezi diakritickými znaménky, vulgární zlomek a čísla horního indexu.[5]
Písmena
Podnadpis Dopisy obsahuje 30 párů majuskulárních a nepatrných znaků s diakritikou nebo nových latinských znaků pro západoevropské jazyky a dva další nepatrné znaky, které se na počátku běžně nepoužívají.[5]
Matematický operátor
Podnadpis Matematický operátor se používá pro znaménka násobení a dělení.[5]
Počet symbolů, písmen a kontrolních kódů
V tabulce níže je uveden počet jednotlivých písmen, symbolů a řídicích kódů v jednotlivých podnadpisech v bloku C1 Controls a Latin-1 Supplement.
Typ podpoložky | Počet symbolů | Rozsah znaků |
---|---|---|
Ovládací prvky C1 | 32 řídicích kódů | U + 0080 až U + 009F |
Interpunkční znaménka a symboly latinky-1 | 32 interpunkce a symboly | U + 00A0 až U + 00BF |
Písmena | 30 párů majuskula a nepatrný s přízvukem Latinské znaky | U + 00C0 až U + 00D6, U + 00D8 až U + 00F6 a U + 00F8 až U + 00FF |
Matematické operátory | The U + 00D7 × MULTIPLIKACE ZNAMENÍ a U + 00F7 ÷ ZNAČKA DIVIZE symboly. | U + 00D7 a U + 00F7 |
Kompaktní stůl
Ovládací prvky C1 a doplněk Latin-1[1] Oficiální tabulka kódů konsorcia Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U + 008x | XXX | XXX | BPH | NBH | IND | NEL | SSA | ESA | HTS | HTJ | VTS | PLD | PLU | RI | SS2 | SS3 |
U + 009x | DCS | PU1 | PU2 | STS | CCH | MW | LÁZNĚ | EPA | SOS | XXX | SCI | CSI | SVATÝ | OSC | ODPOLEDNE | APC |
U + 00Ax | Pozn SP | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | PLACHÝ | ® | ¯ |
U + 00Bx | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
U + 00Cx | A | A | A | A | A | A | Æ | C | E | E | E | E | Ì | Í | Î | Ï |
U + 00 Dx | Ð | Ñ | Ó | Ó | Ó | Ó | Ó | × | Ó | Ù | Ú | Û | " | “ | Þ | ß |
U + 00Ex | A | A | A | A | A | A | … | C | E | E | E | E | ì | í | „ | ï |
U + 00Fx | ð | - | Ó | Ó | Ó | Ó | Ó | ÷ | Ó | ù | ú | û | ü | ý | þ | ÿ |
Poznámky
|
Emodži
Blok doplňku Latin-1 obsahuje dva emodži: U + 00A9 a U + 00AE.[6][7]
Blok má čtyři standardizované varianty definováno pro specifikaci stylu emoji (U + FE0F VS16) nebo textové prezentace (U + FE0E VS15) pro dva emodži, z nichž oba jsou výchozí pro textovou prezentaci.[8]
U + | 00A9 | 00AE |
bod základního kódu | © | ® |
base + VS15 (text) | ©︎ | ®︎ |
základna + VS16 (emodži) | ©️ | ®️ |
Dějiny
Následující dokumenty týkající se Unicode zaznamenávají účel a proces definování konkrétních znaků v bloku Dodatek Latin-1:
Verze | Konečné body kódu[A] | Počet | L2 ID | WG2 ID | Dokument |
---|---|---|---|---|---|
1.0.0 | U + 0080..009F | 32 | X3L2 / 95-002 | PDAM č. 3 podle ISO / IEC 10646-1 o kódování ovládacích prvků C1, 1994-11-01 | |
X3L2 / 95-028 | N1148 | Devět tabulek odpovědí na opakované / prodloužené hlasy, 1995-02-22 | |||
N1203 | Umamaheswaran, V. S .; Ksar, Mike (03.05.1995), „5,3“, Nepotvrzené zápisy ze schůze SC2 / WG2 27, Ženeva | ||||
X3L2 / 95-061 | DAM č. 3 podle ISO / IEC 10646-1 (kódování ovládacích prvků C1), 1995-06-01 | ||||
N1307 | Tabulka odpovědí na hlasovací lístky JTC1 dne 10646 DAM 3, kódování ovládacích prvků C1 (SC2 N 2666), 1996-01-15 | ||||
N1309 | Paterson, Bruce (1996-01-17), Zpráva a dispozice komentářů k DAM 1, UTF 16 a DAM 2, UTF-8, DAM 3, kódování kontrol C1 a DAM 4, odstranění přílohy G: UTF1 | ||||
N1312 | Paterson, Bruce (1996-01-17), Návrh finálního textu 10646 AMD-3, kódování ovládacích prvků C1 | ||||
L2 / 99-048 | Umamaheswaran, V. S. (04.02.1999), Ovládací prvky C1 v kódových tabulkách | ||||
L2 / 99-054R | Aliprand, Joan (1999-06-21), "C1 Controls", Schválený zápis ze schůze UTC / L2 v Palo Alto, 3. – 5. Února 1999 | ||||
N3046 | Suignard, Michel (2006-02-22), Vylepšení formální definice řídicích znaků | ||||
N3103 (pdf, doc ) | Umamaheswaran, V. S. (2006-08-25), "M48.33", Nepotvrzené zápisy ze schůze WG 2 48, Mountain View, CA, USA; 2006-04-24 / 27 | ||||
U + 00A0..00FF | 96 | (být odhodlán) | |||
X3L2 / 94-077 | N994 | Davis, Mark (1994-03-03), ISO / IEC 10646-1 - Navrhovaná oprava návrhu 1 | |||
X3L2 / 94-098 | N1033 (pdf, doc ) | Umamaheswaran, V. S .; Ksar, Mike (01.06.1994), "8.1.15", Nepotvrzené zápisy ze schůze ISO / IEC JTC 1 / SC 2 / WG 2 25, Falez Hotel, Antalya, Turecko, 1994-04-18-22 | |||
L2 / 11-016 | Moore, Lisa (2011-02-15), „Opravte chyby v přiřazení vlastností super a indexovaných písmen (B.13.4) [U + 00AA, U + 00BA]“, UTC # 126 / L2 # 223 minut | ||||
L2 / 11-116 | Moore, Lisa (2011-05-17), „Consensus 127-C14“, UTC # 127 / L2 # 224 minut, Změňte obecnou kategorii na U + 00AA ŽENSKÝ ORDINÁLNÍ INDIKÁTOR a U + 00BA MASKULINNÍ ORDINÁLNÍ UKAZATEL "Lo" pro Unicode 6.1. | ||||
L2 / 11-261R2 | Moore, Lisa (2011-08-16), „Consensus 128-C6“, UTC # 128 / L2 # 225 minut, Změňte obecnou kategorii z „Takže“ na „Po“ ... [U + 00A7 a U + 00B6] | ||||
L2 / 15-050R[b][C] | Davis, Mark; et al. (2015-01-29), Další varianty selektorů pro emodži | ||||
|
Viz také
Reference
- ^ "Databáze znaků Unicode". Standard Unicode. Citováno 2016-07-09.
- ^ „Výčet verzí standardu Unicode“. Standard Unicode. Citováno 2016-07-09.
- ^ Standardní verze Unicode 1.0, svazek 1. Addison-Wesley Publishing Company, Inc. 1991 [1990]. ISBN 0-201-56788-1.
- ^ „3.8: Grafy po blocích“ (PDF). Standard Unicode. verze 1.0. Konsorcium Unicode.
- ^ A b C d E „Tabulky kódů Unicode 6.2“ (PDF). Standard Unicode. Citováno 1. dubna 2013.
- ^ „UTR # 51: Unicode Emoji“. Konsorcium Unicode. 2020-02-11.
- ^ „UCD: Emoji Data for UTR # 51“. Konsorcium Unicode. 2020-01-28.
- ^ „Variační sekvence emodži UTS # 51“. Konsorcium Unicode.