Letadlo (Unicode) - Plane (Unicode)
![]() | tento článek potřebuje další citace pro ověření.Červenec 2016) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
V Unicode standard, a letadlo je souvislá skupina 65 536 (216) kódové body. Existuje 17 letadel označených čísly 0 až 16, což odpovídá možným hodnotám 00–1016 z prvních dvou pozic v šesti pozicích hexadecimální formát (U +hhhhhh). Rovina 0 je základní vícejazyčná rovina (BMP), která obsahuje nejčastěji používané znaky. Vyšší letadla 1 až 16 se nazývají „doplňková letadla“.[1] Poslední kódový bod v Unicode je poslední kódový bod v rovině 16, U + 10FFFF. Od verze Unicode verze 13.0 má sedm letadel přiřazeno kódové body (znaky) a pět je pojmenováno.
Limit 17 letadel je kvůli UTF-16, který může kódovat 220 kódové body (16 letadel) jako páry slova plus BMP jako jediné slovo.[2] UTF-8 byl navržen s mnohem větším limitem 231 (2147483648) kódových bodů (32 768 letadel) a může kódovat 221 (2 097 152) kódových bodů (32 letadel) i pod současným limitem 4 bajtů.[3]
17 letadel pojme 1 114 112 kódových bodů. Z toho je 2 048 náhradní (používá se k vytvoření párů v UTF-16), 66 je bez znaků a 137 468 jsou vyhrazeno pro soukromé použití, přičemž pro veřejné zadávání zůstává 974 530.
Roviny se dále dělí na Bloky Unicode, které na rozdíl od letadel nemají pevnou velikost. 308 bloků definovaných v Unicode 13.0 pokrývá 26% možného prostoru kódových bodů a jejich velikost se pohybuje od minimálně 16 kódových bodů (patnáct bloků) do maximálně 65 536 kódových bodů (doplňková oblast pro soukromé použití-A a -B, které tvoří celek letadel 15 a 16). Pro budoucí použití byly rozsahy znaků předběžně zmapovány pro většinu známých současných a starověkých systémů psaní.[4]
Přehled
Základní | Doplňkový | ||||||||
---|---|---|---|---|---|---|---|---|---|
Letadlo 0 | Letadlo 1 | Letadlo 2 | Letadlo 3 | Letadla 4–13 | Letadlo 14 | Letadla 15–16 | |||
0000– FFFF | 10 000– 1FFFF | 20000–2FFFF | 30000–3FFFF | 40000– DFFFF | E0000 - EFFFF | F0000–10FFFF | |||
Základní vícejazyčné letadlo | Doplňkové vícejazyčné letadlo | Doplňující ideografická rovina | Terciární ideografická rovina | Nepřiřazeno | Doplňkové speciální letadlo | Doplňkové Oblast pro soukromé použití letadla | |||
BMP | SMP | SIP | SPROPITNÉ | — | SSP | SPUA-A / B | |||
0000– 0FFF | 8 000– 8FFF | 10 000–10FFF | 18 000–18FFF | 20000–20FFF | 28 000– 28FFF | 15: SPUA-A |
Letadlo | Přidělené body kódu[poznámka 1] | Přiřazené znaky[poznámka 2] |
---|---|---|
0 BMP | 65,472 | 55,503 |
1 SMP | 24,704 | 22,279 |
2 SIP | 60,912 | 60,866 |
3 TIP | 4,944 | 4,939 |
14 SSP | 368 | 337 |
15 SPUA-A | 65,536 | |
16 SPUA-B | 65,536 | |
Součty | 287,472 | 143,924 |
- ^ Body kódu, které byly přiděleny a Blok Unicode.
- ^ Celkový počet grafických, formátových a řídících znaků (tj. Kromě soukromých znaků, neznaků a náhradních kódových bodů).
Základní vícejazyčné letadlo

První letadlo letadlo 0, Základní vícejazyčné letadlo (BMP) obsahuje znaky téměř ve všech moderních jazycích a velké množství symboly. Primárním cílem pro BMP je podpora sjednocení předchozích znakových sad i znaků pro psaní. Většina přidělených kódových bodů v BMP se používá ke kódování čínštiny, japonštiny a korejštiny (CJK ) postavy.
The High Surrogate (U + D800 – U + DBFF) a nízká náhrada (U + DC00 – U + DFFF) kódy jsou vyhrazeny pro kódování znaků jiných než BMP v UTF-16 pomocí a pár ze 16-bit kódy: jeden vysoký a jeden náhradní. Jedinému náhradnímu kódovému bodu nebude nikdy přiřazen znak.
65 472 z 65 536 kódových bodů v této rovině bylo přiděleno a Blok Unicode, přičemž v nepřidělených rozmezích zůstává pouze 64 kódových bodů (48 kódových bodů na 0870..089F a 16 kódových bodů na 2FE0..2FEF).
Od verze Unicode 13.0[Aktualizace], BMP zahrnuje následujících 163 bloků:
- Základní latinka (Dolní polovina ISO / IEC 8859-1: ISO / IEC 646: 1991-IRV aka ASCII ) (0000–007F)
- Doplněk latinky-1 (Horní polovina roku) ISO / IEC 8859-1 ) (0080–00FF)
- Latin Extended-A (0100–017F)
- Latin Extended-B (0180–024F)
- Rozšíření IPA (0250–02AF)
- Mezerník Modifikační písmena (02B0–02FF)
- Kombinace diakritických značek (0300–036F)
- Řečtina a koptština (0370–03FF)
- cyrilice (0400–04FF)
- Dodatek cyrilice (0500–052F)
- Arménský (0530–058 F)
- Aramejština Skripty:
- hebrejština (0590–05FF)
- arabština (0600–06FF)
- syrský (0700–074 F)
- Arabský dodatek (0750–077 F)
- Thaana (0780–07BF)
- N'Ko (07C0–07FF)
- samaritán (0800–083 F)
- Mandaic (0840–085 F)
- Syrský doplněk (0860–086F)
- Arabská rozšířená-A (08A0–08FF)
- Brahmic skripty:
- Devanagari (0900–097 F)
- bengálský (0980–09FF)
- Gurmukhi (0A00–0A7F)
- Gudžarátština (0A80–0AFF)
- Oriya (0B00–0B7F)
- Tamil (0B80–0BFF)
- Telugština (0C00–0C7F)
- Kannadština (0C80–0CFF)
- Malayalam (0D00–0D7F)
- Sinhálština (0D80–0DFF)
- Thai (0E00–0E7F)
- Lao (0E80–0EFF)
- Tibetský (0F00–0FFF)
- Myanmar (1 000–109 F)
- Gruzínský (10A0–10FF)
- Hangul Jamo (1100–11FF)
- Etiopský (1 200–137 F)
- Etiopský dodatek (1380–139 F)
- Čerokee (13A0–13FF)
- Sjednocené kanadské domorodé slabiky (1400–167 F)
- Ogham (1680–169F)
- Runic (16A0–16FF)
- Filipínský skripty:
- Khmer (1780–17FF)
- mongolský (1800–18AF)
- Unified Canadian Aboriginal Syllabics Extended (18B0–18FF)
- Limbu (1900–194 F)
- Tai skripty:
- Tai Le (1950–197F)
- Nová Tai Lue (1980–19DF)
- Khmerské symboly (19E0–19FF)
- Buginština (1A00–1A1F)
- Tai Tham (1A20–1AAF)
- Kombinace rozšířených diakritických značek (1AB0–1AFF)
- Balijské (1B00–1B7F)
- Sundanština (1B80–1BBF)
- Batak (1BC0–1BFF)
- Lepcha (1C00–1C4F)
- Ol Chiki (1C50–1C7F)
- Cyrilice Extended-C (1C80–1C8F)
- Gruzínský Extended (1C90–1CBF)
- Sundanský dodatek (1CC0–1CCF)
- Vedic Extensions (1CD0–1CFF)
- Latinské doplňky:
- Fonetická rozšíření (1D00–1D7F)
- Doplněk fonetických rozšíření (1D80–1DBF)
- Kombinace doplňku diakritických značek (1DC0–1DFF)
- Rozšířené latinky (1E00–1EFF)
- Řek rozšířen (1F00–1FFF)
- Symboly:
- Obecná interpunkce (2000–206F)
- Horní a dolní indexy (2070–209F)
- Symboly měny (20A0–20CF)
- Kombinace diakritických značek pro symboly (20D0–20FF)
- Písmenové symboly (2100–214F)
- Číselné formuláře (2150–218F)
- Šipky (2190–21FF)
- Matematické operátory (2200–22FF)
- Různé technické (2300–23FF)
- Ovládací obrázky (2400–243F)
- Optické rozpoznávání znaků (2440–245F)
- Uzavřená alfanumerika (2460–24FF)
- Krabice (2500–257 F)
- Blokovat prvky (2580–259 F)
- Geometrické tvary (25A0–25FF)
- Různé symboly (2600–26FF)
- Prsteny (2700–27BF)
- Různé matematické symboly-A (27C0–27EF)
- Doplňkové šipky-A (27F0–27FF)
- Braillovo písmo (2800–28FF)
- Doplňkové šipky-B (2900–297F)
- Různé matematické symboly-B (2980–29FF)
- Doplňkové matematické operátory (2A00–2AFF)
- Různé symboly a šipky (2B00–2BFF)
- Hlaholika (2C00–2C5F)
- Latin Extended-C (2C60–2C7F)
- Koptský (2C80–2CFF)
- Gruzínský dodatek (2D00–2D2F)
- Tifinagh (2D30–2D7F)
- Ethiopic Extended (2D80–2DDF)
- Azbuka rozšířená-A (2DE0–2DFF)
- Doplňková interpunkce (2E00–2E7F)
- CJK skripty a symboly:
- Doplněk radikálů CJK (2E80–2EFF)
- Kangxi radikály (2F00–2FDF)
- Ideografický popis Znaky (2FF0–2FFF)
- CJK symboly a interpunkce (3000–303 F)
- Hiragana (3040–309 F)
- Katakana (30A0–30FF)
- Bopomofo (3100–312F)
- Kompatibilita Hangul Jamo (3130–318F)
- Kanbun (3190–319F)
- Bopomofo Extended (31A0–31BF)
- CJK tahy (31C0–31EF)
- Fonetická rozšíření Katakana (31F0–31FF)
- Přiložené dopisy a měsíce CJK (3200–32FF)
- Kompatibilita CJK (3300–33FF)
- Rozšíření Unified Ideographs CJK A (3400–4DBF)
- Yijing Hexagram symboly (4DC0–4DFF)
- CJK Unified Ideographs (4E00–9FFF)
- Yi slabiky (A000 – A48F)
- Yi radikály (A490 – A4CF)
- Lisu (A4D0 – A4FF)
- Vai (A500 – A63F)
- Azbuka rozšířená-B (A640 – A69F)
- Bamum (A6A0 – A6FF)
- Modifikační tónová písmena (A700 – A71F)
- Latin Extended-D (A720 – A7FF)
- Syloti Nagri (A800 – A82F)
- Běžné formuláře pro indické číslo (A830 – A83F)
- Phags-pa (A840 – A87F)
- Saurashtra (A880 – A8DF)
- Devanagari Extended (A8E0 – A8FF)
- Kayah Li (A900 – A92F)
- Rejang (A930 – A95F)
- Hangul Jamo Extended-A (A960 – A97F)
- Jávský (A980 – A9DF)
- Myanmar Extended-B (A9E0 – A9FF)
- Cham (AA00 – AA5F)
- Myanmar Extended-A (AA60 – AA7F)
- Tai Viet (AA80 – AADF)
- Rozšíření Meetei Mayek (AAE0 – AAFF)
- Ethiopic Extended-A (AB00 – AB2F)
- Latin Extended-E (AB30 – AB6F)
- Cherokee doplněk (AB70 – ABBF)
- Meetei Mayek (ABC0 – ABFF)
- Hangul slabiky (AC00 – D7AF)
- Hangul Jamo Extended-B (D7B0 – D7FF)
- Náhradní:
- Vysoké náhradní (D800 – DB7F)
- Vysoká náhrada pro soukromé použití (DB80 – DBFF)
- Nízké náhrady (DC00 – DFFF)
- Oblast pro soukromé použití (E000 – F8FF)
- Ideografy o kompatibilitě s CJK (F900 – FAFF)
- Abecední prezentační formuláře (FB00 – FB4F)
- Arabské prezentační formuláře-A (FB50 – FDFF)
- Varianty selektorů (FE00 – FE0F)
- Svislé formuláře (FE10 – FE1F)
- Kombinace polovičních známek (FE20 – FE2F)
- Formuláře kompatibility CJK (FE30 – FE4F)
- Varianty malé formy (FE50 – FE6F)
- Arabské prezentační formuláře-B (FE70 – FEFF)
- Formuláře s poloviční a plnou šířkou (FF00 – FFEF)
- Speciální nabídka (FFF0 – FFFF)
Doplňkové vícejazyčné letadlo

Letadlo 1, Doplňkové vícejazyčné letadlo (SMP), obsahuje historické skripty (kromě ideografických CJK) a symboly a notace používané v určitých polích. Skripty zahrnují Lineární B, Egyptské hieroglyfy, a klínové písmo skripty. Zahrnuje také anglické reformní pravopisy jako Shavian a Deseret a některé moderní skripty jako Osage, Warang Citi, a Adlam. Symboly a notace zahrnují historické a moderní hudební notace; matematická alfanumerika; stenografové; Emodži a další piktografické sady; a herní symboly pro hrací karty, Mah Jongg, a domino.
Od verze Unicode 13.0[Aktualizace], SMP zahrnuje následujících 134 bloků:
- Archaická řečtina a další skripty zleva doprava:
- Lineární B Šlabikář (10 000–1007 F)
- Lineární B ideogramy (10080–100FF)
- Egejská čísla (10100–1013F)
- Starořecká čísla (10140–1018F)
- Starověké symboly (10190–101CF)
- Phaistos Disc (101D0–101FF)
- Lycianský (10280–1029F)
- Carian (102A0–102DF)
- Koptská čísla Epact (102E0–102FF)
- Stará kurzíva (10300–1032F)
- gotický (10330–1034F)
- Old Permic (10350–1037F)
- Ugaritický (10380–1039F)
- Starý Peršan (103A0–103DF)
- Deseret (10400–1044F)
- Shavian (10450–1047F)
- Osmanya (10480–104AF)
- Osage (104B0–104FF)
- Elbasan (10500–1052F)
- Bělošský Albánec (10530–1056F)
- Lineární A (10600–1077F)
- Skripty zprava doleva:
- Kyperská slabikář (10800–1083F)
- Imperiální aramejština (10840–1085 F)
- Palmyren (10860–1087F)
- Nabataean (10880–108AF)
- Hatran (108E0–108FF)
- fénický (10900–1091F)
- Lydian (10920–1093F)
- Meroitické hieroglyfy (10980–1099F)
- Meroitic Cursive (109A0–109FF)
- Kharoshthi (10A00–10A5F)
- Starý jihoarabský (10A60–10A7F)
- Starý severní arabský (10A80–10A9F)
- Manichejský (10AC0–10AFF)
- Avestan (10B00–10B3F)
- Nápis Parthian (10B40–10B5F)
- Nápis Pahlavi (10B60–10B7F)
- Psalter Pahlavi (10B80–10BAF)
- Starý Turkic (10C00–10C4F)
- Staromaďarský (10C80–10CFF)
- Hanifi Rohingya (10D00–10D3F)
- Rumi číselné symboly (10E60–10E7F)
- Yezidi (10E80–10EBF)
- Starý Sogdian (10F00–10F2F)
- Sogdian (10F30–10F6F)
- Chorasmian (10FB0–10FDF)
- Elymaic (10FE0–10FFF)
- Brahmic skripty:
- Brahmi (11000–1107F)
- Kaithi (11080–110CF)
- Sora Sompeng (110D0–110FF)
- Chakma (11100–1114F)
- Mahajani (11150–1117F)
- Sharada (11180–111DF)
- Sinhálská archaická čísla (111E0–111FF)
- Khojki (11200–1124F)
- Multani (11280–112AF)
- Khudawadi (112B0–112FF)
- Grantha (11300–1137F)
- Newa (11400–1147F)
- Tirhuta (11480–114DF)
- Siddham (11580–115FF)
- Modi (11600–1165F)
- Mongolský dodatek (11660–1167F)
- Takri (11680–116CF)
- Ahom (11700–1173F)
- Dogra (11800–1184 F)
- Warang Citi (118A0–118FF)
- Ponory Akuru (11900–1195F)
- Nandinagari (119A0–119FF)
- Zanabazarské náměstí (11A00–11A4F)
- Sojombo (11A50–11AAF)
- Pau Cin Hau (11AC0–11AFF)
- Bhaiksuki (11C00–11C6F)
- Marchen (11C70–11CBF)
- Masaram Gondi (11D00–11D5F)
- Gunjala Gondi (11D60–11DAF)
- Makasar (11EE0–11EFF)
- Dodatek Lisu (11FB0–11FBF)
- Tamilský dodatek (11FC0–11FFF)
- Klínové písmo (12 000–123FF)
- Čísla klínového písma a interpunkce (12400–1247F)
- Raně dynastické klínové písmo (12480–1254F)
- Egyptské hieroglyfy (13 000–1342 F)
- Ovládací prvky egyptského hieroglyfového formátu (13430–1343F)
- Anatolské hieroglyfy (14400–1467F)
- Bamum doplněk (16800–16A3F)
- Mro (16A40–16A6F)
- Bassa Váh (16AD0–16AFF)
- Pahawh Hmong (16B00–16B8F)
- Medefaidrin (16E40–16E9F)
- Miao (16F00–16F9F)
- Ideografické symboly a interpunkce (16FE0–16FFF)
- Tangut (17 000–187FF)
- Tangut komponenty (18800–18AFF)
- Khitan Small Script (18B00–18CFF)
- Doplněk Tangut (18D00–18D8F)
- Doplněk Kana (1B000–1B0FF)
- Kana Extended-A (1B100–1B12F)
- Malé rozšíření Kana (1B130–1B16F)
- Nushu (1B170–1B2FF)
- Duployan (1BC00–1BC9F)
- Ovládací prvky formátu zkratky (1BCA0–1BCAF)
- Doplňkové symboly:
- Hudební notace:
- Byzantské hudební symboly (1D000–1D0FF)
- Hudební symboly (1D100–1D1FF)
- Starořecká hudební notace (1D200–1D24F)
- Mayské číslice (1D2E0–1D2FF)
- Matematické symboly:
- Tai Xuan Jing symboly (1D300–1D35F)
- Počítání číslic tyčí (1D360–1D37F)
- Matematické alfanumerické symboly (1D400–1D7FF)
- Sutton SignWriting (1D800–1DAAF)
- Hudební notace:
- Glagolitický dodatek (1E000–1E02F)
- Nyiakeng Puachue Hmong (1E100–1E14F)
- Wancho (1E2C0–1E2FF)
- Mende Kikakui (1E800–1E8DF)
- Adlam (1E900–1E95F)
- Indická čísla Siyaq (1EC70–1ECBF)
- Osmanská čísla Siyaq (1ED00–1ED4F)
- Arabské matematické abecední symboly (1EE00–1EEFF)
- Dlaždice a karty her:
- Mahjong dlaždice (1F000–1F02F)
- Domino dlaždice (1F030–1F09F)
- Hrací karty (1F0A0–1F0FF)
- Přiložený alfanumerický doplněk (1F100–1F1FF)
- Přiložený ideografický dodatek (1F200–1F2FF)
- Různé symboly a piktogramy (1F300–1F5FF)
- Emotikony (1F600–1F64F)
- Okrasné prsteny (1F650–1F67F)
- Dopravní a mapové symboly (1F680–1F6FF)
- Alchymistické symboly (1F700–1F77F)
- Rozšířené geometrické tvary (1F780–1F7FF)
- Doplňkové šipky-C (1F800–1F8FF)
- Doplňkové symboly a piktogramy (1F900–1F9FF)
- Šachové symboly (1FA00–1FA6F)
- Rozšířené symboly a piktogramy-A (1FA70–1FAFF)
- Symboly pro starší výpočetní techniku (1FB00–1FBFF)
Doplňující ideografická rovina

Letadlo 2, Doplňující ideografická rovina (SIP), se používá hlavně pro CJK Ideographs CJK Unified Ideographs, které nebyly zahrnuty do dřívějších standardů kódování znaků.
Od verze Unicode 13.0[Aktualizace], SIP zahrnuje následujících šest bloků:
- Rozšíření Unified Ideographs CJK B (20000–2A6DF)
- CJK Unified Ideographs Extension C (2A700–2B73F)
- CJK Unified Ideographs Extension D (2B740–2B81F)
- Rozšíření CJK Unified Ideographs E. (2B820–2CEAF)
- Rozšíření CJK Unified Ideographs F (2CEB0–2EBEF)
- Dodatek o kompatibilitě ideografů CJK (2F800–2FA1F)
Terciární ideografická rovina

Letadlo 3 je terciární ideografická rovina (TIP). CJK Unified Ideographs Extension G byl přidán k TIP v Unicode 13.0, vydaném v březnu 2020.[5] Je také předběžně přidělen na Skript Oracle Bone, Bronzový scénář, a Skript malé pečeti.[6]
Od verze Unicode 13.0[Aktualizace], TIP zahrnuje následující blok:
- CJK Unified Ideographs Extension G (30000–3134F)
Nepřiřazená letadla
Letadla 4 až 13 (letadla 4 na D v hexadecimální ): Letadlům 4 až 13 ještě nebyly přiřazeny žádné znaky.
Doplňkové speciální letadlo

Letadlo 14 (E v šestnáctkové soustavě) Doplňkové speciální letadlo (SSP). obsahující následující dva bloky od Unicode 13.0[Aktualizace]:
- Značky (E0000 – E007F)
- Doplněk selektorů variant (E0100 – E01EF) - slouží k označení alternativních glyfů pro znaky.
Letadla pro soukromé použití
Dva letadla 15 a 16 (letadla F a 10 v šestnáctkové soustavě), jsou označeny jako „Oblasti pro soukromé použití Obsahují tzv. Bloky Doplňková oblast pro soukromé použití-A (PUA-A) a -B (PUA-B), které jsou k dispozici pro použití stranami mimo ISO a Unicode Consortium.
Reference
- ^ Slovník konsorcia Unicode - doplňková letadla
- ^ Viz tabulka 3.5 „Distribuce bitů UTF-16“ ve standardu Unicode https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf
- ^ Viz tabulka 3.6 „Distribuce bitů UTF-8“ ve standardu Unicode https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf
- ^ Cestovní mapy Unicode
- ^ Unicode, Inc. „Oznámení standardu Unicode®, verze 13.0“.
- ^ „Navrhované nové postavy: Potrubí“. www.unicode.org.