Blok Unicode - Unicode block
A Blok Unicode je jedním z několika souvislých rozsahů číselných kódů znaků (kódové body ) z Unicode znaková sada definovaná znakem Konsorcium Unicode pro administrativní a dokumentační účely. Typicky jsou návrhy, jako je přidání nových glyfů, diskutovány a hodnoceny zvážením příslušného bloku nebo bloků jako celku.
Každý blok je obecně, ale ne vždy, určen k dodávání glyfů používaných jedním nebo více konkrétními jazyky nebo v nějaké obecné oblasti použití, jako je matematika, geodetické, dekorativní sazba, sociální fóra atd.
Návrh a implementace
Bloky Unicode jsou identifikovány jedinečnými názvy, které používají pouze znaky ASCII a jsou obvykle popisující povahu symbolů, v Angličtina; například „tibetský“ nebo „doplňkové šipky-A“. (Při porovnávání názvů bloků je třeba srovnávat velká a malá písmena a ignorovat mezery, pomlčky a podřízené znaky; takže příjmení je ekvivalentní „doplněk_arrows__a“ a „SUPPLEMENTALARROWSA“.[1]
Bloky jsou párově disjunktní, tj. nepřekrývají se. Počáteční bod kódu a velikost (počet bodů kódu) každého bloku jsou vždy násobky 16; proto v hexadecimální zápis, počáteční (nejmenší) bod je U +xxx0 a koncový (největší) bod je U +rrrF, kde xxx a rrr jsou tři nebo více hexadecimálních číslic. (Tato omezení mají za cíl zjednodušit zobrazení glyfů v dokumentech konsorcia Unicode, jako tabulky se 16 sloupci označenými poslední šestnáctkovou číslicí kódového bodu.[1]) Velikost bloku se může pohybovat od minima 16 do maxima 65 536 kódových bodů.
Každý přiřazený bod kódu má vlastnost glyfů nazvanou „Block“, jejíž hodnotou je řetězec znaků pojmenující jedinečný blok, který daný bod vlastní.[2] Blok však může také obsahovat nepřiřazené body kódu, obvykle vyhrazené pro budoucí přidání znaků, které by „logicky“ do tohoto bloku měly patřit. Body kódu, které nepatří k žádnému z pojmenovaných bloků, např v nepřiděleném letadla 3–13, mají hodnotu block = "No_block".[1]
Další klasifikace
Každý bod Unicode má také vlastnost nazvanou „Obecná kategorie ", který se pokouší popsat roli odpovídajícího symbolu v jazycích nebo aplikacích, kvůli kterým byl do systému zahrnut. Příklady obecných kategorií jsou" Lu "(což znamená velká písmena)," Nd "(desetinná číslice) , „Pi“ (interpunkce s otevřenými uvozovkami) a „Mn“ (značka bez mezer, tj. Diakritika pro předchozí glyf). Toto rozdělení je zcela nezávislé na blocích kódu: body kódu s danou obecnou kategorií obecně pokrývají mnoho bloků a nemusí být za sebou, a to ani v rámci každého bloku.[3]
Každý kódový bod má také a vlastnost skriptu, s uvedením které systém psaní je určen pro, nebo zda je určen pro více systémů psaní. To je také nezávislé na bloku.
V popisech systému Unicode lze blok rozdělit na konkrétnější podskupiny, například „Šachové symboly „v bloku“Různé symboly ". Tyto podskupiny nejsou" bloky "v technickém smyslu používaném konsorciem Unicode a jsou pojmenovány pouze pro pohodlí uživatelů.
Seznam bloků
Unicode 13.0 definuje 308 bloků:[1]
- 163 v rovině 0, základní vícejazyčné rovině (BMP)
- 134 v rovině 1, doplňkové vícejazyčné letadlo (SMP)
- 6 v rovině 2, doplňková ideografická rovina (SIP)
- 1 v rovině 3, terciární ideografická rovina (TIP)
- 2 v rovině 14 (E v hexadecimální ), doplňkové speciální letadlo (SSP)
- Po jednom v rovinách 15 (Fhex) a 16 (10hex), nazvaný Doplňková oblast soukromého použití-A a -B
Bloky Unicode a obsahoval skripty | |||||
---|---|---|---|---|---|
Letadlo | Rozsah bloku | Název bloku | Kódové body[A] | Přiřazené znaky | Skripty[b][C][d][E][F] |
0 BMP | U + 0000..U + 007F | Základní latinka[G] | 128 | 128 | latinský (52 znaků), Běžný (76 znaků) |
U + 0080..U + 00FF | Doplněk latinky-1[h] | 128 | 128 | Latinka (64 znaků), Společná (64 znaků) | |
U + 0100..U + 017F | Latin Extended-A | 128 | 128 | latinský | |
U + 0180..U + 024F | Latin Extended-B | 208 | 208 | latinský | |
U + 0250..U + 02AF | Rozšíření IPA | 96 | 96 | latinský | |
U + 02B0..U + 02FF | Mezerník Modifikační písmena | 80 | 80 | Bopomofo (2 znaky), latinka (14 znaků), běžná (64 znaků) | |
U + 0300..U + 036F | Kombinace diakritických značek | 112 | 112 | Zděděno | |
U + 0370..U + 03FF | Řečtina a koptština | 144 | 135 | Koptský (14 znaků), řecký (117 znaků), Společné (4 znaky) | |
U + 0400..U + 04FF | cyrilice | 256 | 256 | cyrilice (254 znaků), zděděno (2 znaky) | |
U + 0500..U + 052F | Dodatek cyrilice | 48 | 48 | cyrilice | |
0 BMP | U + 0530..U + 058F | Arménský | 96 | 91 | Arménský |
U + 0590..U + 05FF | hebrejština | 112 | 88 | hebrejština | |
U + 0600..U + 06FF | arabština | 256 | 255 | arabština (237 znaků), Společný (6 znaků), Zděděný (12 znaků) | |
U + 0700..U + 074F | syrský | 80 | 77 | syrský | |
U + 0750..U + 077F | Arabský dodatek | 48 | 48 | arabština | |
U + 0780..U + 07BF | Thaana | 64 | 50 | Thaana | |
U + 07C0..U + 07FF | NKo | 64 | 62 | Nko | |
U + 0800..U + 083F | samaritán | 64 | 61 | samaritán | |
U + 0840..U + 085F | Mandaic | 32 | 29 | Mandaic | |
U + 0860..U + 086F | Syrský doplněk | 16 | 11 | syrský | |
0 BMP | U + 08A0..U + 08FF | Arabská rozšířená-A | 96 | 84 | Arabština (83 znaků), běžná (1 znak) |
U + 0900..U + 097F | Devanagari | 128 | 128 | Devanagari (122 znaků), Společný (2 znaky), Zděděný (4 znaky) | |
U + 0980..U + 09FF | bengálský | 128 | 96 | bengálský | |
U + 0A00..U + 0A7F | Gurmukhi | 128 | 80 | Gurmukhi | |
U + 0A80..U + 0AFF | Gudžarátština | 128 | 91 | Gudžarátština | |
U + 0B00..U + 0B7F | Oriya | 128 | 91 | Oriya | |
U + 0B80..U + 0BFF | Tamil | 128 | 72 | Tamil | |
U + 0C00..U + 0C7F | Telugština | 128 | 98 | Telugština | |
U + 0C80..U + 0CFF | Kannadština | 128 | 89 | Kannadština | |
U + 0D00..U + 0D7F | Malayalam | 128 | 118 | Malayalam | |
0 BMP | U + 0D80..U + 0DFF | Sinhálština | 128 | 91 | Sinhálština |
U + 0E00..U + 0E7F | Thai | 128 | 87 | Thai (86 znaků), běžné (1 znak) | |
U + 0E80..U + 0EFF | Lao | 128 | 82 | Lao | |
U + 0F00..U + 0FFF | Tibetský | 256 | 211 | Tibetský (207 znaků), běžné (4 znaky) | |
U + 1000..U + 109F | Myanmar | 160 | 160 | Myanmar | |
U + 10A0..U + 10FF | Gruzínský | 96 | 88 | Gruzínský (87 znaků), Společné (1 znak) | |
U + 1100..U + 11FF | Hangul Jamo | 256 | 256 | Hangul | |
U + 1200..U + 137F | Etiopský | 384 | 358 | Etiopský | |
U + 1380..U + 139F | Etiopský doplněk | 32 | 26 | Etiopský | |
U + 13A0..U + 13FF | Čerokee | 96 | 92 | Čerokee | |
0 BMP | U + 1400..U + 167F | Sjednocené kanadské domorodé slabiky | 640 | 640 | Kanadský domorodec |
U + 1680..U + 169F | Ogham | 32 | 29 | Ogham | |
U + 16A0..U + 16FF | Runic | 96 | 89 | Runic (86 znaků), Společné (3 znaky) | |
U + 1700..U + 171F | Tagalog | 32 | 20 | Tagalog | |
U + 1720..U + 173F | Hanunoo | 32 | 23 | Hanunoo (21 znaků), Společné (2 znaky) | |
U + 1740..U + 175F | Buhid | 32 | 20 | Buhid | |
U + 1760..U + 177F | Tagbanwa | 32 | 18 | Tagbanwa | |
U + 1780..U + 17FF | Khmer | 128 | 114 | Khmer | |
U + 1800..U + 18AF | mongolský | 176 | 157 | mongolský (154 znaků), Společné (3 znaky) | |
U + 18B0..U + 18FF | Unified Canadian Aboriginal Syllabics Extended | 80 | 70 | Kanadský domorodec | |
0 BMP | U + 1900..U + 194F | Limbu | 80 | 68 | Limbu |
U + 1950..U + 197F | Tai Le | 48 | 35 | Tai Le | |
U + 1980..U + 19DF | Nová Tai Lue | 96 | 83 | Nová Tai Lue | |
U + 19E0..U + 19FF | Khmerské symboly | 32 | 32 | Khmer | |
U + 1A00..U + 1A1F | Buginština | 32 | 30 | Buginština | |
U + 1A20..U + 1AAF | Tai Tham | 144 | 127 | Tai Tham | |
U + 1AB0..U + 1AFF | Kombinace rozšířených diakritických značek | 80 | 17 | Zděděno | |
U + 1B00..U + 1B7F | Balijské | 128 | 121 | Balijské | |
U + 1B80..U + 1BBF | Sundanština | 64 | 64 | Sundanština | |
U + 1BC0..U + 1BFF | Batak | 64 | 56 | Batak | |
0 BMP | U + 1C00..U + 1C4F | Lepcha | 80 | 74 | Lepcha |
U + 1C50..U + 1C7F | Ol Chiki | 48 | 48 | Ol Chiki | |
U + 1C80..U + 1C8F | Cyrilice Extended-C | 16 | 9 | cyrilice | |
U + 1C90..U + 1CBF | Gruzínský Extended | 48 | 46 | Gruzínský | |
U + 1CC0..U + 1CCF | Sundanský dodatek | 16 | 8 | Sundanština | |
U + 1CD0..U + 1CFF | Vedic Extensions | 48 | 43 | Společný (16 znaků), Zděděný (27 znaků) | |
U + 1D00..U + 1D7F | Fonetická rozšíření | 128 | 128 | Azbuka (2 znaky), řečtina (15 znaků), latinka (111 znaků) | |
U + 1D80..U + 1DBF | Doplněk fonetických rozšíření | 64 | 64 | Řečtina (1 znak), latinka (63 znaků) | |
U + 1DC0..U + 1DFF | Kombinace dodatku o diakritické značky | 64 | 63 | Zděděno | |
U + 1E00..U + 1EFF | Rozšířené latinky | 256 | 256 | latinský | |
0 BMP | U + 1F00..U + 1FFF | Řek rozšířen | 256 | 233 | řecký |
U + 2000..U + 206F | Obecná interpunkce | 112 | 111 | Společný (109 znaků), Zděděný (2 znaky) | |
U + 2070..U + 209F | Horní a dolní indexy | 48 | 42 | Latinka (15 znaků), Společná (27 znaků) | |
U + 20A0..U + 20CF | Symboly měny | 48 | 32 | Běžný | |
U + 20D0..U + 20FF | Kombinace diakritických značek pro symboly | 48 | 33 | Zděděno | |
U + 2100..U + 214F | Písmenové symboly | 80 | 80 | Řečtina (1 znak), latinka (4 znaky), běžná (75 znaků) | |
U + 2150..U + 218F | Číselné formuláře | 64 | 60 | Latinka (41 znaků), běžná (19 znaků) | |
U + 2190..U + 21FF | Šipky | 112 | 112 | Běžný | |
U + 2200..U + 22FF | Matematické operátory | 256 | 256 | Běžný | |
U + 2300..U + 23FF | Různé technické | 256 | 256 | Běžný | |
0 BMP | U + 2400..U + 243F | Ovládací obrázky | 64 | 39 | Běžný |
U + 2440..U + 245F | Optické rozpoznávání znaků | 32 | 11 | Běžný | |
U + 2460..U + 24FF | Uzavřená alfanumerika | 160 | 160 | Běžný | |
U + 2500..U + 257F | Krabice | 128 | 128 | Běžný | |
U + 2580..U + 259F | Blokovat prvky | 32 | 32 | Běžný | |
U + 25A0..U + 25FF | Geometrické tvary | 96 | 96 | Běžný | |
U + 2600..U + 26FF | Různé symboly | 256 | 256 | Běžný | |
U + 2700..U + 27BF | Prsteny | 192 | 192 | Běžný | |
U + 27C0..U + 27EF | Různé matematické symboly-A | 48 | 48 | Běžný | |
U + 27F0..U + 27FF | Doplňkové šipky-A | 16 | 16 | Běžný | |
0 BMP | U + 2800..U + 28FF | Braillovo písmo | 256 | 256 | Braillovo písmo |
U + 2900..U + 297F | Doplňkové šipky-B | 128 | 128 | Běžný | |
U + 2980..U + 29FF | Různé matematické symboly-B | 128 | 128 | Běžný | |
U + 2A00..U + 2AFF | Doplňkové matematické operátory | 256 | 256 | Běžný | |
U + 2B00..U + 2BFF | Různé symboly a šipky | 256 | 253 | Běžný | |
U + 2C00..U + 2C5F | Hlaholika | 96 | 94 | Hlaholika | |
U + 2C60..U + 2C7F | Latin Extended-C | 32 | 32 | latinský | |
U + 2C80..U + 2CFF | Koptský | 128 | 123 | Koptský | |
U + 2D00..U + 2D2F | Gruzínský dodatek | 48 | 40 | Gruzínský | |
U + 2D30..U + 2D7F | Tifinagh | 80 | 59 | Tifinagh | |
0 BMP | U + 2D80..U + 2DDF | Ethiopic Extended | 96 | 79 | Etiopský |
U + 2DE0..U + 2DFF | Azbuka rozšířená-A | 32 | 32 | cyrilice | |
U + 2E00..U + 2E7F | Doplňková interpunkce | 128 | 83 | Běžný | |
U + 2E80..U + 2EFF | Doplněk radikálů CJK | 128 | 115 | Han | |
U + 2F00..U + 2FDF | Kangxi radikály | 224 | 214 | Han | |
U + 2FF0..U + 2FFF | Ideografický popis Znaky | 16 | 12 | Běžný | |
U + 3000..U + 303F | CJK symboly a interpunkce | 64 | 64 | Han (15 znaků), Hangul (2 znaky), Společné (43 znaků), Zděděno (4 znaky) | |
U + 3040..U + 309F | Hiragana | 96 | 93 | Hiragana (89 znaků), Společný (2 znaky), Zděděný (2 znaky) | |
U + 30A0..U + 30FF | Katakana | 96 | 96 | Katakana (93 znaků), Společné (3 znaky) | |
U + 3100..U + 312F | Bopomofo | 48 | 43 | Bopomofo | |
0 BMP | U + 3130..U + 318F | Kompatibilita Hangul Jamo | 96 | 94 | Hangul |
U + 3190..U + 319F | Kanbun | 16 | 16 | Běžný | |
U + 31A0..U + 31BF | Bopomofo Extended | 32 | 32 | Bopomofo | |
U + 31C0..U + 31EF | CJK tahy | 48 | 36 | Běžný | |
U + 31F0..U + 31FF | Fonetická rozšíření Katakana | 16 | 16 | Katakana | |
U + 3200..U + 32FF | Přiložené dopisy a měsíce CJK | 256 | 255 | Hangul (62 znaků), Katakana (47 znaků), Common (146 znaků) | |
U + 3300..U + 33FF | Kompatibilita CJK | 256 | 256 | Katakana (88 znaků), běžná (168 znaků) | |
U + 3400..U + 4DBF | Rozšíření Unified Ideographs CJK A | 6,592 | 6,592 | Han | |
U + 4DC0..U + 4DFF | Yijing Hexagram symboly | 64 | 64 | Běžný | |
U + 4E00..U + 9FFF | CJK Unified Ideographs | 20,992 | 20,989 | Han | |
0 BMP | U + A000..U + A48F | Yi slabiky | 1,168 | 1,165 | Yi |
U + A490..U + A4CF | Yi radikály | 64 | 55 | Yi | |
U + A4D0..U + A4FF | Lisu | 48 | 48 | Lisu | |
U + A500..U + A63F | Vai | 320 | 300 | Vai | |
U + A640..U + A69F | Azbuka rozšířená-B | 96 | 96 | cyrilice | |
U + A6A0..U + A6FF | Bamum | 96 | 88 | Bamum | |
U + A700..U + A71F | Modifikační tónová písmena | 32 | 32 | Běžný | |
U + A720..U + A7FF | Latin Extended-D | 224 | 180 | Latinka (175 znaků), běžná (5 znaků) | |
U + A800..U + A82F | Syloti Nagri | 48 | 45 | Syloti Nagri | |
U + A830..U + A83F | Běžné formuláře pro indické číslo | 16 | 10 | Běžný | |
0 BMP | U + A840..U + A87F | Phags-pa | 64 | 56 | Phags Pa |
U + A880..U + A8DF | Saurashtra | 96 | 82 | Saurashtra | |
U + A8E0..U + A8FF | Devanagari Extended | 32 | 32 | Devanagari | |
U + A900..U + A92F | Kayah Li | 48 | 48 | Kayah Li (47 znaků), Společné (1 znak) | |
U + A930..U + A95F | Rejang | 48 | 37 | Rejang | |
U + A960..U + A97F | Hangul Jamo Extended-A | 32 | 29 | Hangul | |
U + A980..U + A9DF | Jávský | 96 | 91 | Jávský (90 znaků), Společné (1 znak) | |
U + A9E0..U + A9FF | Myanmar Extended-B | 32 | 31 | Myanmar | |
U + AA00..U + AA5F | Cham | 96 | 83 | Cham | |
U + AA60..U + AA7F | Myanmar Extended-A | 32 | 32 | Myanmar | |
0 BMP | U + AA80..U + AADF | Tai Viet | 96 | 72 | Tai Viet |
U + AAE0..U + AAFF | Rozšíření Meetei Mayek | 32 | 23 | Meetei Mayek | |
U + AB00..U + AB2F | Ethiopic Extended-A | 48 | 32 | Etiopský | |
U + AB30..U + AB6F | Latin Extended-E | 64 | 60 | Latinka (56 znaků), řečtina (1 znak), běžná (3 znaky) | |
U + AB70..U + ABBF | Cherokee doplněk | 80 | 80 | Čerokee | |
U + ABC0..U + ABFF | Meetei Mayek | 64 | 56 | Meetei Mayek | |
U + AC00..U + D7AF | Hangul slabiky | 11,184 | 11,172 | Hangul | |
U + D7B0..U + D7FF | Hangul Jamo Extended-B | 80 | 72 | Hangul | |
U + D800..U + DB7F | Vysoké náhradní | 896 | 0 | Neznámý | |
U + DB80..U + DBFF | Vysoká náhrada pro soukromé použití | 128 | 0 | Neznámý | |
0 BMP | U + DC00..U + DFFF | Nízké náhrady | 1,024 | 0 | Neznámý |
U + E000..U + F8FF | Oblast pro soukromé použití | 6,400 | 6,400 | Neznámý | |
U + F900..U + FAFF | Ideografy o kompatibilitě s CJK | 512 | 472 | Han | |
U + FB00..U + FB4F | Abecední prezentační formuláře | 80 | 58 | Arménština (5 znaků), hebrejština (46 znaků), latinka (7 znaků) | |
U + FB50..U + FDFF | Arabské prezentační formuláře-A | 688 | 611 | Arabština (609 znaků), běžná (2 znaky) | |
U + FE00..U + FE0F | Varianty selektorů | 16 | 16 | Zděděno | |
U + FE10..U + FE1F | Svislé formuláře | 16 | 10 | Běžný | |
U + FE20..U + FE2F | Kombinace polovičních známek | 16 | 16 | Azbuka (2 znaky), Zděděno (14 znaků) | |
U + FE30..U + FE4F | Formuláře kompatibility CJK | 32 | 32 | Běžný | |
U + FE50..U + FE6F | Varianty malé formy | 32 | 26 | Běžný | |
U + FE70..U + FEFF | Arabské prezentační formuláře-B | 144 | 141 | Arabština (140 znaků), běžná (1 znak) | |
U + FF00..U + FFEF | Formuláře s poloviční a plnou šířkou | 240 | 225 | Hangul (52 znaků), Katakana (55 znaků), latinka (52 znaků), běžné (66 znaků) | |
U + FFF0..U + FFFF | Speciální nabídka | 16 | 5 | Běžný | |
1 SMP | U + 10 000.. U + 1007 F. | Lineární B Šlabikář | 128 | 88 | Lineární B |
U + 10080..U + 100FF | Lineární B ideogramy | 128 | 123 | Lineární B | |
U + 10100..U + 1013F | Egejská čísla | 64 | 57 | Běžný | |
U + 10140..U + 1018F | Starořecká čísla | 80 | 79 | řecký | |
U + 10190..U + 101CF | Starověké symboly | 64 | 14 | Řečtina (1 znak), běžná (13 znaků) | |
U + 101D0..U + 101FF | Phaistos Disc | 48 | 46 | Společné (45 znaků), Zděděno (1 znak) | |
U + 10280..U + 1029F | Lycianský | 32 | 29 | Lycianský | |
U + 102A0..U + 102DF | Carian | 64 | 49 | Carian | |
U + 102E0..U + 102FF | Koptská čísla Epact | 32 | 28 | Společný (27 znaků), Zděděný (1 znak) | |
U + 10300..U + 1032F | Stará kurzíva | 48 | 39 | Stará kurzíva | |
1 SMP | U + 10330..U + 1034F | gotický | 32 | 27 | gotický |
U + 10350..U + 1037F | Old Permic | 48 | 43 | Old Permic | |
U + 10380..U + 1039F | Ugaritický | 32 | 31 | Ugaritický | |
U + 103A0..U + 103DF | Starý Peršan | 64 | 50 | Starý Peršan | |
U + 10400..U + 1044F | Deseret | 80 | 80 | Deseret | |
U + 10450..U + 1047F | Shavian | 48 | 48 | Shavian | |
U + 10480..U + 104AF | Osmanya | 48 | 40 | Osmanya | |
U + 104B0..U + 104FF | Osage | 80 | 72 | Osage | |
U + 10500..U + 1052F | Elbasan | 48 | 40 | Elbasan | |
U + 10530..U + 1056F | Bělošský Albánec | 64 | 53 | Bělošský Albánec | |
1 SMP | U + 10600..U + 1077F | Lineární A | 384 | 341 | Lineární A |
U + 10800..U + 1083F | Kyperská slabikář | 64 | 55 | Kypřan | |
U + 10840..U + 1085F | Imperiální aramejština | 32 | 31 | Imperiální aramejština | |
U + 10860..U + 1087F | Palmyren | 32 | 32 | Palmyren | |
U + 10880..U + 108AF | Nabataean | 48 | 40 | Nabataean | |
U + 108E0..U + 108FF | Hatran | 32 | 26 | Hatran | |
U + 10900..U + 1091F | fénický | 32 | 29 | fénický | |
U + 10920..U + 1093F | Lydian | 32 | 27 | Lydian | |
U + 10980..U + 1099F | Meroitické hieroglyfy | 32 | 32 | Meroitické hieroglyfy | |
U + 109A0..U + 109FF | Meroitic Cursive | 96 | 90 | Meroitic Cursive | |
1 SMP | U + 10A00..U + 10A5F | Kharoshthi | 96 | 68 | Kharoshthi |
U + 10A60..U + 10A7F | Starý jihoarabský | 32 | 32 | Starý jihoarabský | |
U + 10A80..U + 10A9F | Starý severní arabský | 32 | 32 | Starý severní arabský | |
U + 10AC0..U + 10AFF | Manichejský | 64 | 51 | Manichejský | |
U + 10B00..U + 10B3F | Avestan | 64 | 61 | Avestan | |
U + 10B40..U + 10B5F | Nápis Parthian | 32 | 30 | Nápis Parthian | |
U + 10B60..U + 10B7F | Nápis Pahlavi | 32 | 27 | Nápis Pahlavi | |
U + 10B80..U + 10BAF | Psalter Pahlavi | 48 | 29 | Psalter Pahlavi | |
U + 10C00..U + 10C4F | Starý Turkic | 80 | 73 | Starý Turkic | |
U + 10C80..U + 10CFF | Staromaďarský | 128 | 108 | Staromaďarský | |
1 SMP | U + 10D00..U + 10D3F | Hanifi Rohingya | 64 | 50 | Hanifi Rohingya |
U + 10E60..U + 10E7F | Rumi číselné symboly | 32 | 31 | arabština | |
U + 10E80..U + 10EBF | Yezidi | 64 | 47 | Yezidi | |
U + 10F00..U + 10F2F | Starý Sogdian | 48 | 40 | Starý Sogdian | |
U + 10F30..U + 10F6F | Sogdian | 64 | 42 | Sogdian | |
U + 10FB0..U + 10FDF | Chorasmian | 48 | 28 | Chorasmian | |
U + 10FE0..U + 10FFF | Elymaic | 32 | 23 | Elymaic | |
U + 11000..U + 1107F | Brahmi | 128 | 109 | Brahmi | |
U + 11080..U + 110CF | Kaithi | 80 | 67 | Kaithi | |
U + 110D0..U + 110FF | Sora Sompeng | 48 | 35 | Sora Sompeng | |
1 SMP | U + 11100..U + 1114F | Chakma | 80 | 71 | Chakma |
U + 11150..U + 1117F | Mahajani | 48 | 39 | Mahajani | |
U + 11180..U + 111DF | Sharada | 96 | 96 | Sharada | |
U + 111E0..U + 111FF | Sinhálská archaická čísla | 32 | 20 | Sinhálština | |
U + 11200..U + 1124F | Khojki | 80 | 62 | Khojki | |
U + 11280..U + 112AF | Multani | 48 | 38 | Multani | |
U + 112B0..U + 112FF | Khudawadi | 80 | 69 | Khudawadi | |
U + 11300..U + 1137F | Grantha | 128 | 86 | Grantha (85 znaků), zděděno (1 znak) | |
U + 11400..U + 1147F | Newa | 128 | 97 | Newa | |
U + 11480..U + 114DF | Tirhuta | 96 | 82 | Tirhuta | |
1 SMP | U + 11580..U + 115FF | Siddham | 128 | 92 | Siddham |
U + 11600..U + 1165F | Modi | 96 | 79 | Modi | |
U + 11660..U + 1167F | Mongolský dodatek | 32 | 13 | mongolský | |
U + 11680..U + 116CF | Takri | 80 | 67 | Takri | |
U + 11700..U + 1173F | Ahom | 64 | 58 | Ahom | |
U + 11800..U + 1184F | Dogra | 80 | 60 | Dogra | |
U + 118A0..U + 118FF | Warang Citi | 96 | 84 | Warang Citi | |
U + 11900..U + 1195F | Ponory Akuru | 96 | 72 | Ponory Akuru | |
U + 119A0..U + 119FF | Nandinagari | 96 | 65 | Nandinagari | |
U + 11A00..U + 11A4F | Zanabazarské náměstí | 80 | 72 | Zanabazarské náměstí | |
1 SMP | U + 11A50..U + 11AAF | Sojombo | 96 | 83 | Sojombo |
U + 11AC0..U + 11AFF | Pau Cin Hau | 64 | 57 | Pau Cin Hau | |
U + 11C00..U + 11C6F | Bhaiksuki | 112 | 97 | Bhaiksuki | |
U + 11C70..U + 11CBF | Marchen | 80 | 68 | Marchen | |
U + 11D00..U + 11D5F | Masaram Gondi | 96 | 75 | Masaram Gondi | |
U + 11D60..U + 11DAF | Gunjala Gondi | 80 | 63 | Gunjala Gondi | |
U + 11EE0..U + 11EFF | Makasar | 32 | 25 | Makasar | |
U + 11FB0..U + 11FBF | Dodatek Lisu | 16 | 1 | Lisu | |
U + 11FC0..U + 11FFF | Tamilský dodatek | 64 | 51 | Tamil | |
U + 12000..U + 123FF | Klínové písmo | 1,024 | 922 | Klínové písmo | |
1 SMP | U + 12400..U + 1247F | Čísla klínového písma a interpunkce | 128 | 116 | Klínové písmo |
U + 12480..U + 1254F | Raně dynastické klínové písmo | 208 | 196 | Klínové písmo | |
U + 13000..U + 1342F | Egyptské hieroglyfy | 1,072 | 1,071 | Egyptské hieroglyfy | |
U + 13430..U + 1343F | Ovládací prvky egyptského hieroglyfového formátu | 16 | 9 | Egyptské hieroglyfy | |
U + 14400..U + 1467F | Anatolské hieroglyfy | 640 | 583 | Anatolské hieroglyfy | |
U + 16800..U + 16A3F | Bamum doplněk | 576 | 569 | Bamum | |
U + 16A40..U + 16A6F | Mro | 48 | 43 | Mro | |
U + 16AD0..U + 16AFF | Bassa Váh | 48 | 36 | Bassa Váh | |
U + 16B00..U + 16B8F | Pahawh Hmong | 144 | 127 | Pahawh Hmong | |
U + 16E40..U + 16E9F | Medefaidrin | 96 | 91 | Medefaidrin | |
1 SMP | U + 16F00..U + 16F9F | Miao | 160 | 149 | Miao |
U + 16FE0..U + 16FFF | Ideografické symboly a interpunkce | 32 | 7 | Han (2 znaky), Khitan Small Script (1 znak), Nushu (1 znak), Tangut (1 znak), Společný (2 znaky) | |
U + 17000..U + 187FF | Tangut | 6,144 | 6,136 | Tangut | |
U + 18800..U + 18AFF | Tangut komponenty | 768 | 768 | Tangut | |
U + 18B00..U + 18CFF | Khitan Small Script | 512 | 470 | Khitan malý skript | |
U + 18D00..U + 18D8F | Doplněk Tangut | 144 | 9 | Tangut | |
U + 1B000..U + 1B0FF | Doplněk Kana | 256 | 256 | Hiragana (255 znaků), Katakana (1 znak) | |
U + 1B100..U + 1B12F | Kana Extended-A | 48 | 31 | Hiragana | |
U + 1B130..U + 1B16F | Malé rozšíření Kana | 64 | 7 | Hiragana (3 znaky), Katakana (4 znaky) | |
U + 1B170..U + 1B2FF | Nushu | 400 | 396 | Nüshu | |
1 SMP | U + 1BC00..U + 1BC9F | Duployan | 160 | 143 | Duployan |
U + 1BCA0..U + 1BCAF | Ovládací prvky formátu zkratky | 16 | 4 | Běžný | |
U + 1D000..U + 1D0FF | Byzantské hudební symboly | 256 | 246 | Běžný | |
U + 1D100..U + 1D1FF | Hudební symboly | 256 | 231 | Společný (209 znaků), Zděděný (22 znaků) | |
U + 1D200..U + 1D24F | Starořecká hudební notace | 80 | 70 | řecký | |
U + 1D2E0..U + 1D2FF | Mayské číslice | 32 | 20 | Běžný | |
U + 1D300..U + 1D35F | Tai Xuan Jing symboly | 96 | 87 | Běžný | |
U + 1D360..U + 1D37F | Počítání číslic tyčí | 32 | 25 | Běžný | |
U + 1D400..U + 1D7FF | Matematické alfanumerické symboly | 1,024 | 996 | Běžný | |
U + 1D800..U + 1DAAF | Sutton SignWriting | 688 | 672 | SignWriting | |
1 SMP | U + 1E000..U + 1E02F | Glagolitický dodatek | 48 | 38 | Hlaholika |
U + 1E100..U + 1E14F | Nyiakeng Puachue Hmong | 80 | 71 | Nyiakeng Puachue Hmong | |
U + 1E2C0..U + 1E2FF | Wancho | 64 | 59 | Wancho | |
U + 1E800..U + 1E8DF | Mende Kikakui | 224 | 213 | Mende Kikakui | |
U + 1E900..U + 1E95F | Adlam | 96 | 88 | Adlam | |
U + 1EC70..U + 1ECBF | Indická čísla Siyaq | 80 | 68 | Běžný | |
U + 1ED00..U + 1ED4F | Osmanská čísla Siyaq | 80 | 61 | Běžný | |
U + 1EE00..U + 1EEFF | Arabské matematické abecední symboly | 256 | 143 | arabština | |
U + 1F000..U + 1F02F | Mahjong dlaždice | 48 | 44 | Běžný | |
U + 1F030..U + 1F09F | Domino dlaždice | 112 | 100 | Běžný | |
1 SMP | U + 1F0A0..U + 1F0FF | Hrací karty | 96 | 82 | Běžný |
U + 1F100..U + 1F1FF | Přiložený alfanumerický doplněk | 256 | 200 | Běžný | |
U + 1F200..U + 1F2FF | Přiložený ideografický dodatek | 256 | 64 | Hiragana (1 znak), běžná (63 znaků) | |
U + 1F300..U + 1F5FF | Různé symboly a piktogramy | 768 | 768 | Běžný | |
U + 1F600..U + 1F64F | Emotikony | 80 | 80 | Běžný | |
U + 1F650..U + 1F67F | Okrasné prsteny | 48 | 48 | Běžný | |
U + 1F680..U + 1F6FF | Dopravní a mapové symboly | 128 | 114 | Běžný | |
1 SMP | U + 1F700..U + 1F77F | Alchymistické symboly | 128 | 116 | Běžný |
U + 1F780..U + 1F7FF | Rozšířené geometrické tvary | 128 | 101 | Běžný | |
U + 1F800..U + 1F8FF | Doplňkové šipky-C | 256 | 150 | Běžný | |
U + 1F900..U + 1F9FF | Doplňkové symboly a piktogramy | 256 | 254 | Běžný | |
U + 1FA00..U + 1FA6F | Šachové symboly | 112 | 98 | Běžný | |
U + 1FA70..U + 1FAFF | Rozšířené symboly a piktogramy-A | 144 | 57 | Běžný | |
U + 1FB00..U + 1FBFF | Symboly pro starší výpočetní techniku | 256 | 212 | Běžný | |
2 SIP | U + 20000..U + 2A6DF | Rozšíření Unified Ideographs CJK B | 42,720 | 42,718 | Han |
U + 2A700..U + 2B73F | CJK Unified Ideographs Extension C | 4,160 | 4,149 | Han | |
U + 2B740..U + 2B81F | CJK Unified Ideographs Extension D | 224 | 222 | Han | |
U + 2B820..U + 2CEAF | Rozšíření CJK Unified Ideographs E. | 5,776 | 5,762 | Han | |
U + 2CEB0..U + 2EBEF | Rozšíření CJK Unified Ideographs F | 7,488 | 7,473 | Han | |
U + 2F800..U + 2FA1F | Dodatek k CJK Compatibility Ideographs | 544 | 542 | Han | |
3 TIP | U + 30000..U + 3134F | CJK Unified Ideographs Extension G | 4,944 | 4,939 | Han |
14 SSP | U + E0000..U + E007F | Značky | 128 | 97 | Běžný |
U + E0100..U + E01EF | Doplněk selektorů variant | 240 | 240 | Zděděno | |
15 PUA-A | U + F0000..U + FFFFF | Doplňková oblast pro soukromé použití-A | 65,536 | 65,534 | Neznámý |
16 PUA-B | U + 100 000..U + 10FFFF | Doplňková oblast pro soukromé použití-B | 65,536 | 65,534 | Neznámý |
|
Smazané bloky
Zásady stability Unicode vyžadují, aby znak, který mu byl jednou přiřazen, nemohl být přesunut ani odebrán, ačkoli může být zastaralý. To platí pro Unicode 2.0 a všechny následující verze.
Před tím byly odstraněny následující dřívější bloky:
Rozsah bloků | Název bloku | Dosah nyní obsazen | Nahrazeno blokem | Kódové body | Přiřazené znaky | Skripty |
---|---|---|---|---|---|---|
U + 1000..U + 105F | Tibetský[4] | Myanmar | Tibetský | 96 | 71 | Tibetský |
U + 3400..U + 3D2D | Hangul[5] | Rozšíření Unified Ideographs CJK A | Hangul slabiky | 2350 | 2350 | Hangul |
U + 3D2E..U + 44B7 | Hangul Supplementary-A[5] | Rozšíření Unified Ideographs CJK A | 1930 | 1930 | Hangul | |
U + 44B8..U + 4DFF | Hangul Supplementary-B[5] | Rozšíření Unified Ideographs CJK A | 2376 | 2376 | Hangul | |
Yijing Hexagram symboly |
Reference
- ^ A b C d „Datový soubor Unicode Blocks, verze Unicode 13.0“. Konsorcium Unicode. Citováno 2019-04-29.}
- ^ Slovník Unicode
- ^ „Specifikace jádra Unicode, Kapitola 4: Vlastnosti znaků“ (PDF). Citováno 2020-03-14.
- ^ „3.8: Grafy po blocích“ (PDF). Standard Unicode. Verze 1.0. Konsorcium Unicode.
- ^ A b C „Dodatek E: Názvy bloků“ (PDF). Standard Unicode. Verze 1.1. Konsorcium Unicode.
externí odkazy
- Oficiální webové stránky konsorcia Unicode (Angličtina)
Základní | Doplňkový | ||||||||
---|---|---|---|---|---|---|---|---|---|
Letadlo 0 | Letadlo 1 | Letadlo 2 | Letadlo 3 | Letadla 4–13 | Letadlo 14 | Letadla 15–16 | |||
0000– FFFF | 10 000– 1FFFF | 20000–2FFFF | 30000–3FFFF | 40000– DFFFF | E0000 - EFFFF | F0000–10FFFF | |||
Základní vícejazyčné letadlo | Doplňkové vícejazyčné letadlo | Doplňující ideografická rovina | Terciární ideografická rovina | Nepřiřazeno | Doplňkové speciální letadlo | Doplňkové Oblast pro soukromé použití letadla | |||
BMP | SMP | SIP | SPROPITNÉ | — | SSP | SPUA-A / B | |||
0000– 0FFF | 8 000– 8FFF | 10 000–10FFF | 18 000–18FFF | 20000–20FFF | 28 000– 28FFF | 15: SPUA-A |