Obecná interpunkce - General Punctuation
Obecná interpunkce | |
---|---|
Rozsah | U + 2000..U + 206F (112 kódových bodů) |
Letadlo | BMP |
Skripty | Běžný (109 znaků) Zděděno (2 znaky) |
Sady symbolů | Interpunkce Prostory Ovládací prvky formátu |
Přiřazeno | 111 kódových bodů |
Nepoužitý | 1 vyhrazený kódový bod 6 zastaralé |
Historie verzí Unicode | |
1.0.0 | 67 (+67) |
1.1 | 76 (+9) |
3.0 | 83 (+7) |
3.2 | 95 (+12) |
4.0 | 97 (+2) |
4.1 | 106 (+9) |
5.1 | 107 (+1) |
6.3 | 111 (+4) |
Poznámka: [1][2] |
Obecná interpunkce je Blok Unicode obsahující interpunkční znaménka, mezery a formátovací znaky pro použití se všemi skripty a psacími systémy. Zahrnuty jsou definované šířky mezery, spojovací formáty, směrové formáty, chytré uvozovky, archaická a nová interpunkce, jako je interobang a neviditelné matematické operátory.
Další interpunkční znaky jsou v Doplňková interpunkce blok a posypané desítkami dalších bloků Unicode.
Blok
Obecná interpunkce[1][2][3] Oficiální tabulka kódů konsorcia Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U + 200x | NQ SP | MQ SP | EN SP | EM SP | 3 / M SP | 4 / M SP | 6 / M SP | F SP | P SP | TH SP | H SP | ZW SP | ZW NJ | ZW J | LRM | RLM |
U + 201x | ‐ | Pozn ‑ | ‒ | – | — | ― | ‖ | ‗ | ‘ | ’ | ‚ | ‛ | “ | ” | „ | ‟ |
U + 202x | † | ‡ | • | ‣ | ․ | ‥ | … | ‧ | L SEP | P SEP | LRE | RLE | LRO | RLO | NNB SP | |
U + 203x | ‰ | ‱ | ′ | ″ | ‴ | ‵ | ‶ | ‷ | ‸ | ‹ | › | ※ | ‼ | ‽ | ‾ | ‿ |
U + 204x | ⁀ | ⁁ | ⁂ | ⁃ | ⁄ | ⁅ | ⁆ | ⁇ | ⁈ | ⁉ | ⁊ | ⁋ | ⁌ | ⁍ | ⁎ | ⁏ |
U + 205x | ⁐ | ⁑ | ⁒ | ⁓ | ⁔ | ⁕ | ⁖ | ⁗ | ⁘ | ⁙ | ⁚ | ⁛ | ⁜ | ⁝ | ⁞ | MM SP |
U + 206x | WJ | ƒ() | × | , | + | LRI | RLI | FSI | PDI | Já SS | A SS | Já AFS | A AFS | NA DS | NE DS | |
Poznámky |
Několik znaků v tomto bloku se obvykle nevykreslí přímo viditelným glyfem. Deset prázdné znaky U + 2002 až U + 200B (opraveno en nebo 1⁄2em, em,1⁄3em,1⁄4em,1⁄6em, obrázek a interpunkční prostor, proměnná tenký nebo 1⁄5em a vlasový prostor, pevný prostor nulové šířky) a U + 205F (matematické médium nebo 2⁄9 em prostor) se liší horizontální šířkou, zatímco U + 2000 a U + 2001 (en a em quad) jsou skutečně aliasy U + 2002, respektive U + 2003; další dva, U + 202F a U + 2060 (špatně pojmenované slovo truhlář) jsou varianty U + 2009 nebo U + 2004 a U + 200B, které zakazují zalomení řádků. Tři znaky nulové šířky U + 200B až U + 200D (prostor, non-truhlář a truhlář) se liší v tom, jak ovlivňují ligace a tvarování sousedních písmen, jako je kontextové formy v arabštině. Jedenáct neviditelných znaků U + 200E, U + 200F (zleva do prava a značka zprava doleva), U + 202A až U + 202E (vloží, vyskočí a přepíše) a U + 2066 až U + 2069 (izoláty) ovládat směrovost textu, pokud je nepřekoná označení vyšší úrovně. Existují explicitní čára a oddělovače odstavců na U + 2018 a U + 2019.
Emodži
Blok obecné interpunkce obsahuje dva emodži: U + 203C a U + 2049.[3][4]
Blok má čtyři standardizované varianty definováno pro specifikaci stylu emoji (U + FE0F VS16) nebo textové prezentace (U + FE0E VS15) pro dva emodži, z nichž oba jsou výchozí pro textovou prezentaci.[5]
U + | 203C | 2049 |
bod základního kódu | ‼ | ⁉ |
base + VS15 (text) | ‼︎ | ⁉︎ |
základna + VS16 (emodži) | ‼️ | ⁉️ |
Dějiny
Následující dokumenty týkající se Unicode zaznamenávají účel a proces definování konkrétních znaků v bloku Obecné interpunkční znaménko:
Verze | Konečné body kódu[A] | Počet | UTC ID | L2 ID | WG2 ID | Dokument |
---|---|---|---|---|---|---|
1.0.0 | U + 2000..202E, 2030..203E, 2040..2044 | 67 | (být odhodlán) | |||
L2 / 11-438[b][C] | N4182 | Edberg, Peter (22.12.2011), Sekvence variací emodži (revize L2 / 11-429) | ||||
L2 / 17-086 | Burge, Jeremy; et al. (2017-03-27), Přidejte do Emoji_Component ZWJ, VS-16, klíčenky a značky | |||||
L2 / 17-103 | Moore, Lisa (2017-05-18), „E.1.7 Přidat ZWJ, VS-16, klíčenky a značky do Emoji_Component“, UTC # 151 minut | |||||
1.1 | U + 203F, 2045..2046 | 3 | (být odhodlán) | |||
U + 206A..206F | 6 | (být odhodlán) | ||||
UTC / 1992-xxx | Freytag, Asmus (12. 5. 1992), „C. Bidi“, Nepotvrzené minuty na zasedání UTC č. 52, 8. května 1992 ve společnosti Xerox | |||||
L2 / 01-275 | Davis, Mark (2001-07-16), Nové vlastnosti (ReservedForCf, zastaralé, znechucené) | |||||
L2 / 01-301 | Whistler, Ken (01. 08. 2001), „Alternativní ovládací prvky formátu zděděné od 10646“, Analýza nepoužívání znaků ve standardu Unicode | |||||
L2 / 01-326 | Davis, Mark (2001-08-15), Nové vlastnosti: Reserved_Cf_Code_Point a zastaralé | |||||
L2 / 01-295R | Moore, Lisa (06.11.2001), "Motion 88-M13", Zápis ze zasedání UTC / L2 # 88 | |||||
3.0 | U + 202F, 2048..2049 | 3 | L2 / 97-288 | N1603 | Umamaheswaran, V. S. (1997-10-24), "8,18", Nepotvrzené zápisy ze schůze, WG 2 Meeting # 33, Heraklion, Kréta, Řecko, 20. června - 4. července 1997 | |
L2 / 98-088 | N1711 | Pracovní setkání o mongolském kódování, kterého se zúčastnili zástupci Číny a Mongolska, 1998-02-15 | ||||
L2 / 98-104 | N1734 | Whistler, Ken (1998-03-20), Komentáře k návrhu mongolského kódování, WG2 N1711 | ||||
L2 / 98-252 (pdf, txt ) | N1833RM (pdf, doc ) | Moore, Richard (04.05.1998), Zpětná vazba k komentářům Kena Whistlera k mongolskému kódování: N 1734 | ||||
L2 / 98-251 (pdf, html, txt ) | N1808 (pdf, doc ) | Odpověď na „návrh WG2 N1734“ vznesený na zasedání v Seattlu ohledně „návrhu WG 2 N1711“, 1998-07-09 | ||||
L2 / 98-281R (pdf, html ) | Aliprand, Joan (1998-07-31), „mongolština (IV.A)“, Nepotvrzené minuty - UTC # 77 a NCITS Podskupina L2 # 174 SPOLEČNÉ ZASEDÁNÍ, Redmond, WA - 29. - 31. července 1998 | |||||
N1862 | Revize N1711 - mongolština, 1998-09-17 | |||||
N1865 | Pozice USA - mongolština (N1711, N1734 a N1808), 1998-09-18 | |||||
N1918 | Paterson, Bruce (1998-10-28), Text pro kombinovanou registraci PDAM a hlasování o zvážení - SC2 N 3208 | |||||
L2 / 99-010 | N1903 (pdf, html, doc ) | Umamaheswaran, V. S. (1998-12-30), "8.1.3", Zápis ze schůze pracovní skupiny 2 35, Londýn, Velká Británie; 1998-09-21-25 | ||||
L2 / 99-075.1 | N1973 | Irské komentáře k SC 2 N 3208, 1999-01-19 | ||||
L2 / 99-075 | N1972 (pdf, html, doc ) | Shrnutí hlasování na SC 2 N 3208, hlasování PDAM na WD pro ISO / IEC 10646-1 / Amd. 29: Mongolština, 1999-02-12 | ||||
N2020 | Paterson, Bruce (04.04.1999), Text FPDAM 29 - mongolština | |||||
L2 / 99-113 | Text pro hlasování podle FPDAM podle ISO / IEC 10646, pozm. 29 - mongolština, 1999-04-06 | |||||
L2 / 99-232 | N2003 | Umamaheswaran, V. S. (03.08.1999), „6.1.3 PDAM29 - mongolské písmo“, Zápis ze schůze pracovní skupiny 2 36, Fukuoka, Japonsko, 1999-03-09-15 | ||||
L2 / 99-304 | N2126 | Paterson, Bruce (01.10.1999), Upravený text pro hlasování FDAM podle ISO / IEC 10646-1 / FDAM 29, POZMĚŇOVACÍ NÁVRH 29: mongolský | ||||
L2 / 99-381 | Konečný text pro ISO / IEC 10646-1, FDAM 29 - mongolština, 1999-12-07 | |||||
L2 / 00-010 | N2103 | Umamaheswaran, V. S. (2000-01-05), „6.4.4“, Zápis ze schůze pracovní skupiny 2 37, Kodaň, Dánsko: 1999-09-13-16 | ||||
L2 / 07-209 | Whistler, Ken (05.07.2007), UTR 14 a U + 202F ÚZKÝ BEZPLATNÝ PROSTOR | |||||
L2 / 11-438[b][C] | N4182 | Edberg, Peter (22.12.2011), Sekvence variací emodži (revize L2 / 11-429) | ||||
L2 / 15-187 | Moore, Lisa (11. 8. 2015), „B.14.5“, UTC # 144 minut | |||||
L2 / 16-258 | N4752R2 | Eck, Greg (19. 9. 2016), Mongolské základní formuláře, poziční formuláře a varianty formulářů | ||||
L2 / 16-259 | N4753 | Eck, Greg; Rileke, Orlog Ou (2016-09-20), WG2 # 65 mongolské diskusní body | ||||
L2 / 16-266 | N4763 | Anderson, Deborah; Whistler, Ken; McGowan, Rick; Pournader, Roozbeh; Glass, Andrew; Iancu, Laurențiu; Moore, Lisa (26. 9. 2016), „1. mongolština“, Komentáře k mongolským, malým Khitanům a dalším dokumentům WG2 # 65 | ||||
L2 / 16-297 | N4769 | Anderson, Deborah (2016-10-27), Mongolská zpráva ad hoc | ||||
U + 204A | 1 | L2 / 98-214 | N1747 | Everson, Michael (1998-05-25), Kontrakční znaky pro USS | ||
L2 / 98-281R (pdf, html ) | Aliprand, Joan (1998-07-31), „Postavy z ISO 5426-2 (IV.C.5-6)“, Nepotvrzené minuty - UTC # 77 a NCITS Podskupina L2 # 174 SPOLEČNÉ ZASEDÁNÍ, Redmond, WA - 29. - 31. července 1998 | |||||
L2 / 98-292R (pdf, html, Obrázek 1 ) | "2.6", Komentáře k návrhům na přidání znaků z norem ISO vyvinutých ISO / TC 46 / SC 4, 1998-08-19 | |||||
L2 / 98-292 | N1840 | "2.6", Komentáře k návrhům na přidání znaků z norem ISO vyvinutých ISO / TC 46 / SC 4, 1998-08-25 | ||||
L2 / 98-301 | N1847 | Everson, Michael (1998-09-12), Odpovědi na komentáře NCITS / L2 a Unicode Consortium k mnoha návrhům | ||||
L2 / 98-372 | N1884R2 (pdf, doc ) | Whistler, Ken; et al. (1998-09-22), Další znaky pro UCS | ||||
L2 / 98-329 | N1920 | Kombinovaná registrace PDAM a hlasování o zvážení na WD pro ISO / IEC 10646-1 / Amd. 30, POZMĚŇOVACÍ NÁVRH 30: Další latinka a další znaky, 1998-10-28 | ||||
L2 / 99-010 | N1903 (pdf, html, doc ) | Umamaheswaran, V. S. (1998-12-30), "8.1.5.1", Zápis ze schůze pracovní skupiny 2 35, Londýn, Velká Británie; 1998-09-21-25 | ||||
U + 204B..204D | 3 | L2 / 98-215 | N1748 | Everson, Michael (1998-05-25), Další znaky podpisové značky pro UCS | ||
L2 / 98-281R (pdf, html ) | Aliprand, Joan (1998-07-31), „Signature Marks (IV.C.7)“, Nepotvrzené minuty - UTC # 77 a NCITS Podskupina L2 # 174 SPOLEČNÉ ZASEDÁNÍ, Redmond, WA - 29. - 31. července 1998 | |||||
L2 / 98-292R (pdf, html, Obrázek 1 ) | "2.7", Komentáře k návrhům na přidání znaků z norem ISO vyvinutých ISO / TC 46 / SC 4, 1998-08-19 | |||||
L2 / 98-292 | N1840 | "2.7", Komentáře k návrhům na přidání znaků z norem ISO vyvinutých ISO / TC 46 / SC 4, 1998-08-25 | ||||
L2 / 98-301 | N1847 | Everson, Michael (1998-09-12), Odpovědi na komentáře NCITS / L2 a Unicode Consortium k mnoha návrhům | ||||
L2 / 98-372 | N1884R2 (pdf, doc ) | Whistler, Ken; et al. (1998-09-22), Další znaky pro UCS | ||||
L2 / 98-329 | N1920 | Kombinovaná registrace PDAM a hlasování o zvážení na WD pro ISO / IEC 10646-1 / Amd. 30, POZMĚŇOVACÍ NÁVRH 30: Další latinka a další znaky, 1998-10-28 | ||||
L2 / 99-010 | N1903 (pdf, html, doc ) | Umamaheswaran, V. S. (1998-12-30), "8.1.5.1", Zápis ze schůze pracovní skupiny 2 35, Londýn, Velká Británie; 1998-09-21-25 | ||||
3.2 | U + 2047, 2051 | 2 | L2 / 99-238 | Konsolidovaný dokument obsahující 6 japonských návrhů, 1999-07-15 | ||
N2092 | Přidání čtyřiceti osmi znaků, 1999-09-13 | |||||
L2 / 99-365 | Moore, Lisa (1999-11-23), Komentáře k návrhům JCS | |||||
L2 / 00-024 | Shibano, Kohji (2000-01-31), Návrh JCS revidován | |||||
L2 / 99-260R | Moore, Lisa (02.02.2000), „JCS Proposals“, Zápis ze schůze UTC / L2 v Mission Viejo, 26. – 28. Října 1999 | |||||
L2 / 00-098, L2 / 00-098-stránka5 | N2195 | Odůvodnění pro znaky jiné než Kanji navržené výborem JCS, 2000-03-15 | ||||
L2 / 00-119[d] | N2191R | Whistler, Ken; Freytag, Asmus (2000-04-19), Kódování dalších matematických symbolů v Unicode | ||||
L2 / 00-234 | N2203 (rtf, txt ) | Umamaheswaran, V. S. (2000-07-21), "8.18, 8.20", Zápis ze zasedání SC2 / WG2 v Pekingu, 21. 03. 2000 - 24 | ||||
L2 / 00-115R2 | Moore, Lisa (8. 8. 2000), „Motion 83-M11“, Zápis ze schůzky UTC # 83 | |||||
L2 / 00-297 | N2257 | Sato, T. K. (04.09.2000), JIS X 0213 symboly část-1 | ||||
L2 / 00-342 | N2278 | Sato, T. K.; Everson, Michael; Whistler, Ken; Freytag, Asmus (2000-09-20), Zpráva ad hoc o zpětné vazbě na Japonsko N2257 a N2258 | ||||
L2 / 01-050 | N2253 | Umamaheswaran, V. S. (2001-01-21), "7.16 JIS X0213 Symbols", Zápis ze schůze SC2 / WG2 v Aténách, září 2000 | ||||
U + 204E..2050, 2057, 205F, 2061..2062 | 7 | L2 / 00-005R2 | Moore, Lisa (2000-02-14), "Motion 82-M11", Zápis z UTC # 82 v San Jose | |||
L2 / 00-119[d] | N2191R | Whistler, Ken; Freytag, Asmus (2000-04-19), Kódování dalších matematických symbolů v Unicode | ||||
L2 / 00-234 | N2203 (rtf, txt ) | Umamaheswaran, V. S. (2000-07-21), "8.18", Zápis ze zasedání SC2 / WG2 v Pekingu, 21. 03. 2000 - 24 | ||||
L2 / 00-115R2 | Moore, Lisa (8. 8. 2000), „Motion 83-M11“, Zápis ze schůzky UTC # 83 | |||||
U + 2052, 2063 | 2 | L2 / 01-142[d] | N2336 | Beeton, Barbara; Freytag, Asmus; Ion, Patrick (2001-04-02), Další matematické symboly | ||
L2 / 01-156 | N2356 | Freytag, Asmus (03.04.2001), Další matematické znaky (koncept 10) | ||||
L2 / 01-344 | N2353 (pdf, doc ) | Umamaheswaran, V. S. (9. 9. 2001), „7.7 Matematické symboly“, Zápis ze schůze SC2 / WG2 č. 40 - Mountain View, duben 2001 | ||||
U + 2060 | 1 | L2 / 99-260R | Moore, Lisa (02.02.2000), „Unicode ve značkovacích jazycích“, Zápis ze schůze UTC / L2 v Mission Viejo, 26. – 28. Října 1999 | |||
L2 / 00-005R2 | Moore, Lisa (2000-02-14), „Zero Width Grapheme Break / Join“, Zápis z UTC # 82 v San Jose, Akční položka pro Arnolda Winklera: Vzhledem k tomu, že návrh na zrušení / připojení grafu s nulovou šířkou byl stažen, znovu otevřete akční položku 81-12 (pro Marka Davise připravit návrh pro WG2 pro Joiner Word Zero Width). | |||||
L2 / 00-258 | N2235 | Davis, Mark (08.08.2000), Návrh na přidání NULOVÉ ŠÍŘKY WORD JOINER | ||||
L2 / 00-369 | Whistler, Ken (06.10.2000), „e. (ZERO WIDTH) WORD JOINER“, WG2 ve Vouliagmeni (Athény) | |||||
L2 / 01-050 | N2253 | Umamaheswaran, V. S. (2001-01-21), "7.7 Návrh na přidání NULOVÉ ŠÍŘKY WORDJOINER", Zápis ze schůze SC2 / WG2 v Aténách, září 2000 | ||||
4.0 | U + 2053..2054 | 2 | L2 / 02-141 | N2419 | Everson, Michael; et al. (2002-03-20), Znaky fonetické abecedy Uralic pro UCS | |
L2 / 02-192 | Everson, Michael (02.05.2002), Eversonova odpověď na UPA | |||||
N2442 | Everson, Michael; Kolehmainen, Erkki I .; Ruppel, Klaas; Trosterud, Trond (2002-05-21), Odůvodnění pro umístění Uralské fonetické abecedy do BMP | |||||
L2 / 02-291 | Whistler, Ken (2002-05-31), Zpráva WG2 z Dublinu | |||||
L2 / 02-292 | Whistler, Ken (06.06.2002), Časný pohled na dokument WG2 souhlasu | |||||
L2 / 02-166R2 | Moore, Lisa (8. 8. 2002), „Skripty a nové postavy - UPA“, UTC # 91 minut | |||||
L2 / 02-253 | Moore, Lisa (2002-10-21), "Consensus 92-C2", UTC # 92 minut | |||||
4.1 | U + 2055 | 1 | L2 / 03-151R | Constable, Peter; Lloyd-Williams, James; Lloyd-Williams, Sue; Chowdhury, Shamsul Islam; Ali, Asaddar; Sadique, Mohammed; Chowdhury, Matiar Rahman (10.05.2003), Revidovaný návrh pro kódování skriptu Syloti Nagri v BMP | ||
L2 / 03-136 | Moore, Lisa (18. 8. 2003), „Skripty a nové postavy - scénář Syloti Nagri“, UTC # 95 minut | |||||
U + 2056, 2058..2059 | 3 | L2 / 03-282R | N2610R | Everson, Michael; Cleminson, Ralph (04.09.2003), Konečný návrh pro kódování hlaholiky v UCS | ||
L2 / 03-324 | N2642 | Pantelia, Maria (06.10.2003), Návrh na zakódování dalších řeckých redakčních a interpunkčních znaků do USS | ||||
U + 205A..205C | 3 | L2 / 03-157 | Pantelia, Maria (2003-05-19), Další znaky kódu Beta, které nejsou v Unicode (WIP) | |||
L2 / 03-193R | N2612-7 | Pantelia, Maria (06.06.2003), Návrh na zakódování dalších interpunkčních znaků do USS | ||||
U + 205D | 1 | L2 / 02-312R | Pantelia, Maria (11.07.2002), Návrh na zakódování dalších řeckých redakčních a interpunkčních znaků do USS | |||
L2 / 03-324 | N2642 | Pantelia, Maria (06.10.2003), Návrh na zakódování dalších řeckých redakčních a interpunkčních znaků do USS | ||||
U + 205E | 1 | L2 / 03-354 | N2655 | Freytag, Asmus (10. 10. 2003), Návrh - Symboly používané ve slovnících | ||
L2 / 03-356R2 | Moore, Lisa (2003-10-22), „Consensus 97-C15“, UTC # 97 minut | |||||
5.1 | U + 2064 | 1 | L2 / 07-011R | N3198R | Freytag, Asmus; Beeton, Barbara; Ion, Patrick; Sargent, Murray; Carlisle, David; Pournader, Roozbeh (2007-01-15), 29 Další matematické a symbolické znaky | |
L2 / 07-015 | Moore, Lisa (08.02.2007), „Matematické znaky a symboly (C.4)“, UTC # 110 minut | |||||
L2 / 07-268 | N3253 (pdf, doc ) | Umamaheswaran, V. S. (2007-07-26), "M50.16", Nepotvrzené zápisy z jednání pracovní skupiny 2 50, Frankfurt nad Mohanem, Německo; 2007-04-24 / 27 | ||||
6.3 | U + 2066..2069 | 4 | L2 / 12-186R | Lanin, Aharon; Davis, Mark; Pournader, Roozbeh (2012-07-24), Návrh na Bidi izoluje v Unicode | ||
L2 / 12-290 | N4310 | Lanin, Aharon; Davis, Mark; Pournader, Roozbeh (2012-07-31), Návrh čtyř postav pro Bidi | ||||
L2 / 12-239 | Moore, Lisa (2012-08-14), „Consensus 132-C12“, UTC # 132 minut | |||||
L2 / 13-040 | Pournader, Roozbeh; Lanin, Aharon (29.01.2013), Fasttracking Arabic Letter Mark (ALM) | |||||
L2 / 13-125 | N4447 | Constable, Peter (06.06.2013), Zpráva o spojení Unicode pro WG2 | ||||
|
Reference
- ^ "Databáze znaků Unicode". Standard Unicode. Citováno 2016-07-09.
- ^ „Výčet verzí standardu Unicode“. Standard Unicode. Citováno 2016-07-09.
- ^ „UTR # 51: Unicode Emoji“. Konsorcium Unicode. 2020-02-11.
- ^ „UCD: Emoji Data for UTR # 51“. Konsorcium Unicode. 2020-01-28.
- ^ „Variační sekvence emodži UTS # 51“. Konsorcium Unicode.