Obecná interpunkce - General Punctuation

Obecná interpunkce
RozsahU + 2000..U + 206F
(112 kódových bodů)
LetadloBMP
SkriptyBěžný (109 znaků)
Zděděno (2 znaky)
Sady symbolůInterpunkce
Prostory
Ovládací prvky formátu
Přiřazeno111 kódových bodů
Nepoužitý1 vyhrazený kódový bod
6 zastaralé
Historie verzí Unicode
1.0.067 (+67)
1.176 (+9)
3.083 (+7)
3.295 (+12)
4.097 (+2)
4.1106 (+9)
5.1107 (+1)
6.3111 (+4)
Poznámka: [1][2]

Obecná interpunkce je Blok Unicode obsahující interpunkční znaménka, mezery a formátovací znaky pro použití se všemi skripty a psacími systémy. Zahrnuty jsou definované šířky mezery, spojovací formáty, směrové formáty, chytré uvozovky, archaická a nová interpunkce, jako je interobang a neviditelné matematické operátory.

Další interpunkční znaky jsou v Doplňková interpunkce blok a posypané desítkami dalších bloků Unicode.

Blok

Obecná interpunkce[1][2][3]
Oficiální tabulka kódů konsorcia Unicode (PDF)
 0123456789ABCDEF
U + 200xNQ
SP
MQ
SP
EN
SP
EM
SP
3 / M
SP
4 / M
SP
6 / M
SP
F
SP
P
SP
TH
SP
H
SP
ZW
SP
ZW
NJ
ZW
J
LRM RLM
U + 201x Pozn
U + 202xL
SEP
P
SEP
LRE RLE PDF LRO RLO NNB
SP
U + 203x
U + 204x
U + 205xMM
SP
U + 206x WJ ƒ()   ×    ,    +   LRI RLI FSI PDI
SS
A
SS

AFS
A
AFS
NA
DS
NE
DS
Poznámky
1.^ Od verze Unicode 13.0
2.^ Šedá oblast označuje nepřiřazený kódový bod
3.^ Body kódu Unicode U + 206A - U + 206F jsou zastaralé od verze Unicode verze 3.0

Několik znaků v tomto bloku se obvykle nevykreslí přímo viditelným glyfem. Deset prázdné znaky U + 2002 až U + 200B (opraveno en nebo 12em, em,13em,14em,16em, obrázek a interpunkční prostor, proměnná tenký nebo 15em a vlasový prostor, pevný prostor nulové šířky) a U + 205F (matematické médium nebo 29 em prostor) se liší horizontální šířkou, zatímco U + 2000 a U + 2001 (en a em quad) jsou skutečně aliasy U + 2002, respektive U + 2003; další dva, U + 202F a U + 2060 (špatně pojmenované slovo truhlář) jsou varianty U + 2009 nebo U + 2004 a U + 200B, které zakazují zalomení řádků. Tři znaky nulové šířky U + 200B až U + 200D (prostor, non-truhlář a truhlář) se liší v tom, jak ovlivňují ligace a tvarování sousedních písmen, jako je kontextové formy v arabštině. Jedenáct neviditelných znaků U + 200E, U + 200F (zleva do prava a značka zprava doleva), U + 202A až U + 202E (vloží, vyskočí a přepíše) a U + 2066 až U + 2069 (izoláty) ovládat směrovost textu, pokud je nepřekoná označení vyšší úrovně. Existují explicitní čára a oddělovače odstavců na U + 2018 a U + 2019.

Emodži

Blok obecné interpunkce obsahuje dva emodži: U + 203C a U + 2049.[3][4]

Blok má čtyři standardizované varianty definováno pro specifikaci stylu emoji (U + FE0F VS16) nebo textové prezentace (U + FE0E VS15) pro dva emodži, z nichž oba jsou výchozí pro textovou prezentaci.[5]

Sekvence variací emodži
U +203C2049
bod základního kódu
base + VS15 (text)‼︎⁉︎
základna + VS16 (emodži)‼️⁉️

Dějiny

Následující dokumenty týkající se Unicode zaznamenávají účel a proces definování konkrétních znaků v bloku Obecné interpunkční znaménko:

Reference

  1. ^ "Databáze znaků Unicode". Standard Unicode. Citováno 2016-07-09.
  2. ^ „Výčet verzí standardu Unicode“. Standard Unicode. Citováno 2016-07-09.
  3. ^ „UTR # 51: Unicode Emoji“. Konsorcium Unicode. 2020-02-11.
  4. ^ „UCD: Emoji Data for UTR # 51“. Konsorcium Unicode. 2020-01-28.
  5. ^ „Variační sekvence emodži UTS # 51“. Konsorcium Unicode.