Kombinace postavy - Combining character
v digitální typografie, kombinování znaků jsou postavy které jsou určeny k úpravě dalších znaků. Nejběžnější kombinující znaky v latinském písmu jsou kombinování diakritická znaménka (počítaje v to kombinující akcenty).
Unicode také obsahuje mnoho předkomponované znaky, takže v mnoha případech je možné použít jak kombinaci diakritiky, tak předkomponovaných znaků, podle volby uživatele nebo aplikace. To vede k požadavku na provedení Normalizace Unicode před porovnáním dvou řetězců Unicode a pečlivě navrhnout převaděče kódování, aby správně mapovaly všechny platné způsoby, jak reprezentovat znak v Unicode, na starší kódování, aby nedošlo ke ztrátě dat.[1]
V Unicode je hlavní blok kombinování diakritiky pro evropské jazyky a Mezinárodní fonetická abeceda je U + 0300 – U + 036F. Kombinace diakritických znamének se vyskytuje také v mnoha dalších blocích znaků Unicode. V Unicode se diakritika vždy přidává za hlavní postavu (na rozdíl od některých starších kombinujících znakových sad, jako je ANSEL ) a ke stejnému znaku je možné přidat několik diakritiky, včetně skládaných diakritiky nahoře a dole, i když některé systémy je nemusí dobře vykreslit.
Rozsahy Unicode
Následující bloky jsou věnovány speciálně kombinování znaků:
- Kombinace Diacritical Marks (0300–036F), od verze 1.0, s úpravami v následujících verzích až po 4.1
- Kombinace rozšířených diakritických značek (1AB0–1AFF), verze 7.0
- Kombinace doplňku o diakritické značky (1DC0–1DFF), verze 4.1 až 5.2
- Kombinace diakritických značek pro symboly (20D0–20FF) od verze 1.0, s úpravami v následujících verzích až na 5,1
- Kombinace polovičních značek (FE20 – FE2F), verze 1.0, s úpravami v následujících verzích až na 8,0
Kombinování znaků se neomezuje pouze na tyto bloky; například kombinování dakuten (U + 3099) a kombinování handakuten (U + 309A) jsou v Hiragana blok, Devanagari blok obsahuje kombinování znaků samohlásky a dalších značek pro použití s tímto skriptem atd. Kombinujícím znakům je přiřazeno Hlavní kategorie Unicode „M“ („značka“).
Kombinace diakritických značek[1] Oficiální tabulka kódů konsorcia Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U + 030x | ◌̀ | ◌́ | ◌̂ | ◌̃ | ◌̄ | ◌̅ | ◌̆ | ◌̇ | ◌̈ | ◌̉ | ◌̊ | ◌̋ | ◌̌ | ◌̍ | ◌̎ | ◌̏ |
U + 031x | ◌̐ | ◌̑ | ◌̒ | ◌̓ | ◌̔ | ◌̕ | ◌̖ | ◌̗ | ◌̘ | ◌̙ | ◌̚ | ◌̛ | ◌̜ | ◌̝ | ◌̞ | ◌̟ |
U + 032x | ◌̠ | ◌̡ | ◌̢ | ◌̣ | ◌̤ | ◌̥ | ◌̦ | ◌̧ | ◌̨ | ◌̩ | ◌̪ | ◌̫ | ◌̬ | ◌̭ | ◌̮ | ◌̯ |
U + 033x | ◌̰ | ◌̱ | ◌̲ | ◌̳ | ◌̴ | ◌̵ | ◌̶ | ◌̷ | ◌̸ | ◌̹ | ◌̺ | ◌̻ | ◌̼ | ◌̽ | ◌̾ | ◌̿ |
U + 034x | ◌̀ | ◌́ | ◌͂ | ◌̓ | ◌̈́ | ◌ͅ | ◌͆ | ◌͇ | ◌͈ | ◌͉ | ◌͊ | ◌͋ | ◌͌ | ◌͍ | ◌͎ | CGJ |
U + 035x | ◌͐ | ◌͑ | ◌͒ | ◌͓ | ◌͔ | ◌͕ | ◌͖ | ◌͗ | ◌͘ | ◌͙ | ◌͚ | ◌͛ | ◌͜ | ◌͝ | ◌͞ | ◌͟ |
U + 036x | ◌͠ | ◌͡ | ◌͢ | ◌ͣ | ◌ͤ | ◌ͥ | ◌ͦ | ◌ͧ | ◌ͨ | ◌ͩ | ◌ͪ | ◌ͫ | ◌ͬ | ◌ͭ | ◌ͮ | ◌ͯ |
Poznámky
|
Kódové body U + 032A a U + 0346–034A jsou IPA symboly:
- U + 032A◌̪: zubní
- U + 0346◌͆: dentolabiální
- U + 0347◌͇: alveolární
- U + 0348◌͈: silný artikulace
- U + 0349◌͉: slabá artikulace
- U + 034A◌͊: denasal
Codepoints U + 034B – 034E jsou IPA diakritika pro neuspořádaná řeč:
- U + 034B◌͋: nosní únik
- U + 034C◌͌: velofaryngeální tření
- U + 034D◌͍: labiální šíření
- U + 034E◌͎: pískaná artikulace
U + 034F je „kombinace grafémového truhláře "(CGJ) a nemá žádný viditelný glyf.
Codepoints U + 035C – 0362 jsou dvojitá diakritiky, diakritická znaménka umístěná přes dvě písmena.
Codepoints U + 0363–036F jsou středověká horní písmena abecedy, písmena psaná přímo nad ostatní písmena, která se objevují ve středověkých germánských rukopisech, ale v některých případech se používají až do 19. století. Například U + 0364 je E napsané nad předchozím písmenem, které se použije pro (Brzy ) Nová vysoká němčina přehláska notace, jako např uͤ pro moderní němčinu ü.
Kombinace rozšířených diakritických značek[1][2] Oficiální tabulka kódů konsorcia Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U + 1ABx | ◌᪰ | ◌᪱ | ◌᪲ | ◌᪳ | ◌᪴ | ◌᪵ | ◌᪶ | ◌᪷ | ◌᪸ | ◌᪹ | ◌᪺ | ◌᪻ | ◌᪼ | ◌᪽ | ◌᪾ | ◌ᪿ |
U + 1ACx | ◌ᫀ | |||||||||||||||
U + 1ADx | ||||||||||||||||
U + 1AEx | ||||||||||||||||
U + 1AFx | ||||||||||||||||
Poznámky |
Kombinace doplňku diakritických značek[1][2] Oficiální tabulka kódů konsorcia Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U + 1DCx | ◌᷀ | ◌᷁ | ◌᷂ | ◌᷃ | ◌᷄ | ◌᷅ | ◌᷆ | ◌᷇ | ◌᷈ | ◌᷉ | ◌᷊ | ◌᷋ | ◌᷌ | ◌᷍ | ◌᷎ | ◌᷏ |
U + 1DDx | ◌᷐ | ◌᷑ | ◌᷒ | ◌ᷓ | ◌ᷔ | ◌ᷕ | ◌ᷖ | ◌ᷗ | ◌ᷘ | ◌ᷙ | ◌ᷚ | ◌ᷛ | ◌ᷜ | ◌ᷝ | ◌ᷞ | ◌ᷟ |
U + 1DEx | ◌ᷠ | ◌ᷡ | ◌ᷢ | ◌ᷣ | ◌ᷤ | ◌ᷥ | ◌ᷦ | ◌ᷧ | ◌ᷨ | ◌ᷩ | ◌ᷪ | ◌ᷫ | ◌ᷬ | ◌ᷭ | ◌ᷮ | ◌ᷯ |
U + 1DFx | ◌ᷰ | ◌ᷱ | ◌ᷲ | ◌ᷳ | ◌ᷴ | ◌᷵ | ◌᷶ | ◌᷷ | ◌᷸ | ◌᷹ | ◌᷻ | ◌᷼ | ◌᷽ | ◌᷾ | ◌᷿ | |
Poznámky |
Kombinace diakritických značek pro symboly[1][2] Oficiální tabulka kódů konsorcia Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U + 20Dx | ◌⃐ | ◌⃑ | ◌⃒ | ◌⃓ | ◌⃔ | ◌⃕ | ◌⃖ | ◌⃗ | ◌⃘ | ◌⃙ | ◌⃚ | ◌⃛ | ◌⃜ | ◌⃝ | ◌⃞ | ◌⃟ |
U + 20Ex | ◌⃠ | ◌⃡ | ◌⃢ | ◌⃣ | ◌⃤ | ◌⃥ | ◌⃦ | ◌⃧ | ◌⃨ | ◌⃩ | ◌⃪ | ◌⃫ | ◌⃬ | ◌⃭ | ◌⃮ | ◌⃯ |
U + 20Fx | ◌⃰ | |||||||||||||||
Poznámky |
Kombinace polovičních známek[1] Oficiální tabulka kódů konsorcia Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U + FE2x | ◌︠ | ◌︡ | ◌︢ | ◌︣ | ◌︤ | ◌︥ | ◌︦ | ◌︧ | ◌︨ | ◌︩ | ◌︪ | ◌︫ | ◌︬ | ◌︭ | ◌︮ | ◌︯ |
Poznámky
|
OpenType
OpenType má ccmp "tag funkce" k definování glyfů, které jsou kompozicemi nebo rozklady zahrnujícími kombinování znaků, označit tag pro definování umístění kombinujících znaků na základní glyf a mkmk pro umístění kombinace znaků na sebe.
Zalgo text
Kombinované znaky byly použity k vytvoření tzv.Zalgo text", což je text, který se jeví jako" poškozený "nebo" strašidelný "kvůli nadměrnému použití diakritiky. To způsobí, že se text rozšíří svisle a překryje tak další text.[2]
Viz také
- Mrtvý klíč
- Mezerník Modifikační písmena které by se neměly kombinovat (i když v některých implementacích, kde vývojář zaměnil „kombinování“ s „modifikátorem“)
Poznámky
- ^ Například při převodu mezi windows-1258 a VISCII, první používá kombinování diakritiky, zatímco druhý má velký výběr předkomponovaných znaků, takže převaděč pomocí jednoduchého mapování mezi hodnotami kódu a body kódu Unicode při převodu mezi nimi poškodí text.
- ^ Korpela, Jukka K. „Jak funguje text Zalgo?“. Přetečení zásobníku. Citováno 11. dubna 2019.
externí odkazy
- Kombinace tabulky diakritiky (v Adobe PDF formát)
- Kombinace doplňkového grafu diakritiky (v Adobe PDF formát)
- Kombinace známek testovací stránka směřující ke kombinovaným a předkomponovaným písmenům
- Alan Wood's Unicode Resources
- DecodeUnicode.org kombinující odkaz na diakritická znaménka