Kombinace grafického truhláře - Combining Grapheme Joiner
The kombinace grafémového truhláře (CGJ), U + 034F ͏ KOMBINOVÁNÍ GRAFÉMOVÉHO SPOJENÍ (HTML͏
) je Unicode znak, který nemá viditelný glyf a je „výchozí ignorovatelný“ aplikacemi. Jeho název je nesprávné pojmenování a nepopisuje jeho funkci: znak se nepřipojuje k grafémům.[1] Jeho účelem je sémanticky samostatný znaky, které by měly ne považovat digrafy stejně jako blokovat kanonické přeskupení kombinování známek v průběhu normalizace.
Například v a Maďarský jazyk kontext, sousední písmena C a s by se normálně považovaly za rovnocenné s cs digraph. Pokud jsou odděleny CGJ, budou považovány za dva samostatné grafémy. Na rozdíl od truhlář s nulovou šířkou a podobné znaky, CGJ nemá vliv na to, zda jsou tato dvě písmena poskytnuté samostatně nebo jako ligatura nebo kurzíva spojené - výchozí chování je určeno písmem.[2]
CGJ je také zapotřebí pro složité skripty. Například ve většině případů hebrejština napůl zpívaný přednes přízvuk metheg se má objevit nalevo od samohláskový bod a standardně to většina zobrazovacích systémů vykreslí takto, i když je napsána před samohláskou. Ale několika slovy v Biblická hebrejština metheg se objeví napravo od samohlásky a aby se zobrazovacímu modulu zobrazilo správné vykreslení vpravo, musí být mezi metheg a samohlásku napsáno CGJ. Porovnat:
on | ה |
Pathah (samohláska) | ַ |
metheg | ֽ |
on + pathah + metheg | הַֽ |
on + metheg + pathah | הַֽ |
on + metheg + CGJ + pathah | הֽ͏ַ |
V případě několika po sobě jdoucích kombinování diakritiky, intervenující CGJ naznačuje, že by neměli podléhat kanonickému přeskupení.[2]
Naproti tomu „nulová šířka bez spojení "při U + 200 ° C v Obecná interpunkce rozsah, který zabrání tomu, aby se dva sousední postavy změnily v ligaturu.
Reference
- ^ „UTN # 27: Known anomalies in Unicode Character Names“.
- ^ A b „Unicode StandardVersion 6.0 - základní specifikace“ (PDF). www.unicode.org. Citováno 2020-04-16.