Předkomponovaný znak - Precomposed character - Wikipedia
A předkomponovaný znak (alternativně složený charakter nebo rozložitelný charakter) je Unicode entita, kterou lze také definovat jako posloupnost jednoho nebo více dalších znaků. Předkomponovaný znak může obvykle představovat písmeno s diakritická značka, jako E (Latinsky malé písmeno E s akutní přízvuk ). Technicky E (U + 00E9) je znak, který lze rozložit na ekvivalent řetězec základního písmene E (U + 0065) a kombinování akutní přízvuk (U + 0301). Podobně, ligatury jsou předpoklady jejich základních písmen nebo grafémy.
Předkomponované znaky jsou původním řešením pro zastupování mnoha zvláštních písmen v různých znakové sady. V Unicode jsou zahrnuty především na podporu počítačových systémů s neúplnou podporou Unicode, kde se ekvivalentní rozložené znaky mohou vykreslit nesprávně.
Porovnání předkomponovaných a rozložených znaků
V následujícím příkladu je běžné švédský příjmení Åström napsané dvěma alternativními metodami, první s předponou A (U + 00C5) a Ó (U + 00F6) a druhý pomocí rozloženého základního písmene A (U + 0041) s kombinací prsten výše (U + 030A) a an Ó (U + 006F) s kombinací diaeréza (U + 0308).
- AstrÓm (U + 00C5 U + 0073 U + 0074 U + 0072 U + 00F6 U + 006D)
- Åström (U + 0041 U + 030A U + 0073 U + 0074 U + 0072 U + 006F U + 0308 U + 006D)
Kromě různých barev jsou obě řešení ekvivalentní a měla by se vykreslovat shodně. V praxi však některé implementace Unicode stále mají potíže s rozloženými znaky. V nejhorším případě může být kombinace diakritiky ignorována nebo vykreslena jako nerozpoznané znaky za jejich základními písmeny, protože nejsou zahrnuty ve všech písma. K překonání problémů se některé aplikace mohou jednoduše pokusit nahradit rozložené znaky ekvivalentními předkomponovanými znaky.
S neúplným písmem však mohou být předkomponované znaky také problematické - zvláště pokud jsou exotičtější, jako v následujícím příkladu (zobrazující rekonstruované znaky Protoindoevropský slovo pro „pes“):
- ḱṷṓn (U + 1E31 U + 1E77 U + 1E53 U + 006E)
- .n (U + 006B U + 0301 U + 0075 U + 032D U + 006F U + 0304 U + 0301 U + 006E)
V některých situacích je předkomponovaná zelená k, u a Ó s diakritikou se může zobrazit jako nerozpoznané znaky nebo jejich typografické vzhled se může od konečného dopisu velmi lišit n bez diakritiky. Na druhém řádku by se základní písmena měla alespoň správně vykreslit, i když kombinující diakritiku nelze rozpoznat.
OpenType má ccmp „tag funkce“ k definování glyfů, které jsou kompozicemi nebo rozklady zahrnujícími kombinování znaků.
čínské postavy
Teoreticky většina čínské postavy jak je kódováno uživatelem Sjednocení Han a podobná schémata mohou být považována za předkomponované znaky, protože mohou být redukována (rozložena) na svou složku tahy a popisy ideografů s Jazyky popisu čínských znaků. Takový přístup by mohl snížit počet znaků ve znakové sadě z desítek tisíc na pouhých několik set. Na druhou stranu by taková vysoce rozložená znaková sada představovala výzvy pro vyhledávání a úpravy softwaru a vyžadovala by více bajtů kódování na dokument.
Viz také
- Seznam precomposed latinských znaků v Unicode
- Mrtvý klíč
- Klíč pro psaní
- Kombinace postavy
- Ekvivalence Unicode
- Složité rozložení textu
- Znaky kompatibility Unicode
- Abecední prezentační formuláře - (blok Unicode)
- Arabské prezentační formuláře-A - (blok Unicode)
- Arabské prezentační formuláře-B - (blok Unicode)
Zdroje
- Standard Unicode, verze 5.2: Shoda (viz Oddíl 3.7 Rozklad). Konsorcium Unicode, prosinec 2009.
- MSDN: Definování znakové sady. 8. dubna 2010.
- Normalizační formuláře Unicode (Unicode® Standard Annex # 15): http://unicode.org/reports/tr15/
externí odkazy
- Zdarma IDG Serif, derivát FreeSerif písmo s přidanými deklaracemi předkomponovaných znaků.