Latinské písmo v Unicode - Latin script in Unicode
Více než tisíc postav z Latinské písmo jsou zakódovány v Standard Unicode, seskupené do několika základních a rozšířených latinských jazyků bloky. Rozšířené rozsahy obsahují hlavně předkomponovaný písmena plus diakritika, která jsou ekvivalentně kódována kombinování diakritiky, stejně jako některé ligatury a odlišná písmena, používaná například v pravopisech různých afrických jazyků (včetně klikněte symboly v latině Extended-B) a Vietnamská abeceda (Latin Extended Extended). Latin Extended-C obsahuje doplňky pro Ujgurština a Klaudiánská písmena. Latin Extended-D se skládá z postav, které středověkáci většinou zajímají. Latin Extended-E většinou zahrnuje znaky používané pro německou dialektologii (Teuthonista ).[1]
Bloky
Od verze 13.0 standardu Unicode je 1374 znaků v následujících blocích klasifikováno jako patřící do latinského písma:[2]
- Základní latinka, 0000–007F. Tento blok odpovídá ASCII.
- Doplněk latinky-1, 0080–00FF
- Latin Extended-A, 0100–017F
- Latin Extended-B, 0180–024F
- Rozšíření IPA, 0250–02AF
- Mezerník Modifikační písmena, 02B0–02FF
- Fonetická rozšíření, 1D00–1D7F
- Doplněk fonetických rozšíření, 1D80–1DBF
- Rozšířené latinky, 1E00–1EFF
- Horní a dolní indexy, 2070–209F
- Písmenové symboly, 2100–214F
- Číselné formuláře, 2150–218F
- Latin Extended-C, 2C60–2C7F
- Latin Extended-D, A720 – A7FF
- Latin Extended-E, AB30 – AB6F
- Abecední prezentační formuláře (Latinské ligatury) FB00 – FB4F
- Formuláře s poloviční a plnou šířkou, FF00 – FFEF
Kromě toho je v souboru kódováno několik znaků podobných latince Symboly měny, Ovládací obrázky, Kompatibilita CJK, Uzavřená alfanumerika, Přiložené dopisy a měsíce CJK, Matematické alfanumerické symboly, a Přiložený alfanumerický doplněk bloky, ale i když jsou graficky latinskými písmeny, mají vlastnost script běžný, a proto nepatří do latinského písma z hlediska Unicode. Lisu také se skládá téměř výhradně z latinských forem, ale používá vlastní vlastnost skriptu.
Tabulka znaků
V této tabulce jsou tyto znaky s Vlastnost skriptu Unicode latinky jsou barevně zvýrazněny, což označuje verzi Unicode, ve které byly zavedeny. Vyhrazené body kódu (které lze v budoucnu přiřadit jako znaky) mají šedé pozadí. Všechny znaky, které nepatří do latinského písma, mají bílé pozadí (a verze Unicode, ve které byly zavedeny, proto není uvedena).
Viz také
- Znaky univerzální znakové sady
- Symboly podobné písmenům (blok Unicode)
- Seznam písmen latinského písma
- Seznam latinských písmen podle tvaru
- Matematické alfanumerické symboly
Reference
- ^ Everson, Michael; Dicklberger, Alois; Pentzlin, Karl; Wandl-Vogt, Eveline (02.06.2011). „Revidovaný návrh na zakódování fonetických znaků„ Teuthonista “do UCS“ (PDF).
- ^ „Scripts-13.0.0.txt“. Konsorcium Unicode. 22. ledna 2020. Citováno 16. března 2020.