Algoritmus řazení Unicode - Unicode collation algorithm
Tento článek obsahuje a seznam doporučení, související čtení nebo externí odkazy, ale jeho zdroje zůstávají nejasné, protože mu chybí vložené citace.Září 2016) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
The Algoritmus řazení Unicode (UCA) je algoritmus definovaný v Unicode Technical Report # 10, což je přizpůsobitelná metoda pro výrobu binárních klíčů struny představující text v libovolném systém psaní a Jazyk které lze reprezentovat pomocí Unicode. Tyto klíče lze poté efektivně porovnávat po bajtech, aby se kompletovat nebo je roztřídit podle pravidel jazyka s možností ignorování malých a velkých písmen atd.
Technická zpráva Unicode č. 10 rovněž specifikuje Výchozí tabulka prvků řazení Unicode (DUCET). Tento datový soubor určuje výchozí řazení řazení. DUCET je přizpůsobitelný pro různé jazyky. Některá taková přizpůsobení lze najít v Unicode Společné datové úložiště národního prostředí (CLDR).
Open source implementace UCA je součástí Mezinárodní komponenty pro Unicode, JIP. ICU podporuje krejčovství a řazení krejčovství z CLDR je součástí ICU. Účinky krejčovství a mnoha jazykových krejčovství se zobrazují online Průzkumník národního prostředí ICU.
Viz také
- Třídění
- ISO / IEC 14651
- Evropská pravidla pro objednávání (EOR)
- Společné datové úložiště národního prostředí (CLDR)
externí odkazy
- Algoritmus řazení Unicode: Unicode Technical Standard # 10
- Mimer SQL Unicode Collation Charts
- MySQL srovnávací grafy
Nástroje
- Průzkumník národního prostředí ICU Online ukázka použití Unicode Collation Algorithm Mezinárodní komponenty pro Unicode
- msort Program třídění, který poskytuje neobvyklou úroveň flexibility při definování řazení a extrahování klíčů.
Tento algoritmy nebo datové struktury související článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |
Tento standardy - nebo měření související článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |