Algoritmus řazení Unicode - Unicode collation algorithm

Tento článek obsahuje a seznam doporučení, související čtení nebo externí odkazy, ale jeho zdroje zůstávají nejasné, protože mu chybí vložené citace. Prosím pomozte zlepšit tento článek představuji přesnější citace. (Září 2016) (Zjistěte, jak a kdy odstranit tuto zprávu šablony)

The Algoritmus řazení Unicode (UCA) je algoritmus definovaný v Unicode Technical Report # 10, což je přizpůsobitelná metoda pro výrobu binárních klíčů struny představující text v libovolném systém psaní a Jazyk které lze reprezentovat pomocí Unicode. Tyto klíče lze poté efektivně porovnávat po bajtech, aby se kompletovat nebo je roztřídit podle pravidel jazyka s možností ignorování malých a velkých písmen atd.

Technická zpráva Unicode č. 10 rovněž specifikuje Výchozí tabulka prvků řazení Unicode (DUCET). Tento datový soubor určuje výchozí řazení řazení. DUCET je přizpůsobitelný pro různé jazyky. Některá taková přizpůsobení lze najít v Unicode Společné datové úložiště národního prostředí (CLDR).

Open source implementace UCA je součástí Mezinárodní komponenty pro Unicode, JIP. ICU podporuje krejčovství a řazení krejčovství z CLDR je součástí ICU. Účinky krejčovství a mnoha jazykových krejčovství se zobrazují online Průzkumník národního prostředí ICU.

Viz také

externí odkazy

Algoritmus řazení Unicode: Unicode Technical Standard # 10
Mimer SQL Unicode Collation Charts
MySQL srovnávací grafy

Nástroje

Průzkumník národního prostředí ICU Online ukázka použití Unicode Collation Algorithm Mezinárodní komponenty pro Unicode
msort Program třídění, který poskytuje neobvyklou úroveň flexibility při definování řazení a extrahování klíčů.

Unicode

Kódové body

Postavy

Speciální účel	Kusovníku Kombinace grafického truhláře Značka zleva doprava / Značka zprava doleva Měkká pomlčka Slovo truhlář Truhlář s nulovou šířkou Žádný truhlář s nulovou šířkou Prostor s nulovou šířkou
Seznamy	Postavy CJK Unified Ideographs Kombinace postavy Duplicitní znaky Číslice Skripty Prostory Symboly Poloviční šířka a plná šířka Alias jména a zkratky

zpracovává se

Algoritmy	Obousměrný text Třídění ISO 14651 Rovnocennost Variační sekvence Jádro mezinárodních ideografů
Srovnání	BOCU-1 CESU-8 Punycode SCSU UTF-1 UTF-7 UTF-8 UTF-16 / UCS-2 UTF-32 / UCS-4 UTF-EBCDIC

Na párech
kódové body

Používání

Související normy

související témata

Skripty a symboly v Unicode
Společné a zděděné skripty	Kombinace známek Diacritics Interpunkce Prostor Čísla
Moderní skripty	Adlam arabština Arménský Balijské Bamum Batak bengálský Bopomofo Braillovo písmo Buhid Barmská Kanadský domorodec Chakma Cham Čerokee CJK Unified Ideographs (Han) cyrilice Deseret Devanagari Bože Gruzínský řecký Gudžarátština Gunjala Gondi Gurmukhi Hangul Hanifi Rohingya Hanja Hanunuo hebrejština Hiragana Jávský Kanji Kannadština Katakana Kayah Li Khmer Lao latinský Lepcha Limbu Lisu (Fraser) Lontara Malayalam Masaram Gondi Mende Kikakui Medefaidrin Miao (Pollard) mongolský Mru N'Ko Nová Tai Lue Nüshu Nyiakeng Puachue Hmong Odia Ol Chiki Osage Osmanya Pahawh Hmong Pau Cin Hau Pracalit (Newa) Randžana Rejang samaritán Saurashtra Shavian Sinhálština Sorang Sompeng Sundanština syrský Tagbanwa Tai Le Tai Tham Tai Viet Tamil Telugština Thaana Thai Tibetský Tifinagh Tirhuta Vai Wancho Warang Citi Yi
Starověké a historické skripty	Ahom Anatolské hieroglyfy Starověký severní arab Avestan Bassa Váh Bhaiksuki Brāhmī Carian Bělošský Albánec Koptský Klínové písmo Kypřan Ponory Akuru Dogra Egyptské hieroglyfy Elbasan Elymaic Hlaholika gotický Grantha Hatran Imperiální aramejština Nápis Pahlavi Nápis Parthian Kaithi Kharosthi Khitan malý skript Khojki Khudawadi Khwarezmian (Chorasmian) Lineární A Lineární B Lycianský Lydian Mahajani Makasar Mandaic Manichejský Marchen Meetei Mayek Meroitický Modi Multani Nabataean Nandinagari Ogham Staromaďarský Stará kurzíva Old Permic Staré perské klínové písmo Starý Sogdian Starý Turkic Palmyren ʼPhags-pa fénický Psalter Pahlavi Runic Sharada Siddham Sogdian Jihoarabský Sojombo Sylheti Nagri Tagalština (Baybayin) Takri Tangut Ugaritický Yezidi Zanabazarské náměstí
Notační skripty	Duployan SignWriting
Symboly, emodži	Kulturní, politické a náboženské symboly Měna Matematické operátory a symboly Fonetické symboly (včetně IPA) Emodži
Kategorie: Unicode Kategorie: bloky Unicode

Tento algoritmy nebo datové struktury související článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to.

Tento standardy - nebo měření související článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to.