Slevy (blok Unicode) - Specials (Unicode block)
tento článek potřebuje další citace pro ověření.Duben 2010) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Speciální nabídka | |
---|---|
Rozsah | U + FFF0..U + FFFF (16 kódových bodů) |
Letadlo | BMP |
Skripty | Běžný |
Přiřazeno | 5 kódových bodů |
Nepoužitý | 9 vyhrazených kódových bodů 2 bez znaků |
Historie verzí Unicode | |
1.0.0 | 1 (+1) |
2.1 | 2 (+1) |
3.0 | 5 (+3) |
Poznámka: [1][2] |
Speciální nabídka je krátký Unicode blok přidělený na samém konci Základní vícejazyčné letadlo, na U + FFF0 – FFFF. Z těchto 16 kódových bodů bylo od Unicode 3.0 přiděleno pět:
- U + FFF9 INTERLINEAR ANOTATION ANCHOR, označuje začátek anotovaný text
- U + FFFA MEZINÁRODNÍ ODDĚLOVAČ ANOTACE, označí začátek anotujících znaků
- U + FFFB TERMINÁTOR MEZINÁRODNÍ ANOTACE, označí konec bloku poznámky
- U + FFFC  CHARAKTER VÝMĚNY PŘEDMĚTŮ, zástupný text v textu pro jiný nespecifikovaný objekt, například v a složený dokument.
- U + FFFD � CHARAKTER VÝMĚNY slouží k nahrazení neznámého, nerozpoznaného nebo nepředstavitelného znaku
- U + FFFE <noncharacter-FFFE> ne postava.
- U + FFFF <noncharacter-FFFF> ne postava.
FFFE a FFFF nejsou nepřiřazené v obvyklém smyslu, ale zaručeno, že to nebudou vůbec znaky Unicode. Mohou být použity k uhodnutí schématu kódování textu, protože jakýkoli text, který je obsahuje, není podle definice správně kódovaný text Unicode. Unicode U + FEFF ZNAČKA OBJEDNÁVKY BYTE znak lze vložit na začátek textu Unicode, aby signalizoval jeho endianismus: program, který čte takový text a narazí na 0xFFFE, by pak věděl, že by měl přepnout pořadí bajtů pro všechny následující znaky.
Název bloku v Unicode 1.0 byl Speciální.[3]
Náhradní znak
The náhradní znak (často černý diamant s bílým otazníkem nebo prázdným čtvercovým políčkem) je symbol nalezený v Unicode standard v kódovém bodě U + FFFD v Speciální nabídka stůl. Používá se k označení problémů, když systém není schopen vykreslit proud dat na správný symbol. Obvykle se zobrazuje, když jsou data neplatná a neodpovídají žádnému znaku:
Zvažte textový soubor obsahující německé slovo srst (ve smyslu „pro“) v ISO-8859-1 kódování (0x66 0xFC 0x72
). Tento soubor je nyní otevřen textovým editorem, který předpokládá, že vstup je UTF-8. První a poslední bajt jsou platná kódování ASCII UTF-8, ale prostřední bajt (0xFC
) není platný bajt v UTF-8. Proto by textový editor mohl tento bajt nahradit symbolem nahrazujícího znaku, aby vytvořil platný řetězec Unicode kódové body. Celý řetězec se nyní zobrazuje takto: „f r“.
Špatně implementovaný textový editor může uložit náhradu ve formě UTF-8; data textového souboru pak budou vypadat takto: 0x66 0xEF 0xBF 0xBD 0x72
, který bude v ISO-8859-1 zobrazen jako „f�r“ (toto se nazývá mojibake ). Protože nahrazení je u všech chyb stejné, je nemožné obnovit původní znak. Lepší (ale těžší implementovatelný) design je zachovat původní bajty, včetně chyby, a převést je pouze na náhradu, když zobrazování text. To umožní textovému editoru uložit původní sekvenci bajtů a zároveň uživateli zobrazit indikátor chyby.
Najednou se náhradní znak často používal, když pro daný znak nebyl v písmu k dispozici žádný glyf. Většina moderních systémů pro vykreslování textu místo toho používá písmo .notdef znak, kterým je ve většině případů prázdné pole (nebo „?“ v poli[4]), někdy nazývaný „tofu "(tento prohlížeč zobrazuje ). Pro tento symbol neexistuje žádný bod kódu Unicode."
Náhradní znak se tedy nyní zobrazuje pouze u chyb kódování, jako je neplatný UTF-8. Některý software se to pokouší skrýt překládáním bajtů neplatného UTF-8 na odpovídající znaky Windows-1252 (protože to je nejpravděpodobnější zdroj těchto chyb), takže náhradní znak není nikdy vidět.
Unicode graf
Speciální nabídka[1][2][3] Oficiální tabulka kódů konsorcia Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U + FFFx | IA A | IA S | IA T |  | � | |||||||||||
Poznámky |
Dějiny
Následující dokumenty související s Unicode zaznamenávají účel a proces definování konkrétních znaků v bloku Specials:
Verze | Konečné body kódu[A] | Počet | UTC ID | L2 ID | WG2 ID | Dokument |
---|---|---|---|---|---|---|
1.0.0 | U + FFFD | 1 | (být odhodlán) | |||
U + FFFE..FFFF | 2 | (být odhodlán) | ||||
L2 / 01-295R | Moore, Lisa (06.11.2001), "Motion 88-M2", Zápis ze zasedání UTC / L2 # 88 | |||||
L2 / 01-355 | N2369 (html, doc ) | Davis, Mark (2001-09-26), Žádost o povolení FFFF, FFFE v UTF-8 v textu ISO / IEC 10646 | ||||
L2 / 02-154 | N2403 | Umamaheswaran, V. S. (2002-04-22), „9.3 Povolení FFFF a FFFE v UTF-8“, Návrh zápisu ze schůze WG 2 41, Hotel Phoenix, Singapur, 19. 10. 2001 | ||||
2.1 | U + FFFC | 1 | UTC / 1995-056 | Sargent, Murray (06.06.1995), Doporučení k zakódování znaku WCH_EMBEDDING | ||
UTC / 1996-002 | Aliprand, Joan; Hart, Edwin; Greenfield, Steve (03.03.1996), „Embedded Objects“, UTC # 67 minut | |||||
N1365 | Sargent, Murray (1996-03-18), Shrnutí návrhu - Znak nahrazení objektu | |||||
N1353 | Umamaheswaran, V. S .; Ksar, Mike (25.06.1996), „8,14“, Návrh zápisu ze schůze WG2 v Kodani č. 30 | |||||
L2 / 97-288 | N1603 | Umamaheswaran, V. S. (1997-10-24), "7,3", Nepotvrzené zápisy ze schůze, WG 2 Meeting # 33, Heraklion, Kréta, Řecko, 20. června - 4. července 1997 | ||||
L2 / 98-004R | N1681 | Text ISO 10646 - AMD 18 pro registraci PDAM a hlasování FPDAM, 1997-12-22 | ||||
L2 / 98-070 | Aliprand, Joan; Winkler, Arnold, „Další komentáře k 2.1“, Zápis ze společného setkání UTC a L2 ze setkání v Cupertinu ve dnech 25. – 27. Února 1998 | |||||
L2 / 98-318 | N1894 | Upravený text 10646-1 / FPDAM 18, POZMĚŇOVACÍ NÁVRH 18: Symboly a další, 1998-10-22 | ||||
3.0 | U + FFF9..FFFB | 3 | L2 / 97-255R | Aliprand, Joan (03.12.1997), "3.D Návrh pro in-line notaci (rubín)", Approved Minutes - UTC # 73 & L2 # 170 joint meeting, Palo Alto, CA - 4. - 5. srpna 1997 | ||
L2 / 98-055 | Freytag, Asmus (1998-02-22), Podpora implementace inline a interlineárních anotací | |||||
L2 / 98-070 | Aliprand, Joan; Winkler, Arnold, „3.C.5. Podpora implementace inline a interlineárních anotací“, Zápis ze společného setkání UTC a L2 ze setkání v Cupertinu ve dnech 25. – 27. Února 1998 | |||||
L2 / 98-099 | N1727 | Freytag, Asmus (1998-03-18), Podpora implementace interlineárních anotací, jak se používají ve východoasijské typografii | ||||
L2 / 98-158 | Aliprand, Joan; Winkler, Arnold (26. 5. 1998), „Inline a Interlineární anotace“, Návrh zápisu - společné setkání UTC # 76 a NCITS podskupiny L2 # 173, Tredyffrin, Pensylvánie, 20. – 22. Dubna 1998 | |||||
L2 / 98-286 | N1703 | Umamaheswaran, V. S .; Ksar, Mike (02.07.1998), „8,14“, Nepotvrzené zápisy ze schůze, WG 2 Meeting # 34, Redmond, WA, USA; 1998-03-16-20 | ||||
L2 / 98-270 | Hiura, Hideki; Kobayashi, Tatsuo (1998-07-29), Návrh na návrh inline a interlineární anotace | |||||
L2 / 98-281R (pdf, html ) | Aliprand, Joan (1998-07-31), „In-Line and Interlinear Annotation (III.C.1.c)", Nepotvrzené minuty - UTC # 77 & NCITS Podskupina L2 # 174 SPOLEČNÉ ZASEDÁNÍ, Redmond, WA - 29. - 31. července 1998 | |||||
L2 / 98-363 | N1861 | Sato, T. K. (01.09.1998), Rubínové značky | ||||
L2 / 98-372 | N1884R2 (pdf, doc ) | Whistler, Ken; et al. (1998-09-22), Další znaky pro USS | ||||
L2 / 98-416 | N1882.zip | Podpora implementace meziriadkových poznámek, 1998-09-23 | ||||
L2 / 98-329 | N1920 | Kombinovaná registrace PDAM a hlasování o zvážení na WD pro ISO / IEC 10646-1 / Amd. 30, POZMĚŇOVACÍ NÁVRH 30: Další latinka a další znaky, 1998-10-28 | ||||
L2 / 98-421R | Suignard, Michel; Hiura, Hideki (04.12.1998), Poznámky týkající se meziriadkových anotačních znaků PDAM 30 | |||||
L2 / 99-010 | N1903 (pdf, html, doc ) | Umamaheswaran, V. S. (1998-12-30), "8.2.15", Zápis ze schůze pracovní skupiny 2 35, Londýn, Velká Británie; 1998-09-21-25 | ||||
L2 / 98-419 (pdf, doc ) | Aliprand, Joan (05.02.1999), "Interlinear Annotation Characters", Schválené zápisy - UTC # 78 a NCITS Podskupina L2 # 175 Společné zasedání, San Jose, CA - 1. - 4. prosince 1998 | |||||
UTC / 1999-021 | Duerst, Martin; Bosak, Jon (1999-06-08), Prohlášení W3C XML CG o anotačních znacích | |||||
L2 / 99-176R | Moore, Lisa (04.11.1999), "W3C Liaison Statement on Annotation Character", Zápis ze společného zasedání UTC / L2 v Seattlu, 8. – 10. Června 1999 | |||||
L2 / 01-301 | Whistler, Ken (01. 08. 2001), „E. Označeno jako„ silně nedoporučujeme “pro výměnu prostého textu“, Analýza nepoužívání znaků ve standardu Unicode | |||||
|
Viz také
Reference
- ^ "Databáze znaků Unicode". Standard Unicode. Citováno 2016-07-09.
- ^ „Výčet verzí standardu Unicode“. Standard Unicode. Citováno 2016-07-09.
- ^ „3.8: Grafy po blocích“ (PDF). Standard Unicode. verze 1.0. Konsorcium Unicode.
- ^ „Doporučení pro písma OpenType (OpenType 1.7) - typografie“. docs.microsoft.com. Citováno 18. října 2020.