Formuláře poloviční a plné šířky (blok Unicode) - Halfwidth and Fullwidth Forms (Unicode block)
Formuláře s poloviční a plnou šířkou | |
---|---|
Rozsah | U + FF00..U + FFEF (240 kódových bodů) |
Letadlo | BMP |
Skripty | Hangul (52 znaků) Katakana (55 znaků) latinský (52 znaků) Běžný (66 znaků) |
Sady symbolů | Znaky šířky varianty |
Přiřazeno | 225 kódových bodů |
Nepoužitý | 15 vyhrazených kódových bodů |
Historie verzí Unicode | |
1.0.0 | 216 (+216) |
1.0.1 | 223 (+7) |
3.2 | 225 (+2) |
Poznámka: [1][2][3] |
Formuláře s poloviční a plnou šířkou je jméno a Blok Unicode U + FF00 – FFEF, za předpokladu, že starší kódování obsahuje obě poloviční šířka a plná šířka znaky mohou mít bezztrátový překlad do / z Unicode. Je to poslední z Základní vícejazyčné letadlo kromě toho krátkého Speciální nabídka blok na U + FFF0 – FFFF. Název bloku v Unicode 1.0 byl Varianty poloviční a plné šířky.[4]
Rozsah U + FF01 – FF5E reprodukuje znaky ASCII 21 až 7E jako formy s plnou šířkou. U + FF00 neodpovídá ASCII 20 s plnou šířkou (znak mezery), protože tato role je již splněna U + 3000 "ideografický prostor ".
Rozsah U + FF65 – FF9F kóduje formy s poloviční šířkou katakana při provedení jejich JIS X 0201 rozložení - viz kana poloviční šířky.
Rozsah U + FFA0 – FFDC kóduje formy s poloviční šířkou kompatibilita jamo znaky pro Hangul, při provedení jejich 1974 standard rozložení. Používá se při mapování některých kódování IBM pro korejštinu, například kódové stránky IBM 933, která umožňuje použití Shift Out a Shift In znaky přejít na dvoubajtovou znakovou sadu.[5] Vzhledem k tomu, že dvoubajtová znaková sada mohla obsahovat kompatibilitu jamo, jsou k zajištění kompatibility s obousměrným připojením nutné varianty s poloviční šířkou.[6][7]
Rozsah U + FFE0 – FFEE zahrnuje symboly plné a poloviční šířky.
Blok
Formuláře s poloviční a plnou šířkou[1][2] Oficiální tabulka kódů konsorcia Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U + FF0x | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / | |
U + FF1x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
U + FF2x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
U + FF3x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
U + FF4x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
U + FF5x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | ⦅ |
U + FF6x | ⦆ | 。 | 「 | 」 | 、 | ・ | ヲ | ァ | ィ | ゥ | ェ | ォ | ャ | ュ | ョ | ッ |
U + FF7x | ー | ア | イ | ウ | エ | オ | カ | キ | ク | ケ | コ | サ | シ | ス | セ | ソ |
U + FF8x | タ | チ | ツ | テ | ト | ナ | ニ | ヌ | ネ | ノ | ハ | ヒ | フ | ヘ | ホ | マ |
U + FF9x | ミ | ム | メ | モ | ヤ | ユ | ヨ | ラ | リ | ル | レ | ロ | ワ | ン | ゙ | ゚ |
U + FFAx | HW HF | ᄀ | ᄁ | ᆪ | ᄂ | ᆬ | ᆭ | ᄃ | ᄄ | ᄅ | ᆰ | ᆱ | ᆲ | ᆳ | ᆴ | ᆵ |
U + FFBx | ᄚ | ᄆ | ᄇ | ᄈ | ᄡ | ᄉ | ᄊ | ᄋ | ᄌ | ᄍ | ᄎ | ᄏ | ᄐ | ᄑ | ᄒ | |
U + FFCx | ᅡ | ᅢ | ᅣ | ᅤ | ᅥ | ᅦ | ᅧ | ᅨ | ᅩ | ᅪ | ᅫ | ᅬ | ||||
U + FFDx | ᅭ | ᅮ | ᅯ | ᅰ | ᅱ | ᅲ | ᅳ | ᅴ | ᅵ | |||||||
U + FFEx | ¢ | £ | ¬ |  ̄ | ¦ | ¥ | ₩ | │ | ← | ↑ | → | ↓ | ■ | ○ | ||
Poznámky |
Blok má variační sekvence definované pro východoasijské interpunkční poziční varianty.[8][9] Používají VOLIČ VARIACE U + FE00-1 (VS01) a VOLIČ VARIACE U + FE01-2 (VS02):
U + | FF01 | FF0C | FF0E | FF1A | FF1B | FF1F | Popis |
bod základního kódu | ! | , | . | : | ; | ? | |
základna + VS01 | !︀ | ,︀ | .︀ | :︀ | ;︀ | ?︀ | rohová forma |
základna + VS02 | !︁ | ,︁ | .︁ | :︁ | ;︁ | ?︁ | centrovaná forma |
Pro nulu s plnou šířkou a krátkým diagonálním zdvihem je definována další varianta: U + FF10 FULLWIDTH DIGIT ZERO, U + FE00 VS1 (0︀).[10][9]
Dějiny
Následující dokumenty související s Unicode zaznamenávají účel a proces definování konkrétních znaků v bloku Formuláře poloviční a plné šířky:
Verze | Konečné body kódu[A] | Počet | L2 ID | WG2 ID | Dokument |
---|---|---|---|---|---|
1.0.0 | U + FF01..FF5E, FF61..FFBE, FFC2..FFC7, FFCA..FFCF, FFD2..FFD7, FFDA..FFDC, FFE0..FFE6 | 216 | (být odhodlán) | ||
N4403 (pdf, doc ) | Umamaheswaran, V. S. (2014-01-28), „Usnesení M61.01“, Nepotvrzený zápis ze schůze WG 2 61, Holiday Inn, Vilnius, Litva; 14.06.2013 | ||||
L2 / 17-056 | Lunde, Ken (2017-02-13), Návrh na přidání standardizovaných variačních sekvencí | ||||
L2 / 17-436 | Lunde, Ken (21.01.2018), Návrh na přidání standardizovaných variačních sekvencí pro východoasijskou interpunkci s plnou šířkou | ||||
L2 / 18-039 | Anderson, Deborah; Whistler, Ken; Pournader, Roozbeh; Moore, Lisa; Liang, Hai; Cook, Richard (19. 1. 2018), „24. Interpunkční východoasijská interpunkce“, Doporučení k UTC # 154 ledna 2018 k návrhům skriptů | ||||
L2 / 17-362 | Moore, Lisa (02.02.2018), „B.4.1 Nový návrh na přidání standardizované variační sekvence pro U + FF10 FULL WIDTH DIGIT ZERO“, UTC # 153 minut | ||||
L2 / 18-115 | Moore, Lisa (2018-05-09), „Consensus 154-C17“, 155 minut UTC, Přidejte 16 standardizovaných variačních sekvencí založených na L2 / 17-436R pro Unicode 12.0. | ||||
L2 / 19-055 | Iancu, Laurențiu (2019-01-14), Navrhované změny v hodnotách vlastnosti segmentace pro číslice s plnou šířkou | ||||
L2 / 19-008 | Moore, Lisa (2019-02-08), "B.11.11.1.2 Navrhované změny v hodnotách vlastností segmentace pro celé číslice", UTC # 158 minut | ||||
1.0.1 | U + FFE8..FFEE | 7 | (být odhodlán) | ||
3.2 | U + FF5F..FF60 | 2 | L2 / 99-052 | Freytag, Asmus (05.02.1999), Matematické části z písma symbolu | |
L2 / 01-033 | Karlsson, Kent; Freytag, Asmus (2001-01-16), Odpojte závorky / závorky pro matematiku, výpočetní techniku a notaci Z od podobně vypadajících závorek / závorek CJK | ||||
L2 / 01-159 | N2344 | Ad-hoc zpráva o matematických symbolech, 2001-04-03 | |||
L2 / 01-157 | N2345R | Karlsson, Kent (04.04.2001), Návrh na odpojení určitých interpunkčních znamének CJK od podobně vypadajících matematických plotů | |||
L2 / 01-168 | Whistler, Ken (10.04.2001), Rozdělení závorek a normalizační peklo | ||||
L2 / 01-012R | Moore, Lisa (2001-05-21), „Sloučení závorek a závorek“, Minuty UTC # 86 v Mountain View, leden 2001 | ||||
L2 / 01-223 | Suignard, Michel (2001-05-23), Diskuse o otázkách týkajících se rozřazování závorek | ||||
L2 / 01-184R | Moore, Lisa (2001-06-18), "Motion 87-M21", Zápis ze schůze UTC / L2, Obrátit rozhodnutí učiněné v pohybu 86-M6 nerozpojit závorky. | ||||
L2 / 01-317 | Suignard, Michel (2001-08-14), Oddělení a normalizace závorek | ||||
L2 / 01-295R | Moore, Lisa (11. 11. 2001), „Sjednocení a normalizace závorek“, Zápis ze zasedání UTC / L2 # 88 | ||||
L2 / 02-154 | N2403 | Umamaheswaran, V. S. (2002-04-22), „Resolution M41.1“, Návrh zápisu ze schůze pracovní skupiny 2 41, Hotel Phoenix, Singapur, 19. 10. 2001 | |||
|
Viz také
- Symboly a interpunkční znaménka CJK (blok Unicode)
- Hangul Jamo (blok Unicode)
- Katakana (blok Unicode)
- Latinské písmo v Unicode
- Uzavřená alfanumerika - sekvence odrážek, některé se zobrazují jako celá šířka (např. ⒈, ⓵, ⑴, ⒜, ⓐ)
Reference
- ^ „Dodatek Unicode 1.0.1“ (PDF). Standard Unicode. 1992-11-03. Archivováno (PDF) z původního dne 2016-07-02. Citováno 2016-07-09.
- ^ "Databáze znaků Unicode". Standard Unicode. Archivováno od originálu 2016-07-10. Citováno 2016-07-09.
- ^ „Výčet verzí standardu Unicode“. Standard Unicode. Archivováno z původního dne 2016-06-29. Citováno 2016-07-09.
- ^ „3.8: Grafy po blocích“ (PDF). Standard Unicode. verze 1.0. Konsorcium Unicode.
- ^ „Demonstrace na JIP - Průzkumník převaděče“. demo.icu-project.org. Citováno 7. května 2018.
- ^ https://harjit.moe/hwfwblame.html
- ^ http://userguide.icu-project.org/conversion/data
- ^ Lunde, Ken (2018-01-21). „L2 / 17-436: Návrh na přidání standardizovaných variačních sekvencí pro východoasijskou interpunkci s plnou šířkou“ (PDF).
- ^ A b „Unicode Character Database: Standardized Variation Sequences“. Konsorcium Unicode.
- ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30). „L2 / 15-268: Návrh na reprezentaci lomené nulové varianty prázdné sady“ (PDF).