VISCII - VISCII
MIME / IANA | VISCII |
---|---|
Jazyk (y) | vietnamština, Angličtina |
Vytvořil | Skupina Viet-Std |
Definice | RFC 1456 |
Klasifikace | 8-bit SBCS |
Na základě | ASCII |
VISCII je neoficiálně definovaná změna ASCII Kódování znaků pro používání vietnamského jazyka s počítači. To by nemělo být zaměňováno s podobně pojmenovaným oficiálně registrovaným VSCII kódování. VISCII udržuje 95 tisknutelných znaků ASCII nezměněných, ale nahrazuje 6 z 33 řídicích znaků tisknutelnými znaky. Přidává 128 předkomponované znaky. Unicode a Windows-1258 kódová stránka se nyní používá prakticky pro všechna vietnamská počítačová data,[Citace je zapotřebí ] ale starší soubory VSCII a VISCII mohou vyžadovat převod.
Historie a pojmenování
VISCII byl navržen vietnamskou normalizační pracovní skupinou (Viet-Std Group)[1] sídlící v Silicon Valley V Kalifornii v roce 1992, když ve spolupráci s konsorciem Unicode zahrnovali předem složené vietnamské znaky do standardu Unicode. VISCII, spolu s VIQR, byl poprvé publikován v dvojjazyčné zprávě v září 1992, ve které byl nazván „Vietnamský standardní kodex pro výměnu informací“.[2] Zpráva zaznamenala nárůst využití počítačů ve Vietnamu, že existující aplikace používaly kódování specifická pro dodavatele, která nebyla schopna vzájemně spolupracovat, a že standardizace mezi prodejci bylo proto nutné.[2]
Příští rok, v roce 1993, přijal Vietnam TCVN 5712, jeho první národní norma v EU informační technologie doména.[3] To definovalo kódování znaků s názvem VSCII, který byl vyvinut TCVN Technický výbor pro informační technologie (TCVN / TC1) as názvem „Vietnamský standardní kód pro výměnu informací“.[3] VSCII je nekompatibilní s dříve publikovaným VISCII a jinak s ním nesouvisí.[4] Na rozdíl od VISCII je VSCII „vietnamský standard“ ve smyslu a národní norma.
VISCII a VIQR byly schváleny jako informační stav RFC 1456, připsaný skupině Viet-Std a datovaný květnem 1993. Tento RFC je uvádí jako „konvence“ používané mluvčími zámořských vietnamských Usenet, a že „neurčuje žádnou úroveň standardu“. Navzdory tomu nadále nazývá VISCII „VIetnamese Standard Code for Information Interchange“ (stejný název jako VSCII).[5] Štítky VISCII
a csVISCII
jsou registrovány u IANA pro VISCII, s odkazem na RFC 1456.[6] (Na druhou stranu neexistuje žádný oficiální štítek IANA pro TCVN 5712 / VSCII x-viet-tcvn5712
dříve podporoval Mozilla Firefox.[7])
Design
Tradiční rozšířené ASCII znaková sada se skládá ze sady ASCII a až 128 znaků. Vietnamština vyžaduje 134 dalších písmenných a diakritických kombinací, což je šest příliš mnoho. Existuje (kromě podpory pro klesající tónové značky pro velká písmena, jako v VSCII-3 ) v podstatě čtyři různé způsoby řešení tohoto problému:
- Použití kódování s proměnnou šířkou (stejně jako UTF-8 )
- Zahrnout kombinování diakritických znamének pro tónové značky (stejně jako VSCII-2 a Windows-1258 ) nebo obecně pro diakritiku (stejně jako ANSEL a VNI )
- Nahraďte nějakou interpunkci ASCII, nejlépe interpunkci, která není neměnná ISO 646 (stejně jako VNI pro DOS )
- Vyměňte alespoň šest základních ASCII kontrolní znaky (stejně VPS a VSCII-1 )
VISCII se vydal na poslední možnost a nahradil šest nejméně problematických (např. Nejméně pravděpodobné, že je aplikace rozpozná a na které bude reagovat) C0 kontrolní kódy (STX, ENQ, ACK, DC4, EM a RS) se šesti nejméně používanými kombinacemi velkých písmen a diakritikou.[2] I když tato možnost může způsobit nefunkčnost programů, které používají tyto řídicí kódy při zpracování textu VISCII, vytváří méně komplikací než ostatní dvě možnosti (designéři si všimnou, že8bitové čisté Bylo zjištěno, že přenos v praxi představuje větší potíže než opětovné použití řídicího znaku).[2] Umístění ovládacích znaků C0 nebo C1 a kódy použité pro neporušený prostor v ISO-8859-1, Mac OS Roman a OEM-USA byly záměrně přiděleny velkými písmeny s úmyslem využít malá písmena codepoints s velkým písmem jako použitelné řešení, pokud pro tyto kódy nelze zobrazit grafické znaky.[2]
Vyčerpání všech rozšířených kódové body pro písmena s diakritikou nezbylo místo pro přidání užitečných symbolů, horních čísel, zakřivených uvozovek, správných pomlček atd., jako většina ostatních rozšířených znakových sad ASCII.
Umístění postav záměrně většinou následuje ISO-8859-1 kde mezi oběma kódovými stránkami (velká písmena) jsou společné znaky Ó jako výjimka), motivován obavami o uživatelskou přívětivost.[2]
Podpěra, podpora
VISCII je částečně podporován Softwarová skupina TriChlor v Kalifornii, která vydala různé softwarové balíčky, knihovny a písma kompatibilní s VISCII pro MS-DOS a Windows, Unix a Macintosh. Software kompatibilní s VISCII je k dispozici na mnoha zařízeních FTP stránky.
VISCII byl historicky nabízen jako kódování pro odchozí e-mailem podle Mozilla Thunderbird.[8]
VISCII byl většinou používán zámořskými vietnamskými mluvčími, s VSCII (TCVN) je více populární v severním Vietnamu a VNI je více populární v jižním Vietnamu.[9]
Znaková sada
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | A 1EB2 | ETX 0003 | EOT 0004 | A 1EB4 | A 1EAA | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | ČR 000D | TAK 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | Ỷ 1EF6 | NAK 0015 | SYN 0016 | ETB 0017 | UMĚT 0018 | Ỹ 1EF8 | SUB 001A | ESC 001B | FS 001C | GS 001D | Ỵ 1EF4 | NÁS 001F |
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | A 0061 | b 0062 | C 0063 | d 0064 | E 0065 | F 0066 | G 0067 | h 0068 | i 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | Ó 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | proti 0076 | w 0077 | X 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | DEL 007F |
8_ 128 | A 1EA0 | A 1EAE | A 1EB0 | A 1EB6 | A 1EA4 | A 1EA6 | A 1EA8 | A 1EAC | E 1EBC | E 1EB8 | E 1EBE | E 1EC0 | E 1EC2 | E 1EC4 | E 1EC6 | Ó 1ED0 |
9_ 144 | Ó 1ED2 | Ó 1ED4 | Ó 1ED6 | Ó 1ED8 | Ó 1EE2 | Ó 1EDA | Ó 1EDC | Ó 1EDE | Ị 1 ECA | Ó 1ECE | Ó 1ECC | Ỉ 1EC8 | Ủ 1EE6 | Ũ 0168 | Ụ 1EE4 | Ỳ 1EF2 |
A_ 160 | Ó 00D5 | A 1EAF | A 1EB1 | A 1EB7 | A 1EA5 | A 1EA7 | A 1EA9 | A 1EAD | E 1EBD | E 1EB9 | E 1EBF | E 1EC1 | E 1EC3 | E 1EC5 | E 1EC7 | Ó 1ED1 |
B_ 176 | Ó 1ED3 | Ó 1ED5 | Ó 1ED7 | Ó 1EE0 | Ó 01A0 | Ó 1ED9 | Ó 1EDD | Ó 1EDF | ị 1ECB | Ự 1EF0 | Ứ 1EE8 | Ừ 1EEA | Ử 1EEC | Ó 01A1 | Ó 1EDB | Ư 01AF |
C_ 192 | A 00C0 | A 00C1 | A 00C2 | A 00C3 | A 1EA2 | A 0102 | A 1EB3 | A 1EB5 | E 00C8 | E 00C9 | E 00CA | E 1 EBA | Ì 00CC | Í 00CD | Ĩ 0128 | ỳ 1EF3 |
D_ 208 | Đ 0110 | ứ 1EE9 | Ó 00D2 | Ó 00D3 | Ó 00D4 | A 1EA1 | ỷ 1EF7 | ừ 1EEB | ử 1EED | Ù 00D9 | Ú 00DA | ỹ 1EF9 | ỵ 1EF5 | “ 00DD | Ó 1EE1 | ư 01B0 |
E_ 224 | A 00E0 | A 00E1 | A 00E2 | A 00E3 | A 1EA3 | A 0103 | ữ 1EEF | A 1EAB | E 00E8 | E 00E9 | E 00EA | E 1EBB | ì 00 ES | í 00ED | ĩ 0129 | ỉ 1EC9 |
F_ 240 | đ 0111 | ự 1EF1 | Ó 00F2 | Ó 00F3 | Ó 00F4 | Ó 00F5 | Ó 1ECF | Ó 1ECD | ụ 1EE5 | ù 00F9 | ú 00FA | ũ 0169 | ủ 1EE7 | ý 00FD | Ó 1EE3 | Ữ 1EEE |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
Rozdíly od ISO-8859-1 jsou zobrazeny šedě.
Viz také
- ASCII
- Vietnamská citace - čitelná (VIQR)
- Vietnamský standardní kód pro výměnu informací (VSCII)
- Windows-1258
Reference
- ^ Phung, Quang; Ngo, Hoc D .; Bui, Cuong. „Domovská stránka pracovní skupiny ve vietnamštině“. Skupina Viet-Std. Citováno 2019-08-23.
- ^ A b C d E F Zpráva o standardizaci vietnamského kódování znaků - specifikace kódování znaků VISCII a VIQR 1.1 (Technická zpráva). Skupina Viet-Std. 1992.
- ^ A b „[novinky] TCVN 5712: 1993 (VSCII) - vietnamský národní standard“. 02.06.1993. Archivovány od originál dne 2017-01-11.
- ^ Lunde, Ken. „Kapitola 1: Přehled zpracování informací CJKV (§ Jsou VISCII a VSCII totožné? A co TCVN?)“. Zpracování informací CJKV (2. vyd.). p. 17. ISBN 978-0-596-51447-1.
- ^ Vietnamská pracovní skupina pro normalizaci. „RFC 1456: Konvence pro kódování vietnamského jazyka“. IETF.
- ^ „Sady znaků“. IANA.
- ^ Sivonen, Henri (2014-09-26). "Změny kódování znaků v m-c vyžadují akci c-c". mozilla.dev.apps.thunderbird.
- ^ Sivonen, Henri (2014-09-26). "Změny kódování znaků v m-c vyžadují akci c-c". mozilla.dev.apps.thunderbird.
VISCII a armscii-8 jsou zvláštní v tom smyslu, že po dlouhou dobu samotný Thunderbird (chybně) poskytoval tato kódování v uživatelském rozhraní pro volbu odchozího kódování znaků při psaní zprávy. Proto je možné, že existuje odkaz vytvořený pomocí Thunderbirdu na e-mailové a Usenet příspěvky VISCII a armscii-8.
- ^ Ngo, Hoc Dinh; Tran, TuBinh. "5. Proč mít převod vietnamské znakové sady (znakové sady - kódování)?". Některé speciální funkce WinVNKey.
Další čtení
- Flohr, Guido (2016) [2006]. "Locale :: RecodeData :: VISCII - převodní rutiny pro VISCII". CPAN libintl-perl. Archivováno od originálu dne 2017-01-14. Citováno 2017-01-14.
- https://www.math.nmsu.edu/~mleisher/Software/csets/VISCII.TXT
externí odkazy
- RFC 1456 - Konvence pro kódování vietnamského jazyka
- Pracovní skupina pro vietnamskou normalizaci se sídlem v Kalifornii
- Viet-Std Report 1992
- Software AnGiang
- Software a písma kompatibilní s VISCII pro MS-DOS a Windows
- Software, knihovny a písma kompatibilní s VISCII pro Unix
- WinVNKey, Vietnamský ovladač klávesnice pro Windows podporující nadnárodní znakové sady, včetně VISCII
- MacVNKey, Ovladač klávesnice kompatibilní s VISCII pro Macintosh classic