Indický skriptový kód pro výměnu informací - Indian Script Code for Information Interchange
Indický skriptový kód pro výměnu informací (ISCII) je kódovací schéma pro reprezentaci různých systémů zápisu z Indie. Kóduje hlavní Indické skripty a římský přepis. Podporované skripty jsou: Asámština, Bengálština (bengálština), Devanagari, Gudžarátština, Gurmukhi, Kannadština, Malayalam, Oriya, Tamil, a Telugština. ISCII nekóduje systémy psaní Indie založené na Peršan, ale jeho přepínací kódy systému zápisu to přesto umožňují Kašmír, Sindhi, Urdu, Peršan, Paštštino a arabština. Peršanské systémy psaní byly následně zakódovány do PASCII kódování.
ISCII nebyl široce používán mimo určité vládní instituce a nyní jej zastaral Unicode. Unicode používá samostatný blok pro každý systém psaní Indic a do značné míry zachovává rozložení ISCII v každém bloku.
Pozadí
Psací systémy odvozené od Brahmi mají podobnou strukturu. ISCII tedy kóduje písmena se stejnou fonetickou hodnotou ve stejném bodě kódu a překrývá různé skripty. Například kódy ISCII 0xB3 0xDB představují [ki]. Toto bude vykresleno jako കി v Malayalam, कि v Devanagari, jako ਕਿ v Gurmukhi a jako கி v tamilštině. Systém zápisu lze vybrat ve formátu RTF pomocí značek nebo jako prostý text pomocí níže popsaného kódu ATR.
Jednou z motivací pro použití jediného kódování je myšlenka, že to umožní snadné přepis z jednoho psacího systému do druhého. Existuje však dostatek nekompatibilit, že to není opravdu praktický nápad.
ISCII je 8bitové kódování. Spodní 128 kódových bodů je prostých ASCII, horních 128 kódových bodů je specifických pro ISCII. Kromě kódových bodů představujících znaky používá ISCII kódový bod s mnemotechnickou ATR, která označuje, že následující bajt obsahuje jeden ze dvou druhů informací. Jedna sada hodnot mění zapisovací systém až do dalšího indikátoru zapisovacího systému nebo konce řádku. Další sada hodnot vybírá režimy zobrazení, například tučné a kurzíva. ISCII neposkytuje prostředky k indikaci výchozího systému zápisu.
Rozložení kódové stránky
Následující tabulka ukazuje znakovou sadu pro Devanagari. Sady kódů pro Assamese, Bengali, Gujarati, Gurmukhi, Kannada, Malayalam, Oriya, Tamil a Telugu jsou podobné, přičemž každá forma Devanagari je nahrazena ekvivalentní forma v každém psacím systému. Každý znak je zobrazen se svým desetinným kódem a jeho Unicode ekvivalent.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | ČR 000D | TAK 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | NAK 0015 | SYN 0016 | ETB 0017 | UMĚT 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | NÁS 001F |
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Já 0049 | J 004A | K. 004B | L 004C | M 004D | N 004E | Ó 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | PROTI 0056 | Ž 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | A 0061 | b 0062 | C 0063 | d 0064 | E 0065 | F 0066 | G 0067 | h 0068 | i 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | Ó 006F |
7_ 112 | str 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | proti 0076 | w 0077 | X 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | DEL 007F |
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | ँ 0901 | ं 0902 | ः 0903 | अ 0905 | आ 0906 | इ 0907 | ई 0908 | उ 0909 | ऊ 090A | ऋ 090B | ऎ 090E | ए 090F | ऐ 0910 | ऍ 090D | ऒ 0912 | |
B_ 176 | ओ 0913 | औ 0914 | ऑ 0911 | क 0915 | ख 0916 | ग 0917 | घ 0918 | ङ 0919 | च 091A | छ 091B | ज 091C | झ 091D | ञ 091E | ट 091F | ठ 0920 | ड 0921 |
C_ 192 | ढ 0922 | ण 0923 | त 0924 | थ 0925 | द 0926 | ध 0927 | न 0928 | ऩ 0929 | प 092A | फ 092B | ब 092C | भ 092D | म 092E | य 092F | य़ 095F | र 0930 |
D_ 208 | ऱ 0931 | ल 0932 | ळ 0933 | ऴ 0934 | व 0935 | श 0936 | ष 0937 | स 0938 | ह 0939 | INV | ा 093E | ि 093F | ी 0940 | ु 0941 | ू 0942 | ृ 0943 |
E_ 224 | ॆ 0946 | े 0947 | ै 0948 | ॅ 0945 | ॊ 094A | ो 094B | ौ 094C | ॉ 0949 | ् 094D | ़ 093C | । 0964 | ATR | ||||
F_ 240 | EXT | ० 0966 | १ 0967 | २ 0968 | ३ 0969 | ४ 096A | ५ 096B | ६ 096C | ७ 096D | ८ 096E | ९ 096F |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
Speciální body kódu
- Znak INV - kódový bod D9 (217)
- Znak INV se používá jako pseudo souhláska k samostatnému zobrazení kombinujících prvků. Například क (ka) + ् (halant) + INV = क् (poloviční ka). Ekvivalent Unicode je U + 200D NULA ŠÍŘKA SPOJENÍ.
- Znak ATR - kódový bod EF (239)
- Znak ATR následovaný bajtovým kódem se používá k přepnutí na jiný atribut písma (například tučné písmo) nebo jazyk (například bengálský), a to až do další sekvence ATR nebo na konec řádku. To nemá žádný přímý ekvivalent Unicode, protože atributy písma nejsou součástí Unicode a každý skript má odlišnou sadu bodů kódu.
- Znak EXT - kódový bod F0 (240)
- Znak EXT následovaný bajtovým kódem označuje védský přízvuk. To nemá žádný přímý ekvivalent Unicode, protože védské akcenty jsou přiřazeny odlišným bodům kódu.
- Halantní znak ्— kódový bod E8 (232)
- Halantní znak odstraňuje implicitní samohlásku ze souhlásky a používá se mezi souhláskami k reprezentaci souhláskových souhlásek. Například क (ka) + ् (halant) + त (ta) = क्त (kta). Sekvence ् (halant) + ् (halant) zobrazuje konjunkt s explicitním halantem, například क (ka) + ् (halant) + ् (halant) + त (ta) = क्क. Sekvence ् (halant) + ़ (nukta) zobrazuje konjunkt s polovičními souhláskami, pokud jsou k dispozici, například क (ka) + ् (halant) + ़ (nukta) + त (ta) = क्त.
ISCII | Unicode | ||
---|---|---|---|
single halant | E8 | halant | 094D |
halant + halant | E8 E8 | halant + ZWNJ | 094D 200C |
halant + nukta | E8 E9 | halant + ZWJ | 094D 200D |
- Znak Nukta ़— kódový bod E9 (233)
- The nukta Znak za druhým znakem ISCII se používá pro řadu vzácnějších znaků, které v hlavní sadě ISCII neexistují. Například क (ka) + ़ (nukta) = क़ (qa). Tyto znaky mají předkomponované formuláře v Unicode, jak ukazuje následující tabulka.
ISCII kódový bod | Originál charakter | Charakter s nukta | Unicode kódový bod |
---|---|---|---|
A1 (161) | ँ | ॐ | 0950 |
A6 (166) | इ | ऌ | 090C |
A7 (167) | ई | ॡ | 0961 |
AA (176) | ऋ | ॠ | 0960 |
B3 (179) | क | क़ | 0958 |
B4 (180) | ख | ख़ | 0959 |
B5 (181) | ग | ग़ | 095A |
BA (186) | ज | ज़ | 095B |
BF (191) | ड | ड़ | 095C |
C0 (192) | ढ | ढ़ | 095D |
C9 (201) | फ | फ़ | 095E |
DB (219) | ि | ॢ | 0962 |
DC (220) | ी | ॣ | 0963 |
DF (223) | ृ | ॄ | 0944 |
EA (234) | । | ऽ | 093D |
Kódové stránky pro převod ISCII
K převodu z Unicode (UTF-8) na kódování ISCII / ANSI lze použít následující kódové stránky:
- 57002: Devanagari (Hindi, Marathi, Sanskrit, Konkani)
- 57003: bengálština
- 57004: Tamil
- 57005: Telugu
- 57006: Assamese
- 57007: Odia
- 57008: kannadština
- 57009: Malayalam
- 57010: Gujarati
- 57011: Punjabi (Gurmukhi)
Kódové body pro celý jazyk
Sada kódů pro všechny abugidá používající ISCII | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|