Tamilský skriptový kód pro výměnu informací - Tamil Script Code for Information Interchange
Tamilský skriptový kód pro výměnu informací (TSCII) je kódovací schéma pro reprezentaci Tamil skript. Dolních 128 kódových bodů je prostých ASCII, horní 128 kódových bodů je specifických pro TSCII. Po dlouhých letech používání na internetu pouze na základě soukromé dohody byla úspěšně zaregistrována u IANA v roce 2007.[1]
TSCII kóduje znaky ve vizuálním (písemném) pořadí, paralelně s použitím Tamilského psacího stroje.
Unicode použil strategii kódování logického pořadí pro tamilštinu, následující ISCII, na rozdíl od případu Thai, kde vizuální pořadí kódování dědeček TIS-620 byl adoptován.
Vláda Tamil Nadu podporuje vlastní standardy TAB / TAM pro 8bitové kódování a další, starší kódovací schémata lze stále najít na WWW.
Sbírka etext zdarma na Projekt Madurai používá TSCII kódování, ale již to začalo poskytovat Unicode verze.
Dějiny
Potřebu společného kódování pro tamilštinu pocítili členové různých fór založených na e-mailových konferencích v polovině 90. let, protože na těchto fórech převládalo několik vlastních kódovaných písem. Zatímco některá z komerčních kódování byla populární než ostatní, širší komunita je nepřijala kvůli konfliktním komerčním zájmům. Zatímco Unicode byl většinou přijímán jako budoucí standard, většina desktopových systémů v té době ještě nebyla schopná zvládnout Unicode pro tamilský jazyk a bylo vyžadováno prozatímní 8bitové kódování.
V roce 1997 byl pro zahájení této diskuse vytvořen samostatný seznam adresátů pro diskusi o těchto kódováních ([email protected]), počínaje e-mailem od Dr. K. Kalyanasundaram populárnímu tamilskému autorovi Sujatha který stál v čele výboru pro standardizaci tamilské klávesnice.[2] Toto fórum rychle přilákalo nadšené účastníky z celého světa, včetně několika významných tamilských učenců. Archivy těchto diskusí udržuje INFITT.[3]
Po zveřejnění TSCII se většina členů e-mailové konference [email protected] stala součástí INFITT, což je širší iniciativa zaměřená na standardizaci a další vývoj v různých oblastech tamilských výpočtů.
Rozložení kódové stránky
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ 128 | ௦[A] 0BE6 | ௧ 0BE7 | ஸ்ரீ 0BB8 0BCD 0BB0 0BC0 | ஜ 0B9C | ஷ 0BB7 | ஸ 0BB8 | ஹ 0BB9 | க்ஷ 0B95 0BCD 0BB7 | ஜ் 0B9C 0BCD | ஷ் 0BB7 0BCD | ஸ் 0BB8 0BCD | ஹ் 0BB9 0BCD | க்ஷ் 0B95 0BCD 0BB7 0BCD | ௨ 0BE8 | ௩ 0BE9 | ௪ 0BEA |
9_ 144 | ௫ 0BEB | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | ௬ 0 BEC | ௭ 0BED | ௮ 0BEE | ௯ 0BEF | ஙு 0B99 0BC1 | ஞு 0B9E 0BC1 | ஙூ 0B99 0BC2 | ஞூ 0B9E 0BC2 | ௰ 0BF0 | ௱ 0BF1 | ௲ 0BF2 |
A_ 160 | NBSP 00A0 | ா 0BBE | ி 0BBF | ீ 0BC0 | ு 0BC1 | ூ 0BC2 | ெ 0BC6 | ே 0BC7 | ை 0BC8 | © 00A9 | ௗ 0BD7 | அ 0B85 | ஆ 0B86 | ஈ 0B88 | உ 0B89 | |
B_ 176 | ஊ 0B8A | எ 0B8E | ஏ 0B8F | ஐ 0B90 | ஒ 0B92 | ஓ 0B93 | ஔ 0B94 | ஃ 0B83 | க 0B95 | ங 0B99 | ச 0B9A | ஞ 0B9E | ட 0B9F | ண 0BA3 | த 0BA4 | ந 0BA8 |
C_ 192 | ப 0BAA | ம 0BAE | ய 0BAF | ர 0BB0 | ல 0BB2 | வ 0BB5 | ழ 0BB4 | ள 0BB3 | ற 0BB1 | ன 0BA9 | டி 0B9F 0BBF | டீ 0B9F 0BC0 | கு 0B95 0BC1 | சு 0B9A 0BC1 | டு 0B9F 0BC1 | ணு 0BA3 0BC1 |
D_ 208 | து 0BA4 0BC1 | நு 0BA8 0BC1 | பு 0BAA 0BC1 | மு 0BAE 0BC1 | யு 0BAF 0BC1 | ரு 0BB0 0BC1 | லு 0BB2 0BC1 | வு 0BB5 0BC1 | ழு 0BB4 0BC1 | ளு 0BB3 0BC1 | று 0BB1 0BC1 | னு 0BA9 0BC1 | கூ 0B95 0BC2 | சூ 0B9A 0BC2 | டூ 0B9F 0BC2 | ணூ 0BA3 0BC2 |
E_ 224 | தூ 0BA4 0BC2 | நூ 0BA8 0BC2 | பூ 0BAA 0BC2 | மூ 0BAE 0BC2 | யூ 0BAF 0BC2 | ரூ 0BB0 0BC2 | லூ 0BB2 0BC2 | வூ 0BB5 0BC2 | ழூ 0BB4 0BC2 | ளூ 0BB3 0BC2 | றூ 0BB1 0BC2 | னூ 0BA9 0BC2 | க் 0B95 0BCD | ங் 0B99 0BCD | ச் 0B9A 0BCD | ஞ் 0B9E 0BCD |
F_ 240 | ட் 0B9F 0BCD | ண் 0BA3 0BCD | த் 0BA4 0BCD | ந் 0BA8 0BCD | ப் 0BAA 0BCD | ம் 0BAE 0BCD | ய் 0BAF 0BCD | ர் 0BB0 0BCD | ல் 0BB2 0BCD | வ் 0BB5 0BCD | ழ் 0BB4 0BCD | ள் 0BB3 0BCD | ற் 0BB1 0BCD | ன் 0BA9 0BCD | இ 0B87 |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
- ^ U + 0BE6 TAMIL DIGIT ZERO, který byl přidán s Unicode verze 4.1 v březnu 2005
Nástroje pro převod
Dokumenty kódované UTF-8 můžete převést na TSCII pomocí nástrojů GNU iconv následujícím způsobem,
$ iconv -f utf-8 -t tscii ahoj.utf8> ahoj.tscii
Zatímco převod z TSCII na UTF-8 se provádí záměnou -F a -t vlajky.
Vizuální aplikace
Open source projekt je k dispozici na AnyTaFont2UTF8 udržuje Tamilská komunita Isaiyini
Viz také
- TACE16 (Tamilské kódování všech znaků)