WX notace - WX notation

Rozložení klávesnice Ubuntu Hindi (WX)
Rozložení klávesnice Ubuntu Hindi (WX)

WX notace je přepis systém zastupování indických jazyků v ASCII. Tento systém vznikl v IIT Kanpur pro výpočetní zpracování indických jazyků a je široce používán mezi zpracování přirozeného jazyka (NLP) komunita v Indii. Zápis (i když neidentifikovaný) se používá například v učebnici NLP od IIT Kanpur.[1] Hlavní rysy tohoto transliteračního schématu jsou: Každá souhláska a každá samohláska má jediné mapování do římštiny. Jedná se tedy o předponový kód, výhodný z hlediska výpočtu. Typicky se malá písmena používají pro nesatirované souhlásky a krátké samohlásky, zatímco velká písmena se používají pro aspirované souhlásky a dlouhé samohlásky. Zatímco retroflexované hlasové a hlasové souhlásky jsou mapovány na 't, T, da D', dentály jsou mapovány na 'w, W, x a X'. Odtud název schématu "WX", odkazující na idiosynkratické mapování. Ubuntu Linux poskytuje podporu klávesnice pro notaci WX.

Samohlásky

AAiuUEEÓÓ

Sonoranty

qQL

Anusvāra a visarga

अंअः
MH

The Anunasika je reprezentováno 'z'. Například अँ = az. V sanskrtu je Avagraha je reprezentováno 'Z'. Například वमतोऽन्तः = vamawoZnwaH. To může způsobit zmatek, protože „Z“ se také používá pro jiné účely v případě jiných indických jazyků (viz níže, poslední odstavec).

Souhlásky

क्ख्ग्घ्ङ्Velární
kK.GGF
च्छ्ज्झ्ञ्Palatal
CCjJF
ट्ठ्ड्ढ्ण्Retroflex
tTdDN
त्थ्द्ध्न्Zubní
wŽXXn
प्फ्ब्भ्म्Labiální
pPbBm
य्र्ल्व्Polosamohláska
yrlproti
श्ष्स्ह्Frikativní
SRsh

Toto schéma bylo dále rozšířeno tak, aby představovalo všechny indické skripty odvozené od Brahmi. Aby se zohlednily znaky z jiných indických jazyků, které v Devanagari chybí, používají se tři operátory: „Y“ pro získání dalšího ISCII znak, „V“ pro získání předchozího znaku ISCII a „Z“ pro přidání znaku nukta. Například například „l“ představuje ल (U0932) z Devanagari a „lY“ představuje ळ (U0933) v maráthštině. „e“ představuje ए (U090F) z Devanagari nebo ఏ (U0C0F) z telugštiny a eV představuje ऎ (U090E) nebo ఎ (U0C0E) z telugštiny. Podobně 'ka' představuje क Devanagari a 'kZa' představuje क़.

Viz také

Reference

  1. ^ Akshar Bharati; Vineet Chaitanya; Rajeev Sangal (1996). „Dodatek B“. Zpracování přirozeného jazyka: paninská perspektiva (PDF). Prentice-Hall of India. 191–193. ISBN  9788120309210. Citováno 16. února 2014.

externí odkazy