| tento článek potřebuje další citace pro ověření. Prosím pomozte vylepšit tento článek podle přidávání citací ke spolehlivým zdrojům. Zdroj bez zdroje může být napaden a odstraněn. Najít zdroje: „WX notace“ – zprávy · noviny · knihy · učenec · JSTOR (únor 2014) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) |
Rozložení klávesnice Ubuntu Hindi (WX)
WX notace je přepis systém zastupování indických jazyků v ASCII. Tento systém vznikl v IIT Kanpur pro výpočetní zpracování indických jazyků a je široce používán mezi zpracování přirozeného jazyka (NLP) komunita v Indii. Zápis (i když neidentifikovaný) se používá například v učebnici NLP od IIT Kanpur.[1] Hlavní rysy tohoto transliteračního schématu jsou: Každá souhláska a každá samohláska má jediné mapování do římštiny. Jedná se tedy o předponový kód, výhodný z hlediska výpočtu. Typicky se malá písmena používají pro nesatirované souhlásky a krátké samohlásky, zatímco velká písmena se používají pro aspirované souhlásky a dlouhé samohlásky. Zatímco retroflexované hlasové a hlasové souhlásky jsou mapovány na 't, T, da D', dentály jsou mapovány na 'w, W, x a X'. Odtud název schématu "WX", odkazující na idiosynkratické mapování. Ubuntu Linux poskytuje podporu klávesnice pro notaci WX.
Samohlásky
Sonoranty
Anusvāra a visarga
The Anunasika je reprezentováno 'z'. Například अँ = az. V sanskrtu je Avagraha je reprezentováno 'Z'. Například वमतोऽन्तः = vamawoZnwaH. To může způsobit zmatek, protože „Z“ se také používá pro jiné účely v případě jiných indických jazyků (viz níže, poslední odstavec).
Souhlásky
Toto schéma bylo dále rozšířeno tak, aby představovalo všechny indické skripty odvozené od Brahmi. Aby se zohlednily znaky z jiných indických jazyků, které v Devanagari chybí, používají se tři operátory: „Y“ pro získání dalšího ISCII znak, „V“ pro získání předchozího znaku ISCII a „Z“ pro přidání znaku nukta. Například například „l“ představuje ल (U0932) z Devanagari a „lY“ představuje ळ (U0933) v maráthštině. „e“ představuje ए (U090F) z Devanagari nebo ఏ (U0C0F) z telugštiny a eV představuje ऎ (U090E) nebo ఎ (U0C0E) z telugštiny. Podobně 'ka' představuje क Devanagari a 'kZa' představuje क़.
Viz také
Reference
externí odkazy