Anusaaraka - Anusaaraka

Anusaaraka
Anusaaraka strojový překlad output.jpg
NapsánoKLIPY, Python, Perl, C, C ++
Operační systémKompatibilní s POSIX
K dispozici vAngličtina-Hindština
TypStrojový překlad
LicenceGNU General Public License
webová stránkahttps://ltrc.iiit.ac.in/Anusaaraka/anu_home.html

Anusaaraka je Angličtina až hindština software pro přístup k jazyku (překlad), který využívá algoritmy odvozené z Pāṇini Ashtadhyayi (pravidla gramatiky).[1][2] Tento software vyvíjí Chinmaya International Foundation (CIF)[3] na Mezinárodní institut informačních technologií, Hyderabad (IIIT-H) a University of Hyderabad (Department of Sanskrit Studies).[4] Anusaaraka je vnímána jako fúze tradičních vyspělých indiánů šastry a pokročilé moderní technologie.

Anusaaraka má umožnit uživatelům přístup k textu v jakémkoli Indický jazyk po překladu ze zdrojového jazyka (tj. z angličtiny nebo jiného regionálního indického jazyka).[5] V dnešním informačním věku je k dispozici velké množství informací v angličtině - ať už jde o informace pro konkurenční zkoušky nebo všeobecné čtení. Mnoho lidí, jejichž primárním jazykem je hindština nebo jakýkoli jiný indický jazyk, však nemá přístup k informacím v angličtině. Anusaaraka si klade za cíl překonat tuto jazykovou bariéru tím, že umožní uživateli zadat anglický text do Anusaaraka a přečíst jej v indickém jazyce podle svého výběru.

Anusaaraka odvozuje svůj název od sanskrtského slova „anusaran“, což znamená „následovat“. Jmenuje se to, protože přeložený výstup Anusaaraka se objevuje ve vrstvách - tj. Sled kroků, které na sebe navazují, dokud se uživateli nezobrazí konečný překlad.

Funkce

Věrné znázornění textu ve zdrojovém jazyce

Skrz různé vrstvy výstupu Anusaaraka je snaha zajistit, aby uživatel měl být schopen porozumět informacím obsaženým v anglické větě. Tomuto úsilí je věnována větší důležitost než dokonalým větám v hindštině, protože by bylo zbytečné mít překlad, který dobře čte, ale ve skutečnosti nezachytává informace o zdrojovém textu.

Vrstvený výstup je pro Anusaaraka jedinečný. Uživatel tedy může získat přístup k textovým informacím ve zdrojovém jazyce a k tomu, jak je konečně dosažen překlad do hindštiny. Kritickým rysem vrstveného výstupu je to, že přenos informací se provádí kontrolovaným způsobem v každém kroku, což umožňuje návrat bez ztráty informací. Také jakékoli poškození informací, kterému se nelze vyhnout v procesu překladu, se pak provádí postupně. Proto i když přeložená věta není tak „dokonalá“ jako lidský překlad, s určitým úsilím a orientací na čtení výstupu Anusaaraka může jednotlivec pochopit, co implikuje zdrojový text, při pohledu na vrstvy a kontext, ve kterých se tato věta objevuje.

Reverzibilita

Funkce postupného přenosu informací z jedné vrstvy do druhé dává Anusaarakovi další výhodu spočívající v tom, že přináší reverzibilitu v procesu překladu - což je vlastnost, kterou nelze dosáhnout konvenčním systémem strojového překladu. Dvojjazyčný uživatel Anusaaraka může z důvodu průhlednosti výstupu kdykoli získat přístup k textu ve zdrojovém jazyce v angličtině. K tomu by bylo zapotřebí určité orientace v tom, jak číst výstup Anusaaraka.

Průhlednost

Zobrazení vrstev překladu krok za krokem poskytuje koncovému uživateli zvýšenou úroveň důvěry, protože může sledovat zpět ke zdroji a získat jasnost týkající se přeloženého textu analýzou výstupních vrstev a určitým odkazem na kontext.

Ukázkový výstup

Ukázkový výstup systému Anusaaraka.

Barvy ve výstupu označují kategorii slova:

jmenná fráze
slovesná fráze
adjektivní fráze
příslovková fráze
předložka
spojky
citoslovce

Viz také

externí odkazy

Reference

  1. ^ http://ltrc.iiit.ac.in/~anusaaraka/PUBLICATIONS/rsvp_symposium.html Archivováno 21.07.2011 na Wayback Machine Sympozium RSVP
  2. ^ http://ltrc.iiit.ac.in/downloads/nlpbook/nlp-panini.pdf Panini
  3. ^ „Archivovaná kopie“. Archivovány od originál dne 17.07.2011. Citováno 2010-05-21.CS1 maint: archivovaná kopie jako titul (odkaz) www.chinfo.org/Anusaaraka.html
  4. ^ „Archivovaná kopie“. Archivovány od originál dne 17.07.2011. Citováno 2010-05-21.CS1 maint: archivovaná kopie jako titul (odkaz)
  5. ^ „Archivovaná kopie“. Archivovány od originál dne 17. 7. 2009. Citováno 2011-01-31.CS1 maint: archivovaná kopie jako titul (odkaz)