Euromatrix - Euromatrix - Wikipedia

The EuroMatrix je projekt, který probíhal od září 2006 do února 2009. Cílem projektu bylo rozvíjet a zlepšovat strojový překlad (MT) systémy mezi všemi úředními jazyky Evropské unie (EU).

Na EuroMatrix navázal další projekt EuroMatrixPlus (Březen 2009 až únor 2012).

Přístup k překladu

EuroMatrix prozkoumal pomocí jazykových znalostí v statistický strojový překlad. Statistické techniky byly kombinovány s na základě pravidel přístup, jehož výsledkem je hybridní MT architektura. Projekt experimentoval s kombinací metod a zdrojů ze statistické MT, pravidlové MT, zpracování mělkého jazyka a výpočetní lexikografie a morfologie.

Cíle projektu

EuroMatrix se zaměřil na vysoce kvalitní překlady pro publikaci technických, sociálních, právních a politických dokumentů. Aplikovala pokročilé technologie MT na všechny páry jazyků EU; Rovněž byly vzaty v úvahu jazyky nových a pravděpodobných členských států EU.

Každoroční mezinárodní hodnocení

Konferenční výroční mezinárodní hodnocení setkání strojového překladu („maratony MT“) bylo organizováno za účelem setkání výzkumných pracovníků MT. Účastníci maratonů překládali testovací sady se svými systémy. Testovací sady byly poté hodnoceny manuálními i automatickými metrikami.

MT maratony byly vícedenní události skládající se z několika akcí - letní škola, laboratorní lekce, výzkumné rozhovory, workshopy, konvence open source, výzkumné vitríny.

Seznam MT maratonů

názevdatumMísto
Strojový překlad Marathon 2007[1]16. – 20. Dubna 2007Edinburgh, Velká Británie
Strojový překlad Marathon 2008[2]12. - 17. května 2008Berlín, Německo
Strojový překlad Marathon 2009[3]26. - 30. ledna 2009Praha, Česká republika

Výsledek

Projekt vytvořil nebo podpořil několik nástrojů a zdrojů:[4]

  • Mojžíš, otevřený zdrojový stroj pro statistický strojový překlad
  • Europarl Corpus, verze 3
  • Výsledky seminářů o statistickém strojovém překladu (2007, 2008, 2009)
  • CzEng Corpus, verze 0.7

Financování

Projekt EuroMatrix sponzorovala Program EU pro technologii informační společnosti.

Celkové náklady na projekt činily 2 358 747 EUR, z čehož Evropská unie přispěla částkou 2 066 388 EUR.[5]

Členové projektu

Projektu se zúčastnily zkušené výzkumné skupiny v oblasti strojového překladu, které jsou mezinárodně uznávané, jakož i relevantní průmysloví partneři. Konsorcium zahrnovalo University of Edinburgh (Spojené království), Univerzita Karlova (Česká republika), Sárská univerzita (Německo), Centrum pro hodnocení jazykových a komunikačních technologií (Itálie), MorphoLogic (Maďarsko) a GROUP Technologies AG (Německo).[5]

Projekt koordinoval Hans Uszkoreit, profesor výpočetní lingvistiky na Sárské univerzitě.[5]

Reference

externí odkazy