Euromatrix - Euromatrix - Wikipedia
The EuroMatrix je projekt, který probíhal od září 2006 do února 2009. Cílem projektu bylo rozvíjet a zlepšovat strojový překlad (MT) systémy mezi všemi úředními jazyky Evropské unie (EU).
Na EuroMatrix navázal další projekt EuroMatrixPlus (Březen 2009 až únor 2012).
Přístup k překladu
EuroMatrix prozkoumal pomocí jazykových znalostí v statistický strojový překlad. Statistické techniky byly kombinovány s na základě pravidel přístup, jehož výsledkem je hybridní MT architektura. Projekt experimentoval s kombinací metod a zdrojů ze statistické MT, pravidlové MT, zpracování mělkého jazyka a výpočetní lexikografie a morfologie.
Cíle projektu
EuroMatrix se zaměřil na vysoce kvalitní překlady pro publikaci technických, sociálních, právních a politických dokumentů. Aplikovala pokročilé technologie MT na všechny páry jazyků EU; Rovněž byly vzaty v úvahu jazyky nových a pravděpodobných členských států EU.
Každoroční mezinárodní hodnocení
Konferenční výroční mezinárodní hodnocení setkání strojového překladu („maratony MT“) bylo organizováno za účelem setkání výzkumných pracovníků MT. Účastníci maratonů překládali testovací sady se svými systémy. Testovací sady byly poté hodnoceny manuálními i automatickými metrikami.
MT maratony byly vícedenní události skládající se z několika akcí - letní škola, laboratorní lekce, výzkumné rozhovory, workshopy, konvence open source, výzkumné vitríny.
Seznam MT maratonů
název | datum | Místo |
---|---|---|
Strojový překlad Marathon 2007[1] | 16. – 20. Dubna 2007 | Edinburgh, Velká Británie |
Strojový překlad Marathon 2008[2] | 12. - 17. května 2008 | Berlín, Německo |
Strojový překlad Marathon 2009[3] | 26. - 30. ledna 2009 | Praha, Česká republika |
Výsledek
Projekt vytvořil nebo podpořil několik nástrojů a zdrojů:[4]
- Mojžíš, otevřený zdrojový stroj pro statistický strojový překlad
- Europarl Corpus, verze 3
- Výsledky seminářů o statistickém strojovém překladu (2007, 2008, 2009)
- CzEng Corpus, verze 0.7
Financování
Projekt EuroMatrix sponzorovala Program EU pro technologii informační společnosti.
Celkové náklady na projekt činily 2 358 747 EUR, z čehož Evropská unie přispěla částkou 2 066 388 EUR.[5]
Členové projektu
Projektu se zúčastnily zkušené výzkumné skupiny v oblasti strojového překladu, které jsou mezinárodně uznávané, jakož i relevantní průmysloví partneři. Konsorcium zahrnovalo University of Edinburgh (Spojené království), Univerzita Karlova (Česká republika), Sárská univerzita (Německo), Centrum pro hodnocení jazykových a komunikačních technologií (Itálie), MorphoLogic (Maďarsko) a GROUP Technologies AG (Německo).[5]
Projekt koordinoval Hans Uszkoreit, profesor výpočetní lingvistiky na Sárské univerzitě.[5]