Eurotra - Eurotra

Eurotra byl ambiciózní strojový překlad projekt zřízený a financovaný Evropská komise od roku 1978 do roku 1992.

Povzbuzen skromným úspěchem se starším komerčně vyvinutým systémem strojového překladu SYSTRAN, zahájila velká síť evropských výpočetních lingvistů projekt Eurotra s nadějí na vytvoření nejmodernějšího systému MT pro tehdy sedm, později devět úředních jazyků Evropská komunita.

Jak však čas plynul, očekávání se zmírnila; „Plně automatický vysoce kvalitní překlad“ nebyl rozumně dosažitelný cíl. Skutečným charakterem Eurotry byl nakonec uznán spíše předkonkurenční výzkum než vývoj prototypů.

Projekt byl motivován jednou ze zakládajících zásad EU: že všichni občané mají právo číst veškerá jednání Komise v jejich vlastním jazyce. Jak se připojilo více zemí, vzniklo a kombinatorická exploze vzhledem k počtu zapojených jazykových párů a nutnost překládat všechny příspěvky, projevy a dokonce i soubory zápisů ze schůzí vytvořené EU do dalších osmi jazyků znamenalo, že překlad se rychle stal drtivou součástí správního rozpočtu. K vyřešení tohoto problému byla vyvinuta společnost Eurotra.

Projekt byl neobvyklý v tom, že místo jediného výzkumného týmu měl členské skupiny distribuované po členských zemích, organizované spíše podle jazyků než podle národních linií (například skupiny v Lovani a Utrechtu úzce spolupracovaly) a sekretariát byl se sídlem v Evropská komise v Lucembursko. I když to významně přispělo ke kultuře projektu, ukázalo se to také graficky Brooks „tvrzení v Mýtický muž-měsíc že přidání personálu do projektu vede k tomu, že jeho dokončení trvá déle; čím více je zapojených skupin, tím více času je věnováno správě a komunikaci než samotnému výzkumu jako takému.

Skutečný design projektu byl neobvyklý, protože projekty MT jdou. Starší systémy, jako například SYSTRAN, byly založeny především na slovnících, s menší podporou přeskupení slovosledu. Novější systémy často pracovaly na pravděpodobnostním přístupu založeném na paralelních korpusech. Eurotra oslovila základní struktura textu, který má být přeložen, nejprve prochází syntaktickým textem analyzovat následuje druhá analýza k vytvoření struktury závislostí následovaná konečnou analýzou se třetí gramatikou k vytvoření toho, co bylo interně označováno jako Intermediate Representation (IR). Protože všechny tři moduly byly implementovány jako Prolog programů, bylo by v zásadě možné tuto strukturu posunout zpět prostřednictvím odpovídajících modulů pro jiný jazyk a vytvořit přeložený text v kterémkoli z ostatních jazyků. V praxi to však ve skutečnosti nebylo tak, jak byly jazykové páry implementovány.

První „živý“ překlad zabral 4 MB Microvax běh Ultrix a C-Prolog na kompletní víkend někdy na začátku roku 1987. Věta přeložena z Angličtina do dánština, bylo „Japonsko vyrábí počítače“. Hlavním problémem, kterému tento systém čelil, bylo generování takzvaných „Parse Forests“ - na jakoukoli konkrétní frázi bylo často možné použít velké množství různých gramatických pravidel, které vyprodukovaly stovky, ba tisíce (často identických) parse stromů. To spotřebovalo obrovské množství počítačového úložiště a zbytečně zpomalilo celý proces.

Zatímco Eurotra nikdy nedodala „fungující“ systém MT, projekt měl dalekosáhlý dlouhodobý dopad na rodící se jazykový průmysl v evropských členských státech, zejména v jižních zemích Řecko, Itálie, Španělsko, a Portugalsko. Existuje alespoň jeden komerční systém MT (vyvinutý akademickým / komerčním konsorciem v roce 2006) Dánsko ) odvozený z technologie Eurotra.

Viz také

externí odkazy