LOLITA - LOLITA - Wikipedia
LOLITA je zpracování přirozeného jazyka systém vyvinutý společností Durham University mezi lety 1986 a 2000. Název je akronym pro „Velké, objektové, Jazykové Interakce, Překladatel a analyzátor ".
LOLITA vyvinul Roberto Garigliano a jeho kolegové v letech 1986 až 2000. Byl navržen jako univerzální nástroj pro zpracování neomezeného textu, který by mohl být základem široké škály aplikace. Jeho jádrem byla a sémantická síť obsahující přibližně 90 000 vzájemně propojených konceptů. Text může být analyzován a analyzovány a poté začleněny do sémantické sítě, kde je možné o nich uvažovat (Long a Garigliano, 1993). Fragmenty sémantické sítě lze také vykreslit zpět na Angličtina nebo španělština.
Pomocí systému bylo vytvořeno několik aplikací, včetně analyzátorů finančních informací a nástrojů pro extrakci informací pro společnost DarpaKonference o porozumění zprávám Soutěže “(MUC-6 a MUC-7 ). Ten zahrnoval zpracování originálu Wall Street Journal článků, k provádění úkolů, jako je identifikace klíčových změn pracovních míst v podnicích a shrnutí článků. LOLITA byla jedním z malého počtu systémů na celém světě, která soutěžila ve všech částech úkolů. Popis systému a analýzu výsledků MUC-6 napsal Callaghan (Callaghan, 1998).
LOLITA byla časným příkladem podstatné aplikace napsané v funkční jazyk: sestávalo z přibližně 50 000 řádků Haskell, s přibližně 6000 řádky C. Je to také složitá a náročná aplikace, ve které bylo mnoho aspektů Haskellu při vývoji neocenitelných.
LOLITA byla navržena pro práci s neomezeným textem, takže dvojznačnost na různých úrovních byla nevyhnutelná a významná. Lenost bylo nezbytné při zvládnutí výbuchu syntaktický nejednoznačnost vyplývající z velkého gramatika a také se hodně používalo se sémantickou nejednoznačností. Systém používal více "specifické pro doménu vložený jazyky " pro sémantický a pragmatické zpracování a pro generování textu v přirozeném jazyce ze sémantické sítě. Důležitá byla také schopnost pracovat se složitými abstrakcemi a prototyp nová analýza algoritmy rychle.[1]
Pozdější systémy založené na stejném designu zahrnují Concepts a SenseGraph.
Viz také
Reference
- ^ A History of Haskell: Being Lazy With Class oddíl 11.5
externí odkazy
- Zpráva o pokroku Lolita č. 1 1992
- [1] Sbírka referátů o paralelismu v Haskellu, kde je Lolita často jedním z hlavních testovacích případů
- Modelování víry pro diskurzní plány - (Garagani 1997)