LinguaStream - LinguaStream
LinguaStream je obecná platforma pro Zpracování přirozeného jazyka (NLP), založené na postupném obohacování elektronických dokumentů. LinguaStream je vyvíjen v GREYC (Francouzsky: Groupe de recherche en informatique, image, automatique et instrumentation de Caen) počítačová věda výzkumná skupina (Université de Caen ) od roku 2001. Je k dispozici zdarma pro soukromé použití a výzkumné účely.
Popis
LinguaStream umožňuje navrhovat a vyhodnocovat složité datové proudy a sestavovat analytické komponenty různých typů a úrovní: část mluvy, syntax, sémantika, diskurz nebo statistický. Každá fáze proudu zpracování objevuje a produkuje nové informace, na které se mohou spolehnout následující kroky. Na konci proudu umožňuje několik nástrojů pohodlně vizualizovat analyzované dokumenty a jejich anotace.
LinguaStream je především virtuální laboratoř zaměřená na výzkumné pracovníky v NLP. Umožňuje pohodlné provádění komplexních experimentů na korpusech pomocí různých typů deklarativních formalismů a značného snížení nákladů na vývoj. Jeho použití sahá od průzkumu korpusů po vývoj plně funkčních automatických analyzátorů. Platforma poskytuje integrované prostředí, kde lze dosáhnout všech kroků realizace experimentu.
Technologie
Jako platforma poskytuje LinguaStream rozsáhlý Jáva API. Může být například integrován s Java EE servery k vývoji webových aplikací založených na zpracování streamů. Používá se také pro výuku a poskytuje specifické moduly určené studentům.
Reference
![]() | Tato část obsahuje a seznam doporučení, související čtení nebo externí odkazy, ale jeho zdroje zůstávají nejasné, protože mu chybí vložené citace.Březen 2010) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
![]() | Tato sekce má nejasný styl citace.Březen 2010) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
- „LinguaStream: Integrované prostředí pro experimentální výpočetní lingvistiku“, F. Bilhaut a A. Widlöcher (2006). Ve sborníku z 11. konference Evropské kapitoly Asociace výpočetní lingvistiky (EACL) (Companion Volume), Trento, Itálie.
- „Une plate-form logicielle et une démarche pour la validation de ressources linguistiques sur corpus: application à l'évaluation de la détection automatique de cadres temporels", S. Ferrari, F. Bilhaut, A. Widlöcher, M. Laignelet (2005) . V Actes des 4èmes Journées de Linguistique de Corpus, Lorient, Francie.
- „La plate-forma LinguaStream: un outil d'exploration linguistique sur corpus“, A. Widlöcher a F. Bilhaut (2005). In Actes de la 12e Conférence Traitement Automatique du Language Naturel (TALN), Dourdan.
- „La plate-forma LinguaStream“, F. Bilhaut a A. Widlöcher (2005). Journée ATALA „Articuler les traitements sur corpus“, Paříž, Francie.
- „Platforma LinguaStream“, F. Bilhaut (2003). Ve sborníku z 19. konference španělské společnosti pro zpracování přirozeného jazyka (SEPLN), Alcalá de Henares, Španělsko, 339-340.