LanguageWare - LanguageWare
LanguageWare je zpracování přirozeného jazyka (NLP) technologie vyvinutá společností IBM, který umožňuje aplikacím zpracovávat text v přirozeném jazyce. Zahrnuje sadu knihoven Java, které poskytují řadu NLP funkce: jazyková identifikace, segmentace / tokenizace textu, normalizace, entity a extrakce vztahů a sémantická analýza a disambiguace. Analytický modul používá Konečný státní stroj přístup na více úrovních, což napomáhá jeho výkonovým charakteristikám při zachování přiměřeně malé stopy.
Chování systému je řízeno sadou konfigurovatelných lexiko-sémantických zdrojů, které popisují vlastnosti a doménu zpracovaného jazyka. Výchozí sada prostředků je součástí LanguageWare a popisuje charakteristiky nativního jazyka, například morfologii a základní slovní zásobu pro jazyk. Byly vytvořeny doplňkové zdroje, které zachycují další slovníky, terminologie, pravidla a gramatiky, které mohou být obecné pro daný jazyk nebo specifické pro jednu nebo více domén.
Sada Zatmění - přizpůsobovací nástroje založené na jazycích, LanguageWare Resource Workbench, jsou k dispozici na platformě IBM alphaWorks[1] a umožňuje zkompilovat znalosti domény do těchto zdrojů a začlenit je tak do procesu analýzy.
LanguageWare lze nasadit jako sadu UIMA -kompatibilní komentátory, zásuvné moduly Eclipse nebo Webové služby.
Viz také
- Data Discovery and Query Builder
- Konečný stavový stroj
- Formální jazyk
- IBM Omnifind
- Lingvistika
- Sémantický web
- Sémantika
- Architektura orientovaná na služby
- webové služby
- UIMA
Reference
- ^ „komunita alphaWorks“. alphaworks.ibm.com. 20. října 2009.
externí odkazy
- IBM LanguageWare Resource Workbench na alphaWorks
- IBM LanguageWare Miner pro vícerozměrné socio-sémantické sítě na alphaWorks
- JumpStart Infocenter pro IBM LanguageWare na IBM.com
- Domovská stránka UIMA v Apache Software Foundation
- Rámec UIMA na SourceForge
- IBM OmniFind Yahoo! Edice (BEZPLATNÝ podnikový vyhledávač)
- Skupina sémantických informačních systémů a jazykového inženýrství
- SemanticDesktop.org
Související články
- Branimir K. Boguraev Zpracování konečného stavu na základě anotací ve velkoplošné architektuře NLP, IBM Research Report, 2004
- Alexander Troussov, Michail Sogrin, „IBM LanguageWare Ontological Network Miner“
- Sheila Kinsella, Andreas Harth, Alexander Troussov, Michail Sogrin, John Judge, Conor Hayes, John G. Breslin, „Navigace a anotace sémanticky umožněných sítí lidí a souvisejících objektů“
- Michail Kotelnikov, Alexander Polonsky, Malte Kiesel, Max Völkel, Heiko Haller, Michail Sogrin, Pär Lannerö, Brian Davis, „Interaktivní sémantický Wikis“[trvalý mrtvý odkaz ]
- Sebastian Trüg, Jos van den Oever, Stéphane Laurière, „Sociální sémantická plocha: Nepomuk“
- Séamus Lawless, Vincent Wade, „Dynamický objev obsahu, sklizeň a dodávka“[mrtvý odkaz ]
- R. Mack, S. Mukherjea, A. Soffer, N. Uramoto, E. Brown, A. Coden, J. Cooper, A. Inokuchi, B. Iyer, Y. Mass, H. Matsuzawa a LV Subramaniam, "Text analytika pro vědu o životě pomocí architektury nestrukturované správy informací "
- Alex Nevidomsky, „UIMA Framework and Knowledge Discovery at IBM“, 4. sympozium pro těžbu textů, Fraunhofer SCAI, 2006