BulNet - BulNet
![]() | tento článek může být pro většinu čtenářů příliš technická na to, aby je pochopili. Prosím pomozte to vylepšit na aby to bylo srozumitelné pro neodborníky, aniž by byly odstraněny technické podrobnosti. (Duben 2020) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) |
Bulharský WordNet (BulNet) je elektronický vícejazyčný slovník synonymum množiny spolu s jejich vysvětlujícími definicemi a množinami sémantických vztahů s jinými slovy v jazyce.[1][2]
Navazuje na Princeton WordNet (PWN) rámec, který implementuje tradiční sémantické sítě jehož struktura se skládá z uzlů a vztahů mezi uzly.[3][4][5]
Obecná informace
BulNet byl zahájen v rámci projektu financovaného EU BalkaNet - vícejazyčná sémantická síť balkánských jazyků. Po dokončení BalkaNet. vývoj BulNetu pokračoval s podporou bulharské vlády.
Obsah BulNet
Kategorie
Jak 2015, BulNet obsahoval více než 80 000 synonymum množiny rozdělené do devíti slovních druhů - podstatná jména, slovesa, přídavná jména, příslovce, zájmena, předložky, spojky, částice a citoslovce.
Slova obsažená v BulNetu byla vybrána podle různých kritérií. Hlavními kritérii jsou frekvenční analýza výskytu slov ve velkých korpusech textu a zahrnutí synsety. Synchronní sady zahrnují ty, které jsou již obsaženy ve wordnetech jiných jazyků, a synchronizované sady, které odpovídají vysokofrekvenčním slovním smyslům nalezeným v paralelních korpusech.
Sady souborů
Každá synset kóduje vztah ekvivalence mezi řadou lexikální položky - LITERÁLY (alespoň jeden by měl být v SYNSETU výslovně zastoupen), přičemž každá z nich má jedinečný význam (určený hodnotou SENSE) - která se týká jedné a stejné řeči (zadaná jako hodnota POS) a představují jeden a stejný lexikální význam (specifikovaný jako hodnota DEF). Každá synset je propojena se svým protějškem v PWN 3.0 pomocí jedinečného identifikačního čísla - ID. Společné synsety v balkánských jazycích jsou označeny jako společné koncepty podmnožin - BCS.
V Jednojazyčný databáze by měla být synset propojena s alespoň jednou další synsetou prostřednictvím intralingválního vztahu. Mohou být také zakódovány nepovinné informace, například příklady použití, stylistické zvláštnosti, morfologické nebo syntaktické vlastnosti, podrobnosti o autorovi a poslední úpravě.
Sémantické vztahy
Velké množství vztahů zakódovaných v BulNetu efektivně ilustruje sémantické a derivační bohatství jazyka, které nabízí rozmanité příležitosti pro četné aplikace vícejazyčné databáze. BulNet nabízí jazyková řešení na sémantické úrovni, jako jsou možnosti výběru synonym, dotazy na sémantické vztahy slova v lexikálním systému jazyka (antonymy, holonymy atd.), vysvětlující definiční dotazy a překladové ekvivalenty pro lexikální položku.
BulNet je elektronický vícejazyčný slovník sad synonym spolu s jejich vysvětlujícími definicemi a sadami sémantických vztahů s jinými slovy v jazyce.[1][2]
Hydra
Hydra je systém nezávislý na operačním systému určený pro vývoj, ověřování a zkoumání wordnetu. Program umožňuje uživatelům procházet a upravovat libovolný počet jednojazyčných slovních sítí najednou. Jednotlivé wordnetové sítě jsou synchronizovány, takže je možné paralelně prohlížet a zkoumat ekvivalentní sady synonym nebo synsetové sady.[6]
Reference
- ^ A b Koeva, S. Derivační a morfosémantické vztahy v bulharském Wordnetu. In Intelligent Information Systems, XVI, Varšava, Academic Publishing House, 2008, 359—389. ISBN 978-83-60434-44-4. „Archivovaná kopie“ (PDF). Archivovány od originál (PDF) dne 8.7.2011. Citováno 2015-05-12.CS1 maint: archivovaná kopie jako titul (odkaz)
- ^ A b Tsvetana Dimitrova, Ekaterina Tarpomanova a Borislav Rizov. Zvládání derivace v bulharském Wordnetu. In: Heili Orav, Christiane Fellbaum and Piek Vossen (Eds.) Proceedings of the Seventh Global Wordnet Conference, Tartu, Estonsko, 2014, s. 109-117. [1].
- ^ Koeva, S., G. Totkov a A. Genov. Směrem k bulharské WordNet. Romanian Journal of Information Science and Technology, Vol. 7, No. 1-2, 45-61, 2004. ISSN 1453-8245.
- ^ Koeva, S. Bulharský WordNet - vývoj a perspektivy. In International Conference Cognitive Modeling in Linguistics, Varna, 2005, 270-271.
- ^ Koeva, S. Bulharský Wordnet - současný stav, aplikace a vyhlídky. V bulharsko-amerických dialozích prof. M. Drinov Academic Publishing House, Sofia, 2010, 120-132. ISBN 978-954-322-383-1.
- ^ Borislav Rizov. Hydra: Softwarový systém pro Wordnet. In: Heili Orav, Christiane Fellbaum and Piek Vossen (Eds.) Proceedings of the Seventh Global Wordnet Conference, Tartu, Estonsko, 2014, s. 142-147. [2].