DSSim - DSSim

DSSim[1][2] je mapování ontologie systém, který byl koncipován tak, aby dosáhl určité úrovně předpokládaného strojová inteligence na Sémantický web. Hlavními hnacími faktory jeho vývoje bylo poskytnout alternativu k existující heuristice nebo strojové učení přístupy založené na přístupu více agentů, které využívají nejisté úvahy. Systém poskytuje možný přístup k zajištění porozumění strojům nad daty sémantického webu prostřednictvím víry více agentů a řešení konfliktů.

Teoretické základy

Rámec DSSim pro mapování ontologií byl představen v roce 2005[3] by Miklos Nagy a Maria Vargas-Vera at the Otevřená univerzita (OU). DSSim řeší tři výzvy sémantického webu:

  • Nejistota: Agenti pro mapování ontologie přijímají Dempster – Shaferova teorie pro vytváření přesvědčení o mapování hypotéz. Na základě důkazů podobnosti mapovací agenti kombinují své víry, aby poskytli koherentní pohled na mapování. Systém je založen na teoretickém mentálním modelu pro softwarové agenty, který představuje víry nad podobnostmi různých termínů v různých ontologiích. Prostřednictvím těchto přesvědčení, která jsou odvozena pomocí různých opatření podobnosti a znalostí na pozadí, může každý agent určit určité porozumění pojmům a jejich kontextu.
  • Nekonzistence: Konflikty ve víře jsou řešeny pomocí fuzzy hlasovacího mechanismu. Zpracování dat na sémantickém webu vytváří scénáře, kdy mají různí agenti konfliktní přesvědčení o konkrétním řešení. V těchto situacích musí agenti vyřešit své konflikty, aby vybrali nejlepší možné řešení, např. v našem případě mapování. Agenti pro mapování používají fuzzy hlasování k určení nejlepšího rozhodnutí pro agentovou společnost, ale v případě, že se voliči dopustí chyby ve svých úsudcích, je statisticky nejpravděpodobnější nejlepší alternativa (pokud existuje). Aplikace hlasování pro agenty mapování je možným způsobem, jak zvýšit inteligentnost systémů, tj. Napodobit rozhodování o tom, jak lidé dospějí k rozhodnutí o problematické záležitosti.
  • Rozlehlost: Genetické algoritmy jsou použity techniky založené na optimalizaci, aby poskytly přiměřený časový rámec pro kombinaci víry s použitím velkých ontologií. Jednou z hlavních nevýhod použití Dempster-Shaferovy teorie pro nejisté úvahy je výpočetní složitost kombinace víry. DSSim řeší problém pomocí genetického algoritmu pro vytvoření grafické struktury, která se používá k efektivnímu výpočtu kombinace víry v kontextu ontologického mapování.

DSSim využívá nové 3D vizualizační techniky výsledků mapování i uvažování. Hlavním účelem úložiště a vizualizace uvažování je zachovat stavy uvažování, aby se později zobrazilo koncovým uživatelům. Hlavním cílem je ukázat koncovým uživatelům, proč systém vybral kandidáta na mapování ze dvou různých ontologií.

Hodnocení systému

Hodnocení systému bylo provedeno v rámci Iniciativy pro hodnocení zarovnání ontologie (OAEI). DSSim se zúčastnil roku 2006,[4] 2007,[5] 2008[6] a 2009[7] dosažení postupně zlepšovaných výsledků. V následujících částech je uveden výsledek dvou stop z 8 z OAEI 2008.

RokDostupné skladbyZúčastněné skladbyPočet zúčastněných systémůPokrytí tratí DSSim
2006511020%
2007761785%
20088813100%
2009871687%

Knihovna na OAEI 2008

Podle původní definice úkolu[8] poskytnutý organizátory OAEI 2008, knihovna trati zahrnovala vyrovnání dvou nizozemských tezaurů. Tyto nizozemské tezaury se používají k indexování knih ze dvou sbírek Nizozemské národní knihovny (KB). KB udržuje dvě velké sbírky: depozitní sbírka obsahující všechny nizozemské tištěné publikace (jeden milion položek) a vědecká sbírka obsahující přibližně 1,4 milionu knih převážně o historii, jazyce a kultuře Nizozemska. Každá kolekce je popsána podle vlastního indexovacího systému a koncepční slovní zásoby. Na jedné straně byla vědecká sbírka popsána pomocí GTT, obrovské slovní zásoby obsahující 35 000 obecných konceptů od Wolkenkrabbers (Sky-scrapers) po Verzorging (Care). Na druhou stranu jsou knihy obsažené v depozitní sbírce indexovány hlavně podle Brinkmanova tezauru, který obsahuje velkou sadu nadpisů (více než 5 000), u nichž se očekávalo, že budou sloužit jako globální předměty knih. Ke každému konceptu poskytly tezaury obvyklé lexikální a sémantické informace: preferované štítky, synonyma a poznámky, širší a související pojmy atd. Jazykem obou tezaurů byla nizozemština, ale poměrně podstatná část Brinkmanových konceptů (kolem 60%) pochází s anglickými štítky. Stopa knihovny byla obtížná částečně kvůli její relativně velké velikosti a kvůli její vícejazyčné reprezentaci. Přesto v knihovně Track DSSim dosáhl toho nejlepšího ze 3 zúčastněných systémů. Tyto ontologie však obsahují související a širší pojmy, proto lze mapování provést bez konzultace s vícejazyčnými znalostmi pozadí.

Dssim-oaei2008-library.png

Sledování adresáře na OAEI 2008

Jak uvádí původní definice úkolu[9] Tato trasa, kterou poskytli organizátoři OAEI 2008, je navržena k vyhodnocení kvality mapování ve scénáři integrace taxonomie v reálném světě. Hlavním cílem je změřit, zda zarovnání ontologie nástroje lze efektivně aplikovat na integraci „mělkých ontologií“. Hodnotící datová sada byla extrahována z Google, Yahoo! a Vypadat chytře webové adresáře. Způsob, jakým byly tyto ontologické páry vytvořeny, spočívá v tom, že se spoléháme na referenční interpretaci uzlů, konstruovanou na základě jejich použití. Předpoklad byl, že sémantika uzlů mohla být odvozena od jejich pragmatika, konkrétně z analýzy, které dokumenty byly klasifikovaný pod kterými uzly. Základní myšlenkou tedy bylo spočítat vztahové hypotézy na základě společný výskyt dokumentů. Specifické vlastnosti datové sady byly:

  • Více než 4500 úkolů párování uzlů, kde každý úkol párování uzlů je složen z cest ke kořenům uzlů ve webových adresářích.
  • Expertní mapování pro všechny odpovídající úkoly.
  • Jednoduché vztahy. Webové adresáře v zásadě obsahují pouze jeden typ vztahu, tzv. „Klasifikační vztah“.
  • Vágní terminologie a principy modelování: Přiřazování úkolů zahrnuje typické modelování a terminologické chyby „reálného světa“.
SystémPřesnostRec.F-opatření.
DSSim0.600.410.49
JABLEČNÝ MOŠT0.600.380.47
Lilie0.590.370.46
TaxoMap[10]0.590.390.43
MapPSO[11]0.570.310.40
RiMOM[12]0.550.170.26
ASMOV0.640.120.20

V adresářové stopě se v roce 2008 zúčastnilo pouze 6 systémů. Pokud jde o Hodnota F. DSSim si vedl nejlépe, ale rozdíl byl marginální ve srovnání se systémy CIDER nebo Lily.

Reference

  1. ^ Miklos Nagy a Maria Vargas-Vera. Směrem k automatické integraci sémantických dat: přístup Muti-Agent Framework. Sémantický web. Gang Wu (ed), kapitola 7, str. 107-134; In-Tech Education and Publishing KG; 2010, ISBN  978-953-7619-54-1.
  2. ^ Nagy, Miklos; Vargas-Vera, Maria (2011). "Rámec pro mapování multiagentních ontologií pro sémantický web". Transakce IEEE na systémech, člověku a kybernetice - část A: Systémy a lidé. Institute of Electrical and Electronics Engineers (IEEE). 41 (4): 693–704. doi:10.1109 / tsmca.2011.2132704. ISSN  1083-4427.CS1 maint: ref = harv (odkaz)
  3. ^ Miklos Nagy, Maria Vargas-Vera a Enrico Motta. Rámec pro mapování multiagentních mapování v systému AQUA Answering System. the Čtvrtá mezinárodní mexická konference o umělé inteligenci (MICAI-2005), Poznámky k přednášce v oblasti umělé inteligence LNAI 3789, Gelbukh, A de Albornoz a H. Terashima (Eds), str. 70–79, Monterrey Mexico, 14. – 18. Listopadu 2005.
  4. ^ Jérôme Euzenat, Malgorzata Mochol, Pavel Shvaiko, Heiner Stuckenschmidt, Ondrej Sváb, Vojtech Svátek, Willem Robert van Hage, Mikalai Yatskevich: Výsledky iniciativy pro hodnocení zarovnání na základě ontologie z roku 2006. Ve sborníku z 1. mezinárodního semináře o porovnávání ontologií, ISWC 2006
  5. ^ Jérôme Euzenat, Antoine Isaac, Christian Meilicke, Pavel Shvaiko, Heiner Stuckenschmidt, Ondřej Šváb, Vojtěch Svátek, Willem Robert van Hage, Mikalai Yatskevich (2007). „Výsledky iniciativy pro hodnocení zarovnání do ontologie 2007“ (PDF). Sborník z 2. mezinárodního semináře o porovnávání ontologií, ISWC 2007.CS1 maint: více jmen: seznam autorů (odkaz)
  6. ^ Caterina Caracciolo, Jérôme Euzenat, Laura Hollink, Ryutaro Ichise, Antoine Isaac, Véronique Malaisé, Christian Meilicke, Juan Pane, Pavel Shvaiko, Heiner Stuckenschmidt, Ondřej Šváb-Zamazal a Vojtěch Svátek: Výsledky Iniciativy pro hodnocení zarovnání ontologie z roku 2008. Ve sborníku z 3. mezinárodního semináře o porovnávání ontologií, ISWC 2008
  7. ^ Jérôme Euzenat, Alfio Ferrara, Laura Hollink, Antoine Isaac, Cliff Joslyn, Véronique Malaisé, Christian Meilicke, Andriy Nikolov, Juan Pane, Marta Sabou, François Scharffe, Pavel Shvaiko, Vassilis Spiliopoulos, Heiner Stuckenschmidt, Ondřej Šváb-Zamť Cássia Trojahn dos Santos, George Vouros a Shenghui Wang: Výsledky Iniciativy pro hodnocení zarovnání ontologie z roku 2007. Ve sborníku ze 4. mezinárodního workshopu o porovnávání ontologií, ISWC 2009
  8. ^ Iniciativa pro hodnocení zarovnání ontologie :: Sledování knihovny
  9. ^ Iniciativa pro vyhodnocení zarovnání ontologie :: Název stopy
  10. ^ http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-431/oaei08_paper12.pdf
  11. ^ https://sourceforge.net/projects/mappso/
  12. ^ Juanzi Li; Jie Tang; Yi Li; Qiong Luo (2019-04-16). "RiMOM: Dynamický multistrategický rámec pro zarovnání ontologie". Transakce IEEE na znalostní a datové inženýrství. 21 (8): 1218–1232. CiteSeerX  10.1.1.649.4619. doi:10.1109 / TKDE.2008.202.

externí odkazy