Sémantická integrace - Semantic integration

Sémantická integrace je proces vzájemného vztahu informací z různých zdrojů, například kalendářů a seznamů úkolů, e-mailových archivů, informací o přítomnosti (fyzických, psychologických a sociálních), dokumentů všeho druhu, kontaktů (včetně sociální grafy ), výsledky vyhledávání a z nich odvozené reklamní a marketingové relevance. V tomto kontextu, sémantika se zaměřuje na organizaci a akci na informace tím, že jedná jako prostředník mezi heterogenními zdroji dat, což může být v rozporu nejen strukturou, ale také kontextem nebo hodnotou.

Aplikace a metody

v integrace podnikových aplikací (EAI), sémantická integrace může usnadnit nebo dokonce automatizovat komunikaci mezi počítačovými systémy pomocí publikování metadat. Publikování metadat potenciálně nabízí možnost automatického propojení ontologie. Jeden přístup k (polo) automatizovanému mapování ontologie vyžaduje definici sémantické vzdálenosti nebo její inverze, sémantická podobnost a příslušná pravidla. Mezi další přístupy patří tzv lexikální metody, jakož i metodiky, které se spoléhají na využívání struktur ontologií. Pro výslovné uvedení podobnosti / rovnosti existují ve většině jazyků ontologie speciální vlastnosti nebo vztahy. SOVA, například má „owl: equivalentClass“, „owl: equivalentProperty“ a „owl: sameAs“.

Systémové designy mohou nakonec zaznamenat příchod skládatelných architektur, kde jsou publikovaná sémantická rozhraní spojena a umožňují nové a smysluplné funkce[Citace je zapotřebí ]. Ty by mohly být převážně popsány pomocí deklarativních specifikací v době návrhu, které by mohly být nakonec vykresleny a provedeny za běhu[Citace je zapotřebí ].

Sémantickou integraci lze také použít k usnadnění aktivit návrhu a mapování rozhraní v době návrhu. V tomto modelu se sémantika explicitně aplikuje pouze na design a systémy run-time fungují na syntax úroveň[Citace je zapotřebí ]. Tento přístup „rané sémantické vazby“ může zlepšit celkový výkon systému při zachování výhod designu založeného na sémantice[Citace je zapotřebí ].

Situace sémantické integrace

Z případu použití v oboru bylo pozorováno, že sémantické mapování bylo provedeno pouze v rámci třídy ontologie nebo vlastnosti datový typ. Tyto identifikované sémantické integrace jsou (1) integrace instancí třídy ontologie do jiné třídy ontologie bez jakéhokoli omezení, (2) integrace vybraných instancí v jedné třídě ontologie do jiné třídy ontologie omezením rozsahu hodnoty vlastnosti a (3) integrace instance třídy ontologie do jiné třídy ontologie s hodnotovou transformací vlastnosti instance. Každý z nich vyžaduje konkrétní vztah mapování, kterým je: (1) vztah mapování ekvivalentu nebo subsumpce, (2) vztah podmíněného mapování, který omezuje hodnotu vlastnosti (rozsah dat), a (3) vztah mapování transformace, který transformuje hodnotu vlastnost (transformace jednotky). Každý identifikovaný vztah mapování lze definovat jako (1) typ přímého mapování, (2) typ mapování datového rozsahu nebo (3) typ mapování jednotkové transformace.

Přístupy KG vs. RDB

V případě integrace doplňkového zdroje dat,

  • KG(Znalostní graf ) formálně představuje význam informací obsažený v popisu konceptů, vztahů mezi věcmi a kategorií věcí. Tato vložená sémantika s daty nabízí významné výhody, jako je uvažování nad daty a řešení heterogenních zdrojů dat. Pravidla lze efektivněji aplikovat na KG pomocí grafového dotazu. Například dotaz na graf provádí odvození dat prostřednictvím připojených relací, namísto opakovaného úplného vyhledávání tabulek v relační databázi. KG usnadňuje integraci nových heterogenních dat pouhým přidáním nových vztahů mezi existujícími informacemi a novými entitami. Toto usnadnění je zdůrazněno pro integraci s existujícím populárním propojeným otevřeným zdrojem dat, jako je Wikidata.org.
  • SQL Dotaz je pevně spojen a pevně omezen datovým typem v konkrétní databázi a může spojovat tabulky a extrahovat data z tabulek a výsledkem je obvykle tabulka a dotaz může spojovat tabulky libovolnými sloupci, které se shodují podle datového typu. SPARQL query je standardní dotazovací jazyk a protokol pro Linked Open Data na webu a volně spojený s databází, takže usnadňuje opětovné použití a může extrahovat data prostřednictvím vztahů bez datového typu a nejen extrahovat, ale také generovat další znalostní graf s sofistikovanější operace (logika: tranzitivní / symetrické / inverzníOf / funkční). Inferenční dotaz (dotaz na existující tvrzená fakta bez generování nových faktů logikou) může být rychle srovnatelný s dotazem založeným na uvažování (dotaz na existující plus vygenerovaná / objevená fakta založená na logice).
  • Informační integrace heterogenních zdrojů dat v tradiční databázi je složitá, což vyžaduje redesign databázové tabulky, jako je změna struktury a / nebo přidání nových dat. V případě sémantického dotazu odráží dotaz SPARQL vztahy mezi entitami způsobem, který je v souladu s lidským chápáním domény, takže sémantický záměr dotazu lze vidět na samotném dotazu. Na rozdíl od SPARQL, dotaz SQL, který odráží specifickou strukturu databáze a je odvozen od shody příslušných primárních a cizích klíčů tabulek, ztrácí sémantiku dotazu tím, že chybí vztahy mezi entitami. Níže je uveden příklad, který porovnává dotazy SPARQL a SQL na léky, které léčí „TB obratlů“.

VYBERTE? Léky
KDE {
? diagnóza příklad: Diagnóza.
Příklad diagnózy: název „TB obratle“.
„příklad léčby: canTreat“ diagnóza.
}

VYBERTE DRUG.medID
Z DIAGNÓZY, DROGY, DROGY_DIAGNÓZY
KDE DIAGNOSIS.diagnosisID = DRUG_DIAGNOSIS.diagnosisID
AND DRUG.medID = DRUG_DIAGNOSIS.medID
AND DIAGNOSIS.name = „TB vertebra“

Příklady

The Tichomořské symposium o biopočítačích bylo dějištěm popularizace úlohy mapování ontologie v biomedicínské oblasti a v jeho sborníku lze najít řadu příspěvků na toto téma.

Viz také

Reference

externí odkazy