Kotevní modelování - Anchor modeling
Kotevní modelování je agilní technika modelování databáze vhodná pro informace, které se v průběhu času mění jak ve struktuře, tak v obsahu. Poskytuje grafickou notaci používanou pro koncepční modelování podobné jako u modelování vztahů mezi entitami, s rozšířeními pro práci s dočasnými daty. Technika modelování zahrnuje čtyři modelovací konstrukce: kotvu, atribut, kravatu a uzel, z nichž každá zachycuje různé aspekty modelované domény.[1]Výsledné modely lze převést do návrhů fyzické databáze pomocí formalizovaných pravidel. Když je takový překlad proveden, tabulky v relační databázi budou většinou v šestá normální forma.
Filozofie a historie
Modelování kotev bylo vytvořeno za účelem využití výhod z vysokého stupně normalizace a zároveň se vyhnout jeho nevýhodám. Získají se výhody, jako je schopnost nedestruktivně vyvíjet model, vyhýbat se nulovým hodnotám a udržovat informace bez nadbytečnosti. Díky funkcím v moderních databázových strojích s názvem 'vyloučit spojení „nebo„ vyloučení tabulky “. Aby bylo možné zvládnout změny v informačním obsahu, modelování kotev emuluje aspekty a časová databáze ve výsledném relační databáze schéma.
Nejčasnější instalace využívající modelování kotev byly provedeny v Švédsko s prvním datem do roku 2004, kdy a datový sklad pro pojišťovnu byla postavena pomocí této techniky. V roce 2007 byla tato technika používána v několika datových skladech a jednom OLTP systému a byl mezinárodně představen Larsem Rönnbäckem na konferenci TDWI (Transforming Data with Intelligence] 2007 v Amsterdam.[2] To vyvolalo dostatečný zájem o to, aby technika vyžadovala formálnější popis. Od té doby probíhá výzkum týkající se modelování kotev ve spolupráci mezi tvůrci Olle Regardt a Larsem Rönnbäckem a týmem na katedře počítačových a systémových věd, Stockholmská univerzita. První příspěvek, v němž je formalizováno modelování kotev, byl představen na 28. mezinárodní konferenci o koncepčním modelování a získal cenu za nejlepší příspěvek.[3]
Komerční web poskytuje materiál o modelování kotev, který je zdarma k použití pod a Creative Commons licence. K dispozici je také online nástroj pro modelování, který je zdarma k použití a je otevřený zdroj.[4]
Základní pojmy
Kotevní modelování má čtyři základní koncepty modelování: kotvy, atributy, vazby a uzly. Kotvy se používají k modelování entit a událostí, atributy se používají k modelování vlastností kotev, vazby modelují vztahy mezi kotvami a uzly se používají k modelování sdílených vlastností, například stavů. Atributy a vazby lze historizovat, když je nutné uchovat změny v informacích, které modelují.
Níže je uveden příklad modelu zobrazujícího různé grafické symboly pro všechny koncepty. Symboly připomínají symboly použité v modelování entit a vztahů, s několika rozšířeními. Dvojitý obrys atributu nebo kravaty označuje, že je zachována historie změn a je k dispozici také symbol uzlu (obrysový čtverec se zaoblenými hranami).
Časové aspekty
Kotevní modelování zpracovává dva typy informační evoluce, strukturální změny a změny obsahu. Změny ve struktuře informací jsou vyjádřeny prostřednictvím rozšíření. Vysoký stupeň normalizace umožňuje nedestruktivně přidat nezbytné koncepty modelování potřebné k zachycení změny takovým způsobem, že každý předchozí schéma vždy zůstane jako podmnožina aktuálního schématu. Vzhledem k tomu, že se nedotknete existujícího schématu, poskytuje to výhodu možnosti vyvíjet databázi vysoce iterativním způsobem a bez způsobení jakýchkoli prostojů.
Změny v obsahu informací se provádějí emulací podobných funkcí a časová databáze v relační databáze. V kotevním modelování mohou být informace vázány na body v čase nebo na časové intervaly (otevřené i uzavřené). Časové body, kdy dojde k událostem, jsou modelovány pomocí atributů, například dat narození osob nebo času nákupu. Časové intervaly, ve kterých je hodnota platná, jsou zachyceny historizací atributů a vazeb, například změnami barvy vlasů osoby nebo časovým obdobím, během kterého byla osoba vdaná. V relační databázi je toho dosaženo přidáním jediné sloupec, s datový typ dostatečně podrobné, aby zachytily rychlost změn, na stůl odpovídající historizovanému atributu nebo kravatě. To přidává mírnou složitost jako více než jeden řádek v tabulce musí být prozkoumány, aby se zjistilo, zda je interval uzavřen nebo ne.
Body nebo časové intervaly, které přímo nesouvisejí s modelovanou doménou, například informace o bodech času zadané do databáze, jsou zpracovávány pomocí metadata v kotevním modelování spíše než v jakémkoli z výše uvedených konstruktů. Pokud je třeba zachovat informace o takových změnách v databázi, lze použít bitemporální modelování kotev, kde se kromě aktualizací stanou nedestruktivní i příkazy mazání.
Relační reprezentace
V kotevním modelování existuje mapování jedna k jedné mezi symboly použitými v koncepčním modelu a tabulkami v relační databázi. Každá kotva, atribut, kravata a uzel má v databázi odpovídající tabulku s jednoznačně definovanou strukturou. Koncepční model lze tedy přeložit do schématu relační databáze pomocí jednoduchých automatických pravidel a naopak. To se liší od mnoha jiných technik modelování, ve kterých existují složité a někdy subjektivní kroky překladu mezi koncepční, logickou a fyzickou úrovní.
Ukotvovací tabulky obsahují jeden sloupec, ve kterém jsou uloženy identity. Identita se považuje za jedinou vlastnost entity, která je vždy přítomná a neměnná. Protože identity jsou z modelované domény zřídka dostupné, jsou místo toho technicky generovány, například z přírůstkové číselné řady.
Příklad kotvy pro identitu synovců Kačer Donald je sada 1-n-tic: {⟨#42⟩, ⟨#43⟩, ⟨#44⟩}
Uzly lze považovat za kombinaci kotvy a jediného atributu. Uzlové tabulky obsahují dva sloupce, jeden pro identitu a druhý pro hodnotu. Kvůli společnému ukládání identit a hodnot nelze uzly historizovat. Jejich užitečnost pochází z možnosti snížit požadavky na úložiště a zlepšit výkon, protože tabulky odkazující na uzly mohou ukládat spíše krátkou hodnotu než dlouhý řetězec.
Příkladem uzlu pro pohlaví je sada 2-n-tic: {⟨# 1, 'Male'⟩, ⟨# 2,' Female'⟩}
Statické tabulky atributů obsahují dva sloupce, jeden pro identitu entity, ke které hodnota patří, a jeden pro skutečnou hodnotu vlastnosti. Historizované tabulky atributů mají další sloupec pro uložení počátečního bodu časového intervalu. V tabulce vázaných atributů je sloupcem hodnoty identita, která odkazuje na tabulku uzlů.
Příkladem statického atributu pro jejich jména je sada 2-n-tic: {⟨# 42, 'Huey'⟩, ⟨# 43,' Dewey'⟩, ⟨# 44, 'Louie'⟩}
Příkladem vázaného statického atributu pro jejich pohlaví je sada 2-n-tic: {⟨#42, #1⟩, ⟨#43, #1⟩, ⟨#44, #1⟩}
Příkladem historizovaného atributu pro (měnící se) barvy jejich oblečení je sada 3 n-tic: {⟨# 44, 'Orange', 1938-04-15⟩, ⟨# 44, 'Green', 1939-04-28⟩, ⟨# 44, 'Blue', 1940-12-13⟩}
Statické vazební tabulky se týkají dvou nebo více kotev navzájem a obsahují dva nebo více sloupců pro ukládání identit. Historizované tabulky vazeb mají navíc sloupec pro uložení počátečního bodu časového intervalu. Vázané vázací tabulky mají další sloupec pro každý odkazovaný uzel.
Příkladem statické vazby pro sourozenecký vztah je sada 2-n-tic: {⟨#42, #43⟩, ⟨#42, #44⟩, ⟨#43, #42⟩, ⟨#43, #44⟩, ⟨#44, #42⟩, ⟨#44, #43⟩}
Výsledné tabulky budou všechny v šestá normální forma kromě vazeb, ve kterých nejsou všechny sloupce součástí primárního klíče.
Reference
- ^ L. Rönnbäck; O. Regardt; M. Bergholtz; P. Johannesson; P. Wohed (2010). "Kotevní modelování - hbité modelování informací ve vyvíjejícím se datovém prostředí". Datové a znalostní inženýrství. 69 (12): 1229–1253. doi:10.1016 / j.datak.2010.10.002. ISSN 0169-023X. (Předtisk k dispozici tady )
- ^ 6. evropská konference TDWI - Domovská stránka TDWI Archivováno 20. července 2011, v Wayback Machine
- ^ S pozdravem Olle; Rönnbäck, Lars; Bergholtz, Maria; Johannesson, Paul; Wohed, Petia (2009). "Modelování kotvy". Sborník z 28. mezinárodní konference o koncepčním modelování. ER '09. Gramado, Brazílie: Springer-Verlag: 234–250. ISBN 978-3-642-04839-5.
- ^ Lars Rönnbäck. „Anchor Modeling Academy“. Propagační web. Citováno 20. května 2017.