Modelování datového trezoru - Data vault modeling

Modelování datového trezoru je databáze metoda modelování, která je navržena tak, aby poskytovala dlouhodobé historické úložiště data přicházející z více operačních systémů. Jedná se také o metodu pohledu na historická data, která se zabývá otázkami, jako je auditování, sledování dat, rychlost načítání a odolnost vůči změnám, stejně jako zdůraznění potřeby sledovat, odkud pocházejí všechna data v databázi. To znamená, že každý řádek v datovém trezoru musí být doprovázeny atributy zdroje záznamu a data načtení, což auditorovi umožňuje sledovat hodnoty zpět ke zdroji. Byl vyvinut společností Daniel (Dan) Linstedt v roce 2000.

Modelování datového trezoru nerozlišuje mezi dobrými a špatnými daty („špatný“ znamená neodpovídající obchodním pravidlům).[1] To je shrnuto v prohlášení, že datový trezor ukládá „jedinou verzi faktů“ (vyjádřenou také Danem Linstedtem jako „všechna data po celou dobu“) na rozdíl od praxe v jiných metodách ukládání dat v datovém skladu. A jediná verze pravdy "[2] kde jsou odstraněna nebo „vyčištěna“ data, která neodpovídají definicím.

Metoda modelování je navržena tak, aby byla odolná vůči změnám v obchodním prostředí, odkud pocházejí ukládaná data, explicitním oddělením strukturálních informací od popisných atributů.[3] Datový trezor je navržen tak, aby co nejvíce umožňoval paralelní načítání,[4] takže velmi velké implementace se mohou škálovat bez nutnosti zásadního přepracování.

Historie a filozofie

v datový sklad modelování existují dvě dobře známé konkurenční možnosti pro modelování vrstvy, kde jsou data uložena. Buď modelujete podle Ralph Kimball, s přizpůsobenými rozměry a podnikovou datovou sběrnicí, nebo modelujete podle Bill Inmon s databází normalizováno[Citace je zapotřebí ]. Obě techniky mají problémy při řešení změn v systémech napájejících datový sklad[Citace je zapotřebí ]. U vyhovujících dimenzí musíte také očistit data (přizpůsobit je), což je v mnoha případech nežádoucí, protože to nevyhnutelně ztratí informace[Citace je zapotřebí ]. Úložiště dat je navrženo tak, aby se zabránilo nebo minimalizovalo dopad těchto problémů, a to přesunutím do oblastí datového skladu, které jsou mimo historickou oblast úložiště (čištění se provádí v datových tržištích), a oddělením strukturálních položek (obchodní klíče a asociace mezi obchodními klíči) z popisných atributů.

Dan Linstedt, tvůrce metody, popisuje výslednou databázi takto:

„Model Data Vault je detailně orientované, historické sledování a jedinečně propojená sada normalizovaných tabulek, které podporují jednu nebo více funkčních oblastí podnikání. Jedná se o hybridní přístup zahrnující to nejlepší z třetí normální formy (3NF) a hvězdné schéma. Design je flexibilní, škálovatelný, konzistentní a přizpůsobitelný potřebám podniku. “[5]

Filozofií Data Vault je, že všechna data jsou relevantní data, i když nejsou v souladu se zavedenými definicemi a obchodními pravidly. Pokud data neodpovídají těmto definicím a pravidlům, je to problém pro podnik, nikoli pro datový sklad. Určení „nesprávnosti“ údajů je interpretací údajů, která vychází z konkrétního hlediska, které nemusí být platné pro každého nebo v každém okamžiku. Proto musí datový trezor zachytit všechna data a data se interpretují pouze při hlášení nebo extrakci dat z datového trezoru.

Dalším problémem, na který je datový trezor odpovědí, je, že stále více a více existuje potřeba úplné auditovatelnosti a sledovatelnosti všech dat v datovém skladu. Kvůli Sarbanes-Oxley požadavky v USA a podobná opatření v Evropě je to relevantní téma pro mnoho implementací Business Intelligence, proto se zaměřením jakékoli implementace datového trezoru je úplná sledovatelnost a auditovatelnost všech informací.

Data Vault 2.0 je nová specifikace, je to otevřený standard.[6] Nová specifikace obsahuje komponenty, které definují nejlepší postupy implementace, metodiku (SEI / CMMI, Six Sigma, SDLC atd.), Architekturu a model. Data Vault 2.0 se zaměřuje na zahrnutí nových komponent, jako jsou Big Data, NoSQL - a také se zaměřuje na výkonnost stávajícího modelu. Stará specifikace (z velké části zdokumentovaná zde) je vysoce zaměřena na modelování datového trezoru. Dokumentuje to kniha: Vytváření škálovatelného datového skladu pomocí Data Vault 2.0.

Je nutné vyvinout specifikaci tak, aby zahrnovala nové komponenty, spolu s osvědčenými postupy, aby systémy EDW a BI byly aktuální s potřebami a přáními dnešních podniků.

Dějiny

Modelování datového trezoru původně koncipoval Dan Linstedt v 90. letech a bylo vydáno v roce 2000 jako metoda modelování ve veřejné doméně. V sérii pěti článků o Zpravodaji správy dat jsou rozšířena a vysvětlena základní pravidla metody Data Vault. Obsahují obecný přehled,[7] přehled komponent,[8] diskuse o datech ukončení a připojeních,[9] propojovací tabulky,[10] a článek o postupech načítání.[11]

Alternativní (a zřídka používaný) název metody je „Common Foundational Integration Modeling Architecture.“[12]

Data Vault 2.0[13][14] přišel na scénu od roku 2013 a přináší ke stolu Big Data, NoSQL, nestrukturovanou, polostrukturovanou bezproblémovou integraci spolu s metodikou, architekturou a osvědčenými postupy implementace.

Alternativní interpretace

Podle Dana Linstedta je datový model inspirován (nebo vzoru) zjednodušeným pohledem na neurony, dendrity a synapse - kde jsou neurony spojeny s Huby a Hubovými satelity, Odkazy jsou dendrity (vektory informací) a další Odkazy jsou synapse (vektory v opačném směru). Pomocí sady algoritmů pro dolování dat lze odkazy hodnotit s důvěryhodností a hodnocením síly. Mohou být vytvářeny a házeny za běhu v souladu s učením o vztazích, které v současné době neexistují. Model lze automaticky morfovat, přizpůsobovat a upravovat, jak se používá, a přivádět nové struktury.[15]

Jiný pohled je, že model datového trezoru poskytuje ontologie Enterprise v tom smyslu, že popisuje pojmy v doméně podniku (rozbočovače) a vztahy mezi nimi (odkazy), případně doplňuje popisné atributy (satelity).

Dalším způsobem, jak uvažovat o modelu datového trezoru, je model grafu. Model datového trezoru ve skutečnosti poskytuje model založený na grafech s rozbočovači a vztahy ve světě relační databáze. Tímto způsobem může vývojář použít SQL k získání vztahů založených na grafech s odpověďmi v sekundách.

Základní pojmy

Jednoduchý model datového trezoru se dvěma rozbočovači (modrý), jedním odkazem (zelený) a čtyřmi satelity (žlutý)

Datový trezor se pokouší vyřešit problém řešení změn v prostředí oddělením obchodních klíčů (které nemutují tak často, protože jednoznačně identifikují obchodní entitu) a přidružení mezi těmito obchodními klíči, od popisných atributů těchto klíčů .

Obchodní klíče a jejich přidružení jsou strukturální atributy, které tvoří kostru datového modelu. Metoda datového trezoru má jako jeden ze svých hlavních axiomů, že skutečné obchodní klíče se mění pouze tehdy, když se mění podnikání, a jsou tedy nejstabilnějšími prvky, z nichž lze odvodit strukturu historické databáze. Pokud tyto klíče použijete jako páteř datového skladu, můžete kolem nich uspořádat zbytek dat. To znamená, že výběr správných kláves pro rozbočovače má zásadní význam pro stabilitu vašeho modelu.[16] Klíče jsou uloženy v tabulkách s několika omezeními na strukturu. Tyto tabulky klíčů se nazývají rozbočovače.

Náboje

Rozbočovače obsahují seznam jedinečných obchodních klíčů s nízkou náchylností ke změnám. Rozbočovače také obsahují náhradní klíč pro každou položku rozbočovače a metadata popisující původ obchodního klíče. Popisné atributy pro informace v rozbočovači (například popis klíče, případně ve více jazycích) jsou uloženy ve strukturách nazývaných satelitní tabulky, o nichž bude pojednáno níže.

Centrum obsahuje alespoň následující pole:[17]

  • náhradní klíč, který se používá k připojení ostatních struktur k této tabulce.
  • obchodní klíč, ovladač tohoto rozbočovače. Obchodní klíč se může skládat z několika polí.
  • zdroj záznamu, pomocí kterého lze zjistit, jaký systém načetl každý obchodní klíč jako první.
  • volitelně můžete mít také pole metadat s informacemi o manuálních aktualizacích (uživatel / čas) a datem extrakce.

Centrum nesmí obsahovat více obchodních klíčů, kromě případů, kdy dva systémy dodávají stejný obchodní klíč, ale s kolizemi, které mají různé významy.

Rozbočovače by obvykle měly mít alespoň jeden satelit.[17]

Příklad hubu

Toto je příklad tabulky rozbočovače obsahující automobily, zvané „Car“ (H_CAR). Klíč jízdy je identifikační číslo vozidla.

Název polePopisPovinné?Komentář
H_CAR_IDID sekvence a náhradní klíč pro hubNeDoporučeno, ale volitelné[18]
VEHICLE_ID_NRObchodní klíč, který řídí tento rozbočovač. Může být více než jedno pole pro složený obchodní klíčAno
H_RSRCZdroj záznamu tohoto klíče při prvním načteníAno
LOAD_AUDIT_IDID do tabulky s informacemi o auditu, jako je doba načítání, doba načítání, počet řádků atd.Ne

Odkazy

Asociace nebo transakce mezi obchodními klíči (související například s centry pro zákazníka a produkt navzájem prostřednictvím nákupní transakce) jsou modelovány pomocí tabulek odkazů. Tyto tabulky jsou v zásadě spojovací tabulky typu mnoho k mnoha s některými metadaty.

Odkazy mohou odkazovat na další odkazy, aby se vypořádaly se změnami granularity (například přidání nového klíče do databázové tabulky by změnilo strukturu databázové tabulky). Například pokud máte vztah mezi zákazníkem a adresou, můžete přidat odkaz na odkaz mezi centry pro produkt a přepravní společnost. Může to být odkaz s názvem „Doručení“. Odkazování na odkaz v jiném odkazu je považováno za špatný postup, protože zavádí závislosti mezi odkazy, které ztěžují paralelní načítání. Vzhledem k tomu, že odkaz na jiný odkaz je stejný jako nový odkaz s rozbočovači z druhého odkazu, je v těchto případech upřednostňovaným řešením vytváření odkazů bez odkazování na další odkazy (další informace najdete v části Postupy načítání).

Odkazy někdy propojují rozbočovače s informacemi, které samy o sobě nestačí k vytvoření rozbočovače. K tomu dochází, když jeden z obchodních klíčů přidružených k odkazu není skutečným obchodním klíčem. Jako příklad si vezměte objednávkový formulář s klíčem „číslo objednávky“ a řádky objednávky, které jsou zakódovány semi-náhodným číslem, aby byly jedinečné. Řekněme „jedinečné číslo“. Druhý klíč není skutečný obchodní klíč, takže nejde o žádný rozbočovač. Musíme jej však použít, abychom zaručili správnou podrobnost odkazu. V tomto případě nepoužíváme rozbočovač s náhradním klíčem, ale k odkazu přidáme samotné „jedinečné číslo“ obchodního klíče. To se provádí pouze v případě, že neexistuje možnost nikdy použít obchodní klíč pro jiný odkaz nebo jako klíč pro atributy na satelitu. Tento konstrukt byl Danem Linstedtem na jeho (dnes již zaniklém) fóru nazýván „peg-legged link“.

Odkazy obsahují náhradní klíče pro propojené rozbočovače, jejich vlastní náhradní klíč pro odkaz a metadata popisující původ přidružení. Popisné atributy pro informace o přidružení (jako je čas, cena nebo částka) jsou uloženy ve volaných strukturách satelitní stoly které jsou diskutovány níže.

Příklad odkazu

Toto je příklad tabulky odkazů mezi dvěma rozbočovači pro automobily (H_CAR) a osobami (H_PERSON). Odkaz se nazývá „Driver“ (L_DRIVER).

Název polePopisPovinné?Komentář
L_DRIVER_IDID sekvence a náhradní klíč pro odkazNeDoporučeno, ale volitelné[18]
H_CAR_IDnáhradní klíč pro náboj vozu, první kotva odkazuAno
H_PERSON_IDnáhradní klíč pro osobní rozbočovač, druhá kotva odkazuAno
L_RSRCZdroj záznamů tohoto přidružení při prvním načteníAno
LOAD_AUDIT_IDID do tabulky s auditními informacemi, jako je doba načítání, doba načítání, počet řádků atd.Ne

Satelity

Rozbočovače a odkazy tvoří strukturu modelu, ale nemají žádné časové atributy a nemají žádné popisné atributy. Ty jsou uloženy v samostatných volaných tabulkách satelity. Skládají se z metadat, která je propojují s jejich nadřazeným centrem nebo odkazem, metadata popisující původ přidružení a atributů a také časovou osu s daty zahájení a ukončení atributu. Tam, kde rozbočovače a odkazy poskytují strukturu modelu, poskytují satelity „maso“ modelu, kontext obchodních procesů, které jsou zachyceny v rozbočovačích a odkazech. Tyto atributy jsou uloženy jak s ohledem na podrobnosti záležitosti, tak na časovou osu a mohou sahat od poměrně složitých (všechna pole popisující úplný profil klienta) až po docela jednoduché (satelit na odkazu pouze s platným indikátorem a časová osa).

Atributy jsou obvykle seskupeny do satelitů podle zdrojového systému. Popisné atributy, jako je velikost, cena, rychlost, množství nebo barva, se však mohou měnit různými rychlostmi, takže můžete tyto atributy rozdělit také do různých satelitů na základě jejich rychlosti změny.

Všechny tabulky obsahují metadata, minimálně popisující alespoň zdrojový systém a datum, kdy tato položka vstoupila v platnost, což poskytuje úplný historický pohled na data při vstupu do datového skladu.

Příklad satelitu

Toto je příklad satelitu na spoji mezi řidiči mezi uzly pro automobily a osoby, který se nazývá „Pojištění řidiče“ (S_DRIVER_INSURANCE). Tento satelit obsahuje atributy, které jsou specifické pro pojištění vztahu mezi automobilem a osobou, která jej řídí, například indikátor, zda se jedná o primárního řidiče, název pojišťovny pro toto auto a osobu (může to být také samostatný hub) a souhrn počtu nehod s touto kombinací vozidla a řidiče. Zahrnut je také odkaz na vyhledávací nebo referenční tabulku s názvem R_RISK_CATEGORY obsahující kódy pro kategorii rizika, do které se tento vztah považuje.

Název polePopisPovinné?Komentář
S_DRIVER_INSURANCE_IDID sekvence a náhradní klíč pro satelit na odkazuNeDoporučeno, ale volitelné[18]
L_DRIVER_ID(náhradní) primární klíč pro odkaz řidiče, rodič satelituAno
S_SEQ_NRPořadové nebo pořadové číslo k vynucení jedinečnosti, pokud pro jeden nadřazený klíč existuje několik platných satelitůNe(**)To se může stát, pokud například máte rozbočovač KURZ a název kurzu je atribut, ale v několika různých jazycích.
S_LDTSDatum načtení (počáteční datum) platnosti této kombinace hodnot atributů pro nadřazený klíč L_DRIVER_IDAno
S_LEDTSNačíst datum ukončení (enddate) pro platnost této kombinace hodnot atributů pro nadřazený klíč L_DRIVER_IDNe
IND_PRIMARY_DRIVERUkazatel, zda je řidič primárním řidičem pro tento vůzNe (*)
POJIŠŤOVNANázev pojišťovny pro toto vozidlo a tohoto řidičeNe (*)
NR_OF_ACCIDENTSPočet nehod tohoto řidiče v tomto vozidleNe (*)
R_RISK_CATEGORY_CDKategorie rizika pro řidiče. Toto je odkaz na R_RISK_CATEGORYNe (*)
S_RSRCZdroj záznamů informací na tomto satelitu při prvním načteníAno
LOAD_AUDIT_IDID do tabulky s informacemi o auditu, jako je doba načítání, doba načítání, počet řádků atd.Ne

(*) alespoň jeden atribut je povinný. (**) pořadové číslo se stává povinným, pokud je potřeba k vynucení jedinečnosti pro více platných satelitů na stejném rozbočovači nebo odkazu.

Referenční tabulky

Referenční tabulky jsou běžnou součástí zdravého modelu úložiště dat. Jsou tam proto, aby zabránili nadbytečnému ukládání jednoduchých referenčních dat, na která se hodně odkazuje. Formálněji Dan Linstedt definuje referenční údaje takto:

Jakékoli informace považované za nezbytné k vyřešení popisů z kódů nebo k konzistentnímu překladu klíčů do (sic). Mnoho z těchto polí má „popisný“ charakter a popsat konkrétní stav ostatních důležitějších informací. Referenční data proto žijí v samostatných tabulkách od surových tabulek Data Vault.[19]

Na referenční tabulky se odkazuje ze satelitů, ale nikdy nejsou vázány fyzickými cizími klíči. Neexistuje žádná předepsaná struktura referenčních tabulek: použijte to, co funguje nejlépe ve vašem konkrétním případě, od jednoduchých vyhledávacích tabulek po malé datové trezory nebo dokonce hvězdy. Mohou být historické nebo nemají žádnou historii, ale v takovém případě se doporučuje držet se přirozených klíčů a nevytvářet náhradní klíče.[20] Za normálních okolností mají datové trezory spoustu referenčních tabulek, stejně jako jakýkoli jiný Data Warehouse.

Referenční příklad

Toto je příklad referenční tabulky s kategoriemi rizik pro řidiče vozidel. Lze na něj odkazovat z libovolného satelitu v datovém trezoru. Prozatím to odkazujeme ze satelitu S_DRIVER_INSURANCE. Referenční tabulka je R_RISK_CATEGORY.

Název polePopisPovinné?
R_RISK_CATEGORY_CDKód kategorie rizikaAno
RISK_CATEGORY_DESCPopis kategorie rizikaNe (*)

(*) alespoň jeden atribut je povinný.

Postupy načítání

The ETL aktualizace modelu datového trezoru je poměrně přímočará (viz Data Vault Series 5 - Postupy načítání ). Nejprve musíte načíst všechny rozbočovače a vytvořit náhradní ID pro všechny nové obchodní klíče. Když to uděláte, můžete nyní vyřešit všechny obchodní klíče k nahrazení ID, pokud zadáte dotaz na hub. Druhým krokem je vyřešení propojení mezi rozbočovači a vytvoření náhradních ID pro všechna nová přidružení. Současně můžete také vytvořit všechny satelity, které jsou připojeny k rozbočovačům, protože můžete vyřešit klíč na náhradní ID. Jakmile vytvoříte všechny nové odkazy s jejich náhradními klíči, můžete ke všem odkazům přidat satelity.

Vzhledem k tomu, že rozbočovače nejsou navzájem spojeny, kromě prostřednictvím odkazů, můžete načíst všechny rozbočovače paralelně. Vzhledem k tomu, že odkazy nejsou připojeny přímo k sobě, můžete také načíst všechny odkazy paralelně. Protože satelity lze připojit pouze k rozbočovačům a odkazům, můžete je také načítat paralelně.

ETL je poměrně přímočarý a umožňuje snadnou automatizaci nebo šablonování. Problémy nastávají pouze u odkazů vztahujících se k jiným odkazům, protože vyřešení obchodních klíčů v odkazu vede pouze k dalšímu odkazu, který musí být také vyřešen. Vzhledem k rovnocennosti této situace s odkazem na více uzlů se této obtížnosti lze vyhnout přestavbou takových případů a toto je ve skutečnosti doporučený postup.[11]

Data se z datového trezoru nikdy neodstraní, pokud při načítání dat nedojde k technické chybě.

Datový trezor a dimenzionální modelování

K ukládání dat se obvykle používá modelovaná vrstva datového trezoru. Není optimalizován pro výkon dotazů, ani není snadné jej vyhledávat pomocí známých dotazovacích nástrojů, jako je Cognos OBIEE, Obchodní objekty SAP, Pentaho et al.[Citace je zapotřebí ] Protože tyto výpočetní nástroje pro koncové uživatele očekávají nebo dávají přednost tomu, aby jejich data byla obsažena v dimenzionálním modelu, je obvykle nutný převod.

Za tímto účelem lze rozbočovače a související satelity na těchto rozbočovačích považovat za rozměry a odkazy a související satelity na těchto odkazech lze v dimenzionálním modelu zobrazit jako tabulky faktů. To vám umožní rychle prototypovat dimenzionální model z modelu datového trezoru pomocí pohledů.

Všimněte si, že i když je relativně jednoduché přesunout data z modelu datového trezoru do (očištěného) dimenzionálního modelu, není reverz tak snadný, vzhledem k denormalizované povaze tabulek faktů dimenzionálního modelu, zásadně odlišných od třetí normální forma datového trezoru.

Metodika datového trezoru

Metodika datového trezoru je založena na osvědčených postupech úrovně 5 SEI / CMMI. Zahrnuje několik komponent CMMI úrovně 5 a kombinuje je s osvědčenými postupy od Six Sigma, TQM a SDLC. Zejména se zaměřuje na agilní metodiku Scotta Amblera pro sestavení a nasazení. Projekty datového trezoru mají krátký cyklus vydání s řízeným rozsahem a měly by sestávat z produkčního vydání každé 2 až 3 týdny.

Týmy využívající metodiku datového trezoru by se měly snadno přizpůsobit opakovatelným, konzistentním a měřitelným projektům, které se očekávají na úrovni CMMI 5. Data, která procházejí systémem datového trezoru EDW, začnou sledovat životní cyklus TQM (Total Quality Management), který již dlouho chybí v projektech BI (business intelligence).

Nástroje

2150 Datavault Builder

Kdekoli

Vaultspeed

Reference

Citace

Zdroje

  • Hultgren, Hans (listopad 2012). Modelování agilního datového skladu pomocí Data Vault. Hans Hultgren. ISBN  978-0615723082.
  • Linstedt, Dan (prosinec 2010). Superúčtujte svůj datový sklad. Dan Linstedt. ISBN  978-0-9866757-1-3.
  • Thomas C. Hammergren; Alan R. Simon (únor 2009). Data Warehousing for Dummies, 2. vydání. John Wiley & Sons. ISBN  978-0-470-40747-9.
  • Ronald Damhof; Lidwine van As (25. srpna 2008). „Nová generace EDW - opuštění myšlenky jediné verze pravdy“ (PDF). Database Magazine (DB / M). Array Publications B.V.
  • Linstedt, Dan. „Data Vault Series 1 - Data Vault Overview“. Série datových úložišť. Newsletter pro správu údajů. Citováno 12. září 2011.
  • Linstedt, Dan. „Data Vault Series 2 - Data Vault Components“. Série datových úložišť. Newsletter pro správu údajů. Citováno 12. září 2011.
  • Linstedt, Dan. „Data Vault Series 3 - data ukončení a základní připojení“. Série datových úložišť. Newsletter pro správu údajů. Citováno 12. září 2011.
  • Linstedt, Dan. „Data Vault Series 4 - Link Tables“. Série datových úložišť. Newsletter pro správu údajů. Citováno 12. září 2011.
  • Linstedt, Dan. „Data Vault Series 5 - Loading Practices“. Série datových úložišť. Newsletter pro správu údajů. Citováno 12. září 2011.
  • Kunenborg, Ronald. „Data Vault Rules v1.0.8 Cheat Sheet“ (PDF). Pravidla datového trezoru. Grundsätzlich IT. Citováno 26. září 2012. Cheat sheet odrážející pravidla ve verzi 1.0.8 a další objasnění z fór o pravidlech ve verzi 1.0.8.
  • Linstedt, Dan. „Data Vault Modeling Specification v1.0.9“. Fórum datového trezoru. Dan Linstedt. Citováno 26. září 2012.
  • Linstedt, Dan. „Data Vault Loading Specification v1.2“. DanLinstedt.com. Dan Linstedt. Citováno 2014-01-03.
  • Linstedt, Dan. „Krátký úvod do #datavault 2.0“. DanLinstedt.com. Dan Linstedt. Citováno 2014-01-03.
  • Linstedt, Dan. „Data Vault 2.0 ohlašována“. DanLinstedt.com. Dan Linstedt. Citováno 2014-01-03.
Zdroje v nizozemském jazyce
  • Ketelaars, M.W.A.M. (2005-11-25). „Datawarehouse-modelleren met Data Vault“. Database Magazine (DB / M). Array Publications B.V. (7): 36–40.
  • Verhagen, K .; Vrijkorte, B. (10. června 2008). "Relační versus datový trezor". Database Magazine (DB / M). Array Publications B.V. (4): 6–9.

externí odkazy