Virtualizace dat - Data virtualization
Virtualizace dat je přístup ke správě dat, který umožňuje aplikaci načítat a manipulovat s daty bez požadavku na technické podrobnosti o datech, například jak jsou formátována u zdroje nebo kde jsou fyzicky umístěna,[1] a může poskytnout pohled jednoho zákazníka (nebo jediný pohled na jakoukoli jinou entitu) celkových údajů.[2]
Na rozdíl od tradičních extrahovat, transformovat, načíst („ETL“), data zůstávají na svém místě a pro data je poskytován přístup v reálném čase ke zdrojovému systému. To snižuje riziko datových chyb, přesunutí dat v pracovní zátěži, které se nikdy nemusí použít, a nepokouší se na data uvalit jediný datový model (příkladem heterogenních dat je federovaný databázový systém ). Tato technologie také podporuje zápis aktualizací dat transakcí zpět do zdrojových systémů.[3] K vyřešení rozdílů ve zdrojových a spotřebitelských formátech a sémantice se používají různé techniky abstrakce a transformace. Tento koncept a software je podmnožinou integrace dat a běžně se používá v rámci obchodní inteligence, architektura orientovaná na služby datová služba, cloud computing, podnikové vyhledávání, a správa kmenových dat.
Virtualizace dat a skladování dat
Některé podnikové krajiny jsou plné různorodých zdrojů dat, včetně několika datové sklady, datové trhy a / nebo datová jezera, i když Data Warehouse, pokud je správně implementován, by měl být jedinečný a jediný zdroj pravdy. Virtualizace dat může efektivně propojit data napříč datovými sklady, datovými tržišti a datovými jezery, aniž by bylo nutné vytvářet zcela novou integrovanou fyzickou datovou platformu. Stávající datová infrastruktura může i nadále vykonávat své základní funkce, zatímco vrstva virtualizace dat pouze využívá data z těchto zdrojů. Díky tomuto aspektu virtualizace dat se doplňuje se všemi existujícími zdroji dat a zvyšuje se dostupnost a využití podnikových dat.
Virtualizaci dat lze také považovat za alternativu k ETL a datové sklady. Virtualizace dat je neodmyslitelně zaměřena na produkci rychlých a včasných poznatků z více zdrojů, aniž byste se museli pustit do velkého datového projektu s rozsáhlým ETL a datovým úložištěm. Virtualizaci dat však lze rozšířit a přizpůsobit tak, aby vyhovovala i požadavkům na datové sklady. To bude vyžadovat pochopení požadavků na datové úložiště a historii spolu s plánováním a návrhem, aby bylo možné začlenit správný typ virtualizace dat, integračních a úložných strategií a optimalizace infrastruktury / výkonu (např. Streamování, v paměti, hybridní úložiště).
Příklady
- The Phone House - obchodní název pro evropské operace maloobchodního řetězce mobilních telefonů se sídlem ve Velké Británii Carphone Warehouse —Implementovala technologii Denodo pro virtualizaci dat mezi transakčními systémy její španělské dceřiné společnosti a webovými systémy mobilních operátorů.[3]
- Novartis implementováno TIBCO Nástroj pro virtualizaci dat, který svým výzkumným pracovníkům umožňuje rychle kombinovat data z interních i externích zdrojů do prohledávatelného virtuálního úložiště dat.[3]
- Storage-agnostic Primary Data (zaniklý, převtělený jako Hammer.space) byla platforma virtualizace dat, která umožňovala aplikacím, serverům a klientům transparentně přistupovat k datům, zatímco byla migrována mezi přímo připojeným, připojeným k síti, soukromým a veřejným cloudovým úložištěm .[Citace je zapotřebí ]
- Propojená data lze použít jeden hypertextový odkaz Název zdroje dat (DSN ) poskytnout připojení k virtuální databázové vrstvě, která je interně připojena k řadě back-endových zdrojů dat pomocí ODBC, JDBC, OLE DB, ADO.NET, SOA služby ve stylu a / nebo ODPOČINEK vzory.
- Virtualizace databáze může použít jediné DSBC založené na ODBC k zajištění připojení k podobné vrstvě virtuální databáze.
- Alluxio, open-source virtuální distribuovaný souborový systém (VDFS), zahájený v University of California, Berkeley je AMPLab. Systém odebírá data z různých souborových systémů a úložišť objektů.
Funkčnost
Software pro virtualizaci dat poskytuje některé nebo všechny z následujících funkcí:
- Abstrakce - abstraktní technické aspekty uložených dat, jako je umístění, struktura úložiště, API, přístupový jazyk a technologie úložiště.
- Virtualizovaný přístup k datům - připojte se k různým zdrojům dat a zpřístupněte je ze společného logického přístupového bodu k datům.
- Transformace - Transformace, zlepšení kvality, přeformátování, agregace atd. Zdrojových dat pro spotřebitelské použití.
- Federace dat - Kombinujte sady výsledků z více zdrojových systémů.
- Doručování dat - publikování sad výsledků jako pohledy nebo datové služby prováděné klientskou aplikací nebo uživateli na vyžádání.
Software pro virtualizaci dat může zahrnovat funkce pro vývoj, provoz a / nebo správu.
Mezi výhody patří:
- Snižte riziko chyb v datech[pochybný ]
- Snižte pracovní zátěž systémů tím, že nebudete přesouvat data[pochybný ]
- Zvyšte rychlost přístupu k datům v reálném čase
- Umožňuje zpracování dotazů tlačených dolů ke zdroji dat místo na střední vrstvě
- Většina systémů umožňuje samoobslužné vytváření virtuálních databází koncovými uživateli s přístupem ke zdrojovým systémům
- Výrazně zkrátit dobu vývoje a podpory
- Zlepšete správu a snižte riziko pomocí politik[4]
- Snižte požadované úložiště dat[5]
Nevýhody zahrnují:
- Může ovlivnit dobu odezvy operačních systémů, zejména pokud je nedostatečně škálováno, aby zvládlo neočekávané dotazy uživatelů nebo nebylo naladěno dříve.[6]
- Neukládá heterogenní datový model, což znamená, že uživatel musí data interpretovat, pokud není kombinován s Federace údajů a obchodní porozumění datům[7]
- Vyžaduje definovaný přístup k řízení, aby se předešlo problémům s rozpočtováním u sdílených služeb
- Nevhodné pro záznam historických snímků dat. K tomu je lepší datový sklad[7]
- Správa změn „je obrovská režie, protože všechny změny a změny musí být přijaty všemi aplikacemi a uživateli sdílejícími stejnou virtualizační sadu“[7]
Dějiny
Integrace podnikových informací (EII) (nejprve vytvořen společností Metamatrix), nyní známý jako Red Hat JBoss Data Virtualization, a federované databázové systémy jsou termíny používané některými prodejci k popisu klíčového prvku virtualizace dat: schopnost vytvářet relační JOINy ve federovaném VIEW.
Viz také
- Integrace dat
- Integrace podnikových informací (EII)
- Správa kmenových dat
- Federace údajů
- Nesourodý systém
Reference
- ^ „Co je to virtualizace dat?“, Margaret Rouse, TechTarget.com, vyvoláno 19. srpna 2013
- ^ Zefektivnění údajů o zákaznících
- ^ A b C „Virtualizace dat roste jako alternativa ETL pro integraci dat“ Gareth Morgan, Computer Weekly, vyvolány 19. srpna 2013
- ^ „Rychlý přístup k oddělení dat mezi projekty bez přepracování“ Informatica, vyvoláno 19. srpna 2013
- ^ Virtualizace dat: 6 osvědčených postupů, které byznysu pomohly „získat“ Joe McKendrick, ZDNet, 27. října 2011
- ^ | IT profesionálové odhalují výhody a nevýhody softwaru pro virtualizaci dat " Mark Brunelli, SearchDataManagement, 11. října 2012
- ^ A b C „Výhody a nevýhody virtualizace dat“ Loraine Lawson, BusinessEdge, 7. října 2011
Další čtení
- Virtualizace dat: Nad rámec tradiční datové integrace k dosažení obchodní agility, Judith R. Davis a Robert Eve
- Virtualizace dat pro systémy Business Intelligence: Revoluce v integraci dat pro datové sklady, Rick van der Lans
- Návrh a modelování integrace dat: Techniky pro škálovatelnou a udržitelnou architekturu, Anthony Giordano