Správa kmenových dat - Master data management

Správa kmenových dat („MDM“) je obor s technologickými možnostmi, ve kterém jsou obchodní a Informační technologie („IT“) spolupracují na zajištění jednotnosti, přesnosti, správcovství, sémantické konzistence a odpovědnosti úředně sdíleného podniku hlavní data aktiva.[1][2]

Ovladače pro správu kmenových dat

Organizace nebo skupiny organizací mohou stanovit potřebu správy kmenových dat, pokud obsahují více než jednu kopii dat o obchodní entitě. Držení více než jedné kopie těchto kmenových dat ze své podstaty znamená, že je neefektivnost v udržování „jediná verze pravdy „napříč všemi kopiemi. Pokud nebudou existovat lidé, procesy a technologie, které zajistí, že hodnoty dat budou udržovány ve všech kopiích, je téměř nevyhnutelné, že budou uchovávány různé verze informací o obchodním subjektu. To způsobí neefektivitu provozních dat na základní úrovni se správa hlavních dat snaží zajistit, aby organizace nepoužívala více (potenciálně nekonzistentní ) verze stejných kmenových dat v různých částech jejich operací, ke kterým může dojít ve velkých organizacích.

Mezi další problémy patří (například) problémy s kvalita dat, konzistentní klasifikace a identifikace údajů a sladění dat problémy. Správa hlavních dat různorodých datových systémů vyžaduje datové transformace protože data extrahovaná z různorodého zdrojového datového systému jsou transformována a načtena do centra správy hlavních dat. Chcete-li synchronizovat různorodá zdrojová kmenová data, spravovaná kmenová data extrahovaná z centra správy hlavních dat se znovu transformují a načtou se do odlišného zdrojového datového systému při aktualizaci kmenových dat. Stejně jako u ostatních Extrahovat, transformovat, načíst - na základě pohybu dat jsou tyto procesy nákladné a neefektivní pro vývoj a údržbu, což výrazně snižuje návratnost investic pro produkt pro správu kmenových dat.

Existuje celá řada hlavních příčin problémů s kmenovými daty v organizacích. Tyto zahrnují:

  1. Segmentace obchodní jednotky a produktové řady
  2. Fúze a akvizice

Segmentace obchodní jednotky a produktové řady

Jako výsledek obchodní jednotka a výrobní linka segmentace, stejný obchodní subjekt (jako je zákazník, dodavatel, produkt) bude obsluhován různými produktovými řadami; za účelem zpracování transakce budou zadány nadbytečné údaje o obchodním subjektu. Redundance dat podnikatelských subjektů je sloučena v životním cyklu front-to-office, kde je potřeba autoritativní jediný zdroj pro data strany, účtu a produktu, ale často je znovu redundantně zadán nebo rozšířen.

Typickým příkladem je scénář banky, ve které a zákazník vytáhl a hypotéka a banka tomuto zákazníkovi začne posílat žádosti o hypotéku, ignoruje skutečnost, že daná osoba již má s bankou vztah k hypotečnímu účtu. Stává se to proto, že informacím o zákaznících používaných marketingovou sekcí v bance chybí integrace s informacemi o zákaznících používanými sekcí zákaznických služeb banky. Tyto dvě skupiny tedy nevědí, že stávající zákazník je také považován za vedoucího prodeje. Proces záznam propojení se používá k přidružení různých záznamů, které odpovídají stejné entitě, v tomto případě stejné osobě.

Fúze a akvizice

Jedním z nejčastějších důvodů, proč některé velké korporace zažívají obrovské problémy se správou kmenových dat, je růst fúze nebo akvizice. Všechny organizace, které se spojí, obvykle vytvoří entitu s duplicitními kmenovými daty (protože každá pravděpodobně měla před sloučením alespoň jednu vlastní hlavní databázi). Ideálně, správci databází vyřešit tento problém prostřednictvím deduplikace kmenových dat jako součást fúze. V praxi však sladění několika systémů hlavních dat může představovat potíže kvůli závislostem existujících aplikací na hlavních databázích. Výsledkem je, že se oba systémy častěji plně nespojují, ale zůstávají oddělené, přičemž je definován speciální proces sladění, který zajišťuje konzistenci mezi daty uloženými v těchto dvou systémech. Postupem času se však s dalšími fúzemi a akvizicemi problém znásobuje, objevuje se stále více a více hlavních databází a procesy sladění dat se stávají extrémně složitými, a následně neovladatelnými a nespolehlivými. Kvůli tomuto trendu lze najít organizace s 10, 15 nebo dokonce až 100 samostatnými, špatně integrovanými hlavními databázemi, což může způsobit vážné provozní problémy v oblastech spokojenost zákazníků, provozní efektivita, podpora při rozhodování a dodržování předpisů.

Dalším problémem je stanovení správného stupně podrobnosti a normalizace, které mají být zahrnuty do schématu hlavních dat. Například ve federovaném HR prostředí se podnik může zaměřit na ukládání dat lidí jako aktuální stav, přidání několika polí k identifikaci data pronájmu, data poslední propagace atd. Toto zjednodušení však může zavést chyby ovlivňující podnikání do závislých systémů pro plánování a předpovídání. Zainteresované strany těchto systémů mohou být nuceny vybudovat paralelní síť nových rozhraní pro sledování nástupu nových zaměstnanců, plánovaných odchodů do důchodu a odprodeje, což funguje proti jednomu z cílů správy hlavních dat.

Lidé, procesy a technologie

Správa kmenových dat je povoleno podle technologie, ale je více než technologie, které to umožňují. Schopnost organizace spravovat hlavní data zahrnuje do její definice také lidi a procesy.

Lidé

V rámci MDM by mělo být obsazeno několik rolí. Nejvýznamněji vlastník údajů a správce údajů. Pravděpodobně by ke každé roli bylo přiděleno několik lidí, každá osoba odpovědná za podmnožinu kmenových dat (např. Jeden vlastník dat pro kmenová data zaměstnanců, další pro kmenová data zákazníků).

Vlastník údajů odpovídá za požadavky na kvalitu dat, zabezpečení dat atd., Jakož i za dodržování postupů správy a správy dat. Vlastník údajů by měl také financovat projekty na zlepšení v případě odchylek od požadavků.

Správce dat spouští správu hlavních dat jménem vlastníka dat a pravděpodobně také jako poradce vlastníka dat.

Proces

Na správu kmenových dat lze pohlížet jako na „obor pro specializované zlepšování kvality“[3] definované zásadami a postupy zavedenými a správa dat organizace. Jeho cílem je zajistit procesy pro sbírání, agregace, párování, konsolidace, kvalitní - ujištění, přetrvávající a rozdělující kmenová data v celé organizaci k zajištění společného porozumění, konzistence, přesnost a kontrola[4], při průběžné údržbě a používání těchto údajů aplikací.

Procesy běžně viděné ve správě hlavních dat zahrnují identifikaci zdroje, sběr dat, transformace dat, normalizace, správa pravidel, detekce a oprava chyb, konsolidace dat, datové úložiště, distribuce dat, klasifikace dat, taxonomické služby, tvorba kmenových položek, mapování schématu, kodifikace produktu, obohacení dat, správa hierarchie, řízení obchodní sémantiky a správa dat.

Technologie

Nástroj pro správu kmenových dat lze použít k podpoře správy kmenových dat pomocí odstranění duplikátů, standardizace dat (hromadná údržba),[5] a začlenění pravidel k vyloučení nesprávných dat ze vstupu do systému za účelem vytvoření autoritativního zdroje kmenových dat. Kmenová data jsou produkty, účty a strany, pro které obchodní transakce jsou dokončeny.

Tam, kde technologický přístup vytváří „zlatý záznam“ nebo se opírá o „zdroj záznamu“ nebo „systém záznamu“, je běžné hovořit o tom, kde jsou data „zvládnuta“. Toto je v oboru informačních technologií akceptovaná terminologie, je však třeba dbát na to, jak u odborníků, tak u širší komunity zúčastněných stran, aby nedošlo k záměně pojmu „kmenová data“ s pojmem „zvládnutí dat“.

Implementační modely

Existuje řada modelů pro implementaci technologického řešení pro správu kmenových dat. Ty závisí na hlavním podnikání organizace, její podnikové struktuře a jejích cílech. Tyto zahrnují:

  1. Zdroj záznamu
  2. Registr
  3. Konsolidace
  4. Soužití
  5. Transakce / centralizovaná
Zdroj záznamu

Tento model identifikuje jedinou aplikaci, databázi nebo jednodušší zdroj (např. Tabulku) jako „zdroj záznamu“ (nebo „systém záznamu „kde se spoléhá pouze na aplikační databáze). Výhodou tohoto modelu je jeho koncepční jednoduchost, ale nemusí odpovídat realitě komplexní distribuce kmenových dat ve velkých organizacích.

Zdroj záznamu lze federovat, například podle skupin atributů (takže různé atributy entity hlavních dat mohou mít různé zdroje záznamu) nebo geograficky (takže různé části organizace mohou mít různé hlavní zdroje). Federace je použitelná pouze v určitých případech použití, kde je jasně vymezeno, které podmnožiny záznamů budou nalezeny ve kterých zdrojích.

Zdroj modelu záznamu lze použít více než jednoduše na kmenová data, například na referenční údaje.

Registr[6]

Tento model udržuje centrální registr propojující záznamy napříč různými zdrojovými systémy. Zjistí duplikáty spuštěním algoritmů čištění a shody a poté přiřadí jedinečné globální identifikátory odpovídajícím záznamům, aby pomohla identifikovat „jediná verze pravdy ". Tento model neposílá data zpět do zdrojových systémů, takže změny hlavních dat se nadále provádějí prostřednictvím stávajících zdrojových systémů. Když je potřeba jediný komplexní pohled na zákazníka, použije každý referenční systém k vytvoření pohledu v reálný čas.

Tento model může být užitečný, když má organizace velký počet zdrojových systémů rozšířených po celém světě a je obtížné stanovit autoritativní zdroj. Umožňuje také analýzu dat bez rizika přepsání informací ve zdrojových systémech.

Konsolidace[6]

V tomto modelu jsou kmenová data zpravidla konsolidována z více zdrojů v centru za účelem vytvoření jediné verze pravdy, v tomto kontextu často označované jako „zlatý rekord“. Veškeré aktualizace provedené v kmenových datech se poté použijí na původní zdroje.

Konsolidované rozbočovače jsou levné a rychle se nastavují (jak řešení MDM fungují!). Tento model se používá hlavně pro analýzu a vykazování.

Soužití[6]

Tento model poskytuje „zlatý rekord“ stejným způsobem jako model konsolidace, ale ke změnám kmenových dat může dojít v systému MDM i v aplikačních systémech. To má tendenci zdražovat nasazení.

Hlavní výhodou tohoto stylu je, že data jsou zvládnuta ve zdrojových systémech a poté synchronizována s centrem, takže data mohou harmonicky koexistovat a stále nabízejí jedinou verzi pravdy. Další výhodou tohoto přístupu je, že se zlepšuje kvalita kmenových dat a přístup je rychlejší. Vytváření přehledů je také jednodušší, protože všechny atributy kmenových dat jsou na jednom místě.

Transakce / centralizovaná[6]

Tento model ukládá a udržuje atributy hlavních dat pomocí algoritmů propojení, čištění, párování a obohacení k vylepšení dat. Vylepšená data lze poté publikovat zpět do příslušného zdrojového systému. To vyžaduje oboustranný zásah do zdrojových systémů. Zdrojové systémy se mohou přihlásit k odběru aktualizací publikovaných centrálním systémem, aby byla zajištěna úplná konzistence.

Hlavní výhodou tohoto stylu je, že kmenová data jsou vždy přesná a úplná, zatímco zásady zabezpečení a viditelnosti na úrovni atributu dat mohou být podporovány centrem stylu transakce. Organizace získá centralizovanou sadu kmenových dat pro jednu nebo více domén.

Přenos kmenových dat

Existuje několik způsobů, jak lze kmenová data shromažďovat a distribuovat do jiných systémů.[7] To zahrnuje:

  1. Konsolidace dat - proces zachycení kmenových dat z více zdrojů a integrace do jednoho rozbočovače (úložiště provozních dat ) pro replikaci do jiných cílových systémů.
  2. Federace dat - Proces poskytování jediného virtuálního pohledu na kmenová data z jednoho nebo více zdrojů do jednoho nebo více cílových systémů.
  3. Šíření dat - proces kopírování kmenových dat z jednoho systému do druhého, obvykle prostřednictvím rozhraní point-to-point ve starších systémech.

Řízení změn v implementaci

Správa kmenových dat může při přijetí ve velké organizaci trpět, pokud „jediná verze pravdy „koncept není nakoupen zúčastněnými stranami, které se domnívají, že jejich místní definice kmenových dat je nezbytná. Například hierarchie produktů používaná ke správě zásob se může zcela lišit od hierarchií produktů používaných k podpoře marketingových snah nebo placení obchodních zástupců. je především nutné určit, zda jsou skutečně požadována různá kmenová data. Je-li to nutné, pak implementované řešení (technologie a proces) musí být schopné umožnit existenci více verzí pravdy, ale bude poskytovat jednoduché a transparentní způsoby sladění nezbytné rozdíly. Pokud to není nutné, je třeba upravit procesy. Bez této aktivní správy budou uživatelé, kteří potřebují alternativní verze, jednoduše „obejít“ oficiální procesy, čímž se sníží účinnost celkového programu správy kmenových dat společnosti.

Viz také

Reference

  1. ^ „Gartner Glossary: ​​Master Data Management“. Gartner. Citováno 6. června 2020.
  2. ^ Rouse, Margaret (04.04.2018). „Definice z WhatIs.com“. SearchDataManagement. Citováno 2018-04-09.
  3. ^ Průvodce DAMA-DMBOK, 2010 DAMA International
  4. ^ „Learn how to create a MDM change request - LightsOnData“. LightsOnData. 2018-05-09. Citováno 2018-08-17.
  5. ^ Jürgensen, Knut (2016-05-16). „Master Data Management (MDM): Help or Hindrance?“. Simple Talk. Citováno 2018-04-09.
  6. ^ A b C d Lonnon, Michael (25. května 2018). „4 běžné styly implementace správy hlavních dat“. Systémy Stibo. Citováno 6. června 2020.
  7. ^ „Vytváření zlatého záznamu: lepší data prostřednictvím chemie“, DAMA, snímek 26, Donald J. Soulsby, 22. října 2009

externí odkazy