Nenormalizovaná forma - Unnormalized form - Wikipedia

Nenormalizovaná forma (UNF), také známý jako nenormalizovaný vztah nebo ne první normální forma (NF2),[1] je jednoduchý databáze datový model (organizace dat v databázi) chybí účinnost normalizace databáze. Nenormalizovaný datový model utrpí úskalí redundance dat, kde lze v jednom poli nebo atributu uložit více hodnot nebo složitých datových struktur,[2] nebo kde lze pole replikovat v jedné tabulce (způsob podvracení první normální forma pravidlo jedné hodnoty na pole nebo atribut).

Přehled

A vztah v nenormalizované formě se používá k reprezentaci údajů zadaných uživatelem prostřednictvím formuláře. Pokud formulář obsahuje atomový pole, pak lze model uvažovat v 1NF formulář.[3] Pokud však formulář obsahuje závislé atributy, jsou uloženy jako datová struktura (obvykle jiná tabulka) v rámci tohoto atributu. Data v nenormalizované podobě by nebyla považována za relační protože mu chybí atomová data. Některá základní použití nenormalizovaných vztahů zahrnují práci s daty formulářů v kancelářích. Jeden formulář by odpovídal jednomu záznamu v databázi.[1]

Dějiny

V roce 1970 E.F.Codd navrhl relační datový model, nyní široce přijímaný jako standardní datový model.[4] Toho času, kancelářská automatizace bylo hlavní využití systémů pro ukládání dat, které vyústilo v návrh mnoha NF2 datové modely, jako je Schekův model, Jaeschkeho modely (nerekurzivní a rekurzivní algebra) a model Vnořená tabulka dat (NTD).[1] IBM uspořádal první mezinárodní workshop výhradně na toto téma v roce 1987, který se konal v Darmstadt, Německo.[1] Kromě toho bylo provedeno mnoho výzkumů a byly vydávány časopisy, které by řešily nedostatky relační model. Od přelomu století NoSQL databáze se staly populární díky požadavkům Web 2.0.

Příklad

Studenti se účastní kurzů:

IdnázevChod
1.Zvedák
  • Matematika
  • Chemie
2.TimChemie
3.Ana
  • Fyzika
  • Chemie

Alternativní pohled:

IdnázevKurz 1Kurz 2
1.ZvedákMatematikaChemie
2.TimChemie
3.AnaFyzikaChemie

Výše uvedené tabulky představují data v nenormalizované podobě, protože více než jedna hodnota je uložena v jediném atributu v rámci řady / n-tice (nebo je pojem jedné hodnoty na atribut přepsán opakovanými sloupci). Tento nedostatek definované atomicity znamená, že tabulka nedosáhla úrovně První normální forma.[5] Zde může jeden student absolvovat několik kurzů a tato data se projeví v jednom řádku v databáze. Je vidět, že související entity založené na „kurzu“ jsou problematičtější, stejně jako zajištění konzistence dat (což je buď nemožné, nebo velmi obtížné systematickým způsobem). O něco menší důležitost v moderních systémech je slovo „Chemistry“ uloženo třikrát v databáze což má za následek potenciálně nadměrnou spotřebu paměti.

Výhody a nevýhody

Výhody nenormalizované formy oproti normalizovaným formám jsou -

  • Dokáže pracovat se složitými datovými strukturami, jako jsou objekty, řádky v poli.[6]
  • Protože neexistuje vztah, dotazování na tento datový model je jednodušší.[7]
  • Restrukturalizace dat je jednodušší.[8]

Nevýhody nenormalizované formy jsou -

  • Nepřítomnost vztahy znamená, že data jsou často redundantní.[7]
  • CRUD operace jsou sužovány anomáliemi, a pokud nebudou správně zpracovány, mohou mít za následek nekonzistenci dat.[2]

Moderní aplikace

Dnes se společnostem líbí Google, Amazonka a Facebook vypořádat se s velkým množstvím dat, které je obtížné efektivně uložit. Používají NoSQL databáze, které jsou založeny na principech nenormalizovaného relačního modelu, k řešení problému úložiště.[9] Některé příklady NoSQL databáze jsou MongoDB, Apache Cassandra a Redis. Těchto databází je více škálovatelné a snadněji se dotazují, protože nezahrnují drahé operace jako PŘIPOJIT SE.[Citace je zapotřebí ]

Viz také

Reference

  1. ^ A b C d Kitagawa, Hiroyuki; Kunii, Tosiyasu L. (06.02.1990). Nenormalizovaný relační datový model. 1, 5, 7, 10. ISBN  978-4-431-70049-4.
  2. ^ A b "1NF, 2NF, 3NF a BCNF v normalizaci databáze | Výukový program DBMS | Studytonight". www.studytonight.com. Citováno 2016-09-14.
  3. ^ Codd, E. F. (01.06.1970). "Relační model dat pro velké sdílené datové banky". Commun. ACM. 13 (6): 377–387. doi:10.1145/362384.362685. ISSN  0001-0782.
  4. ^ „Archivy IBM: Edgar F. Codd“. 23.dubna 2003.
  5. ^ „Směšně nenormalizovaná databázová schémata - část první“. 2011-01-19. Citováno 2016-09-14.
  6. ^ „Omezení relačního modelu“ (PDF).
  7. ^ A b „Výhody a nevýhody normalizace databáze | Techwalla.com“. Citováno 2016-09-14.
  8. ^ Abiteboul, Serge; Bidoit, Nicole (01.12.1986). "Vztahy jiné než první normální formy: Algebra umožňující restrukturalizaci dat". Journal of Computer and System Sciences. 33 (3): 361–393. doi:10.1016/0022-0000(86)90058-9.
  9. ^ Moniruzzaman, A B M; Hossain, Syed Akhter (2013). „NoSQL Database: New Era of Database for Big Data Analytics - Classification, Characteristics and Comparison“. International Journal of Database Theory and Application. 6.