Špinavá data - Dirty data

Špinavá data, také známý jako nepoctivá data,[1] jsou nepřesné, neúplné nebo nekonzistentní data, zejména v počítačovém systému nebo databáze.[2]

Špinavá data mohou obsahovat chyby jako pravopisné nebo interpunkční chyby, nesprávná data spojená s polem, neúplná nebo zastaralá data nebo dokonce data, která byla v databázi duplikována. Mohou být čištěny procesem známým jako čištění dat.[3]

Špinavá data (sociální)

Podle definice Garyho T. Marxe, emeritního profesora MIT, existují čtyři typy dat:[4]

  • Necretriční a nediskreditující údaje:
    • Rutinně dostupné informace.
  • Utajené a nediskreditované údaje:
    • Strategická a bratrská tajemství, soukromí.
  • Data, která nejsou tajná a diskreditují:
    • sankční imunita,
    • normativní rozpor,
    • selektivní disenzus,
    • napravit hrozbu pro důvěryhodnost,
    • objevil špinavá data.
  • Utajená a diskreditující data: Skrytá a špinavá data.

Viz také

Reference

  1. ^ Neposkvrněná verze 12 právě venku
  2. ^ Margaret Chu (2004), „What are Dirty Data?“, Blažená data, str. 71 a násl., ISBN  9780814407806
  3. ^ Wu, S. (2013), „Kontrola hrubých údajů o záruce a analýza“ (PDF), Spolehlivé inženýrství a systém, 114: 1–11, doi:10.1016 / j.ress.2012.12.021
  4. ^ „Poznámky k objevování, shromažďování a hodnocení skrytých a“. web.mit.edu. Citováno 2017-02-17.