Sběr dat - Data collection

Příklad sběru dat v biologických vědách: Adélie tučňáci jsou identifikovány a zváženy pokaždé, když přejdou automatizovanou váha na cestě k moři nebo z moře.[1]

Sběr dat je proces shromažďování a měření informace na cílené proměnné v zavedeném systému, který pak umožňuje odpovědět na relevantní otázky a vyhodnotit výsledky. Data sbírka je součástí výzkum ve všech oborech včetně fyzický a společenské vědy, humanitní vědy,[2] a podnikání. Zatímco metody se liší podle disciplíny, důraz na zajištění přesného a poctivého sběru zůstává stejný. Cílem veškerého sběru dat je zachytit kvalitní důkazy, které umožňují analýze vést k formulaci přesvědčivých a důvěryhodných odpovědí na položené otázky.

Důležitost

Bez ohledu na studijní obor nebo preference pro definování údajů (kvantitativní nebo kvalitativní ), přesný sběr dat je nezbytný pro zachování integrity výzkumu. Výběr vhodných nástrojů pro sběr dat (stávajících, upravených nebo nově vyvinutých) a jasně vymezené pokyny pro jejich správné použití snižují pravděpodobnost chyby.

Formální proces sběru dat je nezbytný, protože zajišťuje, že shromážděné údaje jsou definované a přesné. Tímto způsobem jsou následná rozhodnutí založená na argumentech obsažených ve zjištěních prováděna s použitím platných údajů.[3] Tento proces poskytuje jak základní linii, od které se má měřit, tak v určitých případech i náznak toho, co zlepšit.

Existuje 5 běžných metod sběru dat:

  1. uzavřené průzkumy a kvízy,
  2. otevřené průzkumy a dotazníky,
  3. Rozhovory 1 na 1,
  4. zaměřit se na skupiny, a
  5. přímé pozorování.[4]

Problémy s integritou dat[5]

Hlavním důvodem pro zachování integrita dat je podporovat pozorování chyb v procesu sběru dat. Tyto chyby mohou být učiněny záměrně (úmyslné padělání) nebo neúmyslně (náhodný nebo systematické chyby ).

Existují dva přístupy, které mohou chránit integritu dat a zabezpečit vědeckou platnost studijních výsledků vynalezených Craddickem, Crawfordem, Rhodosem, Redicanem, Rukenbrodem a zákony v roce 2003:

  • Zajištění kvality - všechny akce provedené před sběrem dat
  • Kontrola kvality - všechny akce prováděné během a po sběru dat

Zajištění kvality

Jeho hlavním zaměřením je prevence, která je primárně nákladově efektivní činností na ochranu integrity sběru dat. Standardizace protokolu nejlépe demonstruje tuto nákladově efektivní aktivitu, která je vyvinuta v komplexní a podrobné příručce pro sběr dat. Riziko selhání při identifikaci problémů a chyb v procesu výzkumu je zjevně způsobeno špatně napsanými pokyny. Uvádíme několik příkladů takových poruch:

  • Nejistota ohledně načasování, metod a identifikace odpovědné osoby
  • Je třeba shromáždit částečný seznam položek
  • Nejasný popis nástrojů pro sběr dat namísto přísných podrobných pokynů k administraci testů
  • Nerozpoznání přesného obsahu a strategií pro školení a rekvalifikaci zaměstnanců odpovědných za sběr dat
  • Nejasné pokyny k používání, úpravám a kalibraci zařízení pro sběr dat
  • Žádný předem stanovený mechanismus k dokumentaci změn v postupech, které nastanou během vyšetřování

Kontrola kvality

Vzhledem k tomu, že se akce kontroly kvality vyskytují během nebo po sběru dat, všechny podrobnosti jsou pečlivě zdokumentovány. Je nezbytně nutná jasně definovaná komunikační struktura jako předpoklad pro zavedení monitorovacích systémů. Nejistota ohledně toku informací se nedoporučuje, protože špatně organizovaná komunikační struktura vede k laxnímu monitorování a může také omezit příležitosti pro detekci chyb. Kontrola kvality je také odpovědná za identifikaci akcí nezbytných pro nápravu chybných postupů při sběru dat a také za minimalizaci takových budoucích výskytů. Tým si pravděpodobně neuvědomuje nutnost provádět tyto akce, pokud jsou jejich postupy psány neurčitě a nejsou založeny na zpětné vazbě nebo vzdělání.

Problémy se sběrem dat, které vyžadují okamžitou akci:

  • Systematické chyby
  • Porušení protokolu
  • Podvod nebo vědecké pochybení
  • Chyby v jednotlivých datových položkách
  • Problémy s výkonem jednotlivých zaměstnanců nebo stránek

Sběr dat v systému z / OS

z / OS je široce používaný operační systém pro IBM mainframe. Je navržen tak, aby nabízel stabilní, zabezpečené a nepřetržitě dostupné prostředí pro aplikace běžící na sálovém počítači. Provozní data jsou data, která systém z / OS produkuje při svém spuštění. Tato data označují stav systému a lze je použít k identifikaci zdrojů problémů s výkonem a dostupností v systému. Analýza provozních dat analytickými platformami poskytuje přehledy a doporučené akce, aby systém fungoval efektivněji a pomohl vyřešit nebo předcházet problémům. IBM Z Common Data Provider shromažďuje provozní data IT ze systémů z / OS, transformuje je do spotřebního formátu a přenáší je na analytické platformy.[6]

Společný poskytovatel dat IBM Z podporuje shromažďování následujících provozních dat:[7]

  • Zařízení pro správu systému (SMF) data
  • Protokolovat data z následujících zdrojů:
    • Protokol úlohy, výstup, který je spuštěnou úlohou zapsán do definice dat (DD)
    • Soubor protokolu z / OS UNIX, včetně systémového protokolu systému UNIX System Services (syslogd)
    • Klastr VSAM (Entry-Sequence Virtual Storage Access Method)
    • systémový protokol z / OS (SYSLOG)
    • Zprávy IBM Tivoli NetView pro z / OS
    • IBM WebSphere Application Server pro protokol HPEL (High Performance Extensible Logging) systému z / OS
    • Sestavy Monitoru IBM Resource Measurement Facility (RMF) Monitor III
  • Data uživatelských aplikací, provozní data z vlastních aplikací uživatelů

DMP a sběr dat

DMP je zkratka pro platformu pro správu dat. Jedná se o centralizovaný úložný a analytický systém pro data. DMP, které používají hlavně obchodníci, existují ke kompilaci a transformaci velkého množství dat na rozeznatelné informace.[8] Obchodníci mohou chtít přijímat a využívat data první, druhé a třetí strany. DMP to umožňují, protože jsou agregovaným systémem DSP (platforma na straně poptávky) a SSP (platforma na straně dodávky). Když přijde na reklamu, DMP jsou nedílnou součástí optimalizace a vedení marketingových pracovníků v budoucích kampaních. Tento systém a jejich účinnost dokazuje, že kategorizovaná, analyzovaná a kompilovaná data jsou mnohem užitečnější než nezpracovaná data.


Viz také

Reference

  1. ^ Lescroël, A. L .; Ballard, G .; Grémillet, D .; Authier, M .; Ainley, D. G. (2014). Descamps, Sébastien (ed.). „Antarktická změna klimatu: extrémní události narušují plastickou fenotypovou reakci u tučňáků adélie“. PLOS ONE. 9 (1): e85291. doi:10.1371 / journal.pone.0085291. PMC  3906005. PMID  24489657.
  2. ^ Vuong, Quan-Hoang; La, Viet-Phuong; Vuong, Čt-Trang; Ho, Manh-Toan; Nguyen, Hong-Kong T .; Nguyen, Viet-Ha; Pham, Hiep-Hung; Ho, Manh-Tung (25. září 2018). „Otevřená databáze produktivity vietnamských sociálních a humanitních věd pro veřejné použití“. Vědecké údaje. 5: 180188. doi:10.1038 / sdata.2018.188. PMC  6154282. PMID  30251992.
  3. ^ Sběr a analýza dat Dr. Roger Sapsford, Victor Jupp ISBN  0-7619-5046-X
  4. ^ Jovancic, Nemanja. „5 metod sběru dat pro získávání kvantitativních a kvalitativních údajů“. LeadQuizzes. LeadQuizzes. Citováno 23. února 2020.
  5. ^ Northern Illinois University (2005). "Sběr dat". Odpovědné chování při správě dat. Citováno 8. června 2019.
  6. ^ IBM: IBM Z Common Data Provider
  7. ^ IBM: IBM Z Common Data Provider Knowledge Center
  8. ^ Collin, E. M. (04.11.2020). „Sběr dat: Kompletní průvodce“. Snadno vydělané peníze. Citováno 2020-11-05.

externí odkazy