Plán správy dat - Data management plan
A plán správy dat nebo DMP je formální dokument, který popisuje, jak data budou řešeny jak během výzkumného projektu, tak i po dokončení projektu.[1] Cílem plánu správy dat je zvážit mnoho aspektů správa dat, metadata generování, uchování dat a analýza před zahájením projektu;[2] to může v současnosti vést k řádné správě dat,[Citace je zapotřebí ] a připraven na uchování v budoucnosti.
DMP byly původně použity v roce 1966 ke správě sběru a analýzy dat leteckých a inženýrských projektů a byly rozšířeny napříč inženýrskými a vědeckými disciplínami v 70. a 80. letech. Až do počátku dvacátých let se DMP používaly „pro projekty velké technické složitosti a pro omezené účely sběru a zpracování údajů v polovině studia“.[3] V roce 2000 a později E-výzkum a hospodářské politiky vedly k rozvoji a zavádění DMP.[3]
Důležitost
Příprava plánu správy dat před shromažďováním dat je nárokována, aby se zajistilo, že data jsou ve správném formátu, dobře organizovaná a lépe anotovaná.[4] To by pravděpodobně mohlo z dlouhodobého hlediska ušetřit čas, protože není třeba znovu organizovat, přeformátovat nebo se snažit zapamatovat si podrobnosti o datech. Rovněž se tvrdí, že zvyšuje efektivitu výzkumu, protože jak sběratel dat, tak další výzkumní pracovníci by mohli v budoucnu porozumět a používat dobře anotovaná data. Jednou ze součástí plánu správy dat je archivace a uchování dat. Tím, že se sběrač dat rozhodne předem, může sběrač dat během shromažďování dat formátovat, aby se usnadnilo jeho budoucí odeslání do databáze. Pokud jsou data zachována, jsou relevantnější, protože mohou být znovu použita jinými vědci. Umožňuje také sběrači dat nasměrovat požadavky na data do databáze namísto individuálního adresování požadavků. Častým argumentem ve prospěch uchování je, že data, která jsou uchována, mají potenciál vést k novým, neočekávaným objevům a zabraňují duplikaci již provedených vědeckých studií. Archivace dat také poskytuje pojištění proti ztrátě sběrače dat.
V 2010s,[3] finanční agentury stále častěji požadovaly plány správy dat jako součást procesu návrhu a hodnocení,[5] navzdory malým nebo žádným důkazům o jejich účinnosti.[3]
Hlavní součásti
"Neexistuje žádný obecný a definitivní seznam témat, která by měla být zahrnuta v DMP pro výzkumný projekt",[6] a vědci jsou často ponecháni na svých vlastních zařízeních, jak vyplňovat DMP.[2]
Informace o datech a datovém formátu
- Popis údajů, které má projekt vytvořit.[7] To může zahrnovat (ale není omezeno na) data, která jsou:
- Experimentální
- Pozorovací
- Surové nebo odvozené
- Fyzické sbírky
- Modely
- Simulace
- Učební materiály
- Software
- snímky
- Jak budou údaje získány? Kdy a kde budou získány?
- Jak budou po sběru zpracovány údaje? Zahrnout informace o
- Použitý software
- Algoritmy
- Vědecké pracovní postupy
- Formáty souborů, které budou použity, zdůvodněte tyto formáty a popište použité konvence pojmenování.[8]
- Zajištění kvality a opatření kontroly kvality, která budou přijata během odběru, analýzy a zpracování vzorků.
- Jsou-li použita stávající data, jaký je jejich původ? Jak budou shromážděné údaje zkombinovány se stávajícími? Jaký je vztah mezi shromážděnými údaji a existujícími údaji?
- Jak budou data v krátkodobém horizontu spravována? Zvažte následující:
- Řízení verzí pro soubory[9]
- Zálohování dat a datových produktů
- Zabezpečení a ochrana dat a datových produktů
- Kdo bude odpovědný za řízení
Obsah a formát metadat
Metadata jsou kontextové podrobnosti, včetně veškerých informací důležitých pro používání dat. To může zahrnovat popis časových a prostorových detailů, nástrojů, parametrů, jednotek, souborů atd. Metadata se běžně označují jako „data o datech“.[10] Mezi otázky, které je třeba vzít v úvahu, patří:
- Jak podrobná mají být metadata, aby data měla smysl?
- Jak budou metadata vytvořena a / nebo zachycena? Mezi příklady patří laboratorní notebooky, ruční jednotky GPS, automaticky ukládané soubory na nástroje atd.
- Jaký formát bude použit pro metadata? Jaké jsou standardy metadat běžně používané v příslušné vědní disciplíně? Vybraný formát by měl být zdůvodněn.
Zásady pro přístup, sdílení a opakované použití
- Popište veškeré povinnosti týkající se sdílení shromážděných údajů. Mezi ně mohou patřit povinnosti finančních agentur, institucí, jiných profesních organizací a zákonné požadavky.
- Zahrňte informace o tom, jak budou data sdílena, včetně toho, kdy budou data přístupná, jak dlouho budou data k dispozici, jak lze získat přístup a jakákoli práva, která si sběratel dat vyhrazuje pro používání dat.
- Řešte jakékoli etické problémy nebo problémy s ochranou osobních údajů při sdílení údajů
- Adresa duševní vlastnictví & autorská práva problémy. Kdo vlastní autorská práva? Jaké jsou zásady institucí, vydavatelů a / nebo finančních agentur spojené s duševním vlastnictvím? Existují embarga z politických, obchodních nebo patentových důvodů?
- Popište zamýšlené budoucí použití / uživatele dat
- Uveďte, jak by data měla citovat ostatní. Jak bude řešena otázka trvalé citace? Například pokud budou data uložena ve veřejném archivu, bude mít datová sada a identifikátor digitálních objektů (doi) přiděleno?
Dlouhodobé ukládání a správa dat
- Vědci by měli identifikovat vhodný archiv pro dlouhodobé uchování jejich dat. Identifikací archivu v rané fázi projektu lze data vhodně formátovat, transformovat a dokumentovat, aby vyhovovaly požadavkům archivu. Výzkumníci by se měli poradit s kolegy a odbornými společnostmi ve své disciplíně, aby určili nejvhodnější databázi, a zahrnout záložní archiv do svého plánu správy dat pro případ, že by jejich první volba zanikla.
- Na začátku projektu by primární výzkumník měl určit, jaká data budou uchována v archivu. Obvykle je žádoucí uchovat data v té nejsurovější podobě, i když lze zachovat i datové deriváty a produkty.
- Jednotlivec by měl být identifikován jako primární kontaktní osoba pro archivovaná data a zajistit, aby byly kontaktní informace vždy aktualizovány, pokud existují požadavky na data nebo informace o datech.
Rozpočet
Náklady na správu a uchování dat mohou být značné, v závislosti na povaze projektu. Předčasným předvídáním nákladů vědci zajistí, že data budou správně spravována a archivována. Potenciální výdaje, které je třeba vzít v úvahu, jsou
- Personální čas na přípravu, správu, dokumentaci a uchování dat
- Hardware a / nebo software potřebný pro správu, zálohování, zabezpečení, dokumentaci a uchování dat
- Náklady spojené s odesláním dat do archivu
Plán správy údajů by měl zahrnovat způsob, jakým budou tyto náklady hrazeny.
Plán správy dat NSF
Všechny návrhy grantů předložené NSF musí obsahovat plán správy dat, který má maximálně dvě stránky.[11] Toto je doplněk (není součástí 15stránkového návrhu) a měl by popisovat, jak bude návrh v souladu s politikou Průvodce udělováním a správou (viz níže). Může zahrnovat následující:
- Druhy dat
- Standardy, které se mají použít pro formát a obsah dat a metadat
- Zásady pro přístup a sdílení
- Zásady a ustanovení pro opakované použití
- Plány na archivaci dat
Politika shrnutá z NSF Příručka pro udělování cen a správu, část 4 (Šíření a sdílení výsledků výzkumu):[12]
- Okamžitě publikujte s příslušným autorstvím
- Sdílejte data, vzorky, fyzické sbírky a podpůrné materiály s ostatními v rozumném časovém rámci
- Sdílejte software a vynálezy
- Vyšetřovatelé si mohou ponechat svá zákonná práva na jejich duševní vlastnictví, ale přesto musí své výsledky, data a sbírky zpřístupnit ostatním
- Politiky budou prováděny prostřednictvím
- Posouzení návrhu
- Jednání o podmínkách a podmínky
- Podpora / pobídky
Plán správy dat ESRC
Od roku 1995 ve Velké Británii Rada pro hospodářský a sociální výzkum (ESRC) zavedla politiku v oblasti výzkumných údajů. Současná politika ESRC pro výzkumná data uvádí, že výzkumná data vytvořená jako výsledek výzkumu financovaného ESRC by měla být otevřena vědecké komunitě v maximální možné míře, a to prostřednictvím dlouhodobého uchovávání a správy vysoce kvalitních dat.[13]
ESRC vyžaduje plán správy dat pro všechny žádosti o ocenění za výzkum, kde se vytvářejí nová data. Tyto plány jsou navrženy tak, aby podporovaly strukturovaný přístup ke správě dat v průběhu celého životního cyklu dat, což vede k kvalitnějším datům, která jsou připravena k archivaci pro sdílení a opětovné použití. The UK Data Service, stěžejní datová služba ESRC, poskytuje praktické pokyny pro plánování správy výzkumných dat vhodné pro výzkumníky v oblasti sociálních věd ve Velké Británii a po celém světě.[14][15]
ESRC má dlouhodobé ujednání s Archiv dat ve Velké Británii, se sídlem v University of Essex, jako místo pro uložení výzkumných dat, přičemž držitelé ocenění jsou povinni nabízet údaje vyplývající z jejich výzkumných grantů prostřednictvím UK Data Service.[16] Archiv umožňuje opětovné použití dat tak, že data uchová a zpřístupní výzkumným a výukovým komunitám.
Výhody
V literatuře jsou z hlediska výhod DMPs identifikována tři hlavní témata: profesionální výhody, ekonomické výhody a institucionální výhody.[3] Tvrdilo se, že DMP mohou tvořit katalyzátor pro výzkumné pracovníky, kteří by je mohli zlepšit datová gramotnost a postupy správy dat, které knihovna často podporuje.[3]
V praxi
V praxi však DMP často nedosahují stanovených cílů. Revize politik DMP z roku 2012, kterou poskytli výzkumní pracovníci, zjistila, že v politikách chybělo několik prvků Digitální kurátorské centrum Seznam kritérií pro DMP.[17] Vědci sdíleli text DMP.[18] DMP jsou často považovány za „administrativní cvičení spíše než za nedílnou součást“ výzkumného procesu,[19] a bylo uznáno, že DMP nezaručují dobré výsledky správa dat praktik.[20] Většina poskytovatelů finančních prostředků nepožaduje po udělení grantu DMP, čímž okrádá zúčastněné strany o mocný nástroj, kterým může být aktivní DMP. Osvědčeným postupem by bylo „vyžadovat údržbu plánu správy dat po zadání zakázky a během aktivní fáze studie.“[6] V současné době jsou plány sdílení dat pro investory důležitější než plány správy dat.[6]
Viz také
Reference
- ^ „Správa dat výzkumu - Library of Research Data Services + Sciences z University of Virginia“. www2.lib.virginia.edu.
- ^ A b Burnette, Margaret; Williams, Sarah; Imker, Heidi (16. září 2016). „Od plánu k akci: Úspěšná implementace plánu správy dat v multidisciplinárním projektu“. Journal of EScience Librarianship. 5 (1): e1101. doi:10.7191 / jeslib.2016.1101.
- ^ A b C d E F Smale, Nicholas; Unsworth, Kathryn; Denyer, Gareth; Barr, Daniel (17. října 2018). „Historie, prosazování a účinnost plánů správy dat“. bioRxiv: 443499. doi:10.1101/443499. S2CID 91931719.
- ^ „Proč spravovat a sdílet vaše data? - Správa dat“. libraries.mit.edu.
- ^ „Správa a sdílení dat, často kladené otázky (FAQ)“. Archivovány od originál dne 2017-07-11. Citováno 2018-04-06.
- ^ A b C Williams, Mary; Bagwell, Jacqueline; Nahm Zozus, Meredith (červenec 2017). „Plány správy dat: chybějící perspektiva“. Časopis biomedicínské informatiky. 71: 130–142. doi:10.1016 / j.jbi.2017.05.004. PMC 6697079. PMID 28499952.
- ^ „Prvky plánu správy dat“. www.icpsr.umich.edu. Citováno 2015-09-30.
- ^ https://web.archive.org/web/20180504061125/https://libraries.mit.edu/data-management/files/2014/05/file-organization-july2014.pdf
- ^ https://www.fosteropenscience.eu/sites/default/files/pdf/1382.pdf
- ^ Michener, WK a JW Brunt. 2000. Ekologická data: návrh, správa a zpracování. Blackwell Science, 180s.
- ^ „GPG Kapitola II“. www.nsf.gov.
- ^ „Šíření a sdílení výsledků výzkumu - NSF - National Science Foundation“. www.nsf.gov.
- ^ ESRC Research Data Policy 2010
- ^ Příprava a správa dat: Pokyny od britské datové služby
- ^ „Správa a sdílení údajů z výzkumu - SAGE Publications Inc“. www.sagepub.com.[mrtvý odkaz ]
- ^ „UK Data Archive - KDO MŮŽE VKLADOVAT?“. www.data-archive.ac.uk.
- ^ Dietrich, Dianne; Adamus, Trisha; Horník, Alison; Steinhart, Gail (2012). „Odmystifikace požadavků na správu dat od výzkumných pracovníků“. Problémy v knihovně vědy a techniky. 70. doi:10,5062 / F44M92G2.
- ^ Parham, Susan Wells; Doty, Chris (říjen 2012). „Analýza obsahu NSF DMP: Co říkají vědci?“. Bulletin of American Society for Information Science and Technology. 39 (1): 37–38. doi:10.1002 / bult.2012.1720390113.
- ^ Miksa, Tomasz; Simms, Stephanie; Mietchen, Daniel; Jones, Sarah (28. března 2019). „Deset principů pro plány správy dat použitelné na stroji“. PLOS výpočetní biologie. 15 (3): e1006750. doi:10.1371 / journal.pcbi.1006750. PMID 30921316. S2CID 85563774.
- ^ Donelly, Martin (2012). "Plány a plánování správy dat". V Pryor, Graham (ed.). Správa výzkumných dat. London: Facet Publishing. 83–104. ISBN 9781856048910.
Další čtení
Pryor, Graham (2014). Poskytování služeb pro správu výzkumných dat. Facet Publishing. ISBN 9781856049337.
externí odkazy
- Průvodce správou dat: Vytvořte plány inteligentní správy dat pro FAIR Open Science
- DataONE
- DMPonline
- Digitální kurátorské centrum
- Pokyny k návrhu grantu NSF
- Blog LTER: Jak napsat plán správy dat
- UK Data Service: Prepare and Manage Data: Guidance and tools for social science research
- Plan de Gestión de Datos PaGoDa: DMP Toolkit od Konsorcia univerzit v regionu Madrid a UNED pro knihovnickou spolupráci (Madroño - Španělsko)