Sdílení dat - Data sharing
![]() | Tento článek je Použití externí odkazy nemusí dodržovat zásady nebo pokyny Wikipedie.Dubna 2016) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |

Sdílení dat je praxe zpřístupňování údajů použitých pro vědecký výzkum jiným vyšetřovatelům. Mnoho finančních agentur, institucí a publikačních systémů má zásady týkající se sdílení údajů, protože transparentnost a otevřenost jsou mnohými považovány za součást vědecká metoda.[1]
Řada financujících agentur a vědeckých časopisů vyžaduje autory recenzováno dokumenty ke sdílení veškerých doplňujících informací (hrubá data, statistické metody nebo zdrojový kód ) nezbytné k pochopení, rozvoji nebo reprodukovat publikovaný výzkum. Velká část vědeckého výzkumu nepodléhá požadavkům na sdílení údajů a mnoho z těchto politik má liberální výjimky. Při neexistenci závazného požadavku je sdílení údajů na uvážení samotných vědců. Kromě toho v určitých situacích vlády[2] a instituce zakazují nebo přísně omezují sdílení údajů za účelem ochrany vlastnických zájmů, národní bezpečnosti a důvěrnosti subjektu / pacienta / oběti. Sdílení údajů může být rovněž omezeno z důvodu ochrany institucí a vědců před použitím údajů pro politické účely.
Data a metody mohou být požadovány od autora roky po zveřejnění. S cílem podpořit sdílení údajů[3] a předcházet ztrátě nebo poškození dat, řada finančních agentur a časopisů zavedla zásady pro archivace dat. Přístup k veřejně archivovaným datům je nedávným vývojem v historie vědy umožněno technologickým pokrokem v oblasti komunikací a informační technologie. Plné využití výhod moderní rychlé komunikace může vyžadovat konsensuální dohodu o kritériích vzájemného uznávání příslušných příspěvků. Mezi modely uznávané pro zlepšení včasného sdílení údajů pro účinnější reakci na vznikající hrozby infekčních nemocí patří mechanismus sdílení údajů zavedený GISAID Iniciativa.[4][5]
Přes zásady sdílení a archivace dat k zadržování dat stále dochází. Autoři nemusí archivovat data nebo archivují pouze část dat. Selhání samotné archivace dat není zadržením dat. Když výzkumný pracovník požaduje další informace, autor je někdy odmítne poskytnout.[6] Když autoři zadržují data jako tato, riskují ztrátu důvěry vědecké komunity.[7]
Sdílení údajů může také naznačovat sdílení osobních údajů na platformě sociálních médií.
Politika vlády USA
Federální zákon
Dne 9. srpna 2007 podepsal prezident Bush smlouvu Americký zákon o soutěžících (nebo „America Creating Opportunities to Meaningfully Propag Excellence in Technology, Education, and Science Act“) vyžadující, aby civilní federální agentury poskytly pokyny, politiku a postupy s cílem usnadnit a optimalizovat otevřenou výměnu dat a výzkumu mezi agenturami, veřejností a tvůrci pravidel. Viz část 1009.[8]
Zásady sdílení údajů NIH
„Prohlášení o zásadách udělení grantu National Institutes of Health (NIH) definuje„ data “jako„ zaznamenané informace bez ohledu na formu nebo médium, na kterém je lze zaznamenat, a zahrnuje spisy, filmy, zvukové záznamy, obrazové reprodukce, kresby, vzory, nebo jiná grafická znázornění, procedurální manuály, formuláře, diagramy, pracovní diagramy, popisy zařízení, datové soubory, zpracování dat nebo počítačové programy (software), statistické záznamy a další údaje z výzkumu. ““
— Rada pro vládní vztahy[9]
Závěrečné prohlášení NIH o sdílení údajů z výzkumu uvádí:
„NIH znovu potvrzuje svou podporu konceptu sdílení údajů. Věříme, že sdílení dat je nezbytné pro urychlený převod výsledků výzkumu do znalostí, produktů a postupů ke zlepšení lidského zdraví. NIH podporuje sdílení údajů o konečném výzkumu, které slouží těmto a dalším důležitým vědeckým cílům. NIH očekává a podporuje včasné zveřejnění a sdílení konečných údajů o výzkumu ze studií podporovaných NIH pro použití jinými výzkumníky. „NIH uznává, že vyšetřovatelé, kteří údaje shromažďují, mají oprávněný zájem těžit z jejich investice času a úsilí. Proto jsme revidovali naši definici „včasného vydání a sdílení“ tak, aby byla přijata nejpozději do přijetí hlavních zjištění ze souboru konečných dat pro zveřejnění. NIH nadále očekává, že počáteční vyšetřovatelé mohou těžit z prvního a dalšího používání, ale ne z dlouhodobého výlučného používání. “
Zásady NSF z Grant General podmínky
36. Sdílení nálezů, dat a dalších výzkumných produktů
A. NSF… očekává, že vyšetřovatelé budou sdílet s ostatními výzkumnými pracovníky, pouze za přírůstkové náklady a v rozumném čase, data, vzorky, fyzické sbírky a další podpůrné materiály vytvořené nebo shromážděné v průběhu práce. Podporuje také oceněné, aby sdíleli software a vynálezy nebo jinak jednali, aby inovace, které ztělesňují, široce užitečné a použitelné.
b. Úpravy a případně výjimky mohou být povoleny k zajištění práv jednotlivců a subjektů, platnosti výsledků nebo integrity sbírek nebo k uspokojení oprávněných zájmů vyšetřovatelů.
— "Národní vědecká nadace: Grant General Podmínky (GC-1) “, 1. dubna 2001 (str. 17).
Úřad pro integritu výzkumu
Tvrzení o pochybení v lékařském výzkumu mají vážné následky. Ministerstvo zdravotnictví a sociálních služeb USA zřídilo úřad, který má dohlížet na vyšetřování obvinění z pochybení, včetně zadržování údajů. Web definuje poslání:
„Úřad pro integritu výzkumu (ORI) podporuje integritu v biomedicínském a behaviorálním výzkumu podporovaném americkou službou veřejného zdraví (PHS) na přibližně 4 000 institucích po celém světě. ORI monitoruje institucionální vyšetřování pochybení ve výzkumu a usnadňuje odpovědné provádění výzkumu (RCR) prostřednictvím vzdělávací, preventivní a regulační činnosti. “
Ideály ve sdílení údajů
Některé výzkumné organizace mají ze sdílení údajů obzvláště silný pocit. Stanfordská univerzita WaveLab má filozofii o reprodukovatelném výzkumu a zveřejňování všech algoritmů a zdrojových kódů nezbytných k reprodukci výzkumu. V článku nazvaném „WaveLab and Reproducible Research“ autoři popisují některé z problémů, se kterými se setkali při pokusu o reprodukci vlastního výzkumu po určité době. V mnoha případech to bylo tak těžké, že se úsilí vzdali. Tyto zkušenosti je přesvědčily o důležitosti zveřejnění zdrojového kódu.[11] Filozofie je popsána:
- Myšlenka je: Článek o výpočetní vědě ve vědecké publikaci není samotným stipendiem, je to pouze reklama tohoto stipendia. Skutečné stipendium je kompletní prostředí pro vývoj softwaru a kompletní sada pokynů, které generovaly údaje.[12][13]
The Síť pro pozorování dat pro Zemi (DataONE ) a ochrana dat[14] jsou projekty podporované Národní vědecká nadace podněcovat a usnadňovat sdílení údajů mezi vědci ve výzkumu a lepší podporu metaanalýza. Pokud jde o vědy o životním prostředí, vědecká komunita uznává, že hlavní vědecký pokrok zahrnující integraci znalostí v různých oborech bude vyžadovat, aby výzkumní pracovníci překonali nejen technologické překážky sdílení údajů, ale také historicky zakořeněné institucionální a sociologické překážky.[15] Dr. Richard J. Hodes, ředitel Národní institut pro stárnutí uvedl, „starý model, ve kterém vědci žárlivě střežili svá data, již není použitelný“.[16]
Aliance pro přístup daňových poplatníků je skupina organizací, které podporují otevřený přístup k výzkumu sponzorovanému vládou. Skupina vyjádřila „Prohlášení o zásadách“, ve kterém vysvětluje, proč je podle nich otevřený přístup důležitý.[17] Uvádějí také řadu mezinárodních politik pro přístup veřejnosti.[18] Není to o nic víc než při včasné komunikaci důležitých informací, abychom mohli účinně reagovat na mimořádné situace v oblasti zdraví.[19] Zatímco veřejné archivy byly přijaty pro ukládání dat, zejména po formálním zveřejnění, nedokázaly podpořit rychlé sdílení dat během mimořádných událostí v oblasti zdraví, mezi nimi i ebola[20] a Zika,[21][22] ohniska. K uznání zájmů těch, kdo data generují, a zároveň umožnění bezplatného a nezatíženého přístupu k datům a jejich použití (před zveřejněním) pro výzkum a praktické použití, jako jsou ty, které přijala iniciativa GISAID k potírání naléhavých hrozeb, jsou zapotřebí jasněji definované zásady. z chřipky.[23][24]
Mezinárodní politiky
- Austrálie
- Rakousko
- Evropa - Komise Evropských společenství
- Německo
- Spojené království
- „Omic Data Sharing - seznam zásad velkých vědeckých donorů FAIRsharing.org Katalog datových politik
Problémy se sdílením dat na akademické půdě
Genetika
Zadržování údajů se v systému stalo tak běžným genetika že vědci v Massachusetts General Hospital zveřejnil článek v deníku na toto téma. Studie zjistila, že „protože jim byl odepřen přístup k datům, 28% genetiků uvedlo, že nebyli schopni potvrdit publikovaný výzkum.“[25]
Psychologie
Ve studii z roku 2006 bylo zjištěno, že ze 141 autorů publikace z Americká psychologická asociace (APA) empirické články, 103 (73%) neodpovědělo svými údaji po dobu 6 měsíců.[26] V následné studii publikované v roce 2015 bylo zjištěno, že 246 z 394 kontaktovaných autorů příspěvků v časopisech APA nesdílelo své údaje na vyžádání (62%).[27]
Archeologie
Studie z roku 2018 uvádí studii náhodného vzorku 48 článků publikovaných v období únor – květen 2017 v Journal of Archaeological Science který našel otevřeně dostupná surová data pro 18 článků (53%), přičemž nejčastěji sdílenými typy byly kompoziční a datovací data. Stejná studie také zaslala e-mail autorům článků o experimentech s kamennými artefakty, které byly publikovány v letech 2009 a 2015, aby si vyžádaly údaje týkající se těchto publikací. Kontaktovali autory 23 článků a obdrželi 15 odpovědí, což mělo za následek 70% míru odezvy. Obdrželi pět odpovědí, které zahrnovaly datové soubory, což znamenalo celkovou míru sdílení 20%.[28]
Vědci ve výcviku
Studie vědců ve výcviku ukázala, že mnozí již zaznamenali zadržování údajů.[29] Tato studie vyvolala strach, že budoucí generace vědců nebude dodržovat zavedené postupy.
Rozdílné přístupy v různých oborech
Požadavky na sdílení dat jsou častěji kladeny institucemi, finančními agenturami a místy pro publikace v lékařských a biologických vědách než v přírodních vědách. Požadavky se značně liší, pokud jde o to, zda data musí být vůbec sdílena, s kým musí být data sdílena a kdo musí nést náklady na sdílení dat.
Finanční agentury, jako jsou NIH a NSF, mají tendenci vyžadovat větší sdílení údajů, ale i tyto požadavky inklinují k uznání obav o zachování důvěrnosti pacientů, nákladů vzniklých při sdílení údajů a legitimnosti žádosti. Soukromé zájmy a veřejné agentury se zájmy národní bezpečnosti (obrana a vymáhání práva) často odrazují od sdílení údajů a metod prostřednictvím dohod o mlčenlivosti.
Sdílení dat představuje v roce 2006 specifické výzvy participativní monitorování iniciativy, například kde lesní společenství shromažďují údaje o místních sociálních a environmentálních podmínkách. V tomto případě může být přístup založený na právech k vývoji protokolů pro sdílení dat založen na principech svobodný, předchozí a informovaný souhlas a upřednostňovat ochranu práv těch, kteří data generovali, a / nebo osob potenciálně ovlivněných sdílením dat.[30]
Viz také
- Archiv dat
- Šíření údajů
- Ochrana osobních údajů
- Publikování dat
- Citace dat
- FAIR data
- Sdílení souborů
- Sdílení informací
- Otevřená data
- Registr výzkumných datových úložišť
Reference
- ^ „Globální epidemie zdraví je tikající časovanou bombou - ale virové databáze mohou a pomáhají zachránit životy“. HuffPost UK. Citováno 2017-09-06.
- ^ „Záběr průhlednosti“. Ekonom. 2006-08-10. ISSN 0013-0613. Citováno 2017-09-06.
- ^ "Jak podpořit správné chování". Příroda. 416 (6876): 1. 2002. Bibcode:2002 Natur.416R ... 1.. doi:10.1038 / 416001b. PMID 11882850.
- ^ McCauley, John W. (2017-02-23). „Viry: Model k urychlení epidemických reakcí“. Příroda. 542 (7642): 414. Bibcode:2017Natur.542..414M. doi:10.1038 / 542414b. PMID 28230113.
- ^ „Žádný oběd zdarma, ministři zdravotnictví G20 najdou na prvním setkání“. Sledování duševního vlastnictví. 2017-05-20. Citováno 2017-09-06.
- ^ Savage CJ, Vickers AJ (2009). „Empirická studie sdílení údajů autory publikujícími v časopisech PLoS“. PLOS ONE. 4 (9): e7078. Bibcode:2009PLoSO ... 4.7078S. doi:10,1371 / journal.pone.0007078. PMC 2739314. PMID 19763261.
- ^ "Publikace a otevřenost „Kapitola z„ Being a Scientist: Responsible Conduct in Research “, Národní akademie věd.
- ^ "Americký zákon o soutěžících
- ^ "Přístup k výzkumným údajům a jejich uchovávání Archivováno 26. května 2007 v Wayback Machine: Práva a povinnosti “, s. 5. Rada pro vládní vztahy, březen 2006.
- ^ "Zásady sdílení údajů NIH."
- ^ WaveLab a reprodukovatelný výzkum autor: Jonathan B. Buckheit a David L. Donoho
- ^ Web společnosti WaveLab850
- ^ Rimmer, Matthew (01.09.2005). „Japonica Rice: Intellectual Property, Scientific Publishing and Data-sharing“. Prometheus. 23 (3): 325–347. doi:10.1080/08109020500235180. ISSN 0810-9028.
- ^ „Data Conservancy | Data Conservancy se věnuje vývoji institucionálních řešení pro výzvy sběru, uchovávání a opětovného použití dat“.
- ^ Reichman O.J .; Jones M.B .; Schildhauer M.P. (2011). „Výzvy a příležitosti otevřených dat v ekologii“. Věda. 331 (6018): 703–705. Bibcode:2011Sci ... 331..703R. doi:10.1126 / science.1197962. PMID 21311007.
- ^ Článek NY Times o hodnotě sdílených údajů pro výzkum Alzheimerovy choroby
- ^ Webové stránky Alliance for Taxpayer Access
- ^ Celosvětový impuls pro přístup veřejnosti k výzkumu financovanému z veřejných zdrojů
- ^ Shu, Yuelong; McCauley, John (2017). „GISAID: Globální iniciativa pro sdílení všech údajů o chřipce - od vize po realitu“. Eurosurveillance. 22 (13). doi:10.2807 / 1560-7917.es.2017.22.13.30494. PMC 5388101. PMID 28382917.
- ^ Yozwiak, Nathan L .; Schaffner, Stephen F .; Sabeti, Pardis C. (2015-02-26). „Sdílení dat: Otevřený přístup k výzkumu ohniska nákazy“. Příroda. 518 (7540): 477–479. Bibcode:2015 Natur.518..477Y. doi:10.1038 / 518477a. PMID 25719649.
- ^ „Když se výzkum rozběhne“. Hind. Citováno 2017-09-06.
- ^ „Výhody sdílení“. Příroda. 530 (7589): 129. 2016-02-11. Bibcode:2016Natur.530Q.129.. doi:10.1038 / 530129a. PMID 26863943.
- ^ Labe, Stefan; Buckland-Merrett, Gemma (01.01.2017). „Data, nemoci a diplomacie: inovativní příspěvek GISAID ke globálnímu zdraví“. Globální výzvy. 1 (1): 33–46. doi:10,1002 / gch2,1018. ISSN 2056-6646. PMC 6607375. PMID 31565258.
- ^ „Závody CDC k vytvoření vakcíny pro nejnovější kmen ptačí chřipky v Číně“. Bloomberg.com. 2013-04-10. Citováno 2017-09-06.
- ^ Campbell EG, Clarridge BR, Gokhale M a kol. (2002). „Zadržování údajů v akademické genetice: důkazy z národního průzkumu“. JAMA. 287 (4): 473–80. doi:10.1001 / jama.287.4.473. PMID 11798369.
- ^ Wicherts, J. M .; Borsboom, D .; Kats, J .; Molenaar, D. (2006). „Špatná dostupnost údajů z psychologického výzkumu pro opětovnou analýzu“. Americký psycholog. 61 (7): 726–728. doi:10.1037 / 0003-066X.61.7.726. PMID 17032082.
- ^ Vanpaemel, W .; Vermorgen, M .; Deriemaecker, L .; Storms, G. (2015). „Plýtváme dobrou krizí? Dostupnost údajů z psychologického výzkumu po bouři“ (PDF). Collabra. 1 (1): 1–5. doi:10.1525 / collabra.13.
- ^ Marwick, Ben; Birch, Suzanne E. Pilaar (5. dubna 2018). „Standard pro odbornou citaci archeologických dat jako podnět ke sdílení údajů“. Pokroky v archeologické praxi. 6 (2): 125–143. doi:10.1017 / aap.2018.3.
- ^ Vogeli C, Yucel R, Bendavid E a kol. (Únor 2006). „Zadržování údajů a příští generace vědců: výsledky národního průzkumu“. Acad Med. 81 (2): 128–36. doi:10.1097/00001888-200602000-00007. PMID 16436573.
- ^ D Sabogal. 2015. Sdílení dat v komunitním monitorování lesů: poučení z Guyany. Globální program Canopy. http://forestcompass.org/how/resources/data-sharing-community-based-forest-monitoring-lessons-guyana
Literatura
![]() | Scholia má téma profil pro Sdílení dat. |
Výbor pro otázky přeshraničního toku vědeckých údajů, Národní rada pro výzkum (1997). Bits of Power: Problémy globálního přístupu k vědeckým datům. Washington, DC: National Academy Press. doi:10.17226/5504. ISBN 978-0-309-05635-9. - diskutuje o mezinárodní výměně dat v přírodních vědách.
externí odkazy
- "Sobecký gen: Sdílení a zadržování dat v akademické genetice “od Erica Campbella a Davida Blumenthala zveřejněné 31. května 2002.
- Sdílení a archivace dat - Americká psychologická asociace
- Veřejná doména dat digitálního výzkumu
- WaveLab a reprodukovatelný výzkum Jonathan B. Buckheit a David L. Donoho ze Stanfordské univerzity
- Úloha archivů dat a programových kódů v budoucnosti ekonomického výzkumu vydané Federální rezervní bankou v St. Louis
- Iniciativa pro sdílení a archivaci dat Ecological Society of America
- FAIRsharing.org Web o sdílení údajů a zásadách údajů v biologii
- Archiv dat ve Velké Británii: Správa a sdílení dat
- Zdroje a příklady plánu správy dat - Mezuniverzitní konsorcium pro politický a sociální výzkum.
- DataONE
- Příroda Vědecké údaje: otevřená, online publikace pouze pro popis vědecky cenných datových souborů.