Publikování dat - Data publishing - Wikipedia
Publikování dat (taky zveřejnění údajů) je akt uvolnění výzkumná data v zveřejněná forma pro použití ostatními. Jedná se o praxi spočívající v přípravě určitých data nebo soubor dat s) pro veřejné použití, aby byly k dispozici všem k použití, jak si přejí. Tato praxe je nedílnou součástí otevřená věda hnutí. O výhodách plynoucích z této praxe panuje velká a multidisciplinární shoda.[1][2][3]
Hlavním cílem je povýšit data na prvotřídní výzkumné výstupy.[4]Probíhá řada iniciativ, stejně jako body konsensu a sporné otázky.[5]
Existuje několik odlišných způsobů, jak zpřístupnit výzkumná data, včetně:
- publikování dat jako doplňkového materiálu spojeného s a výzkumný článek, obvykle s datovými soubory hostovanými vydavatelem článku
- hostování dat na veřejně přístupném webu se soubory dostupnými ke stažení
- hostování dat v úložišti, které bylo vyvinuto pro podporu publikace dat, např. fík, Vodní nymfa, Dataverse, Zenodo. Existuje velké množství obecných a speciálních (například podle výzkumných témat) úložišť dat.[6] Například UK Data Service umožňuje uživatelům ukládat datové sbírky a znovu je sdílet pro výzkumné účely.
- publikování datového dokumentu o datové sadě, který může být publikován jako předtisk, v deníku nebo v datovém deníku, který je věnován podpoře datových papírů. Data mohou být hostována deníkem nebo hostována samostatně v datovém úložišti.
Publikování dat umožňuje výzkumným pracovníkům zpřístupnit svá data ostatním k použití a umožňuje citovat datové sady podobně jako u jiných typů publikací pro výzkum (například články nebo knihy), což umožňuje producentům datových sad získat akademický kredit za svou práci.
Motivace pro publikování dat se může pohybovat v touze zpřístupnit výzkum, umožnit citovatelnost datových sad nebo mandáty výzkumníka nebo vydavatele, které vyžadují publikování otevřených dat. UK Data Service je jednou z klíčových organizací, které spolupracují s ostatními na zvýšení důležitosti citovat data správně a pomoci výzkumným pracovníkům v tom.
Řešení pro zachování soukromí při publikování dat, jak byla navržena, včetně algoritmů ochrany soukromí, metod „maskování“ dat a algoritmu výpočtu regionální úrovně soukromí.[7]
Metody publikování dat
Datové soubory jako doplňkový materiál
Velké množství časopisů a vydavatelů podporuje doplňující materiál připojený k výzkumným článkům, včetně datových sad. Ačkoli historicky mohl být takový materiál distribuován pouze na vyžádání nebo dál mikroforma do knihoven dnes deníky obvykle tento materiál hostují online. Předplatitelům deníku je k dispozici doplňkový materiál nebo všem, pokud je článek nebo deník otevřený přístup, všem.
Úložiště dat
Existuje velké množství datových úložišť o obecných i specializovaných tématech. Mnoho úložišť je disciplinární úložiště, zaměřený na konkrétní výzkumnou disciplínu, jako je UK Data Service což je důvěryhodné digitální úložiště sociálních, ekonomických a humanitních údajů. Úložiště mohou mít výzkumníci zdarma k nahrání svých dat nebo si mohou za hostování dat účtovat jednorázový nebo průběžný poplatek. Tato úložiště nabízejí veřejně přístupné webové rozhraní pro vyhledávání a procházení hostovaných datových sad a mohou obsahovat další funkce, například identifikátor digitálních objektů, pro trvalou citaci dat a odkaz na související publikované práce a kód.
Datové papíry
Datové papíry jsou „vědecké publikace prohledávatelného dokumentu metadat popisující konkrétní online přístupný datový soubor nebo skupinu datových souborů publikovaný v souladu se standardními akademickými postupy“.[8]Jejich konečným cílem je poskytnout „informace o tom, co, kde, proč, jak a kdo z údajů“.[4]Účelem datového papíru je nabídnout popisné informace o souvisejících datových sadách se zaměřením na sběr dat, rozlišovací znaky, přístup a potenciální opětovné použití, spíše než na zpracování a analýzu dat.[9] Vzhledem k tomu, že datové dokumenty jsou považovány za akademické publikace, které se neliší od jiných typů článků, umožňují vědcům, kteří sdílejí data, získat kredit v měně rozpoznatelné v akademickém systému, čímž „se počítá sdílení dat“.[10] To poskytuje nejen další pobídku ke sdílení údajů, ale také prostřednictvím internetu peer review zvyšuje kvalitu metadat a tím opětovnou použitelnost sdílených dat.
Datové papíry tedy představují vědecká komunikace přístup k sdílení dat.
Navzdory jejich potenciálu nejsou datové papíry konečným a úplným řešením pro všechny problémy se sdílením a opětovným použitím dat a v některých případech jsou považovány za vyvolávající falešná očekávání ve výzkumné komunitě.[11]
Datové deníky
Datové papíry jsou podporovány bohatou řadou deníky, z nichž některé jsou „čisté“, tj. jsou určeny pouze k publikování datových papírů, zatímco jiné - většina - jsou „smíšené“, tj. publikují řadu typů článků včetně datových papírů.
K dispozici je komplexní průzkum o datových denících [12]Pracovníci univerzity v Edinburghu sestavili neúplný seznam datových deníků.[13]
Příklady „čistých“ datových deníků jsou:Data vědy o systému Země,Journal of Open Archaeology Data,Otevřete údaje o zdraví,Polární datový deník,a Vědecké údaje.
Příklady „smíšených“ časopisů vydávajících údaje:Deník biodiverzity,F1000Výzkum,GigaScience,GigaBytePLOS ONE,a SpringerPlus.
Citace dat
Citace dat je poskytování přesných, konzistentních a standardizovaných referencí datové sady stejně bibliografické citace jsou poskytovány pro další publikované zdroje jako výzkumné články nebo monografie. Typicky dobře zavedené Digitální identifikátor objektu (DOI) přístup se používá u DOI, které uživatele přivádějí k webová stránka který obsahuje metadata na datové sadě a samotné datové sadě.[14][15]
Viz také
Reference
- ^ Costello MJ (2009). "Motivující online zveřejňování údajů". BioScience. 59 (5): 418–427. doi:10.1525 / bio.2009.59.5.9.
- ^ Smith VS (2009). „Publikace dat: směrem k databázi všeho“. Poznámky k výzkumu BMC. 2 (113): 113. doi:10.1186/1756-0500-2-113. PMC 2702265. PMID 19552813.
- ^ Lawrence, B; Jones, C .; Matthews, B .; Pepler, S .; Callaghan, S. (2011). „Citace a vzájemné hodnocení údajů: směrem k formálnímu zveřejnění údajů“. International Journal of Digital Curation. 6 (2): 4–37. doi:10.2218 / ijdc.v6i2.205.
- ^ A b Callaghan, S., Donegan, S., Pepler, S., Thorley, M., Cunningham, N., Kirsch, P., Ault, L., Bell, P., Bowie, R., Leadbetter, A., Lowry, R., Moncoiffé, G., Harrison, K., Smith-Haddon, B., Weatherby, A., & Wright, D. (2012). „Vytváření dat z prvotřídního vědeckého výstupu: Citace a publikace dat v environmentálních datových centrech NERC“. International Journal of Digital Curation. 7 (1): 107–113. doi:10.2218 / ijdc.v7i1.218.CS1 maint: více jmen: seznam autorů (odkaz)
- ^ Kratz J, Strasser C (2014). „Shoda a kontroverze ohledně zveřejňování údajů“. F1000Výzkum. 3 (94): 94. doi:10.12688 / F1000Research.4518. PMC 4097345. PMID 25075301.
- ^ Assante, M .; Candela, L .; Castelli, D .; Tani, A. (2016). „Vyrovnávají se vědecké datové úložiště s publikováním výzkumných dat?“. Data Science Journal. 15. doi:10.5334 / dsj-2016-006.
- ^ Zhang, Longbin; Wang, Yuxiang; Xu, Xiaoliang (srpen 2017). „Gaussovské vzorkování založené na logických částech pro online agregaci“. Pátá mezinárodní konference 2017 o pokročilém cloudu a velkých datech (CBD). IEEE. doi:10.1109 / cbd.2017.39. ISBN 978-1-5386-1072-5.
- ^ Chavan, V. & Penev, L. (2011). „Datový dokument: mechanismus pro pobídky ke zveřejňování údajů ve vědě o biologické rozmanitosti“. BMC bioinformatika. 12 (15): S2. doi:10.1186 / 1471-2105-12-S15-S2. PMC 3287445. PMID 22373175.
- ^ Newman Paul; Corke Peter (2009). „Datové dokumenty - recenzované publikace vysoce kvalitních datových souborů“. International Journal of Robotics Research. 28 (5): 587. doi:10.1177/0278364909104283.
- ^ Gorgolewski KJ, Margulies DS, Milham MP (2013). „Počítání sdílení dat: publikační řešení“. Frontiers in Neuroscience. 7: 9. doi:10,3389 / fnins.2013.00009. PMC 3565154. PMID 23390412.
- ^ Parsons, M.A.; Fox, P.A. (2013). „Je publikace dat správnou metaforou?“. Data Science Journal. 12: WDS31 – WDS46. doi:10,2481 / dsj.WDS-042.
- ^ Candela, L., Castelli, D., Manghi, P. a Tani, A. (2015). „Data Journals: A Survey“. Journal of the Association for Information Science and Technology. 66 (1): 1747–1762. doi:10.1002 / asi.23358.CS1 maint: více jmen: seznam autorů (odkaz)
- ^ https://www.wiki.ed.ac.uk/display/datashare/Sources+of+dataset+peer+review
- ^ Australská národní datová služba: povědomí o údajích o údajích Archivováno 07.03.2012 na Wayback Machine (Zpřístupněno 20. března 2012)
- ^ Ball, A., Duke, M. (2011). „Citace a propojení dat“. Informační dokumenty DCC. Edinburgh: Digital Curation Center. Dostupný online: http://www.dcc.ac.uk/resources/briefing-papers/