Data papers: öppen vetenskap och vetenskaplig meritering

Öppen vetenskap blivit framskrivet som den strategi för forskning som EU vill driva när det gäller europeisk forskningspolitik (European Commission, 2016). Det gäller såväl en öppen tillgång till publikationer genom open access som öppen tillgång till forskningsresultat i form av forskningsdata, men inkluderar också citizen science och samhällets deltagande i vetenskap. I den senaste svenska forskningspropositionen Kunskap i samverkan finns en målbild för Öppen vetenskap som tar upp hur öppen tillgång till forskningsresultat är eftersträvansvärt och stegvis ska uppnås genom att arbeta aktivt med att utveckla formerna för det under de närmaste tio åren (Proposition 2016/17:50).

”Open research data is a reality for policy makers, but has not yet become a reality for researchers.” (Elsevier & CWTS 2017, s. 24)

Forskningsdata, det vill säga det empiriska underlag som ligger till grund för forskningen, har tidigare setts som en resurs enbart för de forskare som är involverade i arbetet. Nu ses forskningsdata i allt större utsträckning som ett forskningsresultat som kan delas med andra och göras tillgängligt för nya analyser. Samtidigt är delande av data och forskares praktiker kring forskningsdatahantering djupt rotat i ämnestillhörighet (Borgman 2015). Forskningsdatas användbarhet för andra forskare är dock en komplex fråga. Det räcker sällan med ren tillgång till forskningsdata utan den behöver kringgärdas av dokumentation och metadata inte minst för att bli sökbar. I dagsläget satsas mycket resurser på att bygga upp nya infrastrukturer för öppna forskningsdata.  En form av infrastruktur är de data journals som växt fram över tid. En data journal är en form av tidskrift som innehåller data papers vars syfte är att beskriva forskningsdata på ett sätt som gör den förståelig och användbar för andra (Candela et al 2015; Leonelli 2016). Den här typen av tidskrifter återfinns inom en mängd discipliner men är vanligast i naturvetenskap och medicin. Många gånger är diskussionerna om forskningsdata fokuserade på just dessa ämnesområden där delande av data har en lång tradition eller mängden data är omfattande. Vad betyder utvecklingen kring öppen tillgång av forskningsdata för forskning med andra traditioner i form av mindre projekt och små dataset? Det kan handla om kvalitativ forskning eller ämnen inom humaniora och samhällsvetenskap, men småskalig forskning förekommer inom alla vetenskaper. Det är i den så kallade långa svansen av sådana mindre projekt och datamängder som de flesta forskare arbetar (Heidorn 2008).

Forskningsdata har olika funktion och mening för olika aktörer men får också olika betydelse beroende på när i forskningsprocessen man tittar (Haider & Kjellberg 2016). När det gäller forskares motivation att tillgängliggöra data så är den främsta drivkraften inomvetenskaplig (Elsevier & CWTS 2017). Wallis, Rolando och Borgman (2013) visar att forskare som gör forskning i den långa svansen är villiga att dela data med andra, men att de oftast delar på informella sätt. Liknande slutsatser gjordes i en undersökning vid Malmö högskola som visar att många använder öppna data i sin forskning, men att det krävs en hel del extra arbete för att forskningsdata ska bli användbar för andra (Fransson et al 2016). Faniel, Kriesberg och Yakel (2015) visade att kvalitet på dokumentationen av forskningsdata var en central faktor för att forskares data skulle kunna återanvändas på ett tillfredsställande sätt. Samtidigt belyser Heidorn (2008) betydelsen av infrastruktur för att möjliggöra återfinning och återanvändning av forskningsdata.

Data journals potentiella roll har lyfts fram som en del i infrastrukturen för att tillgängliggöra och beskriva forskningsdata (Leonelli 2016). Candela med flera (2015) har genomfört en översiktsstudie av 100 tidskrifter och konstaterar att antalet data journals växer samtidigt som formerna inte är konsoliderade än. Bibliometriska studier har visat att tidskrifterna har olika etableringsgrad, men många är inkluderade i Web of Science citeringsindex och kan därmed anses vara väl etablerade (Elsevier & CWTS). I Chavan och Penevs (2011) studie av data papers i biologi konstaterar de att formatet har en tänkbar roll för att få en kulturell förändring till stånd genom att ge erkännande till data publicering som en del i vetenskaplig meritering. Tidigare forskning pekar därmed på att data papers är en allt mer etablerad del av ekologin för vetenskaplig kommunikation, men har bara studerats i begränsad omfattning.

Data papers, publicerade i data journals eller i vanliga vetenskapliga tidskrifter, har kanske en viktig roll att spela, speciellt i ljuset av öppen vetenskap där nya incitament krävs för öppet tillgängliggörande. Data papers blir både en del av data-tillgängliggörandet och en publikation att räkna och citera.

Exempel på data journals som innehåller data papers:

Scientific data: http://www.nature.com/sdata

Data in Brief: http://www.journals.elsevier.com/data-in-brief

Journal of Open Psychology Data (JOPD): http://openpsychologydata.metajnl.com

Geoscience Data Journal: http://onlinelibrary.wiley.com/journal/10.1002/(ISSN)2049-6060

Journal of Open Humanities Data (JOHD): http://openhumanitiesdata.metajnl.com

Open Health Data: http://openhealthdata.metajnl.com

Journal of Open Research Software (features peer reviewed Software Metapapers describing research software with high reuse potential): http://openresearchsoftware.metajnl.com

/Jonas Fransson

Referenser

Borgman, C. L. (2015). Big data, little data, no data. Cambridge MA: MIT Press.

Candela, L., Castelli, D., Manghi, P., & Tani, A. (2015). Data journals: A survey. Journal of the Association for Information Science and Technology, 66(9), 1747-1762.

Chavan, V., & Penev, L. (2011). The data paper: a mechanism to incentivize data publishing in biodiversity science. BMC Bioinformatics 12(15).

Elsevier & CWTS (2017). Open Data: The Researchers Perspective. https://www.elsevier.com/__data/assets/pdf_file/0004/281920/Open-data-report.pdf

European Commission (2016). Open innovation, open science, open to the world – a vision for Europe. https://publications.europa.eu/s/cZby

Faniel, I. M., Kriesberg, A. and Yakel, E. (2016). Social scientists’ satisfaction with data reuse. JASIS&T, 67:1404–1416.

Fransson, J., du Toit, M., Tapia Lagunas, P. & Kjellberg, S. (2016). Tillgängliggörande av forskningsdata Nulägesbeskrivning samt rekommendationer för uppbyggnad av stöd till högskolans forskare. Malmö högskolas bibliotek. http://muep.mau.se/handle/2043/20266

Haider, J., & Kjellberg, S. (2016). Data in the making: Temporal aspects in the construction of research data. In J. Rekers & K. Sandell (Eds.), New big science in focus: Perspectives on ESS and MAX IV. Lund: Lund Studies in Arts and Cultural Sciences.

Heidorn, P. B. (2008). Shedding Light on the Dark Data in the Long Tail of Science. Library trends, 57(2), 280-299.

Leonelli, S. (2016). The disruptive potential of data publication. Notes and Records: The Royal Society journal of the history of science.

Proposition 2016/17:50 (2016). Kunskap i samverkan – för samhällets utmaningar och stärkt konkurrenskraft. Stockholm, Utbildningsdepartementet.

Wallis, J. C., Rolando, E., & Borgman, C. L. (2013). If We Share Data, Will Anyone Use Them? Data Sharing and Reuse in the Long Tail of Science and Technology. PLOS ONE, 8(7), e67332.