Öppen tillgång – ett begrepp med komplikationer

Öppen vetenskap drivs allt hårdare som förändringsprocess. Den del av öppen vetenskap som kommit längst i sin utveckling är Öppen tillgång (ÖT). Öppen tillgång har på senare tid ersatt Open Access (OA), åtminstone i mer officiella svenska texter. Open Access har länge använts för öppen publicering, främst av vetenskapliga artiklar men så smått även för andra publikationstyper. Utmaningen med öppen tillgång är att det som begrepp inte ersatt Open Access rakt av, utan det har fått lite olika betydelser. Dessa betydelseskiftningar gör det kanske lättare att använda på en policynivå men på en mer verksamhetsnära nivå så leder det till oklarheter och merarbete när man behöver precisera vad man menar varje gång.

Öppen tillgång används både när man menar “öppen tillgång till forskningspublikationer” (det som tidigare kallades OA eller OA-publicering) och “öppen tillgång till forskningsresultat”. Begreppet forskningsresultat kan betyda flera saker, både resultatet i form ett objekt som en publikation eller resultatet i form av en slutsats. Resultatet i form av ett objekt behöver inte vara publikation. I forskningspropositionen från 2016 så talas det om “öppen tillgång till forskningsresultat inklusive vetenskapliga publikationer, konstnärliga verk och forskningsdata”, dvs. att det kan handla om mycket mer än rena publikationer. Både konstnärliga verk och forskningsdata omfattar otaliga möjliga objekttyper.

Ser man forskningsresultat som tankegods i form av slutsatser, idéer och förslag så öppnar det upp för andra typer av öppen tillgång. Resultat och slutsatser kan tillgängliggöras i populärvetenskapliga publikationer, i podcasts, på bokmässan eller hos Skavlan. Då har forskningskommunikation inkluderats i öppen tillgång.

Så öppen tillgång kan vara:

  • öppet tillgängliggörande av vetenskapliga publikationer (OA-publicering)
  • öppet tillgängliggörande av vetenskapliga publikationer, konstnärliga verk och forskningsdata
  • öppet tillgängliggörande av vetenskapliga publikationer (OA-publicering) plus populärvetenskaplig spridning av resultat/slutsatser (forskningskommunikation)
  • öppet tillgängliggörande av vetenskapliga publikationer, konstnärliga verk och forskningsdata plus populärvetenskaplig spridning av resultat/slutsatser (forskningskommunikation)

Varianterna ovan visa på hur lätt det blir komplext när man börjar diskutera ÖT. Alla de ingående delar har olika sätt att tillgängliggöra (och både skilda målgrupper och motiv). Det finns säkert fler sätt att se öppen tillgång på, och det minskar inte komplexiteten. Så än så länge bör inte begreppet användas utan ett klargörande.

När det gäller krav från forskningsfinansiärer på forskare så rör de fortfarande bara öppen publicering av forskningspublikationer. Plus att upprätta datahanteringsplaner för forskningsprojektet, ett led mot datahantering enligt FAIR-principerna, men inte direkt mot öppna data så länge inte finansiärerna kräver det (H2020 är ett undantag).

Predatory publishers

Min kollega Aron Lindhagen inledde denna blogg för lite mer än två år sedan med ett inlägg om oseriösa förlag och open access, https://blogg.mah.se/vetkom/2017/08/21/oseriosa-forlag-och-open-access/. Vad har hänt sedan dess och är det längre relevant att diskutera i termer av predatory open access eller, som man på svenska valt att kalla dessa, rovtidskrifter och rovförlag?

Visst får vi fortfarande dessa mail, även jag som är en icke forskande bibliotekarie, med smickrande kommentarer om tidigare publikationer och med erbjudanden om att publicera kommande alster i ”världsledande” tidskrifter med snabb reviewprocess. Kostnaderna nämns knappt annat än att det är billigt och att artikeln självklart kommer vara open access.

På en skala med high impact factor-tidskrifterna i den ena änden återfinns i andra änden rent bedrägliga verksamheter som självklart ska undvikas men däremellan ett brett utbud av tidskrifter och förlag med skiftande kvalitet och förutsättningar. Vad definierar egentligen en rovtidskrift eller ett rovförlag och är det ens möjligt att dra en skarp gräns mellan de allt för lågkvalitativa och de som kan anses handla medvetet bedrägligt och är det ens nödvändigt? Att man vill hålla sig ifrån de rent bedrägliga är självklart men det är förmodligen lika viktigt att undvika de som håller allt för låg vetenskaplig kvalitet.

Från min yrkesvardag vet jag att det blir svårare och svårare att skilja dessa åt, mycket på grund av att de medvetet bedrägliga aktörerna blir bättre och bättre på att maskera sina avsikter genom att på olika sätt efterlikna etablerade tidskrifters websidor, korrespondens och tillvägagångssätt. Den kommersiella aktören Cabells, som för en ansenlig summa, tillhandahåller en whitelist och en blacklist ska använda sig av över 60 kriterier när de gör sina bedömningar, se http://www2.cabells.com/about-predatory-journals. Detta ger en fingervisning om komplexiteten och säger en del om att allt inte är svart eller vitt.

Önskemål framförs då och då om att forskare ska tillhandahållas dessa blacklists över de tidskrifter och förlag det inte anses lämpligt att associeras med. De kommersiella lösningar som finns för detta är så kostsamma att endast de största universiteten har de resurser som krävs. Att på lärosätesnivå hålla en lista är också för resurskrävande. En lista måste inte bara fyllas på, vilket är resurskrävande i sig, utan också hållas uppdaterad så att ingen blir kvar trots bättring. Vi har under de senaste åren flera exempel på förlag som tagit steget ”in i finrummet” efter att under lång tid ansetts som en olämplig publiceringskanal.

Vad kan då göras åt situationen och underlätta för val av publiceringskanal? Många forskare, även oa-förespråkare, menar att de aldrig ens läser mail som erbjuder open access-publicering. Dessa åker rakt i papperskorgen. Efter den snabba åtgärden finns tyvärr ingen quick fix utan det krävs en del arbete.

Ett första steg är att lyfta blicken från predatory eller rovtidskrifter och istället fokusera på vad man vill uppnå med sin publicering och utifrån detta bestämma vad som är meriterande eller önskvärd publicering och vad som är demeriterande eller icke önskvärd. På så sätt kommer både de rent bedrägliga tidskrifterna och de med för låg kvalitet att väljas bort.

Hur ska man då gå tillväga? En god idé är att göra detta tillsammans genom att diskussionen förs inom den forskarkontext man befinner sig i. Helt enkelt prata med varandra och tillsammans komma fram till var det är meriterande för er att publicera sig. För uppgiften ska vara möjlig får inte kontexten vara för omfattande. För breda ämnesområden gör arbetet omöjligt.

Till hjälp finns många guider från organisationer och lärosätesbibliotek världen över som bistår med information, metoder och goda råd. Här följer två exempel, båda från amerikanska lärosäten, ett från Bowling Green State University https://libguides.bgsu.edu/predatoryjournals och ett från George Washington University https://guides.himmelfarb.gwu.edu/friendly.php?s=PredatoryPublishing

Känner du dig tveksam erbjuder också vi på Malmö universitetsbibliotek hjälp och stöd i att utvärdera en tidskrift eller ett förlag. Maila publiceringsservice@mau.se.

/Jenny Widmark

Eriksson, S. and Helgesson, G. (2018), Time to stop talking about ‘predatory journals’. Learned Publishing, 31: 181-183. doi:10.1002/leap.1135

Teixeira da Silva, Jaime A., Dobránszki, Judit, Tsigaris, Panagiotis and Al-Khatib, Aceil (2019) Predatory and exploitative behaviour in academic publishing: An assessment. The Journal of Academic Librarianship, 45 102071, doi: 10.1016/j.acalib.2019.102071.

Teixeira da Silva, J. A., & Tsigaris, P. (2018). What value do whitelists and blacklists have in academia? The Journal of Academic Librarianship, 44(6), 781–792. https://doi.org/10.1016/j.acalib.2018.09.017.

Datahanteringsplaner – en härskarring?

Datahanteringsplan, DHP, det låter som ett tydligt koncept. Men utifrån datatyp och syfte med planen kan (och bör) de se helt olika ut. Datatyp avgörs av frågeställning, insamlingsmetod och ämnesspecifika traditioner. Och DHP-mallens syfte beror både på vilken organisation som upprättat mallen för datahanteringsplanen och vilket roll den är tänkt att fylla. DHP är ett generiskt koncept som inte kan omsättas på ett generiskt sätt i praktiken.

DHP beskrivs ofta som att de ska göra nytta för forskarna och vara “levande”, dvs både konsulteras och revideras regelbundet under forskandet. Fast tittar man på frågorna i många mallar för DHP så handlar det i stor grad om datans efterliv, information som behövs för datan ska kunna kureras, arkiveras och eventuellt publiceras. Det beror på att dataarkiv/datarepositorier driver DHP-frågan för det underlättar deras arbete som tar vid efter forskningen.

Även finansiärer ser DHP:er som ett förändringsredskap. Vetenskapsrådet, VR, kommer från och med i år kräva datahanteringsplaner i de projekt som blir beviljade medel. VR kommer inte ha någon speciell mall och kommer inte kräva in datahanteringsplanen förrän i slutredovisningen. Det innebär att forskarna och lärosätena kommer få ta ansvar för datahanteringsplanerna. Vissa tycker det är en defensiv lösning från VR:s sida att inte ta fram en tydlig mall och att inte kräva in och granska planerna. Men jag tycker det är modigt, det ger forskningen en chans att utveckla datahanteringsplaner som gör nytta i de finansierade projekten. Kanske kan visionen om “levande” DHP:er uppnås. Eller åtminstone utvecklandet av forskningsdisciplinsspecifika datahanteringsplaner.

Dock har VR nyligen meddelat att en arbetsgrupp har tillsatts som “ska samordna det nationella arbetet med datahanteringsplaner för att stödja ökad öppen tillgång till forskningsdata”. Den ska också “ta fram en mall för datahanteringsplaner och undersöka behovet av ett gemensamt verktyg som stödjer öppen tillgång till data i enlighet med FAIR-principerna” [1].

I Horizon 2020 rekommenderas en datahanteringsplan även om projektet inte deltar i piloten kring öppen forskningsdata. För H2020-projekt finns en speciell H2020-DHP och den har fokus på hur data ska göras FAIR (Findable, Accessible, Interoperable, Reusable), dvs. främst på forskningsdatans efterliv.

I en intressant artikel i Journal of Biomedical Informatics undersöks de ämnen som vanligtvis tas upp i datahanteringsplansmallar [2]. Analysen ger att datahanteringsplansmallarna har en tyngdpunkt i slutet av forskningsprocessen, att delning/publicering och återanvändning betonas mer än datainsamling och bearbetning av data under forskningsprocessen. Williams et al sammanfattar:

”The least-required items in a data management plan were aspects about data collection and processing. This is unfortunate, because data collection including the original observation and processing are not only large determinants of data quality, they are the determinants for which the opportunity to intervene is lost as time moves on” (s. 138)

Eftersom det är många aktörer inblandade i datahanteringsplansfrågorna så finns det en risk att för stora förhoppningar knyts till datahanteringsplanerna, att de ska lösa många “problem” på en gång”. Att de blir en sorts härskarringar som framställs långt ifrån forskningen.

I ett kommande blogginlägg kommer några olika exempel på datahanteringsplaner att jämföras på en konkret nivå.

/Jonas Fransson

[1] Vetenskapsrådet (2019). Öppen tillgång till forskningsdata. https://www.vr.se/analys-och-uppdrag/oppen-vetenskap/oppen-tillgang-till-forskningsdata.html

[2] Williams, M. et al (2017). Data management plans: the missing perspective. Journal of Biomedical Informatics, 71. https://doi.org/10.1016/j.jbi.2017.05.004

Publicering i XML-format

Jag var på ett arbetsmöte i Göttingen för att lära mig använda en uppsättning verktyg för XML-publicering som redan används av en del universitetsförlag. Verktygslådan kallas Métopes och utvecklas av den franska organisationen Numédif.

Single Source Publishing är en produktionsmodell för publicering som innebär att man har ett enda dokument (en XML-fil) som källa för alla de former (t.ex. PDF, HTML, EPUB, InDesign, andra XML-standarder) innehållet ska presenteras i. Man kan säga att modellen utgår från källdatan istället för presentationsformen. Den bygger på att man strukturerar sin källdata (författarens text) bra.

En fördel med detta är att man inte är beroende av utvecklingen av presentationsverktyg. Om t.ex. EPUB-formatet inte längre är aktuellt har man fortfarande kvar en verktygsoberoende källfil som kan användas för att presentera texten i ett nytt format.

En annan fördel är att man kan effektivisera produktionsflödet genom att automatisera omvandlingen från XML till de olika formaten. Genom att skapa bra mallar behöver man inte redigera varje text i varje format. Utseendet definieras en enda gång i samband med att mallen för t.ex. en pdf-fil skapas.

När man sitter med sin Word-fil som en författare skickat in är det däremot inte så självklart hur den ska förvandlas till en XML-fil. Men även detta kan delvis automatiseras. Men (ännu) inte helt. Produktionsmodellen innebär att man flyttar arbetsinsatser från redigeringen av presentationsformaten till produktionen av XML-filen.

För att XML-filen ska bli användbar måste nämligen författarens text taggas noggrant. Varje del av texten, som t.ex. stycken och rubriker, måste ha ett korrekt och fördefinierat styckeformat. Dessa stycke- och teckenformat måste följa den mall som Numédif har tagit fram i samarbete med förlagsredaktörer. Mallen täcker de flesta behov som kan uppstå vad gäller en vetenskaplig text, så som användande av bilder, tabeller, matematiska formler, angivande av lärosätestillhörighet, finansiärer, ämnesord etc. Taggningen av dokumentet underlättas såklart om författaren jobbat i en välgjord Word-mall som begränsar vilka text- och styckeformat som finns tillgängliga.

När Word-filen är vältaggad kan den läsas av programvaran som spottar ur sig en XML-fil, och sen är det bara att köra.

Arbetsmötet inleddes av de två utvecklarna som varnade oss för att vi nu skulle ha två heldagars snabb genomgång av ett tekniskt system på engelska talad av två fransoser. Och så blev det också – tappade man koncentrationen en minut fick man fråga sin bordsgranne för att hinna ikapp. Det var intensivt men också mycket roligt och spännande att lära sig jobba på ett sätt som jag tror verkligen skulle höja kvaliteten på publiceringen vid Malmö universitet. Till och med endast det första steget i modellen — att producera en XML-fil — skulle vara ett bra steg att ta. Att publicera vetenskapligt material i XML-format ökar tillgängligheten och användbarheten och blir allt oftare ett krav från t.ex. finansiärer (se t.ex. krav på publicering i XML-format i Plan S).

Några inledande konkreta steg för biblioteket skulle kunna vara att dels kontakta de tidskriftsredaktioner som i dag använder vår OJS-installation och fråga om de är intresserade av att publicera i XML-format och dels undersöka möjligheten att tagga våra avhandlingar, vilket borde vara ganska lätt eftersom de är skrivna i en word-mall.

/Jacob Andersson

 

High lights från Munin-konferensen

Emma Nolin, avdelningschef för medier och vetenskaplig publicering, du har varit i Tromsö på Munin-konferensen. Vad är Munin?

Munin-konferensen handlar om vetenskaplig publicering och kommunikation, och då främst open access, open data och open science. Detta var den trettonde konferensen vid Universitetet i Tromsø. (Länk till programmet)

Med tanke på konferensens fokus på öppen vetenskap, var det något som var speciellt intressant?

Mikhail Popov från Royal Society of Chemstry (RSC) presenterade vad som hände när de flippade, gjorde om en sina tidskrifter från att vara prenumerationsbaserad till helt öppen med författaravgift istället. Tidskriften RSC Advances var välrenommerad och en högt rankad tidskrift. Vid omvandlingen såg man en tydlig nedgång i antalet inskickade artiklar (submission rate), man valde att behålla sin acceptans rate och därmed nästan halverades antalet publicerade artiklar. Inflödet av artikelmanus minskade från de flesta länderna, med Indien och Iran i topp där minskningen var ca 80 %. Tidskriften flippades 2016 och submission föll från ca 27000 till 15000 och man ville behålla kvaliteten på de artiklar som antogs så därmed halverades antalet publicerade artiklar i tidskriften från 13000 (2015) till 6700 (2017).

Publiceringsavgiften är förhållandevis låg. Men frågan är: Vem betalar APC? Det är viktigt att det finns en central finansiering för publicering i OA tidskrifter såsom vi har vid Malmö universitet genom publiceringsfonden (länk till fonden). Priset för APC kan inte vara den enda faktorn för tidskriftens fall, utan det måste även vara forskarsamhällets inställning till OA. Tidskriften hade under 2015 den största marknadsandelen inom sitt fält men marknadsandelen gick ner efter flippningen. Deras slutsats var att i nuläget kommer inte förlagen ta risken att massflippa tidskrifter (från licensierat till Open Access). Inte heller bör forskarnas akademiska frihet begränsas. Som förläggare ser de hybridpubliceringen som en hållbar väg mot OA. (Se presentation och video)

Något annat som stack ut?

En annan presentation handlade om ett initiativ från juniora forskare. Corina Logan (nu vid Max Planck Institute for Evolutionary Anthropology) startade BIBS Bullied into Bad Science. De juniora forskarna blir idag tvingade in i det ekosystemet för publicering som finns för att kunna meritera sig. Bullied Into Bad Science är ett initiativ för juniora forskare (Early career researchers, ECRs) vars mål är ett rättvisare och mer öppen och etisk forsknings och publiceringsmiljö. Det var juniora forskare inom Cambridge universitetet som såg ett behov av en reform för publicering för att öka transparensen, reproducerbarheten, aktualiteten, den akademiska stringensen och spridning av det vetenskapliga resultatet.

De anser att det viktiga är att bli bedömd utifrån innehållet i forskningen och texterna i sig och inte vilken tidskrift som man har publicerat sig i och dess impact factor. Det är viktigt med samhällsnyttan såsom att patienter, politiker och yrkesverksamma akademiker utanför akademin kan ta del av senaste relevanta forskning. (Se presentation och video)

Någon snackis? Nationella avtal med Elsevier kanske?

En aktivist och forskare var Jon Tennant. Han menar att Elsevier korrumperar öppen vetenskap i Europa, genom att de på uppdrag av EU ska mäta graden av öppenhet för data och publikationer (OA), där de är en stark part både genom sin förlagsverksamhet men också andra system som Scopus och Plum analytics. Se artikel i The Gaurdian

En cliffhanger med samma part (Elsevier) är att vårt grannland Norge förhandlar avtal med Elsevier och det blir intressant att följa vad utkomsten blir. Ju fler som sätter ner foten gentemot Elsevier desto starkare är vi.  

/Jonas Fransson

Öppen vetenskap – mer öppenhet eller fler styrredskap?

Jag har i min roll som utvecklare av forskarstöd på Malmö universitetsbibliotek och tillika projektledare för ett forskningsdataprojekt den senaste tiden läst mycket på temat öppen vetenskap. Öppen vetenskap som koncept har på senare tid förenklats och handlar nu främst om öppen tillgång till forskningsresultat, både publikationer och underliggande data. Utvecklingen mot öppen vetenskap drivs hårt av EU och därmed även den svenska regeringen. Vi är sent ute, utvecklingen mot öppen vetenskap har kommit längre i många andra länder, speciellt sådana som vi gärna jämför oss med, som Finland, Nederländerna och Storbritannien. Det gör nu att det svenska arbetet för en omställning forceras och sker på bred front, fast än så länge på behörigt avstånd från forskningen och forskarna.
 
EU kommissionen publicerade 2012 en rekommendation om tillgång till och bevarande av vetenskaplig information (https://eur-lex.europa.eu/eli/reco/2012/417/oj), och följde i år upp med en ny rekommendation (https://eur-lex.europa.eu/eli/reco/2018/790/oj). Rekommendationerna har och har haft stort inflytande på olika aktörer, både på EU-nivå och nationell nivå. Ett exempel är datahanteringsplanspilotprojektet inom Horizon 2020. Ett annat är Science Europes ställningstagande för guld-OA och mot hybrid-OA som kommer till i uttryck i Plan S (de undertecknande forskningsfinansiärerna går under namnet cOAlition S, svenska Formas ingår i gruppen). Ett tredje är att Sverige (genom BIBSAM-konsortiet) har sagt upp avtalet med Elsevier när det gäller tillgång till vetenskapliga tidskrifter för att man inte kom överens som OA-komponenten i avtalet (samt prisökningen).    
 
I forskningspropositionen som kom 2016 så talas det inte mycket om öppen vetenskap, men väl öppen tillgång till forskningsresultat och underliggande data (och det talas om 10 år för omställning). Därefter har både Kungliga biblioteket och Vetenskapsrådet fått olika uppdrag:
 
Och därmed är ett antal utredningar igång (och snart klara eftersom tidtabellen är tajt, utkast är i omlopp för “inspel”). Även SUHF har en grupp för samordning av öppen vetenskap (http://www.suhf.se/arbetsgrupp/open-science-samordningsgrupp) och där under en Nationell arbetsgrupp för forskningsdata (http://www.suhf.se/arbetsgrupp/open-science-samordningsgrupp/nationell-arbetsgrupp-for-forskningsdata).  
 
Många saker som är på gång är bra. Det är svårt att vara emot öppen tillgång till publikationer eller data som är tillgängliga för att resultat ska kunna verifieras. Men helheten – alla dessa förändringar som kommer dundra, eller smyga, in i forskares vardag under de kommande tio åren från skilda håll, från finansiärer, från lärosätesledningar och genom de system för tillgängliggörande och för mätning som nu skisseras och byggs upp – vad kommer de göra med forskningen som verksamhet och praktik? Kommer mätningen av utvecklingen mot öppen vetenskap samtidigt bli ett styrredskap (eller kanske till och med en storebrors-funktion)? Kommer forskningens innehåll premieras även om man som forskare inte optimerar sitt agerande i systemet för öppen vetenskap? Hur ska dagens meriterings- och resursfördelningssystem kunna gira 90 grader på tio år (för det måste ju bli meriterande)? 
 
Det är många frågor för det är många aspekter av forskningsvardagen som kan komma att förändras. Men det som oroar mig mest är att det är så få forskare  som medverkar i ovanstående utveckling. Jag menar inte att gemene forskare ska sätta sig in i alla ovanstående frågor, men fler aktiva forskare borde delta i utredningsarbetet (och det borde diskuteras mer). Idag är det främst tjänstemän på myndigheter, från handläggare och utredare till bibliotekschefer och rektorer, som deltar och kanske hinner göra inspel innan utredningarna är klara och öppen vetenskapssystemet byggs vidare. Troligt kommer det vägas och mätas mer, men kommer ämnesspecifika traditioner och akademisk frihet få plats i denna form av öppenhet?
 
Övergången till öppen vetenskap har blivit akut (från politiskt håll) och det kan leda till en ketchup-effekt med många förändringar på kort tid. Varför inte längre tidshorisont och fler forskare involverade? Öppen vetenskap kommer leda till många positiva effekter. En aspekt är bättre ordning på och dokumentation av forskningsdata behövs nog på många ställen, jag skulle idag nog inte kunna reda ut den data som min avhandling bygger på. Min egna goda forskningssed behöver bli godare. Och som biblioteksanställd är jag van att göra nytta för den enskilde användaren. Nu är jag rädd att det kommer förändras, att inte längre främst stödja forskare, utan tvärtom komma tvinga in dem i ett (byråkratiskt)system som kanske inte alltid är för forskningsframstegens bästa. Rädd för att bli en öppen vetenskap-kommissarie som inte längre stödjer forskare, att bli en politruk…
 
/Jonas Fransson

Data papers: öppen vetenskap och vetenskaplig meritering

Öppen vetenskap blivit framskrivet som den strategi för forskning som EU vill driva när det gäller europeisk forskningspolitik (European Commission, 2016). Det gäller såväl en öppen tillgång till publikationer genom open access som öppen tillgång till forskningsresultat i form av forskningsdata, men inkluderar också citizen science och samhällets deltagande i vetenskap. I den senaste svenska forskningspropositionen Kunskap i samverkan finns en målbild för Öppen vetenskap som tar upp hur öppen tillgång till forskningsresultat är eftersträvansvärt och stegvis ska uppnås genom att arbeta aktivt med att utveckla formerna för det under de närmaste tio åren (Proposition 2016/17:50).

”Open research data is a reality for policy makers, but has not yet become a reality for researchers.” (Elsevier & CWTS 2017, s. 24)

Forskningsdata, det vill säga det empiriska underlag som ligger till grund för forskningen, har tidigare setts som en resurs enbart för de forskare som är involverade i arbetet. Nu ses forskningsdata i allt större utsträckning som ett forskningsresultat som kan delas med andra och göras tillgängligt för nya analyser. Samtidigt är delande av data och forskares praktiker kring forskningsdatahantering djupt rotat i ämnestillhörighet (Borgman 2015). Forskningsdatas användbarhet för andra forskare är dock en komplex fråga. Det räcker sällan med ren tillgång till forskningsdata utan den behöver kringgärdas av dokumentation och metadata inte minst för att bli sökbar. I dagsläget satsas mycket resurser på att bygga upp nya infrastrukturer för öppna forskningsdata.  En form av infrastruktur är de data journals som växt fram över tid. En data journal är en form av tidskrift som innehåller data papers vars syfte är att beskriva forskningsdata på ett sätt som gör den förståelig och användbar för andra (Candela et al 2015; Leonelli 2016). Den här typen av tidskrifter återfinns inom en mängd discipliner men är vanligast i naturvetenskap och medicin. Många gånger är diskussionerna om forskningsdata fokuserade på just dessa ämnesområden där delande av data har en lång tradition eller mängden data är omfattande. Vad betyder utvecklingen kring öppen tillgång av forskningsdata för forskning med andra traditioner i form av mindre projekt och små dataset? Det kan handla om kvalitativ forskning eller ämnen inom humaniora och samhällsvetenskap, men småskalig forskning förekommer inom alla vetenskaper. Det är i den så kallade långa svansen av sådana mindre projekt och datamängder som de flesta forskare arbetar (Heidorn 2008).

Forskningsdata har olika funktion och mening för olika aktörer men får också olika betydelse beroende på när i forskningsprocessen man tittar (Haider & Kjellberg 2016). När det gäller forskares motivation att tillgängliggöra data så är den främsta drivkraften inomvetenskaplig (Elsevier & CWTS 2017). Wallis, Rolando och Borgman (2013) visar att forskare som gör forskning i den långa svansen är villiga att dela data med andra, men att de oftast delar på informella sätt. Liknande slutsatser gjordes i en undersökning vid Malmö högskola som visar att många använder öppna data i sin forskning, men att det krävs en hel del extra arbete för att forskningsdata ska bli användbar för andra (Fransson et al 2016). Faniel, Kriesberg och Yakel (2015) visade att kvalitet på dokumentationen av forskningsdata var en central faktor för att forskares data skulle kunna återanvändas på ett tillfredsställande sätt. Samtidigt belyser Heidorn (2008) betydelsen av infrastruktur för att möjliggöra återfinning och återanvändning av forskningsdata.

Data journals potentiella roll har lyfts fram som en del i infrastrukturen för att tillgängliggöra och beskriva forskningsdata (Leonelli 2016). Candela med flera (2015) har genomfört en översiktsstudie av 100 tidskrifter och konstaterar att antalet data journals växer samtidigt som formerna inte är konsoliderade än. Bibliometriska studier har visat att tidskrifterna har olika etableringsgrad, men många är inkluderade i Web of Science citeringsindex och kan därmed anses vara väl etablerade (Elsevier & CWTS). I Chavan och Penevs (2011) studie av data papers i biologi konstaterar de att formatet har en tänkbar roll för att få en kulturell förändring till stånd genom att ge erkännande till data publicering som en del i vetenskaplig meritering. Tidigare forskning pekar därmed på att data papers är en allt mer etablerad del av ekologin för vetenskaplig kommunikation, men har bara studerats i begränsad omfattning.

Data papers, publicerade i data journals eller i vanliga vetenskapliga tidskrifter, har kanske en viktig roll att spela, speciellt i ljuset av öppen vetenskap där nya incitament krävs för öppet tillgängliggörande. Data papers blir både en del av data-tillgängliggörandet och en publikation att räkna och citera.

Exempel på data journals som innehåller data papers:

Scientific data: http://www.nature.com/sdata

Data in Brief: http://www.journals.elsevier.com/data-in-brief

Journal of Open Psychology Data (JOPD): http://openpsychologydata.metajnl.com

Geoscience Data Journal: http://onlinelibrary.wiley.com/journal/10.1002/(ISSN)2049-6060

Journal of Open Humanities Data (JOHD): http://openhumanitiesdata.metajnl.com

Open Health Data: http://openhealthdata.metajnl.com

Journal of Open Research Software (features peer reviewed Software Metapapers describing research software with high reuse potential): http://openresearchsoftware.metajnl.com

/Jonas Fransson

Referenser

Borgman, C. L. (2015). Big data, little data, no data. Cambridge MA: MIT Press.

Candela, L., Castelli, D., Manghi, P., & Tani, A. (2015). Data journals: A survey. Journal of the Association for Information Science and Technology, 66(9), 1747-1762.

Chavan, V., & Penev, L. (2011). The data paper: a mechanism to incentivize data publishing in biodiversity science. BMC Bioinformatics 12(15).

Elsevier & CWTS (2017). Open Data: The Researchers Perspective. https://www.elsevier.com/__data/assets/pdf_file/0004/281920/Open-data-report.pdf

European Commission (2016). Open innovation, open science, open to the world – a vision for Europe. https://publications.europa.eu/s/cZby

Faniel, I. M., Kriesberg, A. and Yakel, E. (2016). Social scientists’ satisfaction with data reuse. JASIS&T, 67:1404–1416.

Fransson, J., du Toit, M., Tapia Lagunas, P. & Kjellberg, S. (2016). Tillgängliggörande av forskningsdata Nulägesbeskrivning samt rekommendationer för uppbyggnad av stöd till högskolans forskare. Malmö högskolas bibliotek. http://muep.mau.se/handle/2043/20266

Haider, J., & Kjellberg, S. (2016). Data in the making: Temporal aspects in the construction of research data. In J. Rekers & K. Sandell (Eds.), New big science in focus: Perspectives on ESS and MAX IV. Lund: Lund Studies in Arts and Cultural Sciences.

Heidorn, P. B. (2008). Shedding Light on the Dark Data in the Long Tail of Science. Library trends, 57(2), 280-299.

Leonelli, S. (2016). The disruptive potential of data publication. Notes and Records: The Royal Society journal of the history of science.

Proposition 2016/17:50 (2016). Kunskap i samverkan – för samhällets utmaningar och stärkt konkurrenskraft. Stockholm, Utbildningsdepartementet.

Wallis, J. C., Rolando, E., & Borgman, C. L. (2013). If We Share Data, Will Anyone Use Them? Data Sharing and Reuse in the Long Tail of Science and Technology. PLOS ONE, 8(7), e67332.

 

Ett brev om öppen tillgång

Från 2017 har Kungliga biblioteket (KB) ett uppdrag från regeringen att samordna arbetet för öppen tillgång till vetenskapliga publikationer i Sverige.

Nyligen skrev KB ett öppet brev på sin blogg. I brevet försöker de reda ut två vanliga missförstånd som de sett kring omställningen till ett öppet tillgängligt publiceringssystem.

De två missförstånd som KB ofta stöter på i sitt arbete handlar om kvalitet och om kostnader.

Öppen tillgång, kvalitet och rovdjursförlag

Kvaliteten på öppet tillgängliga tidskrifter bör bedömas på samma källkritiska sätt som när man väljer att publicera sig i en prenumerationsbaserad tidskrift (som kanske varit etablerad längre tid).

Som forskare bör man titta på ursprung – är förlaget känt? Var har förlaget sitt säte? Finns en tydlig adress som man kan anta existerar i verkligheten? Personerna som ingår i editorial board – har de tydliga kontaktuppgifter? Ifall man söker på förläggarens namn på webben, finns då hen vid något känt lärosäte? Hur ser innehållet i tidigare tidskriftsnummer ut – är artiklarnas innehåll överensstämmande med vad tidskriften säger sig innehålla? Hur ser referenslistorna ut och vilken akademisk nivå håller artiklarna?

I dagens läge svärtar dessvärre de så kallade rovtidskrifterna (eng Predatory journals) ibland ner de fritt tillgängliga tidskrifterna. I och med den tekniska möjligheten med webbpublicering finns också potential att bedriva skumraskaffärer via sajter som liknar elektroniska tidskrifter. Det som ser ut att vara en vetenskaplig tidskrift har ofta sitt säte på okänd ort. Förläggare och granskare har ibland inte ens tillfrågats om de önskar arbeta med tidskriften, men finns trots detta namngivna på tidskriftens webbsajt. I en del fall har aktörerna bakom rovstidskriften lyckats locka till sig forskare som utför ett godkänt reviewarbete med artiklarna, vilket gör att enskilda tidskrifter hos rovförläggare kan nå viss, ibland till och med riktigt god, framgång. Det är en snårig bild och sällan helt enkelt att bedöma kvaliteten, vilket gör att viss efterforskning krävs för att man som forskare ska vara på säkra sidan. Rovförläggare har för vana att skicka ut massmail världen över för att få forskare på kroken.

Biblioteket vid Malmö universitet får frågor om och ger råd vid val av tidskrift för publicering, både för att bedöma den öppna tidskriftens kvalitet eller genom att ge förslag på öppet tillgängliga tidskrifter av hög kvalitet. En tidigare bloggpost handlar om oseriösa förlag, läs gärna inlägget här. Se också bibliotekets sida om hur man väljer tidskrift för publicering

I KBs öppna brev skriver man att problemet med rovtidskrifter är ”ett övergående fenomen som har uppstått i omställningen från ett traditionellt prenumerationsbaserat publiceringssystem till ett öppet tillgängligt publiceringssystem, då nya affärsmodeller utvecklas, prövas och utvärderas.”1

Kostnader

Publiceringssystemet har fram till för ett tag sedan vilat på prenumerationsavgifter som betalningsmodell. I denna modell har biblioteken stått för betalningen till förlagen, vilket gjort att biblioteket kunnat erbjuda sina forskare läsning av artiklar i de tidskrifter man prenumererar på.

Det öppet tillgängliga publiceringssystemet har en annan betalningsmodell. I praktiken infaller betalningen efter att artikeln genomgått peer review. Vid godkännande ombeds författaren betala den författaravgift (APC, article processing charge) som tidskriften har, för slutgiltig publicering. Artiklarna blir med denna modell fritt tillgängliga för alla. Det bör tilläggas att inte alla öppet tillgängliga tidskrifter har en avgift för publicering. Vissa OA-tidskrifter har sin redaktion vid ett lärosäte och har ingen avgift för publicering då redaktionsarbetet har fått lov att ske på inom de inblandades tjänst.

KB har i sitt brev med följande uträkning:

Det har beräknats att den totala summan som betalas globalt för vetenskaplig publicering i ett prenumerationsbaserat system för närvarande är ca 7,6 miljarder € per år för 1,5 miljoner artiklar. Detta är lågt räknat eftersom inte alla artiklar finns indexerade i Web of Science. Räknas antalet artiklar upp till 2 miljoner per år innebär det ändå en genomsnittlig kostnad på 3 800 € per artikel som är publicerad i ett låst, prenumerationsbaserat system. Detta stödjer tesen att det finns tillräckligt med pengar i systemet för en omvandling till ett öppet tillgängligt publiceringssystem.

Ekonomiskt stöd för open access-publicering kan forskare ibland få via sin forskningsfinansiär, eller via författarfonder som några svenska lärosäten har.

På Malmö universitet finns sedan några år en Läs gärna mer om författarfonden här.

Biblioteket har också ett väletablerat arbete med vad som brukar kallas ”den gröna vägen till open access” – parallellpublicering. När forskare vid högskolan registrerar en publikation i det öppna arkivet MUEP, undersöker vi de upphovsrättsliga möjligheterna för att göra artikeln fritt tillgänglig i manuskriptform. Ofta har universitetets forskare författarmanuskriptet och skickar detta omgående till oss. I de fall förlagen tillåter gör vi manuskriptet tillgänglig och alla har då åtkomst till artikeln. Detta sätt att göra vetenskapliga publikationer fritt tillgängliga är kostnadsfritt, men nämns inte i KB:s öppna brev.

Att slutproducera en artikel innefattar ett stort antal steg. Bland annat samordnar tidskriftsförlaget reviewförfarandet och ger sedan artikeln en läsvänlig layout. Tillgängliggörandet handlar om att metadata, information om artikeln och dess innehåll, sprids och används i andra tjänster för att maximera möjligheten för andra att hitta publikationen – öka hittbarheten. Oavsett vilken betalningsmodell och vem som framställer slutprodukten, så finns det fortfarande ett behov av att vissa grundläggande steg utförs.

Oavsett mängden pengar som finns i systemet och hur betalningsmodellerna ser ut så bör målet med öppen tillgång också innefatta att inte ytterligare öka kostnaderna för lärosätena, något som dessvärre fortsätter att ske i och med de nya så kallade offset-avtal som biblioteken sluter med förlagen. Avtalen är tänkta att ge lästillgång och möjlighet till open access-publicering för lärosätena och målet för biblioteken och deras samordnande organisationer har också varit ökad transparens för biblioteken – att få tillgång till den statistik som förlagen har men inte velat dela med sig av.

I bästa fall är offset-avtalen också ett ”övergående fenomen” på väg mot open access. I ett kommande blogginlägg utlovar vi mer ingående information om möjligheterna och problemen med offset-avtalen.

/Helena Stjernberg

Lästips! Bibliometrics and research evaluation: Uses and abuses

bokomslagYves Gingras, professor i vetenskapshistoria och -sociologi, har skrivit boken Bibliometrics and research evaluationUses and abuses (MIT Press). Boken är trots (eller tack vare) sitt ringa omfång (119 sidor) en viktig bok om utvärdering av forskning. Bibliometri, eller rättare sagt bibliometrisk data, i form av aggregerad data om publikationer och citering har blivit en central del i utvärderandet. Begrepp som rankning, metrics, Journal Impact Factor och h-index har blivit en del av forskningsvardagen.  

Yves Gingras problematiserar användningen och argumenterar för ett mer reflekterat bruk. Allt kan inte mätas på ett “objektivt” sätt genom kvantifiering, ämnesanpassad kvalitativ utvärdering kan inte ersättas. Ett annat problem som boken tar upp är okritisk användning av bibliometrisk data, i praktiken en ovetenskaplig datahantering (min tolkning).  

Boken rekommenderas till alla verksamma inom forskningsområdet, alla berörs vi direkt eller indirekt av forskningsutvärdering jämte medföljande buzz-words. Det är inte bara utvärdering som genomförs av administratörer som Yves Gingras problematiserar. Utvärderingsproblematiken reproduceras ständigt av forskare då man bedömer andra eller försöker optimera sin publicering beroende på olika nyckeltal. På sidan 80 skriver han: 

“Indeed, scientists themselves are often the ones who succumb to the anarchic uses of raw bibliometrics. As members of committees and boards with the power to affect policy decisions, they frequently push for the generalized use of such indicators, even though they have not tested their properties. This development only confirms that for scientists, the “enemy” is more often one’s colleague than a distant bureaucrat.” 

Boken finns att låna på universitetsbiblioteket. Mer om kvantitativa indikatorer finns att läsa i t.ex. The Metric Tide: Report of the Independent Review of the Role of Metrics in Research Assessment and Management. Forskning om bibliometri som forskningsfält återfinns t.ex. i tidskrifterna Journal of Informetrics och Scientometrics

/Jonas Fransson

ResearchGate skjuter över ansvaret på användarna

ResearchGate, kanske den största sociala nätverkstjänsten för forskare, har också blivit en plats för spridning av forskningspublikationer. Men flera stora förlag har stämt tjänsten. Spridning och åtkomst av publikationer via ResearchGate kan ses som en sorts piratverksamhet, se tidigare bloggpost om svart open access.

För ResearchGates överlevnad så har ändringar gjorts, vilka minskat den direkta tillgången till publikationer. Under hösten har ResearchGate också skärpt sina användarvillkor. De nya villkoren gäller från den 1:a december och den tredje paragrafen under “4. User obligations” är tydlig med att användaren har ansvaret för att uppladdning och delning sker på ett korrekt sätt:

 “[…] Except in the case of Member Submissions containing content exclusively in the public domain, you represent and warrant, and can demonstrate to our full satisfaction upon request that (i) you own or otherwise control any and all rights or licenses required in order to submit or share all content in your Member Submissions and you consent to the use of such content as contemplated by these Terms, and (ii) you have full authority to act on behalf of any and all owners of any right, title, or interest in and to any content in your Member Submissions to use such content as contemplated by these Terms.”

Att man nu i större utsträckning behöver begära en artikel för att få tillgång till den i Research Gate beror också på att delningen behöver göras mellan användare. ResearchGate kan inte agera mellanhand i form av ett öppet arkiv för utgivna versioner av publikationer på samma sätt längre. 1,7 miljoner publikationer är inte längre fritt tillgängliga, utan kräver en begäran. Det går fortfarande att tillgängliggöra texter öppet i ResearchGate, men då kanske främst preprint-versioner.

Det är centralt att ha koll på sina publiceringsavtal, läs mer i intervjun med Jenny Widmark här i bloggen. Det finns även en webbsida där man kan läsa mer om dessa frågor och Jennys kontaktuppgifter på bibliotekets webbplats: http://mah.se/Bibliotek/Forskar–och-doktorandstod/Publicera-och-sprida/Rattigheter-och-publicering/ 

Den nya versionen kan jämföras med tidigare versioner av användarvillkoren genom Wayback Machine, vilka var betydligt kortare.

Läs mer:
ResearchGate Restricts Access to Nearly 2 Million Articles. The Scientist, November 9, 2017. https://www.the-scientist.com/?articles.view/articleNo/50918/title/ResearchGate-Restricts-Access-to-Nearly-2-Million-Articles/

Publishers push ResearchGate harder in copyright battle. Times Higher Education, November 9, 2017. https://www.timeshighereducation.com/news/publishers-push-researchgate-harder-copyright-battle

/Jonas Fransson