SND 2.0 – en distribuerad infrastruktur för tillgängliggörande av forskningsdata

Vetenskapsrådet har beviljat Svensk Nationell Datatjänst (SND) finansiering som infrastruktur (2018-). SND har under lång tid haft ett fokus på samhällsvetenskaplig forskningsdata, men på senare år även på data inom humaniora samt hälsovetenskap och medicin. Syftet har varit att för att öka tillgången på väldokumenterade och välbevarade forskningsdata. I och med omvandlingen till SND 2.0 så kommer verksamheten ske i en mer distribuerad form där SND är kärnan, och alla ämnesområden ska inkluderas. Från och med nästa år är planerna att både organisation och verksamhet ska förändras och utökas. Göteborgs universitet kommer även fortsättningsvis vara värduniversitet för SND, men verksamheten kommer att ledas av ett konsortium bestående av sju lärosäten (GU, KI, LU, SU, SLU, UMU och UU). De sju konsortiemedlemmarna kommer att bidra med specialistkompetens kring datahantering inom olika vetenskapliga områden (en form av medfinansiering) och kommer därmed fungera som nationella kunskapscentra.  
 
Den största delen av arbetet kring SND kommer göras ute på de deltagande lärosätena, och ingår inte i själva infrastrukturen. Malmö högskola har skrivit en avsiktsförklaring att delta i SND-nätverket, och det har även ett 20-tal andra lärosäten gjort. Lokalt i Malmö kommer det byggas upp en funktion som ska hjälpa forskare att tillgängliggöra data, i slutet av projekt eller i samband med publicering, i SND:s system. Denna lokala funktion som alla medlemmar i SND-nätverket behöver, benämns av SND som en Data Access Unit (DAU), men den kan få en annan benämning vid högskolan. Initialt handlar arbetet om att stödja forskares tillgängliggörande i systemet, men också att granska och komplettera metadata före uppladdning.  
 
Hela infrastrukturen är ett utvecklingsprojekt och antalet datatyper som är möjliga att tillgängliggöra kommer öka efterhand. SND kommer vara en viktig tjänst för att tillgängliggöra mindre datamängder, nu när ökade krav kring datahantering och datatillgängliggörande är att vänta från forskningsfinansiärerna.
 
/Jonas Fransson
 
TILLÄGG: SND bjuder in till två olika dagar i november:
 

SND-forum den 14/11 på temat ”Vägen till FAIR data”
https://snd.gu.se/sv/arrangemang/2017/vägen-till-fair-data

SND-workshop den 15/11 på temat ”Att bygga samarbeten för framtiden” – om forskningsinfrastrukturer med individdata
https://snd.gu.se/sv/arrangemang/2017/att-bygga-samarbeten-för-framtiden

Tillgängliggöra forskningsdata öppet?

Öppet tillgänglig forskningsdata diskuteras allt mer, och därmed också öppet tillgängliggörande. I forskningspropositionen Kunskap i samverkan – för samhällets utmaningar och stärkt konkurrenskraft, som nyligen beslutades, står det [1]:

[…] forskningsdata och vetenskapliga publikationer, som tas fram med offentlig finansiering bör vara öppet tillgängliga så långt det är möjligt. […] För vissa typer av forskningsdata finns dock behov av att begränsa öppenheten för att skydda den personliga integriteten, rikets säkerhet och liknande. För forskning som har innovationspotential kan det finnas behov av att begränsa öppenheten av immaterialrättsliga skäl. Det är dock ett viktigt ställningstagande att öppen tillgång utgör normen och att inskränkningar i öppenheten utgör undantagen.

[…] Regeringens målbild är att alla de vetenskapliga publikationer som är resultat av offentligt finansierad forskning bör bli omedelbart öppet tillgängliga direkt då de publiceras. Likaså bör forskningsdata som ligger till grund för vetenskapliga publikationer bli öppet tillgängliga samtidigt som den tillhörande publikationen.

Malmö högskola har bidragit med en avsiktsförklaring kring deltagande i Svensk Nationell Datatjänsts (SND) tänkta nationella infrastruktur för tillgängliggörande av forskningsdata [2]. Både i forskningspropositionen och i SND:s ansökan till VR låter det hela ganska enkelt: offentligt finansierad forskning bör göra öppet tillgänglig om möjligt och SND leder en konsortieansökan med flertalet universitet som medlemmar för att skapa en lösning. Men i praktiken är det ett komplext område och som tämligen omedelbart genererar frågor. Frågor vars svar beror på vilket perspektiv man intar och perspektiven är många: forskarens, lärosätets (som myndighet), forskningsstödsverksamheternas, forskningspolitikens (på både nationell och europeisk nivå), forskningsfinansiärernas och forskningsinfrastrukturernas (för att nämna ett antal centrala perspektiv).

Intressant är att utgångspunkterna i de accelererande diskussionerna inte är inom-disciplinära eller ens inom-vetenskapliga. En grundtanke är ekonomisk – forskningsdata är en resurs som (i många fall) tagits fram med offentliga medel, inom forskningsprojekt eller inom ramen för anställningar vid lärosäten – och därmed bör/ska forskningsdata göras tillgänglig för samhället. Denna data tänks kunna leda till både innovation och till billigare framtida forskning då data redan finns tillgänglig. En annan grundtanke är att öka forskningens transparens – är forskningsresultaten korrekta? – och det är ett gott mål. Men ett mål som är mer svårt fångat än det först verkar, databearbetning och analys är i mycket forskning väl integrerade.

Dessa olika grundtankar, utgångspunkter för öppet tillgängliggörande, tyder på olika intentioner med det öppna tillgängliggörandet av data, och var och en av dessa intentioner leder till att olika versioner av insamlad data bör tillgängliggöras. För innovation behövs råvara och då bör rådata vara det naturliga tillgängliggöra. Data för framtida forskning? Det beror helt vilka metoder och frågeställningar den framtida forskningen kommer arbeta med, är det snarlikt ursprungsforskningen kanske en väl bearbetad version av data ska tillgängliggöras men är det annan typ av forskning kanske det är bättre med lätt bearbetad data. För att kontrollera forskningsresultat krävs helst alla versionerna av data, från rådata till det bearbetade urval som ligger till grund för just de resultaten som presenteras i den undersökta publikationen. Forskaren Christine Borgman ställer frågan ”When is data?” för att poängtera tidsdimensionen i datahantering [3], vilket leder till insikten att det inte finns någon självklar version av data att tillgängliggöra.

/Jonas Fransson

[1] Proposition 2016/17:50, Kunskap i samverkan – för samhällets utmaningar och stärkt konkurrenskraft. Utbildningsdepartementet: Stockholm. http://www.regeringen.se/4adad0/contentassets/72faaf7629a845af9b30fde1ef6b5067/kunskap-i-samverkan–for-samhallets-utmaningar-och-starkt-konkurrenskraft-prop.-20161750.pdf 

[2] SND (2017). Svensk Nationell Datatjänst: Ansökan till Vetenskapsrådet för Forskningsinfrastruktur Infrastruktur av nationellt intresse 2017.

[3] Borgman, C.L. (2015). Big data, little data, no data : scholarship in the networked world. Massachusetts: The MIT Press.

 

Megajournals

By The Royal Society of London [Public domain], via Wikimedia Commons
Förstasida på ett tidigt nummer av Philosophical Transactions (från Wikimedia Commons).
Ända sedan de första online tidskrifterna började dyka upp har man diskuterat hur man bäst ska ta tillvara på de möjligheter som digital publicering ger för vetenskapliga tidskrifter. Många försök har gjorts med allt från preprint-servrar till öppen peer review, men tidskriftsformen har visat sig seglivad och i mångt och mycket ser de vetenskapliga publiceringsmönstren idag ut som de gjorde innan den digitala revolutionen. Vissa skillnader finns förstås, i stort sett alla förlag lägger t.ex. idag ut accepterade artiklar innan de har blivit publicerade i ett tidskriftsnummer (s.k. online first-artiklar). Ett annat exempel på nya publiceringsmöjligheter i en digital miljö är de s.k. megajournals som börjat dyka upp det senaste decenniet.

Det som kännetecknar en ”megajournal” är:

  1. Artiklarna bedöms enbart efter ifall de håller god vetenskaplig och metodologisk nivå, dvs. man tar t.ex. ingen hänsyn till hur viktig forskningen kan anses vara, eller vilket genomslag man tror att den kan komma att få.
  2. Bred ämnesprofil, PLOS ONE tar t.ex. emot bidrag från alla discipliner inom naturvetenskap och medicin, medan SAGE Open spänner över samhällsvetenskap, beteendevetenskap och humaniora.
  3. Open Access, vanligtvis finansierat med författaravgifter.
  4. En stor redaktion bestående av redaktörer från akademin (och inte professionella redaktörer).[1]

En av grundtankarna med megajournals är att bryta några av de begränsningar i tidskriftsformatet som sattes i den tryckta eran. En sådan begränsning handlar om storlek, där en digital publikation rent teoretiskt kan växa sig hur stor som helst. PLOS ONE, den första och en av de största megajournalerna, publicerade när den var som störst drygt 30 000 artiklar om året. 2016 har siffran sjunkit till ca 23 000, troligen främst till följd av ökad konkurrens från andra megajournals, men fortfarande långt fler än de största ”vanliga” tidskrifterna.

Sedan PLOS ONE dök upp 2006 och snabbt avancerade till att bli världens största peer reviewade tidskrift, har ett flertal andra förlag lanserat egna megajournals. Fenomenet har debatterats kraftigt och där vissa ser dem som den akademiska publiceringens framtid har andra ifrågasatt kvalitetsgranskningen (som ibland kallats ”peer review light”) och jämfört tidskrifterna med en akademisk soptipp för artiklar som inte platsar i mer traditionella, ämnesspecialiserade tidskrifter [2] (i mångt och mycket liknar kritiken den som framförts mot de s.k. rovförlag som diskuteras i en annan bloggpost, där förlagen anklagas för att vara mer intresserade av hösta in författaravgifter från författare än hålla hög vetenskaplig nivå). Traditionella, specialiserade tidskrifter brukar också ha en trogen läsekrets inom disciplinen som håller sig a jour med allt som publiceras i tidskriften, något som man förstås missar om man väljer att publicera sig i en kanal där 100-tals artiklar inom många olika discipliner publiceras varje vecka.

Fördelarna som brukar framhävas för att publicera sig i megajournals är att artiklarna blir OA, visserligen mot en kostnad men författaravgifterna i megajournalerna ligger ofta något under snittet för vad OA publicering brukar kosta. Den tid det tar från att artikeln skickats in till att den publicerats brukar också vara snabbare än hos traditionella tidskrifter. Slutligen så får det faktum att urvalskriterierna inte fokuserar på potentiellt genomslag som konsekvens att de flesta megajournals gladeligen publicerar negativa resultat och ”replication studies”, något som kan vara svårt att få publicerat i traditionella tidskrifter.

På sidan https://megajournals.info/ kan man få en överblick över vilka megajournals som finns, vilka ämnesområden de täcker och vad det kostar att publicera sig i dem.

/Aron Lindhagen

[1] Binfield, P. (2014) Novel Scholarly Journal Concepts. In S. Bartling and S. Friesike (eds.), Opening Science, pp. 155-163. http://doi.org/10.1007/978-3-319-00026-8_10

[2] Spezi, V., Wakeling, S., Pinfield, S., Creaser, C., Fry, J. & Willett, P. (2017) ”Open-access mega-journals: The future of scholarly communication or academic dumping ground? A review”, Journal of Documentation, Vol. 73 Issue: 2, pp.263-283, http://doi.org/10.1108/JD-06-2016-0082

 

Forskningsdatahanteringens komplexitet utifrån intressenternas fokus

Att prata om hantering av forskningsdata är aldrig enkelt. Förutom att varje ämnesdisciplin och datainsamlingsmetod innebär olika förutsättningar för forskningsdatahanteringen så finns det ett tre grundläggande och skilda dimensioner. Den första är forskningen som process (eller aktivitet) där något bearbetas och analyseras för att ett resultat (svar) ska uppnås. Hur det görs är lite olika för varje ämne, men i grunden är det en process där forskaren använder digitala, fysiska eller teoretiska verktyg. Den andra dimensionen är lärosätet som myndighet. Det ställer olika krav på forskningen, krav som när det gäller datahantering ofta kommer från gällande lagstiftning. Forskaren vid lärosätet är en statsanställd som i sin tjänsteutövning forskar. Den tredje dimensionen när det gäller datahantering är yttre krav, krav som inte kommer ifrån eller kanaliseras genom lärosätet som myndighet. Det kan vara krav från forskningsfinansiärer eller från vetenskapliga förlag.

I matrisen nedan tydliggörs skillnaderna i några centrala aspekter kring forskningsdata mellan de olika dimensionerna. Skillnaderna i synsätt kan kanske förklara varför olika aktörer ibland pratar förbi varandra. Ibland andra fall använder man samma begrepp men lägger olika betydelser i det.

  Vad är forskningsdata? Ägande? Öppet tillgängliggörande?
Forskarna Data är material som bearbetas och analyseras

Data definieras av forskningsfrågan

”Min forskningsdata” Vem har nytta av den?

Är ett kapital i kommande projekt och vid samarbeten

Lärosätet Data är allmän handling

Krav på datahanteringen vid känslig data

Data ägs av lärosätet (allmän handling)

Data ska arkiveras

Yttre krav

Inriktning mot öppen vetenskap

Yttre krav Data är underlag till forskningsresultat

Data är råmaterial som kan/bör återanvändas

Öppna licenser vid tillgängliggörande för att möjliggöra återanvändning Data bör beskrivas så att den kan hittas och återanvändas

Data bör återanvändas av resursskäl

matrisen som pdf

Utmaningen för alla parter nu är att förstår de olika perspektiven så att det kommande utvecklingsarbetet inom forskningen och inom stödverksamheterna kan gå hand i hand. Vissa krav är inte förhandlingsbara, som till exempel lagkraven kring arkivering, medan andra är olika beroende på till exempel forskningsfinansiär.

Det är också en fråga om prioriteringar. All data kanske inte ska tillgängliggöras öppet och kanske inte med samma ambitionsnivå, trots att det nu är omöjligt att avgöra vad som kan bli viktig data i framtiden. Men att ha ambitionen att forskningsresultat ska kunna granskas utifrån underliggande data är centralt.

Forskarperspektivet måste få ta större utrymme i diskussionerna. Hur man kan skydda forskningsdata, som kan ses som en strategisk resurs, måste diskuteras. Även vem som ska finansiera mer omfattande dokumentering och preparering av data måste lösas, idag är det få som vill offra produktiv forskningstid på aktiviteter som inte belönas eller ses som meriter.

/Jonas Fransson

Oseriösa förlag och open access

Det senaste decenniet eller så har en ny typ av aktör dykt upp på den vetenskapliga tidskriftsmarknaden. Tidskrifter och förlag, ofta med namn, hemsidor och loggor som är förvirrande lika etablerade motsvarigheter, utlovar snabb publiceringsprocess, open access och stort genomslag för just din artikel till ett pris som inte alltid är så lätt att överblicka till en början. Vid närmare skärskådning visar sig dock att dessa aktörer är mer intresserade av att hösta in författarnas pengar än av att hålla hög vetenskaplig kvalitet, vilket ibland blir pinsamt uppenbart [1]. 

På engelska pratar man ofta om ”predatory publishers” eller ”predatory journals” och på svenska hör man ibland termen ”rovförlag” användas. Termen ”predatory publishers” introducerades av bibliotekarien Jefferey Beall som under många år listade ”possible and…. Predatory” på sin blog Scholarly OA. I januari i år släckte Beall ner sin blog. Bealls blog användes i många sammanhang, men fick också mycket kritik för att vara väl snabb att döma och Bealls incitament har ifrågasatts, inte minst sedan han publicerade en artikel där han lade fram konspirationsteoretiska teorier kring OA i stort [2]. Även om jag själv tycker att termen ”rovförlag” är problematisk har jag för enkelhets skull använt den i texten nedan. 

På senare år har man försökt att kartlägga vilka som publicerar sig i s.k. rovtidskrifter. Resultatet från dessa studier pekar på att problemet främst är utbrett bland unga, oerfarna forskare från Asien och Afrika i länder där det akademiska utvärderingssystemet värdesätter internationell publicering men utan kvalitetskontroll på de tidskrifter där de publicerar sig [3, 4]

Men även i västvärlden ökar kraven på forskare att publicera sig och även här finns problemet med rovtidskrifter och vi på biblioteket får en hel del frågor från forskare som vill ha hjälp att utvärdera kvaliteten på tidskrifter och förlag de funderar på att publicera sig hos och vi ser också (tyvärr) en del fall där forskare har publicerat sig hos förlag som vi vet har rykte om sig att inte hålla den kvalitet som de vill ge sken av på redaktörskap och granskningsprocess. 

Allt är förstås inte svart eller vitt, och det finns förstås utmärkta artiklar som är publicerade i dåliga tidskrifter, förlag med dåligt rykte som publicerar helt ok tidskrifter, och vice versa. Det är alltså inte helt lätt att avgöra vilken tidskrift som är ok och vilken som inte är det, inte minst då informationen på rovförlagens hemsidor ofta har som syfte att lura tilltänkta författare. En hälsosam dos källkritik då man tittar på hemsidorna är alltså att rekommendera. En grundregel är att erbjudanden som låter för bra för att vara sanna ofta är det (snabb publicering, grundlig kvalitetskontroll, låg kostnad och hög impact!). Det kan också till exempel vara en bra ide att kolla om de som uppges som editors faktiskt finns [5], och ifall de i så fall listar redaktörskapet på sina egna hemsidor. Det är nämligen inte helt ovanligt bland dessa förlag att lista forskare som redaktörer utan deras vetskap eller att helt enkelt hitta på redaktörer. En utförligare lista över saker att titta på finns på bibliotekets hemsida och du som är forskare eller doktorand på MAH är alltid välkommen att höra av dig till oss ifall det är något du undrar över. 

/Aron Lindhagen

[1] Stromberg, J. (2014, November 21) ”Get Me Off Your Fucking Mailing List” is an actual science paper accepted by a journal. Retrieved from https://www.vox.com/2014/11/21/7259207/scientific-paper-scam

[2] Beall, J. (2013) The Open-Access Movement is Not Really about Open Access. tripleC, 11(2), 589-597. http://triplec.at/index.php/tripleC/article/view/525

[3] Shen, C., & Björk, B.-C. (2015). “Predatory” open access: a longitudinal study of article volumes and market characteristics. BMC Medicine, 13, 230. http://doi.org/10.1186/s12916-015-0469-2

[4] Xia, J., Harmon, J. L., Connolly, K. G., Donnelly, R. M., Anderson, M. R. and Howard, H. A. (2015), Who publishes in “predatory” journals?. J Assn Inf Sci Tec, 66: 1406–1417. http://doi.org/10.1002/asi.23265

[5] Sorokowski, P., Kulczycki, E., Sorokowska, A. & Pisanski, K. ”Predatory Journals Recruit Fake Editor,” Nature 543 (March 2017): 481-483. http://doi.org/10.1038/543481a