Ordning och reda – även bland forskningsdata

Den europeiska och svenska politiska framtidsvisionen för forskning sammanfaller till stor del. Begreppet ”öppen vetenskap” brukar användas i detta sammanhang. Bland annat utgör tillgängliggörande av forskningsdata en grundsten i denna vision. Digitaliseringen inom forskningen underlättar denna omställningsprocess och ger helt andra möjligheter nu än tidigare. Forskningspolitiskt är läget i Sverige beträffande forskningsdata följande:

”En del i den utvecklingen är att forskningsresultat, både i form av vetenskapliga publikationer och forskningsdata, i allt högre grad är digitala och förväntas vara öppet tillgängliga. Detta gynnar framgångsrik forskning, innovation och utveckling av den offentliga sektorn. Genom att forskningsresultat finns öppet tillgängliga kan dessa återanvändas för nya ändamål, givetvis med beaktande av gällande lagstiftning. På så vis används forskningsmedlen mer effektivt och ger en högre utväxling för samhället.”

”… anser regeringen att forskningsresultat, som forskningsdata och vetenskapliga publikationer, som tas fram med offentlig finansiering bör vara öppet tillgängliga så långt det är möjligt. Samhället investerar många miljarder kronor i offentligt finansierad forskning och genom att forskningsresultaten görs öppet tillgängliga säkerställs att den offentliga forskningsfinansieringen används så effektivt som möjligt. För vissa typer av forskningsdata finns dock behov av att begränsa öppenheten för att skydda den personliga integriteten, rikets säkerhet och liknande. För forskning som har innovationspotential kan det finnas behov av att begränsa öppenheten av immaterialrättsliga skäl. Det är dock ett viktigt ställningstagande att öppen tillgång utgör normen och att inskränkningar i öppenheten utgör undantagen.” (Ur forskningspropositionen Kunskap i samverkan – för samhällets utmaningar och stärkt konkurrenskraft; 2016)

Naturligtvis uppstår frågan om på vilket sätt som detta tillgängliggörande ska åstadkommas inom de närmaste fem−tio åren. Tillgängliggörandet av vetenskapliga publikationers forskningsresultat genom open access ingår, som vi ser, visserligen också i ”öppen vetenskap”, men den typen av informationsdelning kan anses som en förhållandevis etablerad form – även om förlagsbranschen (och kanske även vissa delar av akademin) under de närmaste åren säkerligen kommer att föreslå en rad alternativ som inte alltid kan rubriceras som fritt tillgängliga. Tillgängliggörandet av forskningsdata ser däremot ut att tillhöra en av de stora framtida forskningsfrågorna. För många forskare kommer den vardagliga verksamheten att påverkas i mycket större utsträckning beträffande forskningsdata jämfört med hur open access-publicering berör forskningsarbetet.

Vägen till fritt tillgängliggörande av forskningsdata är lång för många (medan den redan är en realitet i en del forskningskretsar), men egentligen borde just enbart tillgängliggörandet vara nyhet. För när det gäller att hantera forskningsdata på ett ansvarsfullt sätt, kan sådan hantering betraktas att ingå i gängse god forskningssed (de samlade etiska kraven på hur god forskning bör bedrivas). Till detta kommer att redaktionerna för vetenskapliga tidskrifter i allt högre grad visar befogat intresse av att ta del av de forskningsdata som ligger till grund för forskningsresultaten för att kontrollera att de överensstämmer med varandra. Oavsett tidskriftskraven, gäller det att ha ordning på forskningsdatan, såsom versionshantering, meta-taggning och en säker back-up.

Att ta in i bilden är konsekvensen av att inte kunna uppvisa de data som en forskningsrapport bygger på. En sådan brist skulle kunna vara tillräckligt för att bedömas som oredlighet i forskning, alltså en allvarlig avvikelse från god forskningssed. Situationer som denna, bör naturligtvis undvikas till varje pris.

Det är möjligt att de kommande förändringar som ökade krav på tillgänglighet till forskningsdata medför agerar som en sorts katalysator i sammanhanget, för när forskningsdata ska tillgängliggöras, krävs att datan som ska förmedlas är i ordnat skick. Ordnad data blir så att säga en nödvändig, men inte tillräcklig, förutsättning för tillgängliggörandet – det måste också finnas ett användargränssnitt. Och, som sagt, med tanke på god sed i forskning har det nödvändiga villkoret gällt sedan lång tid tillbaka.

Samtidigt som medvetenheten om dessa frågor måste få fäste i alla delar av akademin, måste också det infrastrukturella stödet för hantering av forskningsdata byggas ut. I Forskningsbloggen ”Öppen vetenskap – möjligheter och utmaningar” nämns att Svensk Nationell Datatjänst kan komma att få ansvar för den nationella samordningen av denna infrastrukturuppbyggnad. I stort sett medverkar alla svenska lärosäten på ett eller annat sätt i denna satsning. Men det blir en rejäl utmaning att nå ut med nyordningen beträffande tillgängliggörande av forskningsdata till alla forskare i landet och ställvis kan uppfattningen om ägandeskapet också behöva ändras från ”privat egendom” till ”allmängods”. Till sist kan också poängteras att ökad tillgänglighet naturligtvis måste åstadkommas enligt gällande lagstiftning beträffande individdata och sekretess.

Forskningens genomslag utanför akademin

Om det hade varit en enkel match att på ett entydigt och transparent sätt en gång för alla mäta forskningens genomslag (impact) utanför akademin, hade ett sådant system förstås redan varit på plats. Svenska försök har naturligtvis gjorts, nu senast av Vinnova, vars Mårten Berg inledde ett seminarium – anordnat av SUHF:s Forum för bibliotekschefers arbetsgrupp för bibliometri – som handlade om just forskningens genomslag utanför akademin. Som bekant har Vinnova fått i uppdrag av regeringen att föreslå metoder och kriterier för bedömning av prestation och kvalitet i lärosätenas samverkan med omgivande samhälle. Förslaget var på remiss under våren 2017 men remissinstanserna har, med ett par undantag, inte varit nådiga (se till exempel Fortes och Kungliga Vetenskapsakademins svar) vilket innebär att förslaget knappast kommer att omsättas i praktik – i alla fall inte i föreliggande form.

Eftersom regeringens ambition, som visades i den senaste forskningspropositionen, är att samverkan ska vara det tredje och tillkommande underlaget (förutom externa medel och bibliometri) till fördelning av en viss del av basanslaget för forskning mellan landets lärosäten, blir det intressant att följa hur detta ska åstadkommas i höstens budgetproposition. En repris av Vinnovas pilot-studie är utesluten, inte bara med tanke på remissyttrandena, utan också på grund av de knappa tidsmarginalerna. Grundtipset är att de betyg som lärosätena på ett eller annat sätt fick i Vinnovas pilotstudie, skalas för att beskriva lärosätets storlek (hur denna nu avgörs) och att dessa betyg därefter återanvänds i tilldelningen av basanslag för forskning för 2018 i väntan på att utredningen om ett långsiktigt fördelningssystem blir klar enligt plan i december 2018.

Samtidigt kommer Universitetskanslersämbetet att få ansvar för utvärdering av såväl högre utbildning som av forskning, vilket rimligtvis borde innebära att Universitetskanslersämbetet i en sådan utvärdering inbegriper utbildningens respektive forskningens samverkansaspekter. Det är inte det lättaste, eftersom typen av samverkan varierar betydligt mellan olika forsknings- och utbildningsinriktningar. Det var därför en lättnad att Vinnova vid seminariet deklarerade att de inte (längre?) har ambition att vara en granskningsmyndighet, utan de ska inspirera lärosätenas samverkan på andra sätt.

Annars handlade stora delar av seminariet om olika aspekter av ”altmetrics”, det vill säga alternativa vägar att mäta forskningens genomslag. Altmetrics är därför menat som ett komplement till den traditionella citeringsbaserade bibliometrin – som ju beskriver genomslaget inom akademin. Avsikten med altmetrics är därför bland annat att även inkludera forskningsgenomslaget utanför akademin, främst genom att använda sociala mediers trafikregistrering. Med tanke på de ambitioner som finns bland annat från politiskt håll, både inom EU och på nationell nivå, att ”öppna upp” vetenskapen (genom bland annat öppen tillgång till vetenskapliga publikationer och forskningsdata), är konceptet med altmetrics i linje med en sådan strävan.

Traditionell bibliometri dras visserligen med sina skavanker, medan altmetrics får säga ännu befinna sig i sin linda (även om vissa har anledning att framhålla dess fördelar). Därmed inbjuder detta nya sätt att mäta med utsträckta armar till olika typer av forskningsinsatser, vilka verkar ha tagit fart på allvar under senaste år.

Altmetrics’ främsta problem i nuvarande tappning verkar vara dess till stora delar avsaknad av en tydlig koppling till kvalitet, vilket begränsar användningen om kvalitetsaspekter ska inbegripas. Och det är fullt rimligt att ta hänsyn till sådana. En god uppkoppling gentemot världen utanför akademin är visserligen önskvärd men om forskningsresultaten som förmedlas saknar substans, blir resultaten inte bättre av att fler delar dem. Korrelationen mellan citeringar och olika former av altmetrics förefaller svag, se Costas et al. Av skilda anledningar kan vissa iögonfallande, men kanske inte så viktiga, forskningsresultat därför få oproportionerlig stor spridning i sociala media. ”Crowd pleasers” förekommer ju inte bara i föreläsningssammanhang och bilder på gulliga kattungar tillhör de väl som delas mest på nätet.

Till saken hör också att sociala mediers användning är lätt att logga, men resultatet svårt att tyda. Ibland verkar det som om att bara för att det är lätt att mäta så är detta mätresultat betydelsefullt. Så behöver det naturligtvis inte vara. Resonemanget påminner om att leta efter nyckeln enbart under gatlyktans sken. Dessutom är förändringhastigheten hög inom sociala medier och homogena mätserier kan vara svåra att upprätta. Vem vet om, det i altmetrics ofta använda, Twitter överhuvudtaget finns om fem år? Det finns för närvarande sålunda all anledning till att anta en skeptisk attityd i frågan.

Om inte annat, så visade seminariet att komplexiteten och svårigheten i att mäta forskningsresultats genomslag utanför akademin var betydligt större än inom akademin (även om gängse bibliometri långt ifrån är oomtvistad). Sannolikt är högskolesektorn på väg in i en tidsperiod där olika former av altmetrics kommer att prövas och sållas bort efterhand. Det är kanske först när mer robusta former för altmetrics letat sig in i det akademiska meriteringssystemet vi kan räkna med att dessa börjar tas på större allvar. Som ett steg på denna väg, vore det intressant om ytterligare metoder testas för att sammanväga enskilda vetenskapliga publikationers genomslag inom akademin med samma publikations genomslag utanför akademin. Det finns kanske studier som lyckats med att isolera publikationer (svårigheten att knyta spridningen på sociala medier till enskild publikation ska inte underskattas) och gjort en sådan sammanvägning. Men jag har inte har sett några sådana övertygande studier och blir därför glatt överraskad om någon som har gjort det hör av sig.

En talande bild som Kim Holmberg från Turku universitet avslutade sin presentation med: