Utskrift från Malmö högskolas webbplats www.mah.se

Forskningsdata

Vad är forskningsdata?

Begreppet forskningsdata saknar en entydig definition. Ibland används det för enbart insamlad och analyserad data (källmaterial, empiri), ibland för allt insamlat och skapat material i forskningsprocessen förutom publikationerna som presenterar forskningsresultat. I den breda betydelsen kan enskilda objekt som diagram eller tabeller ses som forskningsdata (och därmed spridas enskilt).

Vad som bör betraktas som forskningsdata är ämnes- och metodberoende. För somliga är begreppet helt naturligt, andra använder källmaterial eller empiri. En del samlar inte in material utan genererar data utifrån beräkningsmodeller, och då bör modellerna ses som forskningsdata då de är utgångspunkten för forskningsresultaten. I bred bemärkelse är data mer än det som samlas in, det kan också vara annan output från forskningsprocessen än rena publikationer, som enskilda illustrationer eller en presentation. Vilken forskningsdata som åsyftas är också otydligt i många sammanhang, det kan röra sig om rådata eller bearbetad data, eller bara det utval av data som ligger till grund för en forskningspublikation.

Öppen forskningsdata är en del av begreppet öppen data, där även t.ex. öppen myndighetsdata ingår. Öppen forskningsdata är också en av pelarna i öppen vetenskap (Open Science).

Varför tillgängliggöra forskningsdata?

Det finns olika argument att motivera att data ska eller bör tillgängliggöras. Vetenskapsrådet motiverar öppen tillgång till forskningsdata i sitt förslag till riktlinjer för öppen tillgång till vetenskaplig information som följer (ur VR:s Förslag till nationella riktlinjer för öppen tillgång till vetenskaplig information):

  • Forskning. Öppen tillgång till forskningsdata kan leda till nya forskningsmöjligheter, särskilt inom tvärvetenskapen. Med öppen tillgång till forskningsdata behöver experiment i vissa fall inte upprepas, utan tidigare resultat kan återanvändas. Data kan också användas inom nya forskningsfält och genom att kombinera olika datamängder kan forskare adressera nya frågeställningar. Vidare underlättas utvecklandet av nya analysmetoder om forskare har tillgång till experimentella data. För dataintensiv forskning (populärt kallat big data) där olika datakällor integreras för att se nya samband är det en förutsättning med tillgång till stora datamängder.
  • Citering. Forskare som återanvänder forskningsdata ska referera till den som ursprungligen tagit fram forskningsdata. Det kan ske genom referens till en publikation som beskriver data eller direkt till datamängden. Öppen tillgång till forskningsdata kan därmed leda till ökat antal citeringar, vilket då blir meriterande för forskargruppen som producerat den. Även flera betydelsefulla tidskrifter ställer kravet på att tillgängliggöra forskningsdata, exempelvis PLOSOne och BioMed Central (förlag). 
  • Demokrati och transparens. Forskningsresultat bekostade av offentliga medel bör av princip vara tillgängliga för medborgarna. Tillgång till de data som använts för att påvisa ett resultat som presenteras i till exempel en artikel är nödvändig för att kontrollera att slutsatserna stämmer.
  • Innovation och användning utanför forskningen. Lättillgänglig data har också potential att kunna användas utanför forskarsamhället till exempel av företag, privatpersoner och andra myndigheter.

Argumentationen är en i dagsläget till stor del baserad på den politiska inriktiningen mot öppen vetenskap och drivs främst uppifrån. Utvecklingen drivs också av Big Data-trenden där stora datamängder analyseras efter mönster. Formellt sett är det ännu ingen merit att öppet tillgängliggöra forskningsdata varken på Malmö högskola eller nationellt sett. Men det finns vinster för enskilda forskare och forskargrupper, olika incitament är:

  • Direkt nytta
    • för forskningen självt (mer robust)
    • för forskarens karriär (erkännande)
    • för disciplinen (bli klokare)
    • för vetenskapen (bättre vetenskap)
  • Normer i projektet, forskargrupper och/eller disciplinen
  • Yttre drivkrafter: policies och förväntningar från forskningsfinansiärer och förlag

Se rapporten Sowing the seed: Incentives and motivations for sharing research data, a researcher’s perspective (pdf) för en diskussion kring de olika incitamenten baserat på de undersöka forskningsprojekten.

Enkätundersökning

Tillgängliggörande av forskningsdata är komplext. Inte minst eftersom de data som ska tillgängliggöras bygger på forskning som av naturen är komplex. Enkätsvaren i den undersökning som biblioteket genomförde november 2015 visar på den stora bredd som finns vid högskolan avseende insamlingsmetoder för data och typer av data som samlas in. Resultaten visar också att en relativt stor andel av respondenterna har använt öppen eller delad data, liksom att många har delat med sig av forskningsdata och då främst informellt. Det råder en viss begreppsförvirring, kring tillgängliggörande kontra arkivering och kring data kontra publikationer. Men också kring vad forskningsdata är för olika forskare. 

Tillgängliggörande, arkivering och datahanteringsplaner

Tillgängliggörande och arkivering av forskningsdata är två likartade, men skilda processer. I vissa fall kan arkiverad data tillgängliggöras rakt av, till exempeldata från viss naturvetenskaplig forskning, medan i andra fall kan data behöva anonymiseras eller på annat sätt anpassas. Alla data kanske inte lämpar sig för tillgängliggörande. Datahanteringsplaner kan vara ett centralt redskap, både före, under och efter avslutat forskningsprojekt. Väl kurerad data är lättare att arkivera och tillgängliggöra. Vad krävs för att data ska bli användbar för andra? Ett svar är att en långsiktighet krävs och att resurser för datahantering behöver inkluderas i ansökningar och projektplaner.

Se Tillgängliggöra forskningsdata för mer information om praktisk tillgängliggörande.

Senast uppdaterad av Jonas Fransson