LÄGESRAPPORT VR - Registerforskning - Öppen tillgång till forskningsdata - Bedömningskriterer för FAIR - Magnus Eriksson, Verksamhetsarkitekt Karl Gertow, Forskningssekreterare
Vetenskapsrådets uppdrag Ur Vetenskapsrådets regleringsbrev för budgetåret 2013 Infrastruktur för registerbaserad forskning Vetenskapsrådet ska inom myndigheten bygga upp en verksamhet för att förbättra tillgängligheten till och underlätta användningen av registeruppgifter för forskningsändamål. Vetenskapsrådet ska bistå forskare med information om register och om relevant lagstiftning. Registerdata för forskning (SOU 2012:36)
Arbetet med uppdraget Projektet Infrastruktur för registerbaserad forskning Projektets tre delar Inrättande av ett registerdataråd Tillhandahållande av informations-, rådgivnings- och utbildningsfunktion för registerforskning Förbättrad tillgänglighet till register för forskningsändamål genom samordning av data Ny enhet inrättad på myndigheten från juni 2015
Registerdatarådet 2017- Organisation Expertis / Roll Funktion Namn Vetenskapsrådet Ordförande Generaldirektör Sven Stafström Medlemmar Statistiska Centralbyrån Dataägare Generaldirektör Joakim Stymne Socialstyrelsen Dataägare Generaldirektör Olivia Wigzell Sveriges Kommuner och Landsting/ De nationella kvalitetsregistren Dataägare Forskningsstrateg Nationella Kvalitetsregister Jack Lysholm Centrala Etik och juridik Ordförande Karin Almgren Etikprövningsnämnden Universiteten Forskning En rektor utsedd av SUHF Eva Åkesson Datainspektionen Tillsynsmyndighet Generaldirektör Ny GD från 1 mars Lena Lindgren Schelin Biobanker Forskning Biobank Sverige Sonja Eaker Fält Mats G. Karlsson Registerforskare inom samhällsvetenskap Registerforskare inom hälsa/epidemiologi Forskning Professor Rune Åberg Forskning Professor Kjell Asplund SND Arkiv/dokumentation Styrelseordförande Anders Brändström FORTE Forskningsråd Huvudsekreterare Peter Allebeck
Identifierade tidstjuvar Definier a & formuler a Ansökning & utlämnand e Analysera & uppdatera Publicera & avsluta Formulera forskningsfrågan Bestäm studiedesign och definiera population Identifiera data för att besvara forskningsfrågan Ansökan etikprövning Begär uppgifter från registerhållare Utlämnande & Integration Reducera tiden för att förstå variablernas betydelse och representation Reducera tiden för kommunikation med registerhållare innan utlämnande
Begrepp Betydelse Historik Populationer METADATA Värdemängder Kodlistor - Historik Variabler Källor Historik Etisk prövning Skadeprövning Utlämnande Arlanda 97232 19 0122 12-68-98-245 Ja 242,19 D 241.22.34.56 DATA M K -9 975.50 75-985 Göteborg A 12-68-98-245 55690.52 SEPARERAT
Register Utiliser Tool Ett verktyg för att hitta, utvärdera och återanvända variabler i register och biobanker
HITTA VARIABLER I RUT Via populationerna som har variabeln o Begrepp som definierar populationer o Tid och geografi Via variablernas innebörd inte bara namn o Begrepp som definierar variabler o Närliggande begrepp Via representation o Kodlistor som variablerna använder o Beskrivna värdemängder F A I R
F A I FÖR ATT UPPNÅ DETTA Beskriver vi register och provsamlingar i biobanker med rik semantik och metadata. Vi gör detta metadata sökbart i en nationell infrastruktur. Tilldelar identifierare till allt inläst metadata. o Kommer att ersätta URI med standardiserad identifierare, tex DOI. R
TILLGÄNGLIGGÖRA Vi tillgängliggör beskrivningarna av registers och biobankers innehåll i en nationell infrastruktur separerat från det data som beskrivs. F A Vi tillgängliggör variablers och populationers innebörd i ett verksamhetssammanhang Vi möjliggör ett uttag av metadata som kan användas för att kommunicera behov inför utlämnande. I R
F A I R FÖR ATT UPPNÅ DETTA Separerar vi metadata från data så att metadata och semantik är tillgängligt även om tillgång till data inte är möjligt. Möjliggör vi ett successivt mer detaljerat urval för att förstå, bedöma och välja variabler. Detta för att hantera den underliggande komplexiteten. Tillgängliggör vi länk mellan infrastrukturens tilldelade identifierare och registrens egna interna identifierare.
INTEROPERABILITET Vi tillhandahåller det metadata och den semantik som efterfrågats för att kunna analysera harmoniseringsmöjligheter mellan register. F A Vi beskriver detta på ett standardiserat sätt. Vi harmoniserar inte mellan datakällor men förespråkar registerhållarnas användning av standardiserade terminologier samt klassifikationer när detta är möjligt. I R
F A I R FÖR ATT UPPNÅ DETTA Har vi samlat in krav på vilket metadata forskare behöver för att bedöma en registervariabels harmoniseringsmöjligheter till en studievariabel. Använder vi det standardiserade ramverket GSIM för att beskriva statistiskt metadata och möta behov från olika typer av registerhållare inom olika domäner. Arbetar vi tillsammans med och utbildar registerhållare i hur de ska gå tillväga för att beskriva sina variabler och sina begreppssystem för att uppnå interoperabilitet.
ÅTERANVÄNDBARHET Vi vill ge forskare möjligheten att återanvända metadata som beskriver variabler selekterade i RUT. Vi vill ge forskarna möjlighet att uttrycka rikt metadata för att beskriva studiedatats ursprung och ta del av andra studiers publicerade metadata kring ursprung. Vi vill underlätta för forskare som uttryckt behov av att registerhållare förbättrar reproducerbarhet vid datauttag från källor. F A I R
F A FÖR ATT UPPNÅ DETTA Vidareutvecklar vi RUT och kompletterar befintlig funktionalitet med möjligheten att beskriva och dela metadata kring ursprung i en forskaryta. I R Vi använder W3C Prov för detta Provenance is information about entities, activities, and people involved in producing a piece of data or thing, which can be used to form assessments about its quality, reliability or trustworthiness. (https://www.w3.org/tr/prov-overview/)
STATUS BEFINTLIG RUT RUT Analys körs i betaversion av 250+ användare idag o o o o o Sök ny version Metadata populationer, variabler och historik Metadata begreppssystem/terminologi Metadata representation, kodlistor, klassifikationer och historik Funktioner för urval av variabler till listor för export I RUT Analys (användargränssnittet för forskare) genomförs löpande utvecklingsaktiviteter för att förenkla användningen tillsammans med forskarreferensgrupp. IDAG
STATUS UTVECKLING RUT Management (användargränssnittet för att administrera metadata) Utvecklingen pågår och version 1 kommer vara klar under hösten 2018 RUT Forskaryta Metadata och semantik för variabler återanvändning av komponenter i nytt usecase. Funktioner för att stödja rikt metadata kring ursprung är under utveckling. Version 1 kommer vara klar under hösten 2018 UTVECKLING
RUT Forskaryta Nästa komponent för att stödja forskaren i processen Metadata studievariabler Metadata källvariabler RUT - MAN Provenance FORSKARYTA Meta - Datahanteringsplan Semantik Population Variabler Värdemängder Export - DDI4 - RDF - mm SÖK UTVÄRDERA - URVAL KOMPONENTER
METADATA STATUS INNEHÅLL Innehåller kvalitetssäkrad metadata från ett antal register o Statistiska centralbyrån (RTB, UTB) o Kvalitetsregistren (DIABETES, RIKSSTROKE, HAKIR) o Provsamlingar från Uppsala Biobank Snart tillgängligt o Socialstyrelsen (Dödsorsak, Läkemedelsregistret) o Kvalitetsregistret Reuma Pågående eller på gång o Inkomst och taxeringsregistret o Lifegene o Provsamlingar från KI Biobank o Svenska intensivvårdsregistret o SWEDEHEART
METADATA STATUS INNEHÅLL Process för att kurera data framtagen, testad på ett antal register samt vidareutvecklad löpande. Utbildningsmaterial för att registerhållare självständigt ska kurera data testat och vidareutvecklas.
Regfo.se och RUT Ärendehanteringssystem Validerade forskningsmiljöer & myndighetssystem RUT Formulera forskningsfråga Etik - prövning Skade - prövning Nyckelhantering & bearbetning Utlämnande Dokumentation VISION
Samordningsuppdraget Öppen tillgång till forskningsdata FORSKNINGSPROPOSITION 2016 Vetenskapsrådet bör ges ett nationellt samordningsansvar för fortsatt arbete rörande öppen tillgång till forskningsdata, dvs. data som tas fram i ett vetenskapligt syfte REGLERINGSBREV 2017 Vetenskapsrådet ska samordna det nationella arbetet med att införa öppen tillgång till forskningsdata. Vid genomförandet av uppdraget ska Vetenskapsrådet samråda med Kungliga biblioteket, universitet och högskolor samt Riksarkivet
Öppen tillgång till forskningsdata måste beakta hela data-livscykeln Återanvända data Datahanteringsplan! Generera och samla data Bearbeta data Principer för Öppen tillgång till forskningsdata Findable Accessible Interoperable Re-usable Sprida och tillgängliggöra data Bevara/arkivera data Analysera data För att uppnå FAIR krävs bl.a. - Incitament - Infrastruktur - Kompetens/roller Adapted from data archive UK
Många aktiviteter/aktörer bidrar till FAIR Exempel från nationell forskningsinfrastruktur (RI) och UoH SUNET SND, Tilda (SLU), SciLifeLab Data Centre RI RUT SND, Tilda (SLU) RI SND m fl Forskningsfinansiärer SKAPA ANALYSERA PUBLICERA REPRODUCERA FAIR SUNET m fl SND Tilda (SLU) SciLifeLab Data Centre MONA (SCB) RI Nationella och internationella aktörer behöver samverka RUT SND, Tilda (SLU), SciLifeLab Data Centre RI SND: Svensk Nationell Datatjänst RI: research (data) infrastructure
Nationella uppdrags-/arbetsgrupper och korsbefruktning däremellan - Befintliga kopplingar och nya inom ramen för VRs uppdrag SUHF (UoH) Samordningsgrupp Open Science Nationell arbetsgrupp för forskningsdata Lärosätenas infrastrukturreferensgrupp (URFI) VR Öppna forskningsdata Båda OA-uppdragen KB Öppna publikationer Riksarkivet Öppna myndighetsdata (PSI) Riksantikvarieämbetet Styrgrupp Digisam (kulturarv)
Öppen tillgång till forskningsdata i EU Nu default i Horizon 2020 European Open Science Cloud Opt-out möjlig: As open as possible, as closed as necessary https://ec.europa.eu/research/press/2016/pdf/opendat a-infographic_072016.pdf Realising the EOSC, EC High-level expert group on EOSC
Samordning Arbetet med samordningsuppdraget Bidra till och facilitera en konstruktiv diskussion om datahantering och tillgängliggörande av forskningsdata i enlighet med FAIR VR ska vara policydrivande i frågor som rör Öppen tillgång till forskningsdata, t ex när det gäller att ta fram riktlinjer och skapa incitament VR:s arbete ska fokusera på hela datahanteringscykeln och innebär således dialog med aktörer involverade i alla steg (dokumentation, lagring, tillgängliggörande osv) VRs arbete utförs både nationellt och internationellt (t.ex. EOSC, Science Europe) Arbetet ska ske i nära samverkan med forskningen (t. ex. via referensgrupp) Styrning Styrning genom utlysningstexter och bidragsvillkor inkl. rapportering (projekt/infrastrukturer), exempelvis diskuteras införande av krav på datahanteringsplaner Efterfråga planering och budget för datahantering/tillgängliggörande av data i de kommittér/styrelser vi deltar i
Status/Aktuellt Referensgrupp (extern) Datahanteringsplaner Regeringsuppdrag om bedömningskriterier för FAIR Nordisk Open Science-konferens hösten 2018 Utlysning: Digitalisering och tillgängliggörande av kulturarvssamlingar, våren 2018
Referensgrupp (prel.) Representanter från/nominerade av: Kungliga biblioteket Riksarkivet SUHF:s grupp för samordning av öppen vetenskap/nationella arbetsgrupp för forskningsdata Kungliga Vetenskapsakademien (2 st forskare) Sveriges Unga Akademi (2 st forskare) Svensk Nationell Datatjänst (SND) Formas Forte Vinnova
Datahanteringsplan (DHP) - exempel på samordningsaktivitet Dokument som beskriver hur datamaterialet ska hanteras under forskningsprojektet och vad som ska ske med det efteråt. DHP är en nyckelkomponent i FAIR och en grundsten i god datahantering Krävs idag av flera forskningsfinansiärer (ffa internationellt) Flertalet mallar och online-verktyg finns internationellt Bör inte vara för betungande, och nyttan för forskaren och forskningen bör lyftas fram what s in it for me DHP på VR VR måste ta ställning till om/hur DHP ska tas in, bedömas och följas upp Samordning mellan nationella (och internationella) finansiärer behövs för att underlätta för forskare. Deltar aktivt i harmoniseringsaktiviteter inom Science Europe
Regeringsuppdrag i december 2017 Kriterier för att bedöma utvecklingen mot ett öppet vetenskapssystem Vetenskapsrådet: att ta fram kriterier för att kunna bedöma i vilken utsträckning forskningsdata som helt eller delvis tagits fram med offentlig finansiering uppfyller FAIR-principerna. Slutredovisas 1 dec 2018. Kungliga biblioteket: att ta fram kriterier för att kunna bedöma i vilken utsträckning vetenskapliga publikationer som helt eller delvis tagits fram med offentlig finansiering uppfyller FAIR-principerna. Kriterierna ska möjliggöra en bedömning av om vetenskapliga publikationer uppfyller det nationella målet om att bli öppet tillgängliga direkt då de publiceras. Kungliga biblioteket ska utifrån de bedömningskriterier som tas fram också föreslå en metod som ska kunna visa en samlad bild av i vilken utsträckning vetenskapliga publikationer och forskningsdata uppfyller FAIR-principerna. Slutredovisas 28 feb 2019. VR och KB ska samråda sinsemellan, och ta hänsyn till att olika ämnesområden har olika förutsättningar, samt inhämta synpunkter från UoH via SUHF.
Findable Accessible Interoperable Re-useable FAIR: Principer för öppen tillgång till forskningsdata - möjliga att hitta/identifiera, registrerade i sökbar resurs - tillskrivna unika persistenta identifierare - beskrivna med utförlig metadata - data/metadata tillgängliga tex via deponering i repositorium - restriktioner och auktoriseringsprocedurer när nödvändigt - efterlever standarder (dataformat, ontologier, osv) - brett användbara ej kommersiellt inlåsta filformat - licenser som tillåter bred återanvändning - data/metadata uppfyller relevanta krav FAIR som 15 tekniskt rotade krav för att möjliggöra maskinläsbarhet
FAIR: Principer för öppen tillgång till forskningsdata FindableAccessibleInteroperable Reusable FAIR som ledord
Bedömningskriterier FAIR - internationella initiativ Initiativ pågår för att operationalisera FAIR-kriterierna och automatiskt/maskinellt eller manuellt bedöma datas FAIRness H2020 Commission expert group on Turning FAIR data into reality Har i uppgift att bl a Propose indicators to measure progress on each of the FAIR components Formulärbaserade verktyg Data Archiving and Networked Services (DANS) (NL) Commonwealth Scientific and Industrial Research Organisation (CSIRO) (AU) FAIRmetrics.org Initiativ för att ta fram kriterier/metoder för automatiserad/maskinell bedömning
Nationella uppdrags-/arbetsgrupper och korsbefruktning däremellan - Befintliga kopplingar och nya inom ramen för VRs uppdrag SUHF (UoH) Samordningsgrupp Open Science Nationell arbetsgrupp för forskningsdata Lärosätenas infrastrukturreferensgrupp (URFI) Tilltänkt SUHFkontakt för FAIRuppdraget VR Öppna forskningsdata Båda OA-uppdragen KB Öppna publikationer Riksarkivet Öppna myndighetsdata (PSI) Riksantikvarieämbetet Styrgrupp Digisam (kulturarv)
registerforskning@vr.se magnus.eriksson@vr.se Karl.Gertow@vr.se