REGISTERUPPDRAGET RUT SÅ FUNGERAR DET Magnus Eriksson, Verksamhetsarkitekt Enheten för registerforskning, Vetenskapsrådet
Dagens agenda Registerforskningsuppdraget RUT Bakgrund Vårt samarbete med registren RUT så fungerar det Hur fungerar sökfunktionen idag Semantik & Interoperabilitet Urval och urvalslistor Hantering av kodlistor Historikhantering och tid i RUT
REGISTERFORSKNINGSUPPDRAGET
Vetenskapsrådets uppdrag kopplat till registerbaserad forskning Förbättra tillgängligheten till och underlätta användningen av registeruppgifter för forskningsändamål. bistå forskare med information om register och relevant lagstiftning Registerdata för forskning (SOU 2012:36) Inskrivet i Vetenskapsrådets instruktion Enheten för Registerforskning
Arbetet med uppdraget Projektet Infrastruktur för registerbaserad forskning Projektets tre delar Inrättande av ett registerdataråd Tillhandahållande av informations-, rådgivnings- och utbildningsfunktion för registerforskning Förbättrad tillgänglighet till register för forskningsändamål genom samordning av data Ny enhet inrättad på myndigheten från juni 2015
Registerdatarådet 2017 Organisation Expertis / Roll Funktion Namn Vetenskapsrådet Ordförande Generaldirektör Sven Stafström Medlemmar Statistiska Centralbyrån Dataägare Generaldirektör Joakim Stymne Socialstyrelsen Dataägare Generaldirektör Olivia Wigzell Sveriges Kommuner och Landsting/ De nationella kvalitetsregistren Dataägare Forskningsstrateg Nationella Kvalitetsregister Jack Lysholm Centrala Etikprövningsnämnden Etik och juridik Ordförande Karin Almgren Universiteten Forskning En rektor utsedd av SUHF Eva Åkesson Datainspektionen Tillsynsmyndighet Generaldirektör Ny GD från 1 mars Lena Lindgren Schelin Biobanker Forskning Biobank Sverige Sonja Eaker Fält Mats G. Karlsson Registerforskare inom samhällsvetenskap Registerforskare inom hälsa/epidemiologi Forskning Professor Rune Åberg Forskning Professor Kjell Asplund SND Arkiv/dokumentation Styrelseordförande Anders Brändström FORTE Forskningsråd Huvudsekreterare Peter Allebeck
Registerforskning.se Information om register, lagar mm Engelsk version på G Steg-försteg guide
Steg-för-steg
VISION Regfo.se och RUT Ärendehanteringssystem Validerade forskningsmiljöer & myndighetssystem RUT Formulera forskningsfråga Etik - prövning Skade - prövning Nyckelhantering & bearbetning Utlämnande Dokumentation
RUT BAKGRUND
RUT Vision Öka värdet på svenska register, forskningsdatabaser, provsamlingar och forskningsdataset genom en infrastruktur för att tillgängliggöra kunskap om datakällornas innehåll samt hur det skapats via metadata och semantik samt möjliggöra återanvändning av denna kunskap genom forskningsprocessen
RUT Målsättningar Att göra innehåll i register och forskningsdatabaser sökbart över domängränser Att effektivisera delning av kunskap om innehållet över domängränser Att tillgängliggöra innehållets ursprung, dvs vilka resurser, aktiviteter och aktörer som har varit en del av processen som skapade det
Stöd tidigt i processen Definiera & formulera Ansökning & utlämnande Analysera & uppdatera Publicera & avsluta Formulera Bestäm forskningsfrågan studiedesign och definiera population Identifiera data för att besvara forskningsfrågan Ansökan etikprövning Begär uppgifter från registerhållare Utlämnande & Integration Reducera tiden för att förstå variablernas betydelse och representation Reducera tiden för kommunikation med registerhållare innan utlämnande
Begrepp Betydelse Historik Populationer METADATA Värdemängder Kodlistor - Historik Variabler Källor Historik Etisk prövning Skadeprövning Utlämnande Arlanda 97232 19 0122 12-68-98-245 Ja 242,19 D 241.22.34.56 DATA M K -9 975.50 75-985 Göteborg A 12-68-98-245 55690.52 SEPARERAT
Vilken typ av metadata Dataset Populationer Variabler Historik Begrepp Begreppssystem Kontext Terminologier/ Ontologier Struktur Betydelse Representation Referentiellt Klassifikationer Kodlistor Versionshantering Historik Ursprung Aktiviteter Metod Källor Verktyg
Forskaren kan identifiera intressanta variabler från ett eller flera register och få information om: variablers betydelse, definition, värdemängd historik RUT mervärde för både forskare och registerhållare populationer Insamlingscykler Bli testpilot för RUT! Registerforskning.se Forskaren kan göra mer precisa beställningar Registerhållaren får ökad kvalitet på sin metadata metadata enligt en internationell standard verktyg för att underhålla och ansluta metadata
RUT för forskaren RUT Analys körs i betaversion av 250+ användare idag o Ny version o Metadata populationer, variabler och historik o Metadata begreppssystem/terminologi o Metadata representation, kodlistor, klassifikationer och historik o Funktioner för urval av variabler till listor för export I RUT Analys (användargränssnittet för forskare) genomförs löpande utvecklingsaktiviteter för att förenkla användningen tillsammans med forskarreferensgrupp. IDAG
STATUS UTVECKLING RUT Management (användargränssnittet för att administrera metadata) Utvecklingen pågår och version 1 kommer vara klar under hösten 2018 RUT Forskaryta Metadata och semantik för variabler återanvändning av komponenter i nytt use-case. Funktioner för att stödja rikt metadata kring proveniens är under utveckling. UTVECKLING
STATUS INNEHÅLL Inläst kvalitetssäkrad metadata o o o o o o o o o o Registret över totalbefolkningen (SCB) Utbildningsregistret (SCB) Nationella Diabetesregistret Nationella kvalitetsregistret för Stroke Nationella kvalitetsregistret för Handkirurgi Uppsala/Umeå Comprehensive Cancer Consortium Provsamlingar (UBB) Swedeheart Provsamlingar (UBB) Dödsorsaksregistret (Socialstyrelsen) Läkemedelsregistret (Socialstyrelsen) Nationella kvalitetsregistret för Reumatologi Pågående o o o o o o o o o o o Inkomst och taxeringsregistret Lifegene Provsamlingar från KI Biobank Svenska intensivvårdsregistret Svenska Palliativregistret Nationellt kvalitetsregister för hjärtintensivvård Nationellt kvalitetsregister för kärlkirurgi Nationellt kvalitetsregister för ljumskbråcksoperationer Nationellt kvalitetsregister inom gynekologisk kirurgi Yrkesregistret (SCB) Geografidatabasen (SCB)
VÅRT SAMARBETE MED REGISTREN
Process Godkännande av innehåll 1 UPPSTART 2 3 4 5 ANALYS & ANALYS & BEGREPPSYSTEM STRUKTURELLMODELL 1. Dataanalys & Modellering 2. Workshop Struktur- och Informationsmodell 3. Revidering Strukturellmodell 1. Analys av domänbegrepp 2. Modellering begreppsmodell 3. Workshop Begreppsmodell 4. Revidering Begreppsmodell INLÄSNING, VALIDERING & GRANSKNING 1. Inläsning/Komplettering 2. Validering kvalitet PUBLICERING Management Management Management Management Metod Metod Metod
Synergier RUT Process Ibland parallell kvalitetsutvecklingsprocess
En introduktion till några av funktionerna RUT SÅ FUNGERAR DET
HUR FUNGERAR SÖKFUNKTIONEN I RUT?
Finns data för populationen? Finns register? Finns variabler? Finns rätt insamlingstid?
Utan RUT Sökmotorer Kollegor Datasetnivå Webbsidor Variabellistor Historik?
Sökbarhet i RUT En nationell ingång Versionshanterat Kvalitetssäkrat av registerägarna Standardiserat metadataramverk Sökning inkluderar semantik
Registrens begreppssystem Behov studie Rökning Stroke patienter Risk faktorer Stroke Patient Blodtryck Patient Boende Diabetes Kvalitetsregister Biobank SCB Provtyp Utbildning snivå Diagnos Alikvot Person Familj Patient Operation Prov
Sökning i RUT inkluderar populationsnamn, variabelnamn RokerA BTA DiabetesA Patient RokerU BehovHjalpmedelAnpassningarHemmetU Avlidna personer folkbokförda i Sverige 2009 Riksstrokepatienter 2009
Sökning i RUT inkluderar semantik Sökning på verksamhetsbegrepp, definitioner samt näraliggande begrepp returnerar Variabler som mäter dessa begrepp Begrepp i registrens begreppssystem Rökning Patient Risk faktorer Blodtryck Stroke Patient Diabetes Boende
Kirurgi
Variabler Beskrivningar Begrepp - Definitioner Begreppssystem - Kontext
Stroke utskrivning
Planerad vidare utredning/utveckling Graphdatabas algoritmer Thesaurus Allmänbegrepp Filter
SEMANTIK & INTEROPERABILITET
Hur är populationen definierad? Finns definition av variabeln? Finns referens till terminologi? Ändras definitionen inom den period vi är intresserade av? Går variabeln att harmonisera in till studien. Är betydelsen tillräckligt lika? Betyder data från två variabler i olika register samma sak? Är de tillräckligt lika? Har betydelsen förändrats över tid?
Utan RUT Mail Telefon Dokument
I Bakgrunden Verksamhet/verklighet Oprecist språk Implicit betydelse Provtyp Utbildnin gsnivå Diagnos Alikvot Person Begrepp Specificera betydelse Patient Operatio n Prov Familj Formalisera Ontologi Terminologi
Vi gör omvärlden begriplig genom att kategorisera den Kategoriseringen bygger på gemensamma egenskaper hos en viss mängd referenter Begreppet består av en unik kombination av kännetecken ( Metoder och principer i terminologiarbetet, Hälso- och sjukvårdens utvecklingsinstitut) Nature Rauk Grass Mountain Meadow
Tyvärr när vi närmar oss ett befintligt register och söker att förstå betydelsen av en variabel behöver vi arbeta oss underifrån och upp vi behöver hjälp att konstruera våra referenter utgående från variabeln och hjälp att förstå den kontext variabeln är definierad inom, registret, via ett begreppssytem. Natur Rauk Gräs Fjäll Äng R_Got_Nat R_Sten R_Sten
Rökare
HANTERING AV VÄRDEMÄNGDER/KODLISTOR
Värdemängder Variabel Kodlista Klassifikation Beskriven värdemängd Type of sample Ascites fluid ASC Amniotic fluid AMN Bronchoalveolar lavage BAL Blood (whole) BLD Bone marrow aspirate Centrifugation BMA Breast RT 10 milk to 15 min <3000 BMK g no braking A Buccal cells BUC <3000 g with B RT 10 to 15 min braking 2 to 10 C 10 to 15 C <3000 g no braking min 2 to 10 C 10 to 15 min <3000 g with braking D RT 10 to 15 min 3000 g to 6000 g E with braking Personnumrets uppbyggnad Personnumret anger dels personens födelsetid och dels ett födelsenummer samt en kontrollsiffra... (Skatteverket)
Klassifikationer & varianter K A B C D E V B D
Historik Ver 1 A B C D E Ver 2 B D Ver 3 A B C E
Reumatisk sjukdom
VARIABLER - HISTORIKHANTERING & TID I RUT
Variabel? Variabel Variabelns representation Variabelns kontext Hematom Hematom (ICD) Hematom (SnoMed) Hematom ICD10SE V1 Source Ref Time Hematom ICD10EN V1 Source Ref Time
Variabler Värdemängder - Historik K1 ver 1 A B C D E K1 ver 2 B D K1 ver 3 A B C E Nedstm11 Nedstm12 Nedstm13 Nedstm K1 Nedstm
Variabler Värdemängder - Historik K1 ver 1 K1 ver 2 K1 ver 3 K2 ver 1 A B A A B D B B C C C D E E E Nedstmk1 11 Nedstmk1 12 Nedstmk1 13 Nedstm K2 13 Nedstm K1 Nedstm K2 Nedstm
Bedömning av dödsorsak
URVAL & URVALSLISTOR
Urvalslistor Förändrat gränssnitt Möjligt välja både variabel och variabelrepresentation Mer detaljerat metadata i mer dynamisk exportfunktion Möjligt justera export efter målgrupp
Pågående Förbättrad hantering av tid i exportlistan Justering namnsättning metadataelement i meny Tillägg metadataelement samt dölja vissa initialt
Anmäl dig via registerforskning.se 17 oktober Folkets Hus Stockholm
PROVA SJÄLVA
Nedstämdhet Prova själva Sök efter variabler jämför betydelsen
Om vi är intresserade av strokepatienter på fem olika sjukhus perioden 2004-2007 Vilka koder användes för att registrera vilket sjukhus under perioden? Prova själva Vilka värdemängder?
Skapa en lista med variabler avseende geografisk hemvist för hushåll 2011-2016 Under vilka perioder har de olika variablerna insamlats? Hur har koder/kodlistor förändrats? Prova själva Historik, Urval & värdemängder?
registerforskning@vr.se magnus.eriksson@vr.se