Modern datahantering för biobanker och relaterad forskning. Behov av infrastruktur för tillgänglighet och säkerhet.

Relevanta dokument
Information technology Open Document Format for Office Applications (OpenDocument) v1.0 (ISO/IEC 26300:2006, IDT) SWEDISH STANDARDS INSTITUTE

ORCID medlemskap och implementering vid Chalmers

Surfaces for sports areas Determination of vertical deformation. Golvmaterial Sportbeläggningar Bestämning av vertikal deformation

LIBRIS öppna infrastruktur

Introduction to the Semantic Web. Eva Blomqvist

Health café. Self help groups. Learning café. Focus on support to people with chronic diseases and their families

engagera samhället, myndigheter och industri för att förbättra forskning som är biobanksbaserad

Isolda Purchase - EDI

LARS. Ett e-bokningssystem för skoldatorer.

Datasäkerhet och integritet

Läkemedelsverkets Farmakovigilansdag

Kunskapsintensiva företagstjänster en förutsättning för en konkurrenskraftig industri. HLG on Business Services 2014

SVENSK STANDARD SS :2010

SYMBERED. - en SYMbol-BEgrepps-REDigerare NUH. Presenterad av Mats Lundälv Författare: Katarina Mühlenbock & Mats Lundälv DART.

FORSKNINGSKOMMUNIKATION OCH PUBLICERINGS- MÖNSTER INOM UTBILDNINGSVETENSKAP

Byggdokument Angivning av status. Construction documents Indication of status SWEDISH STANDARDS INSTITUTE

Introduktion till Entity Framework och LINQ. Källa och läs mer

Creo Customization. Lars Björs

WP6 status för BBMRI.se styrelse Mark Divers

Kursutvärderare: IT-kansliet/Christina Waller. General opinions: 1. What is your general feeling about the course? Antal svar: 17 Medelvärde: 2.

Introduktion till molntjänster Tekniken bakom molntjänster och legala utmaningar

Support Manual HoistLocatel Electronic Locks

Michael Q. Jones & Matt B. Pedersen University of Nevada Las Vegas

Internationella kopplingar Karin Bredenberg,

Semantic and Physical Modeling and Simulation of Multi-Domain Energy Systems: Gas Turbines and Electrical Power Networks

Accomodations at Anfasteröd Gårdsvik, Ljungskile

Teknisk rapport SIS-TR 18:2007 Publicerad/Published: Utgåva/Edition: 1 Språk/Language: svenska/swedish ICS: ;

Managing addresses in the City of Kokkola Underhåll av adresser i Karleby stad

Förändrade förväntningar

A study of the performance

District Application for Partnership

A metadata registry for Japanese construction field

Byggritningar Ritsätt Fästelement. Construction drawings Representation of fasteners SWEDISH STANDARDS INSTITUTE

Ämnesområden. Examensarbete inom datavetenskap (1DV41E) Martin Fredriksson

The national SIMSAM network (I)

Course syllabus 1(7) School of Management and Economics. FEN305 Reg.No. EHVc 2005:6 Date of decision Course Code. Företag och Marknad I

IPv6 i Mobilnät. Mattias Karlsson. mattias.karlsson@telenor.com

UTLYSNING AV UTBYTESPLATSER VT12 inom universitetsövergripande avtal

Documentation SN 3102

Flytta din affär till molnet

Writing with context. Att skriva med sammanhang

SAS VIYA JOHAN ELFMAN ROLAND BALI

ENERGIEFFEKTIVA BYGGNADER EFTER NÄRA NOLL?

Swedbank Mobile Loadtesting. LoadRunner Mobile App protocol

Is there a place for organizational culture in OBM? SWOBM Conference, Stockholm August 18th 2018

Gränslösa ehälsotjänster. Annika Ohlson & Eva Leach SepSOS

Examensarbete Introduk)on - Slutsatser Anne Håkansson annehak@kth.se Studierektor Examensarbeten ICT-skolan, KTH

Politikerdag 2013 Från GIS till Geografisk förståelse. Lars Backhans

Protected areas in Sweden - a Barents perspective

TRENDERNA SOM FORMAR DIN VERKLIGHET 2014 ÅRETS IT AVDELNING

Schenker Privpak AB Telefon VAT Nr. SE Schenker ABs ansvarsbestämmelser, identiska med Box 905 Faxnr Säte: Borås

Taking Flight! Migrating to SAS 9.2!

PubMed lathund Örebro universitetsbibliotek Medicinska biblioteket.

Nilson Group AB. Från informationsförädling till affärsnytta och aktivt styrmedel. CIO Torsten Balslev

FÖRBERED UNDERLAG FÖR BEDÖMNING SÅ HÄR

FÖRBÄTTRA DIN PREDIKTIVA MODELLERING MED MACHINE LEARNING I SAS ENTERPRISE MINER OSKAR ERIKSSON - ANALYSKONSULT

Flytta din affär till molnet

112: det gemensamma europeiska larmnumret måste bli flerspråkigt

The reception Unit Adjunkten - for newly arrived pupils

icore Solutions. All Rights Reserved.

Företagsekonomi, allmän kurs. Business Administration, General Course. Business Administration until further notice

Assigning Ethical Weights to Clinical Signs Observed During Toxicity Testing

Kursplan. NA1032 Makroekonomi, introduktion. 7,5 högskolepoäng, Grundnivå 1. Introductory Macroeconomics

SharePoint 2010 licensiering Wictor Wilén

Statistik över publikationer med öppen tillgång

Swedish National Data Service

MOLECULAR SHAPES MOLECULAR SHAPES

GENOMIC MEDICINE SWEDEN

Flervariabel Analys för Civilingenjörsutbildning i datateknik

Att rekrytera internationella experter - så här fungerar expertskatten

Prioriterade standarder, Handledning, Vägledning, Utbildning Mats Åhlin

Scalable Dynamic Analysis of Binary Code

EBBA2 European Breeding Bird Atlas

Det här med levels.?

SVENSK STANDARD SS-EN ISO 19108:2005/AC:2015

Genusstudier i Sverige

Resultat av den utökade första planeringsövningen inför RRC september 2005

SweLL & legal aspects. Elena Volodina

Böljor, generationer eller träd? Om utvärderandets diffusion i Sverige och den atlantiska världen

Intellektuell )llgångsinventering En bra start på EU- projekt. Anna Aspgren & Lena Holmberg Innova)onskontor Väst

Plats för projektsymbol. Nätverket för svensk Internet- Infrastruktur

Nya möjligheter med M3 Technology. Björn Svensson, Björn Torold

Arbetsplatsträff 8 mars 2011

Quality-Driven Process for Requirements Elicitation: The Case of Architecture Driving Requirements

Typografi, text & designperspektiv

Abstract. Pettersson, Karin, 2005: Kön och auktoritet i expertintervjuer. TeFa nr 43. Uppsala universitet. Uppsala.

Self Service Business Intelligence. Varför? Vad? Hur? Thomas Svahn, Niklas Pernvik Advectas AB.

Anita Finne Grahnén, LIF de forskande läkemedelsföretagen

Copyright 2003, SAS Institute Inc. All rights reserved.

Adding active and blended learning to an introductory mechanics course

Teknikprogrammet Klass TE14A, Norrköping. Jacob Almrot. Självstyrda bilar. Datum:

Day 1: European Cooperation Day 2017

Goals for third cycle studies according to the Higher Education Ordinance of Sweden (Sw. "Högskoleförordningen")

Teenage Brain Development

Hur fattar samhället beslut när forskarna är oeniga?

Transkript:

som en nationell resurs för biomedicinsk forskning Vetenskapsrådet, den 18 september 2007 Modern datahantering för biobanker och relaterad forskning. Behov av infrastruktur för tillgänglighet och säkerhet. Jan-Eric Litton, professor Medicinsk epidemiologi och biostatistik Karolinska Institutet

Dagens situation Ingen infrastruktur i landet Saknas standardisering Begränsad information om biobanksprovet Provsamlingarna starkt personberoende idag Informatiktänkande saknas 2

Agenda Biobanksinformatik BIMS Federerade databaser Biobanker i Europa 3

Vilket problem ska vi lösa? Number of studies Number of participants TARGETED Europe 41 3,500,000 United Kingdom 8 600,000 Scandinavian countries 19 2,000,000 Others 14 900,000 Singlecountry America 30 3,000,000 United-States 23 2,600,000 Others 7 400,000 Australia/New Zealand 4 210,000 Asia 8 1,100,000 Several countries Europe, America, Australia 8 2,000,000 4

Biobanksinformatik En mötesplats för bioinformatik och hälsoinformatik 5

Vilka är problemen? Den gamla goda tiden Research Data Studie deltagare Forskare 6

Vilka är problemen? många olika datakällor Biological Sample Data Genotype Data Phenotype Data Registers 7

Biobank Information Management System (BIMS) Biological Sample Data Genotype Data Phenotype Data Registers 8

Other Biobanks Lab Robot LIMS BIMS DB:s Freezer Web Interface 9

Dataintegration Nio utmaningar 10

Utmaning #1: Data kompatibilitet How old are you?" When were you born? I N T E G R A T I O N Birth date? 11

Utmaning #2: Olika datamodeller Data source with data model Data source with similar data, but in another data model I N T E G R A T I O N Data in integrated data model 12

Utmaning #3: Olika ontologier Kod för chronic ischaemic heart disease: Ontology Code ICD-10 I25.9 ICD-9 414.9 Snomed CT 84537008 UMLS 448589 13

Utmaning #4: Avidentifiering I N T E G R A T I O N 14

Utmaning #5: Vem har rätt till vad? Data source A Data source B I N T E G R A T I O N Data from data source A and B 15

Utmaning #6: Olika dataformat Excel Oracle XML SAS Access I N T E G R A T I O N Common format 16

Utmaning #7: Olika datakvalitet I N T E G R A T I O N? 17

Utmaning #8: Ägarskap till data Mine! Data 18

Utmaning #9: Genotyp data 19

Data 1 Data Integration Sourcespecific Sourcespecific Data 2 Shared data model Sourcespecific Sourcespecific Data 4 BIMS Data Repository Researcher Deidentification Sensitive Data 20

Dataflödet genom BIMS 21

Dataintegrering för länge sedan Merge results 22

Datavaruhuset ODBC - JDBC 23

Federerad databas ODBC JDB C and more 24

Federerad databas Federated database system is a type of database management system that transparently integrates multiple autonomous database systems into a single federated database. The constituent databases are interconnected via a computer network, and may be geographically decentralized. A federated database (or virtual database) is the fully integrated, logical composite of all constituent databases in a federated database system. Data sources could be both structured (relation database, Excel, etc) and/or unstructured data like medical records etc. Because various database management systems employ different query languages, federated database systems can apply wrappers to the sub queries to translate them into the appropriate query languages. ODBC JDB C and more Grid computing is an emerging computing model that provides the ability to perform higher throughput computing by taking advantage of many networked computers to model a virtual computer architecture that is able to distribute process execution across a parallel infrastructure. Grids use the resources of many separate computers connected by a network (usually the Internet) to solve large-scale computation problems. Grids provide the ability to perform computations on large data sets, by breaking them down into many smaller ones, or provide the ability to perform many more computations at once than would be possible on a single computer, by modeling a parallel division of labor between processes. 25

Att koppla ihop 600.000 tvillingpar Syfte; att identifiera kritiska genetiska/livsstils faktorer för vanliga sjukdomar i Europa 26

Tvilling kohorter Australian twins Danish twins English twins Finnish twins Italian twins Dutch twins Norwegian twins Swedish twins Intellectual core facilities Epidemiological expertise (Odense) Genotyping &DNA (Helsinki, Uppsala) Database expertise (Stockholm) Biostatistics expertise (Leiden) Ethical &legal expertise(oslo) 27

28

Muilu J, Peltonen L, Litton JE. The federated database - a basis for biobank-based post-genome studies, integrating phenome and genome data from 600 000 twin pairs in Europe. Eur J Hum Genet 2007. 29

Hub-and-Spoke (Nav och Eker) Inget behov att ansluta alla till alla på nätverksnivå - Databasfederation gör routing av trafiken (och frågorna) - Hubs står för databasservicen Single access point - Hubs kan federeras - Vi kan ha många Hubs geografiskt spridda, genotype Hub, phenotype Hub, Sample Hub, Meta Data Hub, etc. 30

Hub-and-Spoke för Biobanker i Europa 31

www.biobanks.eu Proposal for European Research Infrastructure European Bio-Banking and Biomolecular Resources 50 organisationer 23 ger stöd 8 st har skrivit letter of support 32

www.biobanks.eu Unika förutsättningar att ta ledningen i Europa 33

www.biobanks.eu Unika förutsättningar att ta ledningen i Europa Starkt stöd från VR och regeringen 34

jan-eric.litton@ki.se 35