GA N AT ION ALCTAC ATCA G ENOMI CSGT INFR A S T RU CTURE Datorer och matematik hjälper oss att motverka sjukdomar Adam Ameur Bioinformatiker SciLifeLab Uppsala, 13e Maj 2014
Introduktion till bioinformatik Bioinforma)k - en tvärvetenskaplig disciplin där algoritmer för analys av biologiska data utvecklas Begreppet myntades 1979 Biologiska data har ökat enormt senaste decennierna Bioinformatiken blir allt viktigare Är idag ett stort forskningsområde
Vad är bioinformatik? Matema)k/Sta)s)k Utvecklar modeller Skriver program Datavetenskap Använder verktygen Molekylärbiologi
Analys av DNA-sekvenser
Sekvenseringsrevolutionen HUGO-Projektet (1990-2003) Kartläggning av människans DNA Stort internationellt projekt Kostnad: > 1,000,000,000$ Idag (år 2014) Nästa Generationens Sekvensering (NGS) Kan göras inom en vecka På ett enda instrument Kostnad: drygt 1000$
Snabb ökning av DNA-sekvensprojekt h:p://www.ebi.ac.uk/ena/about/sta?s?cs
Sekvensutrustning inom SciLifeLab E" av de ins+tut med flest instrument i Europa!
Resurser för dataanalys UPPNEX/UPPMAX Superdator för DNA-sekvensanalyser - 208 noder x 16 cores - Lagring av data: 7 PetaByte (1PB = 1000 TeraBytes) www.uppmax.uu.se
Hur går DNA-sekvenseringen till? 1. Prov (tex från blod) 2. Extrahera DNA 3. Fragmentera DNA i små korta bitar ca 100-500 bp 4. Läs DNA bitarna med ett sekvensinstrument 5. Analysera och tolka resultaten
Hur ser datat ut? Miljontals små korta läsningar (ca 100 baser långa) CTGTGGCTTAGCAGGATTGCTAGTCAGTCGATGCTGTGC CGTAGCTAGCTAGCTAGTCGAGGTGTGGACTGTTAGCA GCTGATCGATGCTGATGCGTAGATCGATGATCGATCGAT GTCGATGCTGATCGATCGATGGATAAAATAGCTAAGTCGA GTCGATGCTAGGATGATCGATCGATCGATCGATAGCTA GTCGATCGATGGAGGGCCCCAGGCCATAGATTTCTTATAT AATCGATGGCTGATCGATGCTAGTGATCGATAGCTAGAT GTCGATCGATGGAGGGCCCCAGGCCATAGATTTCTTATAT
Analys av mänskligt DNA (1) Steg 1: Inpassing av läsningar från en individ CTGATCGTGATGGGGGCTGACTAGCTAGCTAGCTA ACTAGCTAGCTAGCTAGCTAGGGATCGATGCTGACTGATC GGGGGCTGACTAGCTAGCTAGCTAGCTAGGGATCGAT CGTGATGGGGGCTGACTAGCTAGCTAGCTAGCTAGGGATCGATGCT CTGACTAGCTAGCTAGCTAGCTAGGGATCGAT TGGCTGATCGTGATGGGGGCTGACTAGCTAGCT AGCTAGGGATCGATGCTGACTGATCGATCGAT GGGGGCTGACTAGCTAGCTAGCTAGCTAGGGATCGAT CGTGATGGGGGCTGACTAGCTAGCTAGCTAGCTAGGGA..GTGGCTGATCGTGATGGGGGCTGACTAGCTAGCTAGCTAGCTAGGGATCGATGCTGACTGATCGATCGAT - - - Humana referensen (ca 3 miljarder baser) - - -
Analys av mänskligt DNA (2) Steg 2: Detektion av genetisk variation CTGATCGTGATGGGGGCTGACTATCTAGCTAGCTA ACTATCTAGCTAGCTAGCTAGGGATCGATGCTGACTGATC GGGGGCTGACTATCTAGCTAGCTAGCTAGGGATCGAT CGTGATGGGGGCTGACTATCTAGCTAGCTAGCTAGGGATCGATGCT CTGACTATCTAGCTAGCTAGCTAGGGATCGAT TGGCTGATCGTGATGGGGGCTGACTATCTAGCT AGCTAGGGATCGATGCTGACTGATCGATCGAT GGGGGCTGACTATCTAGCTAGCTAGCTAGGGATCGAT CGTGATGGGGGCTGACTATCTAGCTAGCTAGCTAGGGA..GTGGCTGATCGTGATGGGGGCTGACTAGCTAGCTAGCTAGCTAGGGATCGATGCTGACTGATCGATCGAT Gene7sk varia7on jämfört med referenssekvensen!
DNA sekvensering inom sjukvården www.ucsf.edu/news/2012/04/11864/value- genomics- and- personalized- medicine- wrongly- downplayed
Sekvensering inom sjukvården Utvecklingen går snabbt framåt! - Nya och förbättrade sekvensinstrument - Metoderna blir snabbare och billigare NGS-metoderna kan snart användas inom vården - Ger svar på frågor som man inte kunde få förut Tre exempel följer på hur vi börjat med detta! - Exempel 1: Hitta orsaken till en ärftlig sjukdom - Exempel 2: Antibiotikaresistenta bakterier - Exempel 3: Analys av leukemiprover
Exempel 1 Welanders Distala Myopati Dominant, ärftlig sjukdom - En kopia av arvsanlaget räcker Niklas Dahl, Joakim Klar, mfl Inst för immunologi, genetik och patologi, Uppsala Univ. Muskeldystrofi - Progressiv försvagning av muskler i händer och fötter - Sjukdomen debuterar runt 40-60 år - Prevalens i Sverige: ca 1 på 10.000 - Hög andel fall vissa regioner i Sverge och Finland Region på kromosom 2 bär orsaken till sjukdomen Ingen sjukdomsorsakande gen i regionen hittad
Hedesundasjukan En hypotes: - Gemensam anfader - Vallonerna från Belgien? - 400 år sedan?
Nästa Generations Sekvensering Strategi: - Två individer analyserades - Leta efter gemensamma varianter I regionen på kromosom 2 Som inte finns i 100-tals friska individer Resultat: En enda variant hittades! I en gen som heter TIA1 Hittades i samtliga patienter Dominant nedärvning i familjer
Beräkning av åldern på mutationen Hur många generationer? Uträkning baseras bla på haplotyp-storlek Beräknad ålder ca 42 generationer! dvs ungefär 1000 år sedan Innan Vallonerna kom till Sverige!
Sammanfattning, Hedesundasjukan Genetiska orsaken till sjukdomen hittad! Kan användas för att ge patienter rätt diagnos Finns ännu inget botemedel men kan hjälpa forskningen framåt
Exempel 2 Antibiotikaresistanta bakterier Beredskap för utbrott och svåra patientfall Åsa Melhus, mfl Akademiska Sjukh, Uppsala Mål: Utveckla snabb DNA-analys av resistenta bakterier - Resultat inom ett par dagar Har redan använts på riktiga fall från sjukhuset! DNA extrac7on, QC, sample prepara7on Library QC and amplifica7on Sequencing and primary data analysis In depth data analysis Dag 1 Dag 2 Dag 3 Dag 4
Hur ser resultaten ut? I princip fullständig kartläggning av bakteriens arvsmassa inklusive eventuella antibiotikaresistenta gener!
Sammanfattning, antibiotikaresistens Vi har möjlighet att snabbt analysera resistenta bakterier! I vilka fall är det användbart? Patienter med okänd, resistent bakterieinfektion Informationen kan användas för att välja behandling Spåra utbrott av resistenta bakterier! Hitta källan till utbrott tex på sjukhus
Exempel 3 - Kronisk Myeloid Leukemi Fusionsproteinet BCR-ABL ett mål för läkemedel Lucia Cavelier, Monica Hermansson, mfl Inst för immunologi, genetik och patologi, Uppsala Univ. Resistansmutationer i BCR- ABL kan utvecklas till följd av medicinering www.cambridgemedicine.org/ar7cle/doi/10.7244/cmj- 1355057881
Resultat - diagnosprov BCR ABL Patientprov vid tid för diagnos
Resutat för ett uppföljningsprov BCR ABL Prov 6 månader senare Mutationer hittas i BCR-ABL. Patienten är resistent, och läkemedlet behöver bytas ut!
Mutationer i 5 KML patienter
Mutationer mappade till proteinstrukturen
BCR-ABL Sammansatta mutationer P1 61m T315I P1 68.5m T315I 91.8% 93.7% F359C 4.2% 3.9% D276G 2.0% F359C 2.0% H396R 1.1% 1.1%
Sammanfattning, analys av BCR-ABL NGS-metoden känsligare än nuvarande metoder Möjliggör för tidigare detektion av resistensmutationer Läkaren kan tidigare göra ett byte av läkemedel! Bra för patienten (kan ev undvika transplantation) Kan spara kostnader för vården
Hur ser framtiden ut? Finns många fler användningsområden inom sjukvården och mängden data kommer fortsätta att växa Stort behov av bioinformatik även i framtiden!
Exempel på sekvensprojekt, NGI Uppsala
Frågor???