Datorer och matematik hjälper oss att motverka sjukdomar Adam Ameur Bioinformatiker Lund, 26e November 2014
Introduktion till bioinformatik Bioinformatik - en tvärvetenskaplig disciplin där algoritmer för analys av biologiska data utvecklas Begreppet myntades 1979 Bioinformatiken blir allt viktigare Biologiska data har ökat enormt senaste decennierna Är idag ett stort forskningsområde
Vad är bioinformatik? Matematik/Statistik Utvecklar modeller Skriver program Datavetenskap Använder verktygen Molekylärbiologi
Analys av DNA-sekvenser
Sekvenseringsrevolutionen HUGO-Projektet (1990-2003) Kartläggning av människans DNA Stort internationellt projekt Kostnad: > 1,000,000,000$ Idag (år 2014) Nästa Generationens Sekvensering (NGS) Kan göras inom en vecka På ett enda instrument Kostnad: drygt 1000$
Snabb ökning av DNA-sekvensprojekt http://www.ebi.ac.uk/ena/about/statistics
Sekvensutrustning inom SciLifeLab Ett av de institut med flest instrument i Europa!
Resurser för dataanalys UPPNEX/UPPMAX Superdator för DNA-sekvensanalyser - 208 noder x 16 cores - Lagring av data: 7 PetaByte (1PB = 1000 TeraBytes) - Dator med mycket arbetsminne (2 TB) www.uppmax.uu.se
Hur går DNA-sekvenseringen till? 1. Prov (tex från blod) 2. Extrahera DNA 3. Fragmentera DNA i små korta bitar ca 100-500 bp 4. Läs DNA bitarna med ett sekvensinstrument 5. Analysera och tolka resultaten
Hur ser datat ut? Miljontals små korta läsningar (ca 100 baser långa) CTGTGGCTTAGCAGGATTGCTAGTCAGTCGATGCTGTGC CGTAGCTAGCTAGCTAGTCGAGGTGTGGACTGTTAGCA GCTGATCGATGCTGATGCGTAGATCGATGATCGATCGAT GTCGATGCTGATCGATCGATGGATAAAATAGCTAAGTCGA GTCGATGCTAGGATGATCGATCGATCGATCGATAGCTA GTCGATCGATGGAGGGCCCCAGGCCATAGATTTCTTATAT AATCGATGGCTGATCGATGCTAGTGATCGATAGCTAGAT GTCGATCGATGGAGGGCCCCAGGCCATAGATTTCTTATAT
Analys av mänskligt DNA (1) Steg 1: Inpassing av läsningar DNA-läsningar från en individ CTGTGGCTTAGCAGGATTGCTAGTCAGTCGATGCTGTGC CGTAGCTAGCTAGCTAGTCGAGGTGTGGACTGTTAGCA GCTGATCGATGCTGATGCGTAGATCGATGATCGATCGAT GTCGATGCTAGGATGATCGATCGATCGATCGATAGCTA GTCGATGCTGATCGATCGATGGATAAAATAGCTAAGTCGA GTCGATCGATGGAGGGCCCCAGGCCATAGATTTCTTATAT AATCGATGGCTGATCGATGCTAGTGATCGATAGCTAGAT GTCGATCGATGGAGGGCCCCAGGCCATAGATTTCTTATAT Inpassning mot mänskliga referenssekvensen CTGATCGTGATGGGGGCTGACTAGCTAGCTAGCTA ACTAGCTAGCTAGCTAGCTAGGGATCGATGCTGACTGATC GGGGGCTGACTAGCTAGCTAGCTAGCTAGGGATCGAT CGTGATGGGGGCTGACTAGCTAGCTAGCTAGCTAGGGATCGATGCT CTGACTAGCTAGCTAGCTAGCTAGGGATCGAT TGGCTGATCGTGATGGGGGCTGACTAGCTAGCT AGCTAGGGATCGATGCTGACTGATCGATCGAT GGGGGCTGACTAGCTAGCTAGCTAGCTAGGGATCGAT CGTGATGGGGGCTGACTAGCTAGCTAGCTAGCTAGGGA..GTGGCTGATCGTGATGGGGGCTGACTAGCTAGCTAGCTAGCTAGGGATCGATGCTGACTGATCGATCGAT --- Humana referensen (ca 3 miljarder baser) ---
Analys av mänskligt DNA (2) Steg 2: Detektion av genetisk variation CTGATCGTGATGGGGGCTGACTATCTAGCTAGCTA ACTATCTAGCTAGCTAGCTAGGGATCGATGCTGACTGATC GGGGGCTGACTATCTAGCTAGCTAGCTAGGGATCGAT CGTGATGGGGGCTGACTATCTAGCTAGCTAGCTAGGGATCGATGCT CTGACTATCTAGCTAGCTAGCTAGGGATCGAT TGGCTGATCGTGATGGGGGCTGACTATCTAGCT AGCTAGGGATCGATGCTGACTGATCGATCGAT GGGGGCTGACTATCTAGCTAGCTAGCTAGGGATCGAT CGTGATGGGGGCTGACTATCTAGCTAGCTAGCTAGGGA..GTGGCTGATCGTGATGGGGGCTGACTAGCTAGCTAGCTAGCTAGGGATCGATGCTGACTGATCGATCGAT Genetisk variation jämfört med referenssekvensen!
DNA sekvensering inom sjukvården www.ucsf.edu/news/2012/04/11864/value-genomicsand-personalized-medicine-wrongly-downplayed
Sekvensering inom sjukvården Utvecklingen går snabbt framåt! - Nya och förbättrade sekvensinstrument - Metoderna blir snabbare och billigare - Ger svar på frågor som man inte kunde få förut NGS-metoderna kan snart användas inom vården Tre exempel följer på hur vi börjat med detta! - Exempel 1: Hitta orsaken till en ärftlig sjukdom - Exempel 2: Antibiotikaresistenta bakterier - Exempel 3: Analys av leukemiprover
Exempel 1 Welanders Distala Myopati Dominant, ärftlig sjukdom - En kopia av arvsanlaget räcker Niklas Dahl, Joakim Klar, mfl Inst för immunologi, genetik och patologi, Uppsala Univ. Muskeldystrofi - Progressiv försvagning av muskler i händer och fötter - Sjukdomen debuterar runt 40-60 år - Prevalens i Sverige: ca 1 på 10.000 - Hög andel fall vissa regioner i Sverge och Finland Region på kromosom 2 bär orsaken till sjukdomen Ingen sjukdomsorsakande gen i regionen hittad
Hedesundasjukan En hypotes: - Gemensam anfader - Vallonerna från Belgien? - 400 år sedan?
Strategi: Nästa Generations Sekvensering - Två individer analyserades - Leta efter gemensamma varianter I regionen på kromosom 2 Som inte finns i 100-tals friska individer Resultat: En enda variant hittades! I en gen som heter TIA1 Hittades i samtliga patienter Dominant nedärvning i familjer
Beräkning av åldern på mutationen Hur många generationer (g)? Uträkning baseras bla på haplotyp-storlek 2/g = M Beräknad ålder ca 42 generationer! dvs ungefär 1000 år sedan Sammanfaller med tidig sjöfart till Finland Innan Vallonerna kom till Sverige!
Sammanfattning, Hedesundasjukan Genetiska orsaken till sjukdomen hittad! Kan användas för att ge patienter rätt diagnos Finns ännu inget botemedel men kan hjälpa forskningen framåt
Exempel 2 Antibiotikaresistanta bakterier Antibiotikaresistenta bakterier - Beredskap för utbrott och svåra patientfall Mål: Utveckla snabb DNA-analys av resistenta bakterier - Resultat inom ett par dagar Har redan använts på riktiga fall från sjukhuset! Åsa Melhus, mfl Akademiska Sjukh, Uppsala DNA extraction, QC, sample preparation Library QC and amplification Sequencing and primary data analysis In depth data analysis Dag 1 Dag 2 Dag 3 Dag 4
Hur ser resultaten ut? I princip fullständig kartläggning av bakteriens arvsmassa inklusive eventuella antibiotikaresistenta gener!
Sammanfattning, antibiotikaresistens Vad kan metoden användas för? Patienter med okänd, resistent bakteriestam! - Informationen kan användas för att välja behandling Spåra utbrott av resistenta bakterier! - Hitta källan till utbrott tex på sjukhus
Exempel 3 - Kronisk Myeloid Leukemi Fusionsproteinet BCR-ABL ett mål för läkemedel Lucia Cavelier, Monica Hermansson, mfl Inst för immunologi, genetik och patologi, Uppsala Univ. Resistansmutationer i BCR- ABL kan utvecklas till följd av medicinering www.cambridgemedicine.org/article/doi/10.7244/cmj-1355057881
Resultat - diagnosprov BCR ABL Patientprov vid tid för diagnos
Resutat för ett uppföljningsprov BCR ABL Prov 6 månader senare Mutationer hittas i BCR-ABL. Patienten är resistent, och läkemedlet behöver bytas ut!
Sammanfattning, analys av BCR-ABL NGS-metoden känsligare än nuvarande metoder Möjliggör för tidigare detektion av resistensmutationer Läkaren kan tidigare göra ett byte av läkemedel! Bra för patienten (kan ev undvika transplantation) Kan spara kostnader för vården
Hur ser framtiden ut? Finns många fler användningsområden inom sjukvården Exempel 1: Icke invasiv fosterdiagnostik - Fånga upp fostrets DNA från mammans blod - Kan användas för att få diagnos på fostret - Raporterar endast vissa specifika avvikelser - Samma som nu studeras med invasiva metoder
Hur ser framtiden ut? Exempel 2: Organtransplantation - Hitta matchning för mellan donator och patient - Kan öka chansen för lyckad transplantation - Kräver snabb analys av specificka DNA-sekvenser
Sammanfattning DNA-analyser blir en allt viktigare del av sjukvården Stora mängder data måste bearbetas snabbt Behövs nya metoder för dataanalys - och fler bioinformatiker!
Exempel på sekvensprojekt, NGI Uppsala
Frågor???