Nationellt resurscentrum för biologi och bioteknik Övning i bioinformatik Människans genom Databaser ger kunskap om genetiska sjukdomar Många molekylärbiologiska databaser och program är fritt tillgängliga på Internet. Du kan därför arbeta som molekylärbiologisk forskare med samma material som används av professionella forskare. Hur kan beskrivningen av det mänskliga genomet och andra organismers genom bidra till förståelsen av hälsa och sjukdom hos människan? Databaser på Internet kan användas för att få kunskap om sjukdomar som kan drabba människor. Övningen ger en inblick i hur databaser kan utnyttjas. Du kan sedan själv söka svar på frågor i anslutning till olika sjukdomar och deras genetiska bakgrund. Variation i nukleotidsekvenser När nukleotidsekvensen från en DNA-sträng analyseras kallas detta sekvensering. Vid sekvenseringen av människans genom har man utgått från ett tiotal individer. Om ditt eget genom skulle sekvenseras finner du troligen att ungefär var tusende nukleotid avviker vid jämförelse med varje annat mänskligt genom. Variationen i nukleotidsekvensen beror på mutationer, dvs. att nukleotider byts ut, försvinner eller tillkommer. En undersökning visar att var och en av oss har omkring ett hundratal nya mutationer i jämförelse med våra föräldrars genom. Vissa genetiska sjukdomar kan bero på att enstaka nukleotider förändras, medan andra sjukdomar orsakas av större förändringar i nukleotidsekvensen. Översikt över Ensembl Ensembl är en fritt tillgänglig sökmotor som visar de kompletta genomen för ett flertal djurarter. Det finns stora likheter mellan människans och andra djurarters genom. Om vi studerar genomen för olika djurarter kan vi lära oss mer om människans biologi och förstå den genetiska bakgrunden till många sjukdomar. I den här övningen kommer vi att endast studera en mindre del av all information som går att få fram via Ensembl. Du kan själv upptäcka mer möjligheter genom att använda introduktionen och de utarbetade exemplen som finns på startsidan. Det finns också en utmärkt hjälpfunktion. Innehållet i Ensembl förändras efterhand eftersom det ständigt tillkommer information om organismernas genom. Tidpunkten för den senaste uppdateringen anges på webbsidan. Nationellt resurscentrum för biologi och bioteknik Bioinformatikövning 2005.11.08 Får fritt kopieras i icke-kommersiellt syfte om källan anges
Studera kromosomer 1. Gå in på www.ensembl.org. För hur många arter har man sekvenserat genomet? 2. Klicka på Browse under rubriken Mammals, Homo sapiens. Till höger på den sida som öppnas syns figurer som representerar människans 22 autosomer, samt X- och Y-kromosomerna. Vilken av människans kromosomer har minst antal baspar? Jämför också antalet baspar i X- och Y-kromosomerna. (Klicka på bilderna av kromosomerna. På den nya sida som öppnas finns uppgifter om antalet baspar (bps) i kromosomen.) 3. Klicka på en av människans kromosomer. Du ser nu en uppförstorad bild av kromosomen till vänster på skärmen (se fig. t.v). I vänstra kolumnen syns bruna staplar som visar gentätheten, dvs. hur många gener som finns i en viss region. Vissa regioner har många gener vilket visas genom långa, bruna staplar. Jämför också med andra kromosomer. Finns det någon del av en kromosom som alltid saknar gener? En av kolumnerna visar mängden SNPs (Single Nucleotide Polymorphism) inom olika delar av kromosomen. Kolumnen längst till höger visar en närbild av kromosomen. Här syns de namn som forskare satt på en del av kromosomens band. Namnen börjar med p för den ena av kromosomens armar och q för den andra av armarna. Length: Genes (known and novel): 62,435,964 bps 631 Known Genes: 592 PseudoGenes: 180 SNPs: 269,648 Ovan visas kromosom 20 från människa. På högra delen av webbsidan finns ytterligare information om kromosomen. Exempelvis anger Genes (known and novel) det totala antalet gener som man antar finns på kromosomen, medan Known Genes anger antalet gener som är kartlagda och där nukleotidsekvensen är publicerad i databaser. (Uppgifterna uppdateras ständigt och siffrorna ändras därför efterhand.) Innan koden för det humana genomet beskrivits visste man inte hur många gener som fanns totalt. Gener kunde bara identifieras genom omfattande experiment. Efterhand lärde man sig att gener innehåller koder som markerar början och slutet på genen. När nu människans hela genom har sekvenserats kan datorer användas för att söka efter de koder som gör att gener kan identifieras. Till exempel har man identifierat gener hos människan genom att studera musens genom. Detta har lett till att över 200 nya mänskliga gener upptäcktes. Till vänster på webbsidan finns rubriken View Chr xx Synteny ( i stället för xx står numret på den kromosom du valt.) Jämför kromosomen från människan med musens genom (vs Mouse). Under rubriken Change chromosome nere t.h. på sidan kan man jämföra med andra kromosomer från människan Studera figuren över kromosomerna från människa och mus. Finns det några DNA-sekvenser i kromosom 20 hos människan som också förekommer hos musen? På vilken/ vilka kromosom/er hos musen finns notsvarigheten till människans DNA-sekvenser? 2
Sökning efter sjukdomsframkallande gener Du ska nu, som exempel, söka efter en gen som är orsak till en form av bröstcancer. Frågor att besvara under övningen: Hur visar sig bröstcancer? Finns det några gener som har betydelse för bröstcancer och var finns de i så fall i genomet? Finns jämförbara gener hos andra djurarter? Gå till startsidan www.ensembl.org. Överst finns en meny där det står Search all Ensembl. Välj alternativet Disease i denna meny. I den tomma rutan till höger skriver du in breast cancer. Starta sökningen efter gener som har betydelse för denna sjukdom genom att klicka på knappen Go. Resultatet blir en lista med ett stort antal träffar de första 20 visas på sidan. Klicka på en av länkarna: 4. OMIM disease: Breast cancer 2, early onset (3) ENSG00000139618 i den nya rutan som öppnas. Ett nytt fönster som visar figurer av människans alla kromosomer visas. På vilken kromosom finns en markering som visar var genen för bröstcancer finns? Under figuren med kromosomer finns en list där det bl.a. står Name(s) klicka på länken som finns nedanför: ENSG00000139618. Länken leder till en ny sida, Human GeneView med mycket information. Denna sida blir utgångspunkt för det fortsatta arbetet. Gå tillbaka till sidan efter varje deluppgift. En liten bit ner på sidan står rubriken Description i den grå kolumnen. T.h. om rubriken finns länken Source: Uniprot/SWISSPROT P13569. Klicka på länken som leder dig vidare till en ny webbsida UniProt. Sök rätt på rubriken Disease som finns långt ner på sidan (under References). Beskriv effekten av bröstcancergenen: Vilka riskerar drabbas av sjukdomen (kvinnor/män, gamla/unga)? Gå tillbaka till sidan Human GeneView i databasen Ensembl genom att klicka på webbläsarens bakåtknapp. En liten bit ner på denna sida finns rubriken Transcripts med en ruta t.h. som bl.a. visar hur genen byggs upp av exoner (se Ensembl trans, t.h. finns en rad med rutor förbundna med streckade linjer. Varje ruta motsvaras av en exon - en gen består i allmänhet av flera rutor/ exoner.) Ovanför rutan finns länkarna Transcript info, Exon info och Peptide info. Klicka på t.ex. länken Transcript info. I fönstret som öppnas finns längs ner bassekvensen för genen. Längst ner på sidan finns menyn Show the following features där man kan välja olika alternativ. Pröva de olika alternativen i menyn Show the following features (tryck också på Refresh). Hur ändras presentationen av bassekvensen? Vilka upplysningar får man? Vad betyder SNP:s? (Förklaringar till olika färgbeteckningar finns nederst på sidan och varierar beroende på vilket alternativ som väljs i menyn.)). 3
Gå tillbaka till sidan Human GeneView genom att använda bakåtknappen på webbläsaren. Sök efter en liknande gen hos andra organismer. Till höger om rutan Orthologue Prediction finns angivet gener från olika djur som motsvarar (är homologa med) bassekvensen för bröstcancergenen hos människa, se tabell nedan. Djuren i tabellen anges med latinska namn.ta reda på de svenska namnen. Klicka på länken Align för att göra en jämförelse mellan bassekvensen hos människa och det djur du valt (t.ex. mus (Mus musculus). Beskriv hur resultatet ser ut när man gör en sådan alignment. På vilket sätt kan man se vilken bassekvens som är mest lik människans? (Du ska inte ta reda på vilken denna sekvens är.) Orthologue Prediction The following gene(s) have been identified as putative orthologues by reciprocal BLAST analysis: Species Apis mellifera Canis familiaris Bos taurus Mus musculus Pan troglodytes Fugu rubripes Gallus gallus Xenopus tropicalis Rattus norvegicus Gene identifier ENSAPMG00000005046 (Novel Ensembl prediction) [MultiContigView] [Align] ENSCAFG00000006383 (XP_543141.1) [MultiContigView] [Align] PREDICTED: breast cancer 2, early onset [Source: RefSeq_peptide (XP_543141)] ENSBTAG00000000988 (Novel Ensembl prediction) [MultiContigView] [Align] ENSMUSG00000041147 (Brca2) [MultiContigView] [Align] breast cancer 2 [Source:MarkerSymbol;Acc:MGI:109337] ENSPTRG00000005766 (BRCA2) [MultiContigView] ENSPTRG00000005767 (BRCA2) [MultiContigView] SINFRUG00000143218 (Novel Ensembl prediction) [MultiContigView] [Align] SINFRUG00000155989 (Novel Ensembl prediction) [MultiContigView] [Align] ENSGALG00000017073 (NP_989607.1) [MultiContigView] [Align] breast cancer 2, early onset [Source: RefSeq_peptide (NP_989607)] ENSXETG00000017011 (Novel Ensembl prediction) [MultiContigView] [Align] ENSXETG00000017012 (Novel Ensembl prediction) [MultiContigView] [Align] ENSRNOG00000001111 (BRCA2_RAT) [MultiContigView] [Align] Breast cancer type 2 susceptibility protein homolog (Fanconi anemia group D1 protein homolog). [Source:Uniprot/SWISSPROT;Acc:O35923] Tetraodon GSTENG00030170001 (GSTENG00030170001) [MultiContigView] [Align] nigroviridis View alignments of homologies. 4
Varför har människor och t.ex. möss så lika gener? Människor och möss härstammar från en gemensam förfader för omkring 75 miljoner år sedan och bägge arterna har ärvt denne förfaders gener. Genomforskning hjälper oss att direkt se hur DNA-koden har utvecklats under den tid som gått. Vi kan därmed göra goda förutsägelser om för hur länge sedan vår gemensamme förfader levde och hur denne såg ut. Under den tid som gått har mutationer gjort att generna hos människor och möss ser olika ut. En jämförelsen mellan människans och musens genom visar dock att merparten av DNA är lika. Musen är därför mycket användbar för att söka efter gener som är gemensamma med människan för att använda i forskning om sjukdomar. Du har nu arbetat på motsvarande sätt med Ensembl som forskare gör för att få kunskap om arvsmassan hos organismerna. Databasen innehåller en sådan enorm mängd information att det finns gott om oupptäckta samband. Om du lär dig att använda databasen och ställa frågor kommer du förmodligen att kunna upptäcka samband ingen annan har lagt märke till när det gäller människans genom. Referenser: 1. Hodge, Russ och Andrade, Miguel Surfing the human and mouse genomes on the Internet European Learning Laboratory for the life Sciences vid European Molecular Biology Laboratory (EMBL) 2. Övningar från www.ensembl.org. 5