Karl Holm Ekologi och genetik, EBC, UU karl.holm@ ebc.uu.se Nick Brandt Populationsgenetik
Kursens upplägg Föreläsningar 24/4, 10:15-16:00 Friessalen Introduktion, HWE 27/4, 10:15-16:00 Inavel 28/4, 10:15-16:00 Genetisk drift 29/4, 08:15-12:00 Genetisk struktur 4/5, 10:15-16:00 Selektion 12/5, 08:15-09:00 Lindahlsalen Frågestund Material (Studentportalen) PDF från föreläsningar, Övningsuppgifter med facit Övningstenta Formelsamling Tenta 13/5, 8.00-13.00
Populationsgenetik: introduktion VAD? Definition, teoretisk och tillämpad populationsgenetik VARFÖR? Exempel på hur populationsgenetiken kommit till användning HUR? Grundläggande begrepp och en standardmodell för evolution i populationer
Vad är populationsgenetik? Läran om populationers genetiska sammansättning och de faktorer som påverkar den över tid. En kvantitativ modell för evolution. I teoretisk populationsgenetik används simuleringar och teoretiska modeller för att bättre förstå hur evolutionära processer påverkar gener i populationer över tid. I tillämpad populationsgenetik används genetiska markörer för att dra slutsatser om populationens struktur, historia, släktskap och selektion, samt för att beskriva geners funktion.
Varför populationsgenetik? Modern populationsgenetik har kraftigt påverkats av tre stora omvälvningar inom de biologiska vetenskaperna: Konceptuellt: Betrakta populationer och gener ur ett evolutionärt historiskt perspektiv Empiriskt/datadrivet: 1. Sammanställandet av flera arters fullständiga genom. 2. Sekvenseringsteknologi för att upptäcka polymorfier, markörer. 3. Tekniker för att snabbt och kostnadseffektivt genotypa* och sekvensera ett stort antal individer. Datorkraft för lagring/hantering/analys av data: En lane Illumina sekvensering generar (idag) 500 millioner fragment av 101 bp längd (50.500.000.000 baser = 17 mänskliga genom) till en kostnad av ca. 12.000 Skr. *sammanställa ett stort antal markörer i en individs genom
Nyttan av populationsgenetik? Användningsområden inom olika biologiska forskningsfält: EVOLUTION: studiet av artbildning och naturlig selektion EKOLOGI: information om populationers historia, struktur, spridning och migration NATURVÅRD: skattning av populationers/arters storlek för bevarandet av genetisk variation och livskraft ODLING/AVEL: teori och metodik för att ta fram livskraftiga varianter i olika miljöer MEDICIN: modern teori och metodik för att finna kandidatgener för genetiskt nedärvda sjukdomar och hur dessa gener samverkar med andra gener och med miljön
Tillämpad populationsgenetik Exempel: Hotade populationer
Genetisk variation i den svenska vargpopulationen Övervakning av den svenska vargpopulationen med hjälp av genetiska markörer. Populationen grundas av två vargar. Ytterligare en varg migrerar in.
Inavel i den svenska vargpopulationen Inavelskoefficienten (graden av släktskap mellan enskilda individer) uppskattad från släktträd. Standardiserad heterozygositet är ett mått på den genetiska variationen i populationen.
Grundläggande begrepp DNA -AGCCTATTTGACG- -AGCGTATTTGCCGpolymorfier Gen Den grundläggande fysiska och funktionella enheten av DNA som går i arv, dvs för information vidare från en generation till nästa.
Locus (pl. loci) Känd plats i genomet där en gen är lokaliserad. Alleler (A och a) Allel De olika varianter av en gen som kan förekomma vid ett bestämt locus (A och a). A a Locus Heterozygot En diploid individ är heterozygot vid ett locus om allelerna vid detta locus är olika (Aa). Homozygot En diploid individ är homozygot vid ett locus om... (AA eller aa)? Homologa kromosomer
Genotyp Uppsättningen alleler vid ett lokus hos en individ (AA/Aa/aa). Alleler (röd och blå) Fenotyp Uttryckt form eller variant av en karaktär hos en specifik individ (röd eller blå). A a Lokus för färg Dominant allel En allel som uttrycker sin fenotypiska effekt även om den förekommer heterozygot med en recessiv allel. Recessiv allel En allel vars fenotyp inte uttrycks i en heterozygot. Allel (A och a) Homozygot Homologa kromosomer (AA eller aa) Heterozygot (Aa) Genotyp (AA/Aa/aa) Fenotyp (röd/blå)
Den centrala doktrinen i molekylärbiologi the central dogma Genotypen lagras i DNA och går i arv. Proteinfunktionen påverkar individens fenotyp.
Mendelsk nedärvning Egenskaper (fenotyper) nedärvs genom distinkta partiklar (alleler). Alleler förekommer i par (hos diploida individer) där en allel kommer från vardera förälder. Gregor Mendel (1822-1884) Mendels två lagar: 1. Allelerna segregerar slumpmässigt, dvs när haploida könsceller bildas så kan vilken som av de två allelerna hos den heterozygota föräldern ingå i en specifik könscell (gamet). 2. Gener för olika egenskaper (fenotyper) nedärvs oberoende av varandra. Detta gäller bara för icke-länkade gener!
Mendelsk nedärvning, exempel: Hur många är allelerna? Vilka är fenotyperna och genotyperna i föräldragenrationen och F1- generationen? Vilka proportioner av fenotyperna respektive genotyperna förväntas i F2-generationen? Vilken, om någon, allel är dominant över den andre? Vad kallas denna nedärvning?
Kvantitativa egenskaper: många gener som samverkar En gen, två alleler Två gener, två alleler Tre gener, två alleler Kan vi få samma spridning i fenotypen med bara en gen? Många gener, två alleler Exempel på fenotyper: längd, blomningstid, fitness/ överlevnad?
Grundläggande evolutionära processer: Varifrån kommer variationen? Mutationer Migration Vart tar den vägen? Drift Inavel Selektion
Grundläggande evolutionära processer: Mutationer Punktmutationer (SNP = single nucleotide polymorphisms) Genetisk markör En variation (mutation) i DNA-sekvensen av något slag vars plats i genomet vi känner till, antingen definitivt, eller relativt andra markörer. Typer av genetiska markörer Mikrosatelliter RFLP (restriction enzyme polymorphism) SNPs (punktmutationer) - den idag mest förekommande och använda
Några mått på genetisk variation (genetisk diversitet) Heterozygositet (H) H = antalet heterozygoter totala antalet individer Allelisk diversitet (A) A = totala antalet alleler i alla loci antalet loci Frekvensen polymorfa loci (P) P = antalet polymorfa loci totala antalet loci
Genetisk diversitet i några olika arter (hotade och ickehotade) H A n Människa 0.81 8.9 28 Schimpans 0.65 7.8 35 Prärievarg 0.68 5.9 17 Etiopisk varg 0.21 2.4 20 Alligator 0.67 8.3 28 Komodovaran 0.31 4 78 H = heterozygositet, A = allelisk diversitet, n = sampelstorlek
Allelefrekvenser och genotypfrekvenser - vad är det? När vi vill beskriva den genetiska variationen i en population, så räknar vi intuitivt data. Antag ett locus i följande population som består av 10 diploida individer: A1A1 A1A2 Genotyper: A1A1 A1A2 A2A2 A1A2 A1A1 A1A1 Antal: 4 4 2 10 A1A2 A2A2 A2A2 Alleler: A1 A2 A1A2 A1A1 Antal 12 8 20
Hur beräknar vi allel- och genotypfrekvenser? Istället för att använda räknedata från ett specifikt exempel, så kan vi generalisera förhållandet mellan alleler och genotyper med relativa frekvenser (p): A1A1 Genotyper: A1A1 A1A2 A2A2 A1A2 A1A2 A1A1 A1A1 Antal: 4 4 2 10 A1A2 A2A2 A2A2 Notation: X11 X12 X22 1 A1A2 A1A1 Relativa frekvenser (genotyper): 0.4 0.4 0.2 1 1. Frekvensdefinition av f Den relativa frekvensen av A1-alleler bland alla alleler i populationen: p(a1) = X11 + 1/2 X12 = 0.4 + 1/2 0.4 = 0.6 2. Sannolikhetsdefinition av p a) Dra slumpmässigt en individ ur populationen b) Dra slumpmässigt en allel från den individen p(a1) = X11 1 + X12 1/2 + X22 0 = 0.4 1 + 0.4 1/2 + 0.2 0 = 0.6 A1A1 A1A2 A2A2
Varför använder vi dessa frekvenser och hur kan förhållandet mellan dem illustreras? 1. Att räkna med frekvenser inbjuder oss att tänka i termer av sannolikheter (de är egentligen samma sak!). Detta har visat sig mycket användbart inom populationsgenetiken. 2. Givet att vissa specifika förhållanden råder i populationen vi studerar, så gäller ett enkelt samband mellan proportionerna av allel- och genotypfrekvenserna i en population: Detta samband kallas Hardy-Weinbergs lag, och det specifika förhållande som måste gälla är att inga evolutionära krafter verkar i populationen.
Hardy-Weinbergs lag/jämvikt (HWE) Vad är HWE? En av de mest använda principerna/grundmodellerna inom populationsgenetiken. Används för att identifiera inavel, parningssystem och populationsstruktur i verkliga populationer. Beskriver det förväntade förhållandet mellan genotypfrekvenser och allelfrekvenser i en ideal population.
Hardy-Weinbergs lag/jämvikt (HWE) Vad är en ideal population - förutsättningarna för HWE? 1. Slumpmässig parning 2. Oändligt stor populationsstorlek 3. Ingen migration 4. Inga mutationer 5. Ingen selektion Kort sagt: en population där inga evolutionära krafter verkar! Övriga: diploid organism med sexuell reproduktion; icke-överlappande generationer, osv
Hardy-Weinbergs lag/jämvikt (HWE) Alleler: A och a Allelfrekvenser: p + q = 1 Genotyper: AA, Aa, aa Genotypfrekvenser: p 2 + 2pq + q 2 = 1
Hardy-Weinbergs lag/jämvikt (HWE) Vad händer med allel- och genotypfrekvenser i en HWE population? Allelfrekvenserna förändras inte. Genotypfrekvenserna kan beräknas utifrån allelfrekvenserna. Om vi har ett två-allelslokus, med allel A i frekvensen p och allel a i frekvensen q = 1 - p, då gäller: Genotyper AA Aa aa Förväntade frekvenser p^2 2pq q^2 där allelfrekvenserna: p + q = 1 och genotypfrekvenserna: p 2 + 2pq + q 2 = 1
HWE och förväntad heterozygotigrad (= genetisk diversitet, He) HWE: Genotyper AA Aa aa Frekvens p 2 + 2pq + q 2 = 1 Den totala frekvensen homozygoter (F): F = kx i=1 p 2 i där k = antalet alleler i lokuset och pi = allelfrekvensen för allel i Analogt, så är förväntad heterozygotigrad den förväntade frekvensen heterozygoter (He) i en population i HWE: H e =1 F =1 kx i=1 p 2 i jmfr. med observerad heterozygotigrad: antalet heterozygoter H = totala antalet individer
Hardy-Weinberg proportioner Vid vilken allelfrekvens är heterozygotigraden maximerad? I vilken genotyp hittar vi lågfrekventa (sällsynta) alleler?
Test av Hardy-Weinberg proportioner i en population 1(4) Ett lokus för röda blodkroppar undersöktes hos 1000 engelska blodgivare: Genotyp AA Aa aa Observerat antal 298 489 213 =1000 Förväntat antal??? =1000 Är populationen i HWE vid detta lokus? Allelfrekvenser vid ett tvåallelslokus: p + q = 1 Förväntade genotypfrekvenser vid HWE: p 2 + 2pq + q 2 = 1
Test av Hardy-Weinberg proportioner i en population 2(4) Är populationen i HWE vid detta lokus? Genotyp AA Aa aa Observerat antal 298 489 213 =1000 Förväntat antal??? =1000 Allelfrekvenser: p + q = 1; förväntade genotypfrekvenser vid HWE: p 2 + 2pq + q 2 = 1 1. Beräkna allelfrekvenserna: p(a) = frekvens(a) = ((2 298) + 489) / (2 1000) = 0.5425 q(a) = 1 - p(a) = 1-0.5425 = 0.4575 2. Beräkna föväntade genotypfrekvenser (om population i HWE): Förväntad frekvens (AA) = p 2 = 0.5425 2 = 0.2943 Förväntad frekvens (Aa) = 2pq = 2 0.5425 0.4575 = 0.4964 Förväntad frekvens (aa) = 1 - (p 2 + 2pq) = 0.2093 3. Beräkna föväntat antal från genotypfrekvenserna: Förväntat antal (AA) = p 2 1000 = 294.3 Förväntat antal (Aa) = 2pq 1000 = 496.4 Förväntat antal (aa) = q 2 1000 = 209.3
Test av Hardy-Weinberg proportioner i en population 3(4) Är populationen i HWE vid detta lokus? Genotyp AA Aa aa Observerat antal 298 489 213 =1000 Förväntat antal 294.3 496.4 209.3 =1000 Överenstämmelse mellan observerat- och förväntat antal testas med ett X 2 -test (chi-2) med nollhypotesen H0: Ingen skillnad föreligger mellan observerat och förväntat antal; population i HWE. 2 = kx (o e) 2 e X 2 = teststatistik O = observerat antal e = förväntat antal k = antalet genotypklasser χ 2 = 2 2 ( 298 2 94,3) ( 489 4 96,4) ( 213 209,3) 294,3 + 496,4 + 209,3 2 = 0, 22
Test av Hardy-Weinberg proportioner i en population 4(4) Vår beräknade teststatistik för X 2 = 0.22 kontrolleras mot tabell: Frihetsgrader = k - 1 - ep ger df = 3-1 - 1 = 1 k = antalet klasser av data (varav 2 är fria att variera av 3) ep = antal parametrar estimerade från data (p) Från tabell: X 2 0.95; 1df = 3.841 0.22 < 3.841, H0 kan inte förkastas, dvs genotypfrekvenserna avviker inte signifikant från HWE proportioner. Populationen befinner sig i HWE.
Sammanfattning Populationsgenetiken är den bästa modell vi har för evolutionära processer. Populationsgenetik används för att nå ökad förståelse för evolutionära och demografiska processer. Hardy-Weinbergs lag är en central princip inom populationsgenetiken. Hardy-Weinberg jämvikt: Allelfrekvenser förändras inte över tiden. Allelerna kombineras slumpvis. Genotypfrekvenserna kan beräknas utifrån allelfrekvenserna (p + q = 1): Genotyper AA Aa aa Frekvenser p 2 2pq q 2