Serik Sagitov Matematiska Vetenskaper, Chalmers Coalescent trees in phylogenetic inference 1
Example of a species tree and 3 gene trees Species tree S Gene trees G 2
Liang Liu and Dennis K. Pearl Systematic Biology 56 (2007), 504-514 Species Trees from Gene Trees: reconstructing Bayesian posterior distributions of a species phylogeny using estimated gene tree distributions 3
BAYESIAN HIERARCHICAL MODEL f ( S D) = 1 f ( D G, Λ) f (G S, θ ) f (θ ) f ( S ) f (Λ)dθdGdΛ f ( D) f (S ) prior probability of species tree S f ( S D) posterior probability of species tree given sequence data D f ( D G, Λ ) likelihood of the sequence data D given the gene trees G and parameters Λ in the substitution model f (G S, θ ) prior distribution of the gene trees given the species trees and θ = 4µ N eff scaled effective population sizes 4
3 independent coalescent trees 3 n= n=2 5
WF-populationsmodell R.A.Fisher S.Wright Sewell Wright R. A. Fisher Antaganden J. B. S. Haldane Sewell Wright generationer R. A. Fisher 3. icke-överlappande 4. konstant generationsstorlek N 5. WF-nedärvning (slumpgifte) J. B. S. Haldane 6
WF-nedärvning med N=5 Barn Föräldrar 2 0 0 2 0 3 1 0 1 1 7
Tid 18 generationer i WF-modellen N=11
Tid Genetisk drift i balans med neutral mutation
Fullt genträd med mutationer TCGAGGTATTAAC TCTAGGTATTAAC TCGAGGCATTAAC
Delträd för n=5 sekvenser utav 2N=22
Kingmans koalescent trädmodellen för n sekvenser som är utvalda på måfå från en stor WF-population ett viktigt redskap i molekylär populationsgenetik WF-tolkningen av grenlängden i koalescent-träd 1 längdenhet = 2N generationer 12
1000 generationer 1 Simulerade koalescentträd för n=25 Tolkningen för WFmodellen med N=500 13
Effektiv populationsstorlek Neff Mer realistisk modell Koalescent Neff = N WF-modellen Tolkningen av grenlängden i koalescent-träd 1 längdenhet = 2Neff generationer 14
Två populationer med samma verkliga storlek N men skilda effektiva storlekar Neff Antalet mutationer placerade i varje koalescentträd är proportionellt mot Neff n=4 mindre Neff större Neff mindre genetisk större genetisk variation variation 15
Exempel på små Neff Nordliga elefantsälen: Ingen genetisk variation funnen vid jämförelse av 20 olika gener Dagens verkliga populationsstorlek överstiger 30,000 På 1890-talet jagades beståndet ner till 20 individer Den genetiska variationen hos vilda gepardbestånd är betydligt mindre än hos andra däggdjur med liknande populationsstorlekar. 16
Faktorer som påverkar genetiska driften fluktuationer i populationsstorlek parningssystem migrationsmönster åldersfördelning variationsgrad i antalet barn per familj 17
Neff = N/σ2 Generaliserad WF-nedärvning konstant populationsstorlek N variansen σ2 i antal barn per familj WF-modellen ger σ2 1 Större varians σ2 gör att Neff blir mindre 18
Neff = N/cgeo cgeo = v12 /x1+ + vk2 /xk Geografiskt strukturerad modell med snabb migration subpopulationer av storlekarna Nx1,, Nxk stationära frekvenser för bakåtriktad migration v1,, vk WF-nedärvning 19
Neff = N/cdem cdem = i j vi σij2 π ij xj /xi2 Varierande populationsstorlek [Jagers and Sagitov, JAP-04] möjliga populationsstorlekar Nx1,, Nxk övergångssannolikheter πij stationära frekvenser v1,, vk generaliserad WF-nedärvning 20
Neff = N/cage en ny formel för cage Modell med överlappande generationer [Sagitov and Jagers, AAP-05] konstant populationsstorlek konstant åldersfördelning konstant åldersfördelning för mödrar vid barnafödande generaliserad WF-nedärvning 21
Exempel: svenska kvinnor 2002 111 årskullar Neff = medellivslängd 82.6 år mödrarnas snittålder vid barnafödande 30.6 år 0.39 N 22
Kommande projekt 1. Geografiskt strukturerade populationer i varierande miljö 2. WF-modellen med något som kallas för isolering via avstånd 3. Två-könsmodeller med polygamisk parning För dessa tre modeller skall det etableras nya formler för Neff 23
Publikationer 1. 2. 3. 4. 5. 6. Sagitov S. (1999) The general coalescent with asynchronous mergers of ancestral lines. J. Appl. Prob. 36, 1116-1125. Möhle M. and Sagitov S. (2001) A classification of coalescent processes for haploid exchangeable population models. Ann. Prob. 29, 1547-1562. Sagitov, S. (2003) Convergence to the coalescent with simultaneous multiple mergers. J. Appl. Prob. 40, 839-854 Möhle M. and Sagitov S. (2003) Coalescent Patterns in Exchangeable Diploid Population Models. J. Math. Biol. 47, 337-352. Jagers P. and Sagitov S. (2004) Convergence to the coalescent in populations of substantially varying size. J. Appl. Prob. 41, 368-378. Sagitov S. and Jagers P. (2005) The coalescent effective size of age-structured populations. Ann. Appl. Probab. 15, 1778-1797 Tack så mycket för er sammanlagt mer än 60 timmars uppmärksamhet!!! 24