Nr 999 Simulering ör tet av multile trait analy ör egenkaer mätta å olika individer Gunnar Janon & Öje anell Uala Science Park, SE 75 83 UPPSL Tel: 08-8 85 00 Fax: 08-8 86 00 kogork@kogork.e htt://www.kogork.e
Ämneord: kogträdörädling, imulering SkogFork Stitelen Skogbruket Forkningintitut SkogFork arbetar ör ett långiktigt, lönamt kogbruk å ekologik grund. Bakom SkogFork tår kogbolag, kogägareöreningar, tit, god, allmänningar, lantkolor, SkogMakinFöretagarna m.l., om betalar årliga intreentbidrag. Hela kogbruket bidrar deutom till inanieringen genom en avgit å virke om avverka i Sverige. Verkamheten inaniera vidare av taten enligt ärkilt avtal och av onder om ger rojektbundet töd. SkogFork arbetar med orkning och utveckling med oku å yra centrala rågetällningar: Produktvärde och roduktioneektivitet, Miljöanaat kogbruk, Nya organiationtrukturer amt Skogodlingmaterial. På de områden där SkogFork har ärkild kometen utör även i tor omattning udrag åt kogöretag, makintillverkare och myndigheter. Serien rbetraort dokumenterar långliggande örök amt inventeringar, tudier m.m. och ditribuera enbart eter ärkild betällning. Forkning- och örökreultat rån SkogFork ublicera i öljande erier: SkogFork-Nytt: Nyheter, ammanattningar, överikter. Reultat: Slutater och rekommendationer i lättillgänglig orm. Redogörele: Utörlig redovining av genomört orkningarbete. Reort: Vetenkaligt inriktad erie (å engelka). Handledningar: nviningar ör hur olika arbeten lämligen utör. ISSN 0-305X 88b9e-c3b-3d6-95d-3530375cad8.doc-beba-000-0-
Innehåll Inledning... 3 Material och metoder... Modell... Statitik och biologik modell... 5 Simulering av avkommevärden... 5 Förutättningar... 7 Simuleringtudie... 7 Simuleringtudie... 8 Reultat och dikuion... 9 Simuleringtudie... 9 Simuleringtudie... 0 Slutat... 3 Reerener... 3 88b9e-c3b-3d6-95d-3530375cad8.doc-beba-000-0-
88b9e-c3b-3d6-95d-3530375cad8.doc-beba-000-0-
Inledning Inom kvantitativ genetik och hudjurörädling har under de enate decennierna kett en mycket nabb utveckling och ananing av avancerad tatitik kattningmetodik ör genetika tillämningar. Motvarande akna nätan helt inom kogträdörädling. När det gäller kattning av genetika korrelationer är metodkraven mycket tora. Svårigheten ligger i att man aldrig kan mäta genotyer eller genetik variation direkt utan enbart den enotyvariation om är det amlade reultatet av genetika eekter och relativt ett betydligt törre individuell miljöåverkan. Skattning av ett genetikt amband innebär att man ur ynliga/mätbara enotyvärden kall ärkilja ett genetikt amband. Skattningrincien bygger å att man via graden av likhet (kovarian) mellan via tyer av läktingar aveende ambandet mellan egenkaerna identiierar den genetikt betingade delen av ambandet. Genetika korrelationer är genom det indirekta kattningättet behätade med tora kattningel. Seciellt våra ur metodynunkt är kattningar av genetika amband mellan egenkaer, om kommer till uttryck å olika individer, t.ex. träd i etträdarceller kontra träd i lerträdarceller eller träd rån amma amilj mätta i olika örök. en idag rekommendabla metodiken bygger å Mixed Model Equation (MME) och iterativ kattning med.k. Retricted Maximum Likelihood -teknik (REML). ktuella metodöverikter ge av bl.a. Henderon (98), Mayer (990, 99) och Schaeer (986, 993). REML-tekniken är lexibel och kan relativt lätt anaa till olika multivariata modeller där deignmatrien varierar mellan variabler. Man kan t.ex. ha olika ixa eekter ör de olika egenkaerna. Vidare kan ena egenkaen vara mätt å t.ex. halvykonmaterial och den andra å helykonmaterial. I regel är kraven åa eciella i varje enkilt all att det kräver mer eller mindre kräddarydda löningar, bl.a. å grund av att beräkningarna ota är mycket krävande. etta innebär att användare inom kogträdörädling ota är hänviade till egen utveckling av rogramvara ör ina tillämningar. För den eciella men relativt vanliga ituationen där olika egenkaer mät å olika trädindivider har därör ett FORTRN-rogram ör kattning av varianer och kovarianer med REML-metodik utarbetat ör att använda inom kogträdörädling (rogram TTFSREML, Janon, 997). Programmet är gjort ör två egenkaer mätta å olika individer och aver helykonanaly. För att teta rogrammet har data med kända varianer och kovarianer imulerat och jämört med de kattningar om rogrammet ger. Huvudytet med imuleringarna i denna raort har varit att jämöra de kattningar av arametrar om FORTRN-rogrammet ger med imulerade data genererade utirån kända varianer och kovarianer. Ett andra yte var att via hur imuleringar kan använda ör att katta medelel till genetika korrelationer. 88b9e-c3b-3d6-95d-3530375cad8.doc-beba-000-0- 3
Material och metoder Simuleringarna har gjort ör en ituation med två egenkaer mätta å olika individer och aver helykon. Modell I matriorm har modellen öljande uteende: y X y 0 där y och y X och X b och b Z och Z och Z och Z och e och e 0 b Z X b 0 0 Z Z 0 e e obervationvektor ör de två egenkaerna deignmatri ör ixa blockeekter vektor med ixa blockeekter deignmatri ör lummäiga öräldraeekter vektor ör lummäiga öräldraeekter deignmatri ör lummäiga amiljeeekter vektor med lummäiga amiljeeekter vektor med lummäiga reidualer 0 Z Förväntade medelvärden var y Xb E y Xb e E E E e 0 Varian-kovarianmatrierna är (öräldrarna anta vara obeläktade) Var g g g g g med inver g g I, g I, g g I g g Var med inver I, I, I och och Var e r 0 e r 0 0 r med inver och e I e, e I 0 r Cov( ) Cov( ) Cov(,, e e, e e ) 0. e 88b9e-c3b-3d6-95d-3530375cad8.doc-beba-000-0-
Statitik och biologik modell en biologika modellen utgör grunden ör imuleringarna. Utirån genetika varianer och kovarianer generera data om varar mot den tatitika modellen. en tatitika modellen, y jj' k j j ' jj ' e jj' k, leder till öljande ammanättning av den totala enotyika varianen t där t e e enotyik varian öräldravarian amiljevarian reidualvarian en genetika modellen, P E, ger å motvarande ätt P där P E enoyik varian additiv öräldravarian dominanvarian E miljövarian Sambandet mellan de tatitika och genetika variantermerna är 3 e E Simulering av avkommevärden För varje individ generera en avkommeobervation med ett y-värde ör den imulerade egenkaen. För att detta kall vara möjligt välj ört: h h d d r r heritabilitet ör egenka heritabilitet ör egenka dominanvarian i örhållande till enotyik varian ör egenka dominanvarian i örhållande till enotyik varian ör egenka additiv genetik korrelationkoeicient dominankorrelation r E miljömäig korrelation, i detta all örutatt vara 0 P enotyik varian ör egenka 88b9e-c3b-3d6-95d-3530375cad8.doc-beba-000-0- 5
P enotyik varian ör egenka b ör i =, n ix blockeekt ör egenka j b ör i =, n ix blockeekt ör egenka j Utirån dea örutättningar beräkna additiv genetik varian ( ) domi- nanvarian ( ) och miljövarian ( E ) : h P h P d P d P E P E P Tredje teget blir edan att generera data. etta öljer nedantående arbetgång. Sammanlagt öräldrabidrag i egenka : k k k där och är eekt av örälder, reektive och k och k är eudolumtal ör öräldereekt reektive öräldereekt och är genererade ör N(0,). Sammanlagt öräldrabidrag i egenka : k r ( r ) r ( r ) k k k k där och är eekt av örälder, reektive och k reektive k är amma lumtal om i öregående uttryck. Familjebidraget i egenka ( ) : k Familjebidraget i egenka ( ) : r r ( ) k k 3 88b9e-c3b-3d6-95d-3530375cad8.doc-beba-000-0- 6
vkommeobervation i egenka : 3 y b 5 där 3 k k 5 E k 6 utgör den lummäiga reidualen i den tatitika modellen. i k k E k 6 vkommeobervation i egenka : 3 y b 7 8 med motvarande reidualterm ammanatt av de tre ita termerna. i k k E k 9 Förutättningar I tabell redovia örutättningarna ör de två imuleringtudierna. Tabell. Förutättningar ör imuleringarna Simuleringtudie Simuleringtudie ntal öräldrar 30 60 ntal block 0 0 ntal avkommor er amilj och block ntal amiljer 5 75 ntal imuleringar 5 30 Simuleringtudie I några imuleringar har 5 % av obervationerna lummäigt tagit bort ör att imulera en överlevnad å 75 %. Simuleringar har gjort del med ett artiellt diallelt korningchema (igur ), del med ett aktoriellt korningchema (igur ). I några all har imuleringarna baerat å aktika datadeigner och den lutgiltiga MME-löningen och variankattningen. etta innebär att MME-löningen ixa eekter ör reektive egenka utnyttjat. Till dea har edan lumgenererade värden ör örälder, amilj och reidual adderat. Modellen ör att generera avkommeobervation blir i detta all ör egenka : y ijj ' k b i j j' jj ' e och ör egenka : ijj' k y ijj ' k b i r r j jj' ( r ) ( r j ) r jj' j' e ijj ' k ( r ) j' 88b9e-c3b-3d6-95d-3530375cad8.doc-beba-000-0- 7
där y tijj' k är obervation k å örälderkombination jj i block i och egenka t och alla är genererade normalördelade eudo-lumtal N(0, ). Konvergen anåg unådd när den relativa örändringen ör all varian- och kovariankattningar rån en iteration till näta var mindre än 0,0000 ( i några all 0,000). Förälder 3 5 6 7 8 9... 3 5 6 7 8 9 30 x x x x x x x x x x 3 x x x x x x x x x x 5........ x x x x x 3 x x x x x x x x x x 5 x x x x x Figur. Partiellt diallelt korningchema om har använt i huvuddelen av imuleringarna. x markerar de korningar om ingår. Förälder 3 5 6 x x x x x 7 x x x x x 8 x x x x x 9 x x x x x........................ 7 x x x x x 8 x x x x x 9 x x x x x 30 x x x x x Figur. Faktoriellt korningchema om använt i några av imuleringarna. x markerar de korningar om ingår. Simuleringtudie Simuleringtudie kiljer ig rån tudie genom att imuleringarna har genomört med ett törre datamaterial (tabell ). Ett artiellt diallelt korningchema med 5 korningar er örälder utnyttjade. I denna tudie redovia även exemel å hur imuleringar kan utnyttja ör att katta medelel till genetika korrelationer. 88b9e-c3b-3d6-95d-3530375cad8.doc-beba-000-0- 8
Reultat och dikuion Simuleringtudie Tabell viar en ammantällning av reultaten av imuleringarna. I igur 3 och via avvikelen mellan kattad och örutatt korrelation or den additiva korrelationen reektive dominan korrelationen. Tabell. Reultat av imuleringarna. Förutättningar Skattad r() r() h h ntal ob. trait ntal ob. trait eign Överlevnad % r() r() -0,95-0,95 0,0 0,0 5 000 5 000 Part 00-0,955-0,88-0,75-0,75 0,0 0,0 5 000 5 000 Part 00-0,73-0,73 0,00 0,00 0,0 0,0 5 000 5 000 Part 00 0,003 0,00 0,5 0,5 0,0 0,0 5 000 5 000 Part 00 0,9 0,8 0,5 0,5 0,0 0,0 5 000 5 000 Part 00 0,68 0,8 0,50 0,50 0,0 0,0 5 000 5 000 Part 00 0,53 0,503 0,75 0,75 0,0 0,0 5 000 5 000 Part 00 0,738 0,7 0,75 0,75 0,05 0,70 5 000 500 Fakt 00 0,738 0,6 0,75 0,75 0,0 0,0 5 000 5 000 Part 00 0,77 0,76 0,75 0,75 0,0 0,0 5 000 5 000 Part 75 0,756 0,78 0,90 0,90 0,0 0,0 5 000 5 000 Part 00 0,9 0,86 0,90 0,50 0,05 0,70 5 000 500 Part 00 0,937 0,0 0,90 0,50 0,05 0,70 5 000 500 Fakt 00 0,90 0,3 0,90 0,90 0,0 0,0 50 5 000 Part 75 0,903 0,76 0,95 0,95 0,0 0,0 5 000 5 000 Part 00 0,96 0,880 0,95 0,95 0,0 0,0 5 000 5 000 Fakt 00 0,9 0,896 0,95 0,95 0,0 0,0 5 000 5 000 Part 00 0,963 0,886 0,98 0,98 0,0 0,0 5 000 5 000 Part 00 0,98 0,9 0,99 0,680 0,058 0,03 80 0 Part Verklig 0,830 0,60 0,753 0,670 0,0070 0,6 96 0 Part Verklig 0,53 0,595 0,8536 0,973 0,7 0,6590 3 857 5 Fakt Verklig 0,860 0,75 0,595 0,06 0,8 0,600 8 5 Fakt Verklig 0,337 0,6 0,8533 0,930 0,33 0,595 3 857 5 Fakt Verklig 0,833 0,76 Reultaten viar å god överentämmele mellan de örutatta arametrarna och de eter imuleringarna kattade arametrarna med beaktande av de medelel om de är behätade med. Simuleringar baerade å data hämtade ur verkliga material med den lutgiltiga MME-löningen och variankattningen har den törta avvikelen mellan örutatt och kattad korrelation och uviar en vi tenden till underkattning jämört med den örutatta genetika korrelationen. etta kan örklara av låg heritabilitet och litet datamaterial. 88b9e-c3b-3d6-95d-3530375cad8.doc-beba-000-0- 9
Förutatt korrelation Figur 3. vvikele i additiv genetik korrelation, r(). vvikel kattad och örutatt korrelation ( r ( ) kattad r ( 0,5 0, 0,5 0, 0,05 0 - -0,5-0,05 0 0,5-0, -0,5-0, -0,5 vvikele ). Punkterna betecknar imuleringar baerade å verkliga datadeigner med den lutgiltiga MME-löningen och variankattningen. Förutatt korrelation Figur. vvikele i dominankorrelation, r(). vvikelen har beräknat om killnaden mellan kattad och örutatt korrelation ( r ( ) kattad r ( ) örutatt 0,5 0, 0,5 0, 0,05 0 - -0,5-0,05 0 0,5-0, -0,5-0, -0,5 vvikele ). Punkterna betecknar imuleringar baerade å verkliga datadeigner med den lutgiltiga MME-löningen och variankattningen. Simuleringtudie I den andra imuleringtudien använde 60 öräldrar och 75 amiljer, d.v.. ett betydligt törre material än i Simuleringtudie. Ett artiellt diallelt korningchema använde där varje örälder ingick i 5 korningar. I igur 5 och 6 via avvikelen mellan kattad och örutatt korrelation or den additiva korrelationen reektive dominan korrelationen. Reultaten viar å god överentämmele mellan de örutatta arametrarna och de eter imuleringarna kattade arametrarna (med beaktande av de relativt tora el de är behätade med) över hela kalan rån korrelationer å - till +. 0 88b9e-c3b-3d6-95d-3530375cad8.doc-beba-000-0-
vvikele vvikele Figur 5. vvikele i additiv genetik korrelation, r(). vvikelen ha Figur 6. vvikele i dominankorrelation, r(). vvikelen har beräknat om killnaden mellan kattad och örutatt korrelation ( r ( ) kattad r ( ) örut dditv, avvikele (kattad-örutatt) 0,0 0,08 0,06 0,0 0,0 0,00 -,00-0,50-0,00,00 0,50,00 kattad och örutatt korrelation ( r ( ) kattad r ( ) örutatt -0,0-0,06-0,08-0,0 Förutatt ). ominan, avvikele (kattad-örutatt) 0,0 0,08 0,06 0,0 0,0 0,00 -,00-0,50-0,00,00 0,50,00-0,0-0,06-0,08-0,0 Förutatt ). 88b9e-c3b-3d6-95d-3530375cad8.doc-beba-000-0-
REML enligt EM algoritmen ger inga elkattningar till variankomonenter eller därur kattade arametrar. För att å elkattningar kan imuleringar använda. Tillvägagångättet är då att ört katta eekter och varianer ur data och edan utnyttja dem i imuleringarna. Till dea kända blockeekter addera genetika och miljömäiga eekter rån normalördelade eudolumtal med de varianer om tidigare kattat rån data. ea imuleringar urea ett antal gånger ör varje dataet. Medelelet till kattningarna erhåll edan om tandardavvikelen till en (ko)variankomonent eller arameter. I igur 7 via exemel å imulerat medelel ör additiv genetik korrelation. Felet är mint när korrelationen är nära - eller + och tört när korrelationen ligger nära 0. I igur 8 via motvarande ör dominankorrelationen. Medelel 0, 0,5 0, 0,05 0 -,00-0,80-0,60-0,0-0,0 0,00 0,0 0,0 0,60 0,80,00 Figur 7. Medelel vid olika additiv genetik korrelation kattad rån imuleringarna. Medelel 0, 0,5 0, 0,05 0 -,00-0,50 0,00 0,50,00 Figur 8. Medelel vid olika dominankorrelation kattad rån imuleringarna. 88b9e-c3b-3d6-95d-3530375cad8.doc-beba-000-0-
Slutat Huvudytet med imuleringtudien var att utirån kända varianer och kovarianer imulera data ör att jämöra med de kattningar om FORTRNrogrammet ger. Varken avvikelen i additiv genetik korrelation eller dominan korrelation viar å några törre ytematika avvikeler. en använda REML-roceduren ger inga elkattningar till variankomonenter eller därur kattade arametrar. I raorten ge exemel å hur imuleringar kan använda ör att ta ram elkattningar till genetika korrelationer. Reerener Henderon, C. R. 98. lication o linear model in animal breeding. Guelh, Univerity o Guelh. 3. Janon, G. 997. TTFSREML (Two Trait Full Sib REtricted Maximun Likelihood). atarogram ör kattning av varianer och avelvärden i avkommeörök med diallell eller aktoriell korninglan och med två egenkaer mätta å olika individer. (SkogFork), Uala. Mayer, K. 990. Preent tatu o knowledge about tatitical rocedure and algorithm to etimate variance and covariance comonent. Proc. th World congre on Genetic alied to Livetock Production, Edinburgh 3-7 July, 990, Vol XIII, 07 8. Mayer, K. 99. Etimating variance and covariance or multile animal model by retricted maximum likelihood. Genet. Sel. Evol. 5, 67 83. Schaeer, L. R., Wilton, J. W. & Thomon, R. 978. Simultaneou etimation o variance and covariance comonent rom multitrait mixed model equation. Biometric 3: 99 08. Schaeer, L.R. 993. Variance comonent etimation method. Komendium. Univerity o Guelh, Guelh, Ontario. 3 88b9e-c3b-3d6-95d-3530375cad8.doc-beba-000-0-