Föreläsning 7 Statistik; teori och tillämpning i biologi 1
Dagens föreläsning o Fortsättning envägs-anova Scheffes test (kap 11.4) o Tvåvägs-ANOVA Korsade faktorer (kap 12.1, 12.3) Randomiserade blockförsök (kap 12.4ab) Upprepade mätningar (kap 12.4c) Nästlad ANOVA (kap 15.1) 2
Envägs-ANOVA Multipla jämförelser, Scheffes test När man vill jämföra kombinationer av medelvärden med en annan kombination av medelvärden eller ett specifikt medelvärde (multipla kontraster) används Scheffes test. Stegen för hypotesprövning följs. Testvariabeln betecknas S och beräknas enligt: (GB s. 251, BB s. 237) S = c ix i SE SE = s 2 c i 2 n i = error MS c i 2 n i där c i är koefficienten som tillhör medelvärdet från grupp nummer i. Kritiska värdet är: S α = k 1 F α 1,k 1,N k 3
Envägs-ANOVA Multipla jämförelser, Scheffes test Hypoteserna kan formuleras enligt: H 0 : μ 1 + μ 2 2 H a : μ 1 + μ 2 2 μ 3 + μ 4 2 μ 3 + μ 4 2 = 0 0 Konfidensintervall kan skapas: (GB s. 253, BB s. 239) c i X i ± S α SE 4
Envägs-ANOVA Multipla jämförelser, Scheffes test, exempel Vi återgår till exemplet med grisfoder från föregående föreläsning. En tillverkare gör foder 1 och 3, och en annan tillverkare gör foder 2 och 4. Undersök om det är skillnad i viktökning mellan de två tillverkarna. Foder 1 Foder 2 Foder 3 Foder 4 X i 2,42 5,18 1,14 6,94 n i 5 6 5 5 error MS = 12,2 17 5
Tvåvägs-ANOVA (lika antal obs.) (GB s. 264-278, BB s. 250-264) Nu går vi över till tvåvägs-anova med lika antal observationer. Detta innebär att grupperna är indelade efter två faktorer och att det är lika många observationer i varje cell. Varför använda tvåvägs-anova? Tidseffektivt att undersöka två faktorer samtidigt Det kan testas för effekter för båda faktorerna Man kan upptäcka interaktioner (t.ex. synergi) mellan två faktorer Om det inte är lika många observationer i varje cell uppstår ett beroende mellan de kvadratsummor som ska beräknas, vilket gör analysen väldigt komplex. 6
Tvåvägs-ANOVA (lika antal obs.) Beteckningar a antalet nivåer på faktor A b antalet nivåer på faktor B n antalet observationer i en cell N = abn totala antalet observationer X ijl obs l på nivå i (faktor A) och nivå j (faktor B) X ij cellmedelvärde för cellen ij X i medelvärde för nivå i på faktor A X j medelvärde för nivå j på faktor B X totalmedelvärde 7
Tvåvägs-ANOVA (lika antal obs.) Exempel En forskare vill undersöka hur kackerlackor växer i olika kombinationer av temperatur och luftfuktighet. 27 identiska kackerlackor delas upp på 9 olika kombinationer av dessa faktorer, och deras längd i mm observeras efter två veckor. Temperatur (Celsius) Luftfuktighet (%) 20 30 40 33 66 99 1 2 3 9 10 11 17 18 19 8 5 6 7 13 14 15 21 22 23 9 10 11 18 19 20 26 27 28
Tvåvägs-ANOVA (lika antal obs.) Kvadratsummor (GB s. 265-267, BB s. 251-253) a b total SS = X ijl X 2 n i=1 j=1 l=1 a cells SS = n X ij X 2 a b i=1 j=1 b error SS = X ijl X ij 2 i=1 j=1 Cells SS kan delas upp i tre andra kvadratsummor, nämligen factor A SS, factor B SS och AB interaction SS. Det är dessa tre kvadratsummor som är av intresse. n l=1 9
Tvåvägs-ANOVA (lika antal obs.) Kvadratsummor factor A SS = bn X i X 2 a i=1 b factor B SS = an X j X 2 j=1 AB interaction SS = cells SS (factor A SS + factor B SS) 10
Tvåvägs-ANOVA (lika antal obs.) Kvadratsummor, ANOVA-tabell (GB s. 270, BB s. 256) DF SS MS Factor A a-1 bn X i X 2 a i=1 b Factor B b-1 an X j X 2 Interaction (a-1)(b-1) j=1 cells SS (factor A SS + factor B SS) Error ab(n-1) X ijl X ij 2 b i=1 j=1 n l=1 Total N-1 X ijl X 2 a a b n i=1 j=1 l=1 SS DF SS DF SS DF SS DF 11
Tvåvägs-ANOVA (lika antal obs.) Undersöka effekter (ex. GB s.265-69,bb s.251-55) Med hjälp av tvåvägs-anova går det som sagt att testa för faktor A-, faktor B- och interaktionseffekt. Dessa olika tester följer de fyra stegen för hypotesprövning. H 0 : μ 1 = μ 2 = = μ a H a : minst två μ i är olika Faktor A-effekt H 0 : μ 1 = μ 2 = = μ b H a : minst två μ j är olika Faktor B-effekt H 0 : Det finns ingen interaktion mellan faktor A och B H a : Det finns interaktion mellan faktor A och B 12
Tvåvägs-ANOVA (lika antal obs.) Olika modeller (GB s. 275-276, BB s. 261-262) Hur man beräknar testvariabeln F varierar beroende på hur studien har lagts upp. Det finns tre olika modeller: Model 1 ANOVA Man är bara intresserad av de valda nivåerna på faktorerna, dvs. båda faktorerna är fixa Model 2 ANOVA Båda faktorerna är slumpmässiga (random), vilket innebär att man är intresserad av alla möjliga nivåer på de två faktorerna Model 3 ANOVA Ena faktorn är fix, andra faktorn är slumpmässig 13
Tvåvägs-ANOVA (lika antal obs.) Beräkna testvariabeln F (GB s. 276, BB s. 262) Model ANOVA Effekt 1 (A,B fixa) 2 (A, B slump) 3 (A fix, B slump) Faktor A factor A MS error MS factor A MS interact. MS factor A MS interact. MS Faktor B factor B MS error MS factor B MS interact. MS factor B MS error MS Interaktion interact MS error MS interact MS error MS interact MS error MS 14
Tvåvägs-ANOVA (lika antal obs.) Multipla jämförelser Om man upptäcker en signifikant interaktionseffekt innebär det att faktoreffekten för en faktor varierar för olika nivåer på den andra faktorn. Då är det (oftast) inte intressant att undersöka faktoreffekterna, och inte heller att jämföra medelvärden för olika nivåer på faktorerna. Man bör istället göra multipla jämförelser enligt metoderna i kapitel 11 på cellmedelvärdena. Om interaktionseffekten ej är signifikant, men faktoreffekterna är signifikanta kan det göras jämförelser mellan medelvärden för olika nivåer på de fixa faktorerna enligt metoderna i kapitel 11. Se stycket om det på sidan 288-289 i GB och 274-275 i BB. 15
Tvåvägs-ANOVA (lika antal obs.) Exempel 16
Tvåvägs-ANOVA (lika antal obs.) Beräkna testvariabeln F, exempel Vi återgår till exemplet med kackerlackor. För att genomföra en tvåvägs-anova har SPSS använts, och en reducerad utskrift finns nedan. Utred om det finns faktoreffekter eller interaktionseffekter. 17
Tvåvägs-ANOVA (bara en obs.) (GB s. 281-282, BB s. 267-268) Ett specialfall vid tvåvägs-anova är det när man bara en observation per cell, n = 1. Kvadratsummorna total SS, factor A SS och factor B SS beräknas på samma sätt som innan. Men, eftersom vi bara har en observation per cell blir error SS noll. Istället beräknas remainder SS enligt: total SS (factor A SS + factor B SS) Om man kan anta att det finns interaktion mellan de två faktorerna rekommenderas det att man inte gör några test alls. 18
Tvåvägs-ANOVA Andra varianter Beroende på vad hur undersökningen ska utformas finns det ett antal olika varianter på tvåvägs-anova. Vi kommer diskutera tre olika varianter och när de ska användas: Randomiserade blockförsök (kap 12.4a) Upprepade mätningar (repeated measures, kap 12.4c) Nästlad (hierarkisk) ANOVA (kap 15.1) 19
Tvåvägs-ANOVA Randomiserade blockförsök Randomiserade blockförsök används när man vill undersöka en faktor, men man måste ta hänsyn till en underliggande faktor som kan påverka resultatet. Denna underliggande faktor kallas då för block. Ett exempel på detta kan vara att man vill testa fyra olika frösorter i något avseende. Då kan planteringens position påverka utfallet, så då kan man plantera de fyra olika frösorterna i ett visst antal ytor. Dessa olika ytor blir då blocken i denna undersökning. Ett randomiserat blockförsök har oftast bara en observation per cell. Blocken är slumpmässiga och den huvudsakliga faktorn är fix, så beräkningar sker enligt ANOVA modell 3. 20
Tvåvägs-ANOVA Upprepade mätningar Inom biologi använder man sig ofta av upprepade mätningar, det vill säga att samma enhet observeras ett antal gånger under olika förutsättningar (på en faktor). Kursboken ger ett exempel där tre försöksdjur utsätts för olika bedövningsmedel. När effekten för ett bedövningsmedel försvunnit prövas ett annat och så vidare. Det kan även handla om att man undersöker hur något utvecklas över tid och då mäter samma enhet vid olika tidpunkter. Även för denna variant sker beräkningar enligt ANOVA modell 3. 21
Tvåvägs-ANOVA Nästlad (hierarkisk) ANOVA De varianter vi diskuterat tidigare används när de två faktorerna är korsade, vilket innebär att alla nivåer på faktor A kan kombineras med alla nivåer på faktor B. Men, ibland kan faktor B vara nästlad inom faktor A. Detta betyder att olika nivåer på faktor B bara finns i kombination med en eller några kombinationer på faktor A. Man kan då även se faktor A som grupper och faktor B som undergrupper till faktor A. I nästlad ANOVA kan man inte skatta någon interaktionseffekt, på grund av att faktorerna ej är korsade. 22
Nästlad (hierarkisk) ANOVA Exempel En forskare vill undersöka hur vikten hos räkor påverkas om de utöver sin vanliga mat även äter vitamin A respektive B. Forskaren hade bara tillgång till sex olika dammar med identiska räkor i, så vitamin A och B tillsattes i två dammar vardera och de två sista dammarna användes som kontroll. Efter sex månader vägdes räkorna och detta samman-ställdes i nedanstående tabell. Vikten är angiven i gram. Kontroll Vitamin A Vitamin B Damm 1 Damm 2 Damm 3 Damm 4 Damm 5 Damm 6 30 60 80 110 140 170 35 65 85 115 150 175 45 75 95 125 155 185 50 80 100 130 160 190 23
Tack för idag! Nästa tillfälle: Lektion 4, onsdag 13 april 10-12, sal S41 24