Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi

Relevanta dokument
Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Fuktighet i jordmåner. Variansanalys (Anova) En statistisk fråga. Grafisk sammanfattning: boxplots

Statistisk försöksplanering

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Statistisk försöksplanering

Föreläsning G60 Statistiska metoder

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning G60 Statistiska metoder

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

7.5 Experiment with a single factor having more than two levels

Föreläsning G60 Statistiska metoder

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

7.5 Experiment with a single factor having more than two levels

8.1 General factorial experiments

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

TENTAMEN PC1307 PC1546. Statistik (5 hp) Onsdag den 20 oktober, Ansvarig lärare: Bengt Jansson ( , mobil: )

Omtentamen i Metod C-kurs

ANOVA Mellangruppsdesign

Föreläsning 15: Faktorförsök

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Tentamen för kursen. Linjära statistiska modeller. 20 mars

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 11 december, Ansvarig lärare: Bengt Jansson ( , mobil: )

Introduktion till statistik för statsvetare

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 7 maj, 2011

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Hur skriver man statistikavsnittet i en ansökan?

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning G60 Statistiska metoder

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Elementa om Variansanalys

Statistik 1 för biologer, logopeder och psykologer

TENTAMEN. PC1307/1546 Statistik (5 hp) Måndag den 19 oktober, 2009

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

OBS! Vi har nya rutiner.

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Föreläsningsanteckningar till kapitel 9, del 2

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Räkneövning 3 Variansanalys

Multipel Regressionsmodellen

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

Tentamen i matematisk statistik

Tentamen i matematisk statistik

AMatematiska institutionen avd matematisk statistik

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Vetenskaplig metod och statistik

, s a. , s b. personer från Alingsås och n b

F3 Introduktion Stickprov

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Följande resultat erhålls (enhet: 1000psi):

Regressions- och Tidsserieanalys - F3

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

Tentamen i Matematisk statistik Kurskod S0001M

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 24 april, Ansvarig lärare: Bengt Jansson ( , mobil: )

Hur man tolkar statistiska resultat

Föreläsning 5. Kapitel 6, sid Inferens om en population

Tentamen i Dataanalys och statistik för I den 28 okt 2015

Matematisk statistik för B, K, N, BME och Kemister

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Lösningsförslag till Matematisk statistik LKT325 Tentamen

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Tentamen i Matematisk statistik Kurskod S0001M

Vetenskaplig metod och statistik

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

F23 forts Logistisk regression + Envägs-ANOVA

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, ONSDAGEN DEN 17 MARS 2010 KL

Ledtrådar till utvalda uppgifter för NDAB01, vt2011, 17 januari 2011.

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Metod och teori. Statistik för naturvetare Umeå universitet

Tentamen i matematisk statistik

732G01/732G40 Grundläggande statistik (7.5hp)

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

ANOVA I: Kap 14. Åldersgrupper -30 år år 51- år. Totalt n k N = 9 X k X = s k s = 8.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Transkript:

Föreläsning 7 Statistik; teori och tillämpning i biologi 1

Dagens föreläsning o Fortsättning envägs-anova Scheffes test (kap 11.4) o Tvåvägs-ANOVA Korsade faktorer (kap 12.1, 12.3) Randomiserade blockförsök (kap 12.4ab) Upprepade mätningar (kap 12.4c) Nästlad ANOVA (kap 15.1) 2

Envägs-ANOVA Multipla jämförelser, Scheffes test När man vill jämföra kombinationer av medelvärden med en annan kombination av medelvärden eller ett specifikt medelvärde (multipla kontraster) används Scheffes test. Stegen för hypotesprövning följs. Testvariabeln betecknas S och beräknas enligt: (GB s. 251, BB s. 237) S = c ix i SE SE = s 2 c i 2 n i = error MS c i 2 n i där c i är koefficienten som tillhör medelvärdet från grupp nummer i. Kritiska värdet är: S α = k 1 F α 1,k 1,N k 3

Envägs-ANOVA Multipla jämförelser, Scheffes test Hypoteserna kan formuleras enligt: H 0 : μ 1 + μ 2 2 H a : μ 1 + μ 2 2 μ 3 + μ 4 2 μ 3 + μ 4 2 = 0 0 Konfidensintervall kan skapas: (GB s. 253, BB s. 239) c i X i ± S α SE 4

Envägs-ANOVA Multipla jämförelser, Scheffes test, exempel Vi återgår till exemplet med grisfoder från föregående föreläsning. En tillverkare gör foder 1 och 3, och en annan tillverkare gör foder 2 och 4. Undersök om det är skillnad i viktökning mellan de två tillverkarna. Foder 1 Foder 2 Foder 3 Foder 4 X i 2,42 5,18 1,14 6,94 n i 5 6 5 5 error MS = 12,2 17 5

Tvåvägs-ANOVA (lika antal obs.) (GB s. 264-278, BB s. 250-264) Nu går vi över till tvåvägs-anova med lika antal observationer. Detta innebär att grupperna är indelade efter två faktorer och att det är lika många observationer i varje cell. Varför använda tvåvägs-anova? Tidseffektivt att undersöka två faktorer samtidigt Det kan testas för effekter för båda faktorerna Man kan upptäcka interaktioner (t.ex. synergi) mellan två faktorer Om det inte är lika många observationer i varje cell uppstår ett beroende mellan de kvadratsummor som ska beräknas, vilket gör analysen väldigt komplex. 6

Tvåvägs-ANOVA (lika antal obs.) Beteckningar a antalet nivåer på faktor A b antalet nivåer på faktor B n antalet observationer i en cell N = abn totala antalet observationer X ijl obs l på nivå i (faktor A) och nivå j (faktor B) X ij cellmedelvärde för cellen ij X i medelvärde för nivå i på faktor A X j medelvärde för nivå j på faktor B X totalmedelvärde 7

Tvåvägs-ANOVA (lika antal obs.) Exempel En forskare vill undersöka hur kackerlackor växer i olika kombinationer av temperatur och luftfuktighet. 27 identiska kackerlackor delas upp på 9 olika kombinationer av dessa faktorer, och deras längd i mm observeras efter två veckor. Temperatur (Celsius) Luftfuktighet (%) 20 30 40 33 66 99 1 2 3 9 10 11 17 18 19 8 5 6 7 13 14 15 21 22 23 9 10 11 18 19 20 26 27 28

Tvåvägs-ANOVA (lika antal obs.) Kvadratsummor (GB s. 265-267, BB s. 251-253) a b total SS = X ijl X 2 n i=1 j=1 l=1 a cells SS = n X ij X 2 a b i=1 j=1 b error SS = X ijl X ij 2 i=1 j=1 Cells SS kan delas upp i tre andra kvadratsummor, nämligen factor A SS, factor B SS och AB interaction SS. Det är dessa tre kvadratsummor som är av intresse. n l=1 9

Tvåvägs-ANOVA (lika antal obs.) Kvadratsummor factor A SS = bn X i X 2 a i=1 b factor B SS = an X j X 2 j=1 AB interaction SS = cells SS (factor A SS + factor B SS) 10

Tvåvägs-ANOVA (lika antal obs.) Kvadratsummor, ANOVA-tabell (GB s. 270, BB s. 256) DF SS MS Factor A a-1 bn X i X 2 a i=1 b Factor B b-1 an X j X 2 Interaction (a-1)(b-1) j=1 cells SS (factor A SS + factor B SS) Error ab(n-1) X ijl X ij 2 b i=1 j=1 n l=1 Total N-1 X ijl X 2 a a b n i=1 j=1 l=1 SS DF SS DF SS DF SS DF 11

Tvåvägs-ANOVA (lika antal obs.) Undersöka effekter (ex. GB s.265-69,bb s.251-55) Med hjälp av tvåvägs-anova går det som sagt att testa för faktor A-, faktor B- och interaktionseffekt. Dessa olika tester följer de fyra stegen för hypotesprövning. H 0 : μ 1 = μ 2 = = μ a H a : minst två μ i är olika Faktor A-effekt H 0 : μ 1 = μ 2 = = μ b H a : minst två μ j är olika Faktor B-effekt H 0 : Det finns ingen interaktion mellan faktor A och B H a : Det finns interaktion mellan faktor A och B 12

Tvåvägs-ANOVA (lika antal obs.) Olika modeller (GB s. 275-276, BB s. 261-262) Hur man beräknar testvariabeln F varierar beroende på hur studien har lagts upp. Det finns tre olika modeller: Model 1 ANOVA Man är bara intresserad av de valda nivåerna på faktorerna, dvs. båda faktorerna är fixa Model 2 ANOVA Båda faktorerna är slumpmässiga (random), vilket innebär att man är intresserad av alla möjliga nivåer på de två faktorerna Model 3 ANOVA Ena faktorn är fix, andra faktorn är slumpmässig 13

Tvåvägs-ANOVA (lika antal obs.) Beräkna testvariabeln F (GB s. 276, BB s. 262) Model ANOVA Effekt 1 (A,B fixa) 2 (A, B slump) 3 (A fix, B slump) Faktor A factor A MS error MS factor A MS interact. MS factor A MS interact. MS Faktor B factor B MS error MS factor B MS interact. MS factor B MS error MS Interaktion interact MS error MS interact MS error MS interact MS error MS 14

Tvåvägs-ANOVA (lika antal obs.) Multipla jämförelser Om man upptäcker en signifikant interaktionseffekt innebär det att faktoreffekten för en faktor varierar för olika nivåer på den andra faktorn. Då är det (oftast) inte intressant att undersöka faktoreffekterna, och inte heller att jämföra medelvärden för olika nivåer på faktorerna. Man bör istället göra multipla jämförelser enligt metoderna i kapitel 11 på cellmedelvärdena. Om interaktionseffekten ej är signifikant, men faktoreffekterna är signifikanta kan det göras jämförelser mellan medelvärden för olika nivåer på de fixa faktorerna enligt metoderna i kapitel 11. Se stycket om det på sidan 288-289 i GB och 274-275 i BB. 15

Tvåvägs-ANOVA (lika antal obs.) Exempel 16

Tvåvägs-ANOVA (lika antal obs.) Beräkna testvariabeln F, exempel Vi återgår till exemplet med kackerlackor. För att genomföra en tvåvägs-anova har SPSS använts, och en reducerad utskrift finns nedan. Utred om det finns faktoreffekter eller interaktionseffekter. 17

Tvåvägs-ANOVA (bara en obs.) (GB s. 281-282, BB s. 267-268) Ett specialfall vid tvåvägs-anova är det när man bara en observation per cell, n = 1. Kvadratsummorna total SS, factor A SS och factor B SS beräknas på samma sätt som innan. Men, eftersom vi bara har en observation per cell blir error SS noll. Istället beräknas remainder SS enligt: total SS (factor A SS + factor B SS) Om man kan anta att det finns interaktion mellan de två faktorerna rekommenderas det att man inte gör några test alls. 18

Tvåvägs-ANOVA Andra varianter Beroende på vad hur undersökningen ska utformas finns det ett antal olika varianter på tvåvägs-anova. Vi kommer diskutera tre olika varianter och när de ska användas: Randomiserade blockförsök (kap 12.4a) Upprepade mätningar (repeated measures, kap 12.4c) Nästlad (hierarkisk) ANOVA (kap 15.1) 19

Tvåvägs-ANOVA Randomiserade blockförsök Randomiserade blockförsök används när man vill undersöka en faktor, men man måste ta hänsyn till en underliggande faktor som kan påverka resultatet. Denna underliggande faktor kallas då för block. Ett exempel på detta kan vara att man vill testa fyra olika frösorter i något avseende. Då kan planteringens position påverka utfallet, så då kan man plantera de fyra olika frösorterna i ett visst antal ytor. Dessa olika ytor blir då blocken i denna undersökning. Ett randomiserat blockförsök har oftast bara en observation per cell. Blocken är slumpmässiga och den huvudsakliga faktorn är fix, så beräkningar sker enligt ANOVA modell 3. 20

Tvåvägs-ANOVA Upprepade mätningar Inom biologi använder man sig ofta av upprepade mätningar, det vill säga att samma enhet observeras ett antal gånger under olika förutsättningar (på en faktor). Kursboken ger ett exempel där tre försöksdjur utsätts för olika bedövningsmedel. När effekten för ett bedövningsmedel försvunnit prövas ett annat och så vidare. Det kan även handla om att man undersöker hur något utvecklas över tid och då mäter samma enhet vid olika tidpunkter. Även för denna variant sker beräkningar enligt ANOVA modell 3. 21

Tvåvägs-ANOVA Nästlad (hierarkisk) ANOVA De varianter vi diskuterat tidigare används när de två faktorerna är korsade, vilket innebär att alla nivåer på faktor A kan kombineras med alla nivåer på faktor B. Men, ibland kan faktor B vara nästlad inom faktor A. Detta betyder att olika nivåer på faktor B bara finns i kombination med en eller några kombinationer på faktor A. Man kan då även se faktor A som grupper och faktor B som undergrupper till faktor A. I nästlad ANOVA kan man inte skatta någon interaktionseffekt, på grund av att faktorerna ej är korsade. 22

Nästlad (hierarkisk) ANOVA Exempel En forskare vill undersöka hur vikten hos räkor påverkas om de utöver sin vanliga mat även äter vitamin A respektive B. Forskaren hade bara tillgång till sex olika dammar med identiska räkor i, så vitamin A och B tillsattes i två dammar vardera och de två sista dammarna användes som kontroll. Efter sex månader vägdes räkorna och detta samman-ställdes i nedanstående tabell. Vikten är angiven i gram. Kontroll Vitamin A Vitamin B Damm 1 Damm 2 Damm 3 Damm 4 Damm 5 Damm 6 30 60 80 110 140 170 35 65 85 115 150 175 45 75 95 125 155 185 50 80 100 130 160 190 23

Tack för idag! Nästa tillfälle: Lektion 4, onsdag 13 april 10-12, sal S41 24