Hypotesprövning 1. En biolog undersöker om förekomsten av parasiten Gyrodactylus salaris är vanligare hos lax i södra Östersjön jämfört med norra. Han fångar in 111 laxar i norra Östersjön av vilka 56 bär på parasiten. Stickprovet från södra Östersjön omfattar 93 individer varav 36 är infekterade av Gyrodactylus. Vilken slutsats kan han dra? Formulera hypotes och utför en prövning av hypotesen. 2. En doktorand arbetar med bältdjur i ett område i sydvästra Australien. Hon har noterat att i en av de lokaler hon studerar förefaller det förekomma ovanligt många honor. Normalt är könskvoten 1:1 hos bältdjur. Hon observerar ett stickprov 50 individer av vilka 37 är honor. Förefaller könskvoten avvika från 1:1? Testa med två olika metoder. 3. En forskare undersöker om vikten hos nyfödda vargvalpar skiljer sig mellan två populationer som lever i olika habitat. Hon samlar in följande data: Population 1 Population 2 Vikt (gram) 491 392 402 357 411 398 397 368 421 411 439 399 456 Vilken slutsats kan hon dra? 4. En amatörlöpare som brukar springa maraton är intresserad över det eventuella sambandet mellan hur lång tid det tar att springa och den aktuella dagstemperaturen. Hon har noterat sina senaste löptider och jämför dessa med hur varmt det var vid de olika loppen. Tid Temperatur (grader Celcius) 4 tim. och 32 min. 25 4 tim. och 12 min. 20 3 tim. och 52 min. 13 4 tim. och 1 min. 17 4 tim. och 4 min. 19 a) Gör en vanlig scatterplot (x-y-diagram) över datapunkterna. Gör en gissning huruvida det finns ett signifikant samband eller inte (jämför sedan med svaret i fråga e).
b) Gör en regressionsanalys och ta fram linjens ekvation (använd formlerna för a och b från föreläsningen). c) Gör en prediktion för vad man kan vänta sig att tiden, enligt det nyss uträknade sambandet i fråga b, borde bli om dagstemperaturen är 22 grader. d) Hur bra är dagstemperaturen som prediktor för att förutsäga löptiden? e) Testa genom ett t-test för korrelation om det finns ett signifikant samband mellan temperatur och tid. Använd H 0 : ρ = 0 och df = n-2.
Svar övningsuppgifter hypotesprövning 1. H 0 : Gyrodactylus-förekomsten hos lax är densamma i norra och södra Östersjön. H 1 : Förekomsten är inte den samma. Frågan kan besvaras med χ 2 à posteriori (även kallat kontingenstabell). Andra tänkbara testmetoder är Fischers exakta test, t-test och simuleringsbaserade tekniker (ej genomgångna på denna kurs). Observerad förekomst: Södra Östersjön Norra Östersjön Totalt Lax med Gyrodactylus 36 56 92 Lax fri från Gyrodactylus 57 55 112 Totalt 93 111 204 Förväntad förekomst: Södra Östersjön Norra Östersjön Totalt Lax med Gyrodactylus 41.94 50.06 92 Lax fri från Gyrodactylus 51.06 60.94 112 Totalt 93 111 204 χ 2 = (36-41.94) 2 /41.94 + (57-51.06) 2 /51.06 +... = 2.82 df = (r-2) x (c-1) = (2-1) x (2-1) = 1 P>0.1 H 0 accepteras alltså (det kritiska värdet för att förkasta H 0 vid df=1 är 3.84) och biologen kan dra slutsatsen att det inte finns några tecken på att Gyrodactylus-förekomsten skulle skilja sig mellan norra och södra Östersjön. 2. Frågan kan belysas med ett exakt test eller χ 2 à priori. H 0 : Könskvoten är 1:1 H 1 : Könkvoten avviker från 1:1
Exakt test: Vid exakt test används binomialfördelningen Bin(50, 0.5). Denna fördelning finns med under flik 12 i kompendiet - Binomiala sannolikheter. Det förväntade antalet honor av 50 insamlade individer är 25. H 0 förkastas vid ett osannolikt lågt respektive högt antal honor. Osannolikt lågt antal honor är 17 eller färre, osannolikt högt antal honor är 33 eller fler. Observationen 37 av 50 honor är alltså att betrakta som osannolik under om H 0 är sann. H 0 förkastas alltså. Det exakta P-värdet för observationen är P=0.000936 vilket innebär trestjärnig signifikans. χ 2 à priori: Antal honor Antal "ej honor" Totalt Observerat 37 13 50 Förväntat 25 25 50 differens 12-12 0 χ 2 = (12) 2 /25 + (-12) 2 /25 = 11.52 df = 2-1=1 P < 0.001 liksom med det exakta testet kan H 0 förkastas med trestjärnig signifikans. 3. Frågan kan belysas med ett t-test. H 0 : Vikten hos nyfödda vargvalpar är densamma i population 1 och 2. H 1 : Vikten hos nyfödda vargvalpar är inte den samma i population 1 och 2.
Beräkna t på motsvarande sätt som exemplet med blodtryck flik 13 i kompendiet. Värdena ska bli: Population 1 Population 2 Medelvärde 426.833 397.286 Varians 1211.367 1024.571 n 6 7 df 11 t 1.594 0.1<P<0.2 H 0 accepteras. Data tyder inte på någon viktskillnad hos nyfödda valpar från de två olika populationerna. 4. a) 280 270 260 Tid 250 (min) 240 230 220 10 15 20 25 30 Temp b) a= 184.99, b = 3.362, Linjens ekvation: y = 184.99 + 3.362 x c) y = 184.99 + 3.362 x Prediktion: y = 184.99 + 3.362 * 22 = 258.954 259 minuter blir avrundat 4h och 20 min. d) r 2 = 0.951 Alltså, 95,1% av variationen i tid förklaras av temperatur. Temperatur verkar vara en bra prediktor för att förutsäga tiden. e) t = r/ ((1-r 2 )/(n-2)) r=0.975, r 2 = 0.951, n=5, t=7.63, df=3, Tabell ger: p < 0.005, H 0 förkastas.