UMEÅ UNIVERSITET Istitutioe för matematisk statistisk Statistiska metoder, 5 poäg MSTA36 Peter Ato LÖSNINGSFÖRSLAG 005-10-6 LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK Statistiska metoder, 5 poäg 1. Vilopulsfrekvese mättes på 10 studeter. Följade resultat erhölls: 60, 64, 60, 76, 7, 56, 7, 80, 64, 80 (slag/miut). a) Bestäm medelvärde och media. x = 68,4. Mediae blir medelvärdet av de två mittersta värdea i storleksordig, dvs (64 + 7) / = 68,0 b) Jämför de två värde du räkat fram. Vilka slutsatser ka ma dra? Värdea ligger mycket ära varadra, vilket tyder på e symmetrisk bakomliggade fördelig.. Ma ville jämföra två olika metoder att mäta alkohol i blod. E viss mägd blod delades upp i 0 delar, varav 10 aalyserades med de ea metode och 10 med de adra. Medelvärdet för de 10 mätigara eligt metod A var 1,4 promille och de skattade stadardavvikelse s = 0,09 promille. För mätigara gjorda eligt metod B blev medelvärdet 1,45 promille och stadardavvikelse s = 0,03 promille. Avgör med lämpligt test om de två aalysmetodera ka ases ge likvärdiga resultat (i geomsitt). Redogör för vilka atagade du gör. Vi atar att mätvärdea är ormalfördelade och att de bakomliggade variasera i de två populatioera är idetiska. Vi ka bilda ett 95% kofidesitervall för x x och se om det 1 täcker värdet 0. Vi får 1 1 x x ± t( fg) s + 1 p ( 1) s + ( 1) s 1 1 fg = 1 + = 18. t(18) =,10 (95% kofidesgrad). s p = = + 1 0,000685. s p = 0,06. Kofidesitervallet blir -0,03 +/- 0,05 = (-0,055; -0,005). Eftersom itervallet ite iehåller olla ka vi förkasta att metodera är idetiska. Metod A ger lägre värde ä metod B. 1
3. Ma ville testa om uppgifter om vikt i e ekät stämmer med verklig vikt. Ma geomförde ett test blad kvior i åldrara 35-54 år aställda i e viss orgaisatio. I e ekätudersökig ikluderades frågor om bl a lägd och vikt. Kort tid efter att ekätsvare lämats, togs kviora i för provtagig av företagshälsovårde. Då kotrollerades äve vikte. Om viktuppgifte frå ekäte är y-variabel och de verkliga vikte x-variabel, erhölls följade lijära regressiossambad mella de båda viktuppgiftera. Båda viktera ages i kg. Variatiosområdet är 44 106 kg. = 84; r = 0,8; y = 1,0 + 0,78x Gör med hjälp av siffrora e tolkig av hur väl viktuppgiftera frå ekäte stämmer med de verkliga vikte. r = 0,8 medför att r = (0,8) = 0,67. 67% förklarigsgrad, dvs mycket av de verkliga vikte går att förklara med de påstådda, me 33% av viktvariatioe beror på adra saker (aturlig variatio, mätfel, förädrigar över tide, att persoera ite käer si vikt m.m.). E perso som väger 44 kg uppger i geomsitt att ho väger 1 + (0,78)44 = 46,3 kg. E perso som väger 106 kg uppger i geomsitt att ho väger 1 + (0,78)106 = 94,7 kg. Däremella har vi eligt modelle e lijär förädrig. Persoer som väger 54,5 kg säger i geomsitt att de väger just 54,5 kg. Slutsatse blir att lätta persoer tederar att överskatta si vikt, tuga uderskattar de. 4. Age om påståedea eda är saa eller falska. Motivera dia beslut. 0,5 poäg för varje rätt svar och ytterligare 0,5 poäg för varje vettig motiverig. a) Ett 99% kofidesitervall är alltid bredare ä motsvarade 95% kofidesitervall. Stämmer, vill ma ha högre säkerhet krävs bredare itervall. b) Ett 95% kofidesitervall för ett populatiosmedelvärde har beräkats till (-0,1; 9,6). Vi ka då på sigifikasivå 5%, dra slutsatse att medelvärdet är skilt frå oll. Fel. Eftersom värdet 0 ligger i itervallet ka vi ite förkasta att populatiosmedelvärdet är 0. c) Om slutsatse frå e prövig av hypotese att x = 0 mot x 0, blir att p-värdet är exakt p = 0,01, så kommer ågo av gräsera i det 99%-iga tvåsidiga kofidesitervallet att vara exakt oll. Stämmer. Logiskt ka ma förstå det på följade sätt: om p < 0,01 fis ite 0 i itervallet, me om p > 0,01 fis 0 i itervallet, Alltså, om p = 0,01 fis 0 precis på gräse. 5. E udersökig av dödlighete i e kommu för e viss tidsperiod visade följade atal dödsfall för mä. Ålder (år) Atal dödsfall 0-14 5 15-44 9
45-64 75 65-461 Totalt 550 I hela ladet fördelade sig dödsfalle så, att % var i ålder 0-14 år, 4% i ålder 15-44 år, 1% i ålder 45-64 år och resterade 8% var 65 år eller äldre. Vad ka vi säga om dödsfalles åldersfördelig i de studerade populatioe jämfört med riket? Geomför ett lämpligt test på 5% sigifikasivå. Förvätade värde (E i ) ges av 11,, 66 och 451. ( O E ) i i χ = = 3,7 + 7,68 + 1,3 + 0, = 1,40. Detta skall jämföras med tabellvärdet i= 1 Ei (5% sig.ivå, 3 fg) 7,81. Eftersom vårt testvärde är större ä tabellvärdet förkastas ollhypotese om samma fördelig på 5% sig.ivå. Vi har e aa dödlighetsfördelig i de aktuella kommue jämfört med riket i övrigt. 6. Ma vill göra e udersökig av hur stor adel i e populatio som har blodgrupp 0. Hur måga slumpmässigt utvalda persoers blodgrupp måste ma kotrollera om ma vill bilda ett 95% kofidesitervall för de saa adele, där itervallets lägd ite för överstiga 0,08 Vi räkar på värsta täkbara fallet p = 0,5. Om itervallet ite blir lägre ä 0,08 då p = 0,5 så blir det ite det för ågot aat p heller. Itervallet blir p(1 p) pˆ ± z. Itervallets lägd blir p(1 p) 4z z 0,08 p(1 p). Med z = 1,96 får vi 0,0064 601 (måste vara heltal). p( 1 p) z. Vi får 7. För att jämföra fiskars tillväxt i olika miljöer väger och märker ma ett atal lika stora fiskar av samma sort och fördelar dem slumpmässigt till två olika försöksgrupper. Dessa försöksgrupper av fiskar lever i ätburar i olika miljöer. Efter e tid mäter ma fiskaras viktökig i gram med edaståede resultat: Miljö 1: 7, 35, 54, 68, 61, 49, 66, 70 Miljö : 34, 54, 55, 51, 46, 43, 33. Ata att fiskaras tillväxt är ormalfördelad med samma varias i de två miljöera. a) Bilda ett 95% kofidesitervall för de geomsittliga skillade mella tillväxtera hos fiskar i de två miljöera. x = 59,38 x = 45, 14, s 1 1 = 1,7, s 1 = 9,01, 1 = 8, = 7. Vi atar att de bakomliggade variasera är lika och får då de poolade skattige
(8 1)(1,7) + (7 1)(9,01) s p = = 11,15. t-värdet blir här,16 (fg = 13) 8 + 7 1 1 Kofidesitervallet blir ( x1 x ± t( fg) s p + ) = (14,4+/-1,46) = (1,8 ; 6,7). 1 b) Bilda ett 99% kofidesitervall för de geomsittliga skillade mella tillväxtera hos fiskar i de två miljöera. Det eda som förädras jämfört med a) är att vi här har t-värdet 3,01. Itervallet blir (14,4+/-17,37) = (-3,1 ; 31,6). c) Vad ka ma, utgåede frå resultate i a) och b) säga om p-värdet för ett test av om de geomsittliga skillade mella tillväxtera hos fiskar i de två miljöera ka ases vara lika (tvåsidig alterativhypotes)? Eftersom det 95%-iga itervallet iehåller olla, meda det 99%-iga ite gör det, måste p- värdet ligga mella 0,01 och 0,05. 8. 0 solrosfrö delades slumpmässigt i i fyra grupper och platerades i krukor. Jorde i krukora gödslades eligt fyra olika metoder (Behadlig A-D). 17 frö grodde. Två veckor efter platerig mättes platoras höjd och e variasaalys geomfördes. Vilka slutsatser ka ma dra frå följade MINITAB-utskrift? 1) p-värdet i variasaalyse är 0,000. Vi ka alltså förkasta att behadligara ger samma geomsittliga resultat, på alla rimliga sigifikasivåer. ) Tukeys test visar att behadlig C ger sigifikat kortare plator ä alla de övriga behadligara. Itervalle vid de övriga jämförelsera iehåller alla värdet oll, vilket iebär att de behadligara A, B och D ite går att skilja åt. 3) Normalplotte visar att det ite går att förkasta att residualera är ormalfördelade. Det atagadet verkar således kua vara ok. 4) Bartletts test visar att det ite går att förkasta att variasera är lika i de 4 behadligsgruppera. Det atagadet verkar alltså också kua vara ok. Slutsatse blir: Välj ite behadlig C. Av övriga behadligar ger B högst medellägd i vår udersökig, me skillade jämfört med A och D är ite statistiskt säkerställd. Oe-way ANOVA: Behadlig A; Behadlig B; Behadlig C; Behadlig D Source DF SS MS F P Factor 3 1058,4 35,8 18,68 0,000 Error 13 45,5 18,9 Total 16 1303,9 S = 4,345 R-Sq = 81,17% R-Sq(adj) = 76,83%
Idividual 95% CIs For Mea Based o Pooled StDev Level N Mea StDev -----+---------+---------+---------+---- Behadlig A 4 9,000 4,967 (-----*-----) Behadlig B 5 3,000 4,950 (----*----) Behadlig C 5 16,00 3,701 (----*----) Behadlig D 3 37,667 3,055 (------*------) -----+---------+---------+---------+---- 16,0 4,0 3,0 40,0 Pooled StDev = 4,345 Tukey 95% Simultaeous Cofidece Itervals All Pairwise Comparisos Idividual cofidece level = 98,84% Behadlig A subtracted from: Lower Ceter Upper Behadlig B -5,554 3,000 11,554 Behadlig C -1,354-1,800-4,46 Behadlig D -1,07 8,667 18,406 Behadlig B (----*----) Behadlig C (----*----) Behadlig D (-----*------) -16 0 16 3 Behadlig B subtracted from: Lower Ceter Upper Behadlig C -3,865-15,800-7,735 Behadlig D -3,646 5,667 14,979 Behadlig C (----*----) Behadlig D (-----*----) -16 0 16 3 Behadlig C subtracted from: Lower Ceter Upper Behadlig D 1,154 1,467 30,779 (----*-----) -16 0 16 3
Probability Plot of Res Normal - 95% CI Percet 99 95 90 80 70 60 50 40 30 0 Mea 6,69495E-16 StDev 3,917 N 17 AD 0,387 P-Value 0,349 10 5 1-15 -10-5 0 Res 5 10 Test for Equal Variaces for Lägd Behadlig A B C Bartlett's Test Test Statistic 0,74 P-Value 0,863 Levee's Test Test Statistic 0,56 P-Value 0,648 D 0 10 0 30 95% Boferroi Cofidece Itervals for StDevs 40