LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Relevanta dokument
S0005M V18, Föreläsning 10

F10 ESTIMATION (NCT )

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Föreläsning G04: Surveymetodik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Statistik för teknologer, 5 poäng Skrivtid:

4.2.3 Normalfördelningen

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Introduktion till statistik för statsvetare

95%-igt konfidensintervall för andel kalsongbärare i populationen: Slutsats: Med 95% säkerhet finns andelen kalsongbärare i intervallet 38-48%

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Föreläsning G70 Statistik A

Lycka till! I(X i t) 1 om A 0 annars I(A) =

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Föreläsning G70 Statistik A

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

a) Beräkna E (W ). (2 p)

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

================================================

2. Konfidensintervall för skillnaden mellan två proportioner.

θx θ 1 om 0 x 1 f(x) = 0 annars

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Tentamen i Matematisk statistik för V2 den 28 maj 2010

TMS136: Dataanalys och statistik Tentamen med lösningar

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Jag läser kursen på. Halvfart Helfart

TENTAMEN I MATEMATISK STATISTIK

1. Test av anpassning.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 5

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

Tentamen i matematisk statistik

Tentamen Metod C vid Uppsala universitet, , kl

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

Följande resultat erhålls (enhet: 1000psi):

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

7.5 Experiment with a single factor having more than two levels

Tillåtna hjälpmedel: Eget handskrivet formelblad (A4), utdelad tabellsamling, miniräknare med tömt minne Studenterna får behålla tentamensuppgifterna

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Tentamen i matematisk statistik

Borel-Cantellis sats och stora talens lag

Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

Tentamen i matematisk statistik

Databaser - Design och programmering. Programutveckling. Programdesign, databasdesign. Kravspecifikation. ER-modellen. Begrepps-modellering

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Jag läser kursen på. Halvfart Helfart

7.5 Experiment with a single factor having more than two levels

TENTAMEN I MATEMATISK STATISTIK. Statistik för lärare, 5 poäng

Räkneövning 3 Variansanalys

Grundläggande matematisk statistik

Avd. Matematisk statistik

Metod och teori. Statistik för naturvetare Umeå universitet

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Smärtlindring vid medicinsk abort

Datorövning 2 Fördelningar inom säkerhetsanalys

ANOVA I: Kap 14. Åldersgrupper -30 år år 51- år. Totalt n k N = 9 X k X = s k s = 8.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

OBS! Skriv e-postadress på tentan om du vill ha resultatet innan jul. Tentamensgenomgång måndagen den 9/ kl i MC413.

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Tentamen i matematisk statistik, Statistisk Kvalitetsstyrning, MSN320/TMS070 Lördag , klockan Lärare: Jan Rohlén

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

b 1 och har för olika värden på den reella konstanten a.

Examinationsuppgifter del 2

Statistik en introduktion

Webprogrammering och databaser. Begrepps-modellering. Exempel: universitetsstudier Kravspec. ER-modellen. Exempel: kravspec forts:

Genomsnittligt sökdjup i binära sökträd

Statistik för ingenjörer 1MS008

Databaser - Design och programmering. Databasdesign. Kravspecifikation. Begrepps-modellering. Design processen. ER-modellering

Transkript:

UMEÅ UNIVERSITET Istitutioe för matematisk statistisk Statistiska metoder, 5 poäg MSTA36 Peter Ato LÖSNINGSFÖRSLAG 005-10-6 LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK Statistiska metoder, 5 poäg 1. Vilopulsfrekvese mättes på 10 studeter. Följade resultat erhölls: 60, 64, 60, 76, 7, 56, 7, 80, 64, 80 (slag/miut). a) Bestäm medelvärde och media. x = 68,4. Mediae blir medelvärdet av de två mittersta värdea i storleksordig, dvs (64 + 7) / = 68,0 b) Jämför de två värde du räkat fram. Vilka slutsatser ka ma dra? Värdea ligger mycket ära varadra, vilket tyder på e symmetrisk bakomliggade fördelig.. Ma ville jämföra två olika metoder att mäta alkohol i blod. E viss mägd blod delades upp i 0 delar, varav 10 aalyserades med de ea metode och 10 med de adra. Medelvärdet för de 10 mätigara eligt metod A var 1,4 promille och de skattade stadardavvikelse s = 0,09 promille. För mätigara gjorda eligt metod B blev medelvärdet 1,45 promille och stadardavvikelse s = 0,03 promille. Avgör med lämpligt test om de två aalysmetodera ka ases ge likvärdiga resultat (i geomsitt). Redogör för vilka atagade du gör. Vi atar att mätvärdea är ormalfördelade och att de bakomliggade variasera i de två populatioera är idetiska. Vi ka bilda ett 95% kofidesitervall för x x och se om det 1 täcker värdet 0. Vi får 1 1 x x ± t( fg) s + 1 p ( 1) s + ( 1) s 1 1 fg = 1 + = 18. t(18) =,10 (95% kofidesgrad). s p = = + 1 0,000685. s p = 0,06. Kofidesitervallet blir -0,03 +/- 0,05 = (-0,055; -0,005). Eftersom itervallet ite iehåller olla ka vi förkasta att metodera är idetiska. Metod A ger lägre värde ä metod B. 1

3. Ma ville testa om uppgifter om vikt i e ekät stämmer med verklig vikt. Ma geomförde ett test blad kvior i åldrara 35-54 år aställda i e viss orgaisatio. I e ekätudersökig ikluderades frågor om bl a lägd och vikt. Kort tid efter att ekätsvare lämats, togs kviora i för provtagig av företagshälsovårde. Då kotrollerades äve vikte. Om viktuppgifte frå ekäte är y-variabel och de verkliga vikte x-variabel, erhölls följade lijära regressiossambad mella de båda viktuppgiftera. Båda viktera ages i kg. Variatiosområdet är 44 106 kg. = 84; r = 0,8; y = 1,0 + 0,78x Gör med hjälp av siffrora e tolkig av hur väl viktuppgiftera frå ekäte stämmer med de verkliga vikte. r = 0,8 medför att r = (0,8) = 0,67. 67% förklarigsgrad, dvs mycket av de verkliga vikte går att förklara med de påstådda, me 33% av viktvariatioe beror på adra saker (aturlig variatio, mätfel, förädrigar över tide, att persoera ite käer si vikt m.m.). E perso som väger 44 kg uppger i geomsitt att ho väger 1 + (0,78)44 = 46,3 kg. E perso som väger 106 kg uppger i geomsitt att ho väger 1 + (0,78)106 = 94,7 kg. Däremella har vi eligt modelle e lijär förädrig. Persoer som väger 54,5 kg säger i geomsitt att de väger just 54,5 kg. Slutsatse blir att lätta persoer tederar att överskatta si vikt, tuga uderskattar de. 4. Age om påståedea eda är saa eller falska. Motivera dia beslut. 0,5 poäg för varje rätt svar och ytterligare 0,5 poäg för varje vettig motiverig. a) Ett 99% kofidesitervall är alltid bredare ä motsvarade 95% kofidesitervall. Stämmer, vill ma ha högre säkerhet krävs bredare itervall. b) Ett 95% kofidesitervall för ett populatiosmedelvärde har beräkats till (-0,1; 9,6). Vi ka då på sigifikasivå 5%, dra slutsatse att medelvärdet är skilt frå oll. Fel. Eftersom värdet 0 ligger i itervallet ka vi ite förkasta att populatiosmedelvärdet är 0. c) Om slutsatse frå e prövig av hypotese att x = 0 mot x 0, blir att p-värdet är exakt p = 0,01, så kommer ågo av gräsera i det 99%-iga tvåsidiga kofidesitervallet att vara exakt oll. Stämmer. Logiskt ka ma förstå det på följade sätt: om p < 0,01 fis ite 0 i itervallet, me om p > 0,01 fis 0 i itervallet, Alltså, om p = 0,01 fis 0 precis på gräse. 5. E udersökig av dödlighete i e kommu för e viss tidsperiod visade följade atal dödsfall för mä. Ålder (år) Atal dödsfall 0-14 5 15-44 9

45-64 75 65-461 Totalt 550 I hela ladet fördelade sig dödsfalle så, att % var i ålder 0-14 år, 4% i ålder 15-44 år, 1% i ålder 45-64 år och resterade 8% var 65 år eller äldre. Vad ka vi säga om dödsfalles åldersfördelig i de studerade populatioe jämfört med riket? Geomför ett lämpligt test på 5% sigifikasivå. Förvätade värde (E i ) ges av 11,, 66 och 451. ( O E ) i i χ = = 3,7 + 7,68 + 1,3 + 0, = 1,40. Detta skall jämföras med tabellvärdet i= 1 Ei (5% sig.ivå, 3 fg) 7,81. Eftersom vårt testvärde är större ä tabellvärdet förkastas ollhypotese om samma fördelig på 5% sig.ivå. Vi har e aa dödlighetsfördelig i de aktuella kommue jämfört med riket i övrigt. 6. Ma vill göra e udersökig av hur stor adel i e populatio som har blodgrupp 0. Hur måga slumpmässigt utvalda persoers blodgrupp måste ma kotrollera om ma vill bilda ett 95% kofidesitervall för de saa adele, där itervallets lägd ite för överstiga 0,08 Vi räkar på värsta täkbara fallet p = 0,5. Om itervallet ite blir lägre ä 0,08 då p = 0,5 så blir det ite det för ågot aat p heller. Itervallet blir p(1 p) pˆ ± z. Itervallets lägd blir p(1 p) 4z z 0,08 p(1 p). Med z = 1,96 får vi 0,0064 601 (måste vara heltal). p( 1 p) z. Vi får 7. För att jämföra fiskars tillväxt i olika miljöer väger och märker ma ett atal lika stora fiskar av samma sort och fördelar dem slumpmässigt till två olika försöksgrupper. Dessa försöksgrupper av fiskar lever i ätburar i olika miljöer. Efter e tid mäter ma fiskaras viktökig i gram med edaståede resultat: Miljö 1: 7, 35, 54, 68, 61, 49, 66, 70 Miljö : 34, 54, 55, 51, 46, 43, 33. Ata att fiskaras tillväxt är ormalfördelad med samma varias i de två miljöera. a) Bilda ett 95% kofidesitervall för de geomsittliga skillade mella tillväxtera hos fiskar i de två miljöera. x = 59,38 x = 45, 14, s 1 1 = 1,7, s 1 = 9,01, 1 = 8, = 7. Vi atar att de bakomliggade variasera är lika och får då de poolade skattige

(8 1)(1,7) + (7 1)(9,01) s p = = 11,15. t-värdet blir här,16 (fg = 13) 8 + 7 1 1 Kofidesitervallet blir ( x1 x ± t( fg) s p + ) = (14,4+/-1,46) = (1,8 ; 6,7). 1 b) Bilda ett 99% kofidesitervall för de geomsittliga skillade mella tillväxtera hos fiskar i de två miljöera. Det eda som förädras jämfört med a) är att vi här har t-värdet 3,01. Itervallet blir (14,4+/-17,37) = (-3,1 ; 31,6). c) Vad ka ma, utgåede frå resultate i a) och b) säga om p-värdet för ett test av om de geomsittliga skillade mella tillväxtera hos fiskar i de två miljöera ka ases vara lika (tvåsidig alterativhypotes)? Eftersom det 95%-iga itervallet iehåller olla, meda det 99%-iga ite gör det, måste p- värdet ligga mella 0,01 och 0,05. 8. 0 solrosfrö delades slumpmässigt i i fyra grupper och platerades i krukor. Jorde i krukora gödslades eligt fyra olika metoder (Behadlig A-D). 17 frö grodde. Två veckor efter platerig mättes platoras höjd och e variasaalys geomfördes. Vilka slutsatser ka ma dra frå följade MINITAB-utskrift? 1) p-värdet i variasaalyse är 0,000. Vi ka alltså förkasta att behadligara ger samma geomsittliga resultat, på alla rimliga sigifikasivåer. ) Tukeys test visar att behadlig C ger sigifikat kortare plator ä alla de övriga behadligara. Itervalle vid de övriga jämförelsera iehåller alla värdet oll, vilket iebär att de behadligara A, B och D ite går att skilja åt. 3) Normalplotte visar att det ite går att förkasta att residualera är ormalfördelade. Det atagadet verkar således kua vara ok. 4) Bartletts test visar att det ite går att förkasta att variasera är lika i de 4 behadligsgruppera. Det atagadet verkar alltså också kua vara ok. Slutsatse blir: Välj ite behadlig C. Av övriga behadligar ger B högst medellägd i vår udersökig, me skillade jämfört med A och D är ite statistiskt säkerställd. Oe-way ANOVA: Behadlig A; Behadlig B; Behadlig C; Behadlig D Source DF SS MS F P Factor 3 1058,4 35,8 18,68 0,000 Error 13 45,5 18,9 Total 16 1303,9 S = 4,345 R-Sq = 81,17% R-Sq(adj) = 76,83%

Idividual 95% CIs For Mea Based o Pooled StDev Level N Mea StDev -----+---------+---------+---------+---- Behadlig A 4 9,000 4,967 (-----*-----) Behadlig B 5 3,000 4,950 (----*----) Behadlig C 5 16,00 3,701 (----*----) Behadlig D 3 37,667 3,055 (------*------) -----+---------+---------+---------+---- 16,0 4,0 3,0 40,0 Pooled StDev = 4,345 Tukey 95% Simultaeous Cofidece Itervals All Pairwise Comparisos Idividual cofidece level = 98,84% Behadlig A subtracted from: Lower Ceter Upper Behadlig B -5,554 3,000 11,554 Behadlig C -1,354-1,800-4,46 Behadlig D -1,07 8,667 18,406 Behadlig B (----*----) Behadlig C (----*----) Behadlig D (-----*------) -16 0 16 3 Behadlig B subtracted from: Lower Ceter Upper Behadlig C -3,865-15,800-7,735 Behadlig D -3,646 5,667 14,979 Behadlig C (----*----) Behadlig D (-----*----) -16 0 16 3 Behadlig C subtracted from: Lower Ceter Upper Behadlig D 1,154 1,467 30,779 (----*-----) -16 0 16 3

Probability Plot of Res Normal - 95% CI Percet 99 95 90 80 70 60 50 40 30 0 Mea 6,69495E-16 StDev 3,917 N 17 AD 0,387 P-Value 0,349 10 5 1-15 -10-5 0 Res 5 10 Test for Equal Variaces for Lägd Behadlig A B C Bartlett's Test Test Statistic 0,74 P-Value 0,863 Levee's Test Test Statistic 0,56 P-Value 0,648 D 0 10 0 30 95% Boferroi Cofidece Itervals for StDevs 40