Lösningsförslag till Matematisk statistik LKT325 Tentamen

Relevanta dokument
LMA201/LMA522: Faktorförsök

Tillämpad matematisk statistik LMA521 Tentamen

Matematisk statistik LKT325 Tentamen med lösningar

TMS136. Föreläsning 13

FÖRELÄSNING 8:

Lösningsförslag till Tillämpad matematisk statistik LMA521, Tentamen

TMS136. Föreläsning 11

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 11: Mer om jämförelser och inferens

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

TMS136. Föreläsning 10

Statistisk försöksplanering

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Tillämpad matematisk statistik LMA522 (maskin/mekatroniks kurs) Tentamen

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Statistisk försöksplanering

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

9. Konfidensintervall vid normalfördelning

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Tentamen i Matematisk statistik Kurskod S0001M

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Föreläsning 12, FMSF45 Hypotesprövning

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

FÖRELÄSNING 7:

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Tentamen i Matematisk statistik Kurskod S0001M

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

LKT325/LMA521: Faktorförsök

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

F3 Introduktion Stickprov

Tentamen i Dataanalys och statistik för I den 28 okt 2015

TMS136. Föreläsning 7

σ 12 = 3.81± σ n = 0.12 n = = 0.12

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Föreläsning 5. Kapitel 6, sid Inferens om en population

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Tentamen i Matematisk statistik Kurskod S0001M

27,5 27,6 24,8 29,2 27,7 26,6 26,2 28,0 (Pa s)

Formler och tabeller till kursen MSG830

Lycka till!

Avd. Matematisk statistik

Övningstenta för MSG830

Avd. Matematisk statistik

LKT325/LMA521: Faktorförsök

Matematisk statistik för B, K, N, BME och Kemister

Thomas Önskog 28/

, s a. , s b. personer från Alingsås och n b

Konfidensintervall, Hypotestest

Tentamen i Matematisk statistik Kurskod S0001M

MSG830 Statistisk analys och experimentplanering

F9 SAMPLINGFÖRDELNINGAR (NCT

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, ONSDAGEN DEN 17 MARS 2010 KL

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Föreläsningsanteckningar till kapitel 9, del 2

Lektionsanteckningar 11-12: Normalfördelningen

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

10. Konfidensintervall vid två oberoende stickprov

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

0 om x < 0, F X (x) = c x. 1 om x 2.

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

AMatematiska institutionen avd matematisk statistik

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Avd. Matematisk statistik

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

F9 Konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

TMS136: Dataanalys och statistik Tentamen

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Avd. Matematisk statistik

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

8 Inferens om väntevärdet (och variansen) av en fördelning

Föreläsning 12: Regression

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Föreläsning 15: Faktorförsök

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Övningstentamen 2 Uppgift 1: Uppgift 2: Uppgift 3: Uppgift 4: Uppgift 5: Uppgift 6: i ord

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Hur man tolkar statistiska resultat

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Transkript:

Lösningsförslag till Matematisk statistik LKT325 Tentamen 20190115 Kursansvarig: Reimond Emanuelsson Betygsgränser: för betyg 3 krävs minst 20 poäng, för betyg 4 krävs minst 30 poäng, för betyg 5 krävs minst 40 poäng. 1. (2+2+3 poäng) För händelserna A och B gäller att Beräkna... P (A) = 0.5, P (B) = 0.4, P (A B) = 0.3. (a) (b) P (A B c ) = P (A) P (A B) 1 P (B) = 0.5 0.3 1 0.4 = 0.33... P (A c B c ) = P ((A B) c ) = 1 P (A B) = 1 [P (A) + P (B) P (A B)] = 0.4 (c) P ((A B) (A B) c ) = P ((A B) \ (A B)) = {även} = = P (A \ B) + P (B \ A) = P (A) + P (B) 2P (A B) = 0.3. 2. (1+3 poäng) I de lilla municipalsamhället Stuvesberg är telefonnumren femsiriga, från 20 000 till 99 999. (a) Antal telefonnummer, som är möjliga (nns) är 80 000. (b) Man behåller alla telefonnummer som är möjliga i a) men tar bort de som börjar med siran 7, d.v.s. 80 000 10 10 000 = 70 000. Därefter inför man alla sexsiriga telefonnummer, som börjar med 7, d.v.s. man får 100 000 nya telefonnummer. Antal möjliga telefonnummer nns det totalt efter dessa två ändringar är alltså 170 000. 3. (2+2+3 poäng) Tiden för Börje att lägga ett golv i ett rum (på 60m 2 ), är normalfördelad med väntevärde 1.5 och standardavvikelse 0.40, dvs ξ 1 N(1.5, 0.40) (enhet timmar). Efter att golvet är lagt, tapetseras rummet av Lasse och tar en tid, som är ξ 2 N(2.5, 0.41) (enhet timmar). (a) Sannolikheten golvläggningen tar mindre än 2.0 h är ( ) 2.0 1.5 Φ = 0.89. 0.40 (b) För sannolikheten att den totala tiden (golvläggning+tapetsering) har vi att ξ 1 + ξ 2 N(1.5 + 2.5, 0.40 2 + 0.41 2 ) = N(1.5 + 2.5, ). Sannolikheten att den totala tiden ligger mellan 3.5 och 4.5 h är ( ) ( ) ( ) 4.5 4.0 3.5 4.0 4.5 4.0 Φ Φ = 2[Φ 1 = 0.62. (c) Antag istället att de börjar jobba samtidigt, och att förutsättningarna i övrigt är som ovan. Sannolikheten att Börje blir klar först: ( ) 1.0 ξ 1 ξ 2 N(1.0, ), P (ξ 1 ξ 2 ) = 1 P (ξ 1 ξ 2 0) = Φ = 1 0.04 = 0.96. 1

4. (2+3 poäng) Talen (25.0, 26.0, 24.5, 22.0, 25) är ett observerat stickprov på en normalfördelning med väntevärde µ och standardavvikelse σ. Räknehjälp: Från stickprovet beräknas medelvärde x = 24.5 och standardavvikelse s = 1.5. (a) Ett tvåsidigt 95%:s kondensintervall för väntevärdet µ. Stickprovets storlek är n = 5, så vi behöver kvantilen t 4,0.025 = 2.78. Intervallet skrivet som en olikhet och intervall är 24.5 ± t 5,0.025 s 5 = 24.5 ± 1.86 resp. [22.6, 26.4] (b) Ett uppåt begränsat 95%:s kondensintervall för standardavvikelsen σ: Vi behöver kvantilen χ 2 0.95 (4) = 0.71 så att intervallet för σ2 och σ är ] [0, 4s2 = [0, 12.7] resp. [0, 3.56]. 0.71 5. (2+4 poäng) Antalet cyklister som passerar GB-bron i Stuvesbergs Centrum under en minut är Poissonfördelat med väntevärde 1.5. Antalet cyklister under olika minuter antas oberoende av varandra. (a) Sannolikheten att minst två cyklister passerar bron under en given minut är ( λ P (ξ 2) = 1 P (ξ = 0) P (ξ = 1) = 1 e λ 0 ) 0! + λ1 = 0.44 1! (b) Låt ζ = 60 ξ k. Sannolikheten (approximativt) att minst 60 cyklister passerar k=1 bron under en timma är P (ζ > 60) där ζ approximativt är N(60λ, 60λ) enl. CGS och 60λ = 90, 60λ = 9.48683. ( ) ( ) 60 90 30 P (ζ > 60) = 1 P (ζ 60) 1 Φ = Φ = 0.999 9.48683 9.48683 6. (3 + 2 + 2 poäng) Familjen Yrsel åkte på gemensam cykelsemester förra sommaren. Semestern varade i 32 dagar och varje dag innebar en cykelsträcka på 3 mil (vi kan tänka oss att varje sträcka var likvärdig i svårighetsgrad). Vi kan tänka oss att tiden en sträcka cyklades är en responsvariabel (y). Responsvariabeln kan påverkas av tre olika faktorer (ålder, kön och om det regnar eller inte). Då familjen består av jämnåriga föräldrar och deras två barn som är tvillingsyskon (en icka och en pojke) samt att det regnade 16 av dagarna som familjen cyklade så kan man undersöka responsvariabeln med hjälp av ett 2 3 försök där det existerar 4 replikat för varje provgrupp. (a) Beräkna huvud- och samspels-eekter. Lösning 164.9 + 43 + 159.1 + 38.5 + 224.7 + 179 + 222.2 + 183 M = = 151.8 8 164.9 + 43 159.1 + 38.5 224.7 + 179 222.2 + 183 l A = = 81.85 4 l B = = 2.2 l C = = 100.9 l AB = = 2.0 l AC = = 38.4 l BC = = 2.9 l ABC = = 1.3 (b) Beräkna ett 95%-igt referensintervall och avgör vilka skattade eekter som är signikanta. Till din hjälp får du att den skattade standardavvikelsen för eekterna har räknats ut till s eekt = 4.5. Denna har man räknat ut med hjälp av alla s i värdena i tabellen. 2

Faktorer A: Ålder B: Kön C: Regn Låg (-) 12 Man Torrt Hög (+) 42 Kvinna Blött Nr. A B C ŷ i s i 1 - - - 164.9 4.3 2 + - - 43.0 3.9 3 - + - 159.1 4.8 4 + + - 38.5 5.1 5 - - + 224.7 7.0 6 + - + 179.0 4.9 7 - + + 222.2 7.7 8 + + + 183.0 10.5 Tabell 1: Faktorer samt försöksplan för tiden det tar att cykla en sträcka om 3 mil. Nr. A B C AB AC BC ABC ŷ i s i 1 - - - + + + - 164.9 4.3 2 + - - - - + + 43.0 3.9 3 - + - - + - + 159.1 4.8 4 + + - + - - - 38.5 5.1 5 - - + + - - + 224.7 7.0 6 + - + - + - - 179.0 4.9 7 - + + - - + - 222.2 7.7 8 + + + + + + + 183.0 10.5 Tabell 2: Provtagningsplan med samspelseekterna tillagda. Lösning Först beräknar vi den gemensamma skattningen av variansen såsom s 2 p = 3s2 1 + 3s2 2 +... 3 8 = 40.65. Eftersom eekten har variansen σ 2 = 4 σ2 så blir skattningen av eekternas eekt 8 varians s 2 = 40.65 = 20.3. eekt 2 Alltså får eekten den skattade standardavvikelsen s eekt = 4.5. Det tvåsidiga 95%-iga referensintervallet fås genom att multiplicera standardavvikelsen för effekten med 97.5% kvantilen för t-fördelningen med frihetsgraden 8(4 1) = 24. Alltså blir referensintervallet 0 ± t 0.025 (df = 24) s eekt = 0 ± 2.06 4.5 = 0 ± 9.27. Från referensintervallet kan vi slutleda oss till att eekterna A, C, och AC är signikanta eftersom dessa alla har ett absolutvärde större än 9.27. (c) Under familjen Yrsels cykelsemester så cyklade far och dotter på racingcyklar och mor och son på mountainbikes. Detta kan ha spelat in i hur snabbt de cyklade. Man kan alltså räkna in en fjärde faktor, D som motsvarar cykeltyp där låg (-) skulle motsvara racingcykel och (+) mountainbike. Försöksplanen är alltså egentligen en reducerad försöksplan, 2 4 1 -plan. Bestäm generator, ord och upplösning för denna reducerade försöksplan. 3

Lösning Då en person är antingen gammal och kvinna eller ung och man så kommer de cykla på mountainbikes, annars inte. Det betyder alltså att D:s kolumn motsvarar tvåfaktorsamspelet AB då AB har positivt värde då A och B är båda låga eller A och B är båda höga. Nr. A B C AB AC BC ABC D ŷ i s i 1 - - - + + + - + 164.9 4.3 2 + - - - - + + - 43.0 3.9 3 - + - - + - + - 159.1 4.8 4 + + - + - - - + 38.5 5.1 5 - - + + - - + + 224.7 7.0 6 + - + - + - - - 179.0 4.9 7 - + + - - + - - 222.2 7.7 8 + + + + + + + + 183.0 10.5 Tabell 3: Tabell med den exta faktorn D inkluderad. 7. (6 poäng) Man har alltså generatorn D = AB. Detta ger den denierande relationen I = ABD. Ordet är alltså ABD som har upplösning III. Vi har alltså en 2 4 1 III -plan. Alice, Bob och Carol är tre ölintresserade kemistudenter. Var för sig har de i sina lägenheter bryggt fyra på förhand utvalda ölsorter. De har använt samma recept och samma instruktioner, men de undrar om de olika omständigheterna i deras lägenheter och/eller deras utrustning har lett till en skillnad i alkoholhalten. I första tabellen nedan kan vi se den uppmätta alkoholhalten. I den andra tabellen nedan kan vi se den påbörjade ANOVA-tabellen. Ölsort 1 Ölsort 2 Ölsort 3 Ölsort 4 Alice 5.2 4.1 6.8 5.9 Bob 5.4 3.9 6.5 5.5 Carol 5.0 3.5 6.5 5.6 Variationskälla SS df M S F Mellan ölbryggare 0.245......... Mellan ölsorter 11.949......... Okänd......... Totalt 12.363... Fyll i resten av ANOVA-tabellen och utför ett hyptestest för att testa om alkoholhalten påverkas av vem som brygger ölet. Lösning: Den fullständiga ANOVA-tabellen bör se ut så här: Variationskälla SS df M S F Mellan ölbryggare 0.245 2 0.123 4.366 Mellan ölsorter 11.949 3 3.983 141.97 Okänd 0.168 6 0.028 Totalt 12.363 11 Vi använder de fem stegen. 4

Steg 1. Steg 2. Steg 3. Steg 4. Steg 5. Låt α 1, α 2 och α 3 beteckna hur stor eekt respektive ölbryggare har på alkoholhalten. Våra hypoteser blir då H 0 : α 1 = α 2 = α 3 och H 1 : alla µ i är inte lika. Vi väljer signikansnivå α = 0.05. (Man är fri att välja signikansnivå men det är bara 0.05 som nns i tabellen så om man väljer någon annan nivå får man problem.) Testvariabeln vi vill använda är F r = MSr SS r/(r 1) = MS o SS o/(r 1)(k 1). I vårt fall är r 1 = 3 1 = 2 och (r 1)(k 1) = (3 1)(4 1) = 6 så vår testvariabel är F -fördelad med 2 och 6 frihetsgrader. Vi vill ta fram vårt observerade värde på F. För att göra det så fyller vi i ANOVA-tabellen succesivt. Vi vet att SS t = SS r + SS k + SS o så vi vet att SS o = 12.363 0.245 11.949 = 0.168. Frihetsgraderna är r 1 = 2, k 1 = 3, (r 1)(k 1) = 6 och n 1 = 11. Vi vet också att MS = SS/df vilket ger att MS r = 0.245/2 = 0.123, MS k = 11.949/3 = 3.983 och att MS o = 0.168/6 = 0.028. Tillslut får vi att F r = MS r/ms o = 0.123/0.028 = 4.366 och att F k = MS k /MS o = 3.983/0.028 = 141.97. Eftersom det är variationen mellan raderna (ölbryggarna) vi är intresserade av är det F r vi vill jämföra med tabellen. Vi tittar i F-fördelningstabellen med 2 och 6 frihetsgrader och ser att det kritiska värdet är 5.14. Eftersom vårt observerade värde F r = 4.366 är mindre än det kritiska värdet så kan vi inte förkasta H 0 på signikansnivå α = 0.05. Slutsats: Vi kan inte dra slutsatsen att alkoholhalten påverkas av vem utav studenterna som brygger ölet. 8. (4 + 2 + 2 poäng) En forskare är intresserad av ett specikt väntevärde. Hen misstänker att väntevärdet är större än 20. För att testa detta har hen samlat in ett stickprov av storlek 64 från den relevanta populationen och resultaten blev x = 21.5 och s 2 = 38.4. (a) Utför ett hypotestest för att bedöma om forskarens misstankar stämmer. Använd signikansnivå α = 0.05. (b) Hur stort är p-värdet för testet? (c) Givet att stickprovsstorleken och stickprovsvariansen förblir samma, vilket är det minsta värde på stickprovsmedelvärdet som leder till att nollhypotesen förkastas på signikansnivå α = 0.05? Lösning: (a) Vi använder de fem stegen. Låt µ vara väntevärdet av intresse. Steg 1 Testet bör vara ensidigt eftersom forskaren vill påvisa att väntevärdet är större än 20. H 0 : µ 20 mot H 1 : µ > 20 Steg 2 Signikansnivån var given: α = 0.05. Steg 3 Testvariabeln är Z = X µ 0 s/ n som är normalfördelad eftersom n = 64 > 30. Steg 4 Den observerade testvariabeln blir x µ 0 s/ n = 21.5 20 38.4/ 64 = 1.5 6.2/8 = 1.935. Steg 5 Vi tittar i N(0, 1)-tabellen och får fram det kritiska värdet 1.645. Eftersom den observerade testvariabeln är större (längre ifrån 0) än det kritiska värdet så bör nollhypotesen förkastas. (b) Vi utgår från vår observerade testvariabel 1.935, tittar i N(0, 1)-tabellen och får fram värdet 0.026 som är vårt p-värde. 5

(c) Vi söker alltså det väre på x som gör att p-värdet blir just under 0.05. Tabellvärdet för 0.05 är 1.645 så vår observerade testvariabel borde vara just under 1.645, eller med andra ord vill vi att Vi löser olikheten för x och får att x 20 6.2/8 < 1.645. x < 1.645 6.2/8 + 20 = 21.27. Alltså är 21.27 det minsta värdet på x som leder till att nollhypotesen förkastas. 6