Avd. Matematisk statistik TENTAMEN I SF90, SANNOLIKHETSTEORI OCH STATISTIK, TISDAGEN DEN 9:E JUNI 205 KL 4.00 9.00. Kursledare: Tatjana Pavlenko, 08-790 84 66 Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook (Beta), Hjälpreda för miniräknare, räknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 0 poäng. Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för tentander med, preliminärt, 22 23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Det ankommer på dig själv att ta reda på om du har rätt att komplettera. Poäng från kontrollskrivning och laborationer under kursomgång period 4 VT205 tillgodoräknas. Obs! Man måste på denna tentamen erhålla minst 20 poäng (av 60) utan medräknad bonus för att bonuspoängen skall räknas med. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Uppgift (a) För två händelser, A och B, är följande sannolikheter kända P (A B) = 0.92, P (A B ) = 0.88, P (A B) = 0.68. Avgör om A och B är oberoende händelser. (5 p) (b) Antag att i genomsnitt var tionde bil som passerar Häggvikavfarten på E6 kör för fort och att olika bilar håller oberoende hastigheter. En polis mäter hastigheten på 5 bilar. Vad är sannolikheten att minst 3 bilar kör för fort? (5 p) Uppgift 2 (a) Låt X och Y vara normalfördelade och beroende stokastiska variabler med E(X) = V (X) = och E(Y ) = V (Y ) = samt korrelationskoefficient ρ = /4. Bestäm P (X + 2Y ) 2). (3 p) (b) Vid ett försök att bestämma jordaccelerationen g (enhet m/s 2 ) vid en viss plats mätte man hur lång tid det tog för föremål att falla olika kända sträckor. Man erhöll följande mätvärden Fallsträcka (meter): 0.25 0.50 0.75.00 Falltid (sekunder): 0.23 0.32 0.39 0.45
forts tentamen i SF90 205-06-09 2 Den förväntade falltiden t och fallsträckan s är relaterade genom sambandet s = gt2 2. Härled och beräkna med minstakvadratmetoden skattningen av g baserad på ovanstående data om vi betraktar falltiderna som utfall av oberoende stokastiska variabler med samma varians och där de enskilda mätningarna av falltiderna saknar systematiska fel. (7 p) Uppgift 3 En ideell förening Den Gröna Jorden planerar en insamling för utökning av grönområden runt fastigheterna. Föreningen skickar därför ett brev till var och en av de 000 medlemmarna där man ber om ett bidrag på 50 eller 00 kronor. Man vet från tidigare att 50 och 00 kronors bidrag är lika vanliga och att 20% av medlemmarna inte ger något bidrag. Bestäm med hjälp en lämplig och välmotiverad approximation, sannolikheten att föreningens sammanlagda insamling överstiger 58 000 kronor. (0 p) Uppgift 4 För att undersöka effekten av två olika rostskyddsmedel, M och M 2, behandlades 0 järnstavar med medel M och ytterliggare 0 stavar med medel M 2. På var och en av 0 olika platser grävdes därefter två stavar ned; en stav med varje behandling. Efter två månader togs alla stavar upp och graden av rost mättes. Följande mätvärden (i lämplig enhet) erhölls: Plats: 2 3 4 5 6 7 8 9 0 Medel M : 9.5 23.35 20.0 6.70 3.85 7.70 22.77 2.7 34.06 8.7 Medel M 2 : 2.96 27.70 22.93 9.02 32.26 7.35 27.39 25.43 33.43 8.4 Ange en lämplig statistisk modell baserad på normalfördelning som beskriver data, och undersök genom att testa en hypotes eller genom att dra slutsatser från ett konfidenintervall, om det finns någon systematisk skillnad i grad av rost mellan de två rostskyddsmedlen. Välj signifikansnivån α = 0.05. (0 p) Uppgift 5 Vid tillverkning av en viss detalj kan två typer av fel uppstå, A och B. Dessa fel kan dock ej uppkomma bägge två på en och samma detalj. I försäljningsspecifikationen för denna detalj står det angivet att fel A förekommer med sannolikheten 0.05, och fel B med sannolikheten 0.09. För att undersöka om dessa värden fortfarande är aktuella så kontrollerades 50 enheter uttagna helt slumpmässigt. Av dessa befanns 2 st ha fel A, 2 st ha fel B, och resten var felfria. Utför ett statistiskt test på 5% signifikansnivå för att avgöra om försäljningsspecifikationen är förenlig med data. (0 p) Uppgift 6 Vid tillverkning av gjutmassa för kakelugnar är det viktigt att viktprocent av ett visst ämne, olivinsand, inte ligger allt för långt under 8%. Vid övervakning av tillverkningsprocessen tar man
forts tentamen i SF90 205-06-09 3 med jämna mellanrum slumpmässigt ut 5 prov ur den tillverkade massan och mäter viktprocenten av olivinsand. De erhållna mätningarna är x,..., x 5. Om x, som man får från dessa mätningar, understiger 8% alltför mycket, dvs x < c, betraktar man detta som att tillverkningprocessen är ur kontroll och slår larm. Man har studerat tillverkningen under längre tid och kommit fram till att x,..., x 5 kan anses som ett stickprov från en normalfördelning med väntevärde µ (vilket är 8 då tillverkningsprosessen är under kontroll) och standardavvikelse.. (a) Vid övervakning av tillverkningsprocessen löper man en viss risk att slå larm även om processen är under kontroll. Bestäm konstanten c så att denne felrisk (dvs testets signifikansnivå) blir 0.0. (6 p) (b) Antag att man använder den alarmgräns c som du har bestämt i del (a). Bestäm sannolikheten att upptäcka att tillverkningsprocessen är ur kontroll då den verkliga viktprocenten av olivinsand är 7%. Om du inte klarar del (a) så använd c = 6.3. (4 p)
Avd. Matematisk statistik LÖSNINGSFÖRSLAG TENTAMEN I SF90 MATEMATISK STATISTIK. TISDAGEN DEN 9:E JUNI 205 KL 4.00 9.00 Uppgift (a) A och B är oberoende om P (A B) = P (A)P (B). Vi har P (A B ) = P (A B) och P (A B) = P (A B ). Vidare P (A B) = P (A B) P (A B ) P (A B) = 0.92 ( 0.68) ( 0.88) = 0.48. P (A) = P (A B) P (A B) = 0.92 ( 0.88) = 0.8. P (B) = P (A B) P (A B ) = 0.92 ( 0.68) = 0.6. Detta ger P (A)P (B) = 0.8 0.6 = 0.48 = P (A B). Svar: A och B är oberoende. (b) Låt X vara antalet bilar som kör för fort. Då gäller att X Bin(5, 0.). Vi vill beräkna P (X 3), (minst tre bilar kör för fort). P (X 3) = P (X 2) = F X (2) = tabell 6, fls = 0.859 = 0.84. Svar: P (X 3) = 0.84. Uppgift 2 (a) C(X, Y ) = ρ V (X) V (Y ) = /4 = /4. V (X + 2Y ) = V (X) + 2 2 V (Y ) + 2 2C(X, Y ) = + 4 + 4 ( /4) = 4. Vidare vet man att X + 2Y N( + 2, 4) = N(3, 2). Med hjälp av detta får vi Svar: P (X + 2Y 2 = 0.3085. P (X + 2Y 2) = Φ ( 0.5) = Φ (0.5) = 0.695 = 0.3085. (b) Falltiden m(s) då fallsträckan är s uppfyller enligt texten s = g(m(s))2 2 som ger m(s) = 2s/g. Låt X i = falltiden då sträckan är s i. Vi har alltså E(X i ) = m(s i ) = 2si /g. De observerade falltiderna x,, x 4 för fallsträckorna s,, s 4 är alltså utfall av X, X 2, X 3, X 4 som är oberoende med samma varians σ 2 och väntevärden m(s i ), i =, 2, 3, 4.
forts tentamen i SF90 205-06-09 2 Skattningen g obs är alltså det g-värde som minimerar Q(g) = ( ) 2 2si x i. g Vi får dq dg = ( ) ( 2si 2si 2 x i g 2 g 3/2 = x g 3/2 i 2si g ) 2s i. Minimum då dq/dg = 0 ger ( gobs 2 ) 4 = s 2 i 4 x. i 2si Med insatta numeriska värden erhålls g obs = ( ) 2 5 = 9.80..597 Svar: g obs = 9.80. Uppgift 3 Låt X i beteckna bidrag från medlem nr i, i =,..., 000. X i är oberoende av varandra med samma fördelning. Vi vill bestämma P (Y > 58000) där Y = 000 X i är sammanlagt bidrag. Eftersom antal medlemmar är tillräkligt stort kan vi använda Centrala Gränsvärdessatsen vilket ger att Y är approximativt N(E(Y ), D(Y ))-fördelad, där och V (Y ) = V E(Y ) = E ( 000 ( 000 ) 000 X i = E(X i ) = 000E(X i ), ) 000 X i = ober. X i = V (X i ) = 000V (X i ), D(Y ) = 000D(X i ). För att bestämma E(X i ) och D(X i ) måste vi först ta fram fördelningen för X i. Från uppgift vet vi att P (X i = 50) = P (X i = 00) och att P (X i = 0) = 0.20. Eftersom sannolikheterna måste summeras till ett får vi p + p + 0.20 = vilket ger p = 0.4. Med detta ges fördelningen för X i av k 0 50 00 p X (k) 0.2 0.4 0.4 Nu får man E(X i ) = 3 kp X (k) = 0 0.2 + 50 0.4 + 00 0.4 = 60. k=
forts tentamen i SF90 205-06-09 3 Vidare vilket ger E(X 2 i ) = 3 k 2 k X (k) = 5000 k= V (X i ) = E(X 2 i ) (E(X i )) 2 = 5000 60 2 = 400 och D(X i ) = V (X i ) = 400 = 37.42. Nu har man att Y N(000 60, 400 000) = N(60000, 83.2), approximativt. Detta ger ( ) 58000 60000 P (Y > 58000) = P (Y 58000) Φ = Φ(.69) = Φ(.69) = 0.9545. 83.2 Svar: P (Y > 58000) 0.9545. Uppgift 4 Typsituation för modellen stickprov i par: X i N(µ i, σ ) och Y i N(µ i +, σ 2 ), i =,..., 0, där är skillnad i grad av rost mellan M och M 2. Vi vill testa hypotes om det finns någon systematisk skillnad mellan de två rostskyddsmedlen, dvs Vi bildar differenser z i = y i x i : H 0 : = 0, mot H : 0. 2.8, 4.35, 2.83, 2.32, 0.4, 0.35, 4.62, 3.72, 0.63, 0.57. Enligt modellen är z i observationer av Z i som är oberoende och N(, σ z ) fördelade, där σ z = σ 2 + σ 2 2 fördelade, i =,..., 0. Vi skattar med z =.95 och σ z med Som testvariabeln använder vi s z = 0 0(z i z) 2 = 2.064. t = z 0 0 = 0.95 2.064 = 2.989. Eftersom t > t 0.025 (9) = 2.26 förkastas H 0 på nivån 0.05%. Svar: Det finns en signifikant skillnad mellan de två rostskyddsmedlen. Alternativt kan ett 95% konfidensintervall för göras (se formelsamlingen avsnitt 0. och.2): I = ( z ± t 0.025 (9) s z 0 = (.95 ± 2.26 2.064 0 ) = (.95 ±.475) = (0.48, 3.43). Svar: Eftersom intervallet ej täcker över 0 är slutsatserna de samma som ovan vis hypotesprövning. Uppgift 5 Vi har typsituationen för χ 2 -test med tre möjliga resultat: A Felet A inträffar, A 2 felet B inträffar,a 3 inget av felen inträffar. D.v.s. r = 3. Beteckningar enligt formelsamlingen. Hypotesen är H 0 : p = 0.05, p 2 = 0.09 och p 3 = p p 2 = 0.05 0.09 = 0.86.
forts tentamen i SF90 205-06-09 4 Vi har n = 50 observationer varav x = 2, x 2 = 7 och x 3 = 50 2 2 = 7. Vi får därför Q = r j= (x j np j ) 2 np j = (2 50 0.05)2 50 0.05 + (2 50 0.09)2 50 0.09 + (7 50 0.86)2 50 0.86 = 7.98. χ 2 α(r ) = χ 2 0.05(2) = 5.99 < 7.98, vilket gör att vi förkastar H 0 på 5% nivån. Eftersom np = 50 0.05 = 7.5 5 så gäller att alla np j 5, vilket är ett krav för χ 2 -testet. Svar: H 0 förkastas på 5% nivån. Försäljningsspecifikationen är inte förenlig med data. Uppgift 6 Låt X vara viktprocent av olivinsand i gjutmassa. Då gäller att X N(µ,.). Vi testar hypotes H 0 : µ = 8 (dvs tillverkningsprosess är under kontroll) mot H : µ < 8 (tillverkningsprosess är ur kontroll) och förkastar H 0 om x < c, där x är medelvärde av de fem oberoende observationer x,..., x 5 som man har fått vid övervakning av tillverkningsprocessen. Det gäller att x är en observation av X N(µ,./ 5). (a) Man vill bestämma c sådan att testets signifikansnivån α blir 0.0, dvs då X N(8,./ 5). Detta ger 0.0 = P (H 0 förkastas då H 0 är sann) = P ( X < c), c = 8 λ 0.0. 5 = 6.8556. Svar: c = 6.8556. (b) Här söker vi testets styrka i punkten 7, se fms. avsn. 4.. ( h(7) = P (förkasta H 0 om µ = 7) = P X < c X N Svar: h(7) = 0.3846. ( 7,. )) 5 ( ) ( ) c 7 6.8556 7 = Φ./ = Φ 5.5./ = Φ( 0.2935) = 0.3846. 5.5