Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSLÄRA OCH STATISTIK MÅNDAGEN DEN 17 AUGUSTI 2009 KL 08.00 13.00. Examinator: Gunnar Englund, tel. 790 74 16. Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik. Räknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 10 poäng. Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för de tentander med 22 23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Det ankommer på dig själv att ta reda på om du har rätt att komplettera. Rättningstiden är högst tre veckor. Tentamen kommer att finnas tillgänglig på elevexpeditionen fram till sju veckor efter skrivningstillfället. Uppgift 1 a) A, B och C är tre händelser sådana att A och B är disjunkta, B och C är oberoende, A och C är oberoende. Vidare gäller att P (A) = 0.5, P (B) = 0.3 och P (C) = 0.4. Beräkna P (B C ) och P (A B C ) (C är komplementet till C.) (5 p) b) Den stokastiska variabeln X har täthetsfunktionen { k x om 0 x 1, f X (x) = 0 annars. (i) Beräkna konstanten k. (ii) Beräkna E(X) och D(X). Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p) Uppgift 2 Ett arbetslag vid ett bygge består av sju man. Detta arbetslag antages arbeta 200 dagar under ett år. Erfarenheten visar att risken för att en arbetare skadas vid bygget en viss dag 2 är 2 promille dvs. Trots att arbetslaget arbetar tillsammans antages skadorna hos de 1000 olika medlemmarna vara oberoende. Vidare antages antalet skador under olika dagar vara oberoende. (a) Beräkna sannolikheten för att det totala antalet skador hos arbetslaget under ett år överstiger tre. (5 p)
forts tentamen i SF1901 (f d 5B1501) 09 08 17 2 (b) Beräkna sannolikheten för att någon av arbetslagets medlemmar skadas mer än tre gånger under ett år. (5 p) I både (a)- och (b)-delen är lämpliga och välmotiverade approximationer tillåtna. Uppgift 3 Framför en bankomat står en kö om 28 personer. Av tidigare erfarenhet vet man att betjäningstiden för en bankomatkund är en stokastisk variabel med väntevärde 0.8 minuter och standardavviketse 0.3 minuter. Beräkna med hjälp av rimliga och väl motiverade approximationer sannolikheten att kön är avverkad på mindre än 20 minuter. Du får förutsätta oberoende mellan de olika betjäningstiderna. (10 p) Uppgift 4 Koncentrationen av en aktiv ingrediens i ett material tros påverkas av vilken katalysator som används i processen. Standardavvikelsen av den aktiva koncentrationen är känd till att vara 3.0 g/l, oberoende av katalysatorteknik. Tjugo observationer av koncentrationen togs, tio från katalysator 1 och tio från katalysator 2 med följande resultat: Katalysator 1: 57.9 66.2 65.4 65.4 65.2 62.6 67.6 63.7 67.2 71.0 Katalysator 2: 66.4 71.7 70.3 69.3 64.8 69.6 68.6 69.4 65.3 68.8 Finns det någon anledning att tro att den aktiva koncentrationen beror på valet av katalysator? Basera ditt svar på beräkning av ett lämpligt 95%-konfidensintervall. Observationerna antas vara normalfördelade. (10 p) Uppgift 5 Nationalekonomiprofessorerna Peter Bohm och Martin Dufwenberg genomförde ett experiment med 396 studenter på grundkursen i nationalekonomi vid Stockholms universitet. Dessa studenter får anses vara relativt väl förtrogna med EMU-frågan. Ett slumpvis urval av hälften av studenterna fick frågan Skall Sverige gå med i den europeiska monetära unionen (EMU) och införa euro som betalningsmedel? där 107 av 198 tillfrågade svarade Ja, den andra hälften fick frågan Skall Sverige gå med i den europeiska monetära unionen (EMU) och avskaffa kronan som betalningsmedel? där 95 av 198 tillfrågade svarade Ja. Beräkna ett (approximativt) 95%-igt konfidensintervall för skillnaden i Ja -andelar och använd detta för att på nivån 5% testa om undersökningen ger belägg för att fråge-formuleringen påverkar resultatet. (10 p) Uppgift 6 Weibullfördelningen (uppkallad efter Wallodi Weibull, 1887-1979, professor i maskinelement vid KTH, se www.weibullnews.com/ybullbio.htm för en kort biografi), är en av de mest använda fördelningarna för att beskriva livslängder av olika sorts komponenter. Den stokastiska variabeln X är Weibullfördelad om P (X > x) = e a xc, x 0
forts tentamen i SF1901 (f d 5B1501) 09 08 17 3 där a och c är givna positiva parametrar. a) Härled täthetsfunktionen till X. (3 p) För en viss sorts komponenter är c = 2, medan a är okänd. Man gör därför observationer av livslängderna på 5 komponenter och erhåller värdena (enhet:år) 0.26 0.30 0.34 0.74 0.95 b) Beräkna maximum-likelihoodskattningen av a. (4 p) c) Skatta på lämpligt sätt percentilen L 10. Med L 10 menas det värde som uppfyller P (X L 10 ) = 10%. (3 p)
Avd. Matematisk statistik LöSNINGAR TILL TENTAMEN I SF1901 (f d 5B1501) SANNOLIKHETSLÄRA OCH STATISTIK MÅNDAGEN DEN 17 AUGUSTI 2009 KL 08.00 13.00. a) Uppgift 1 P (B C ) = P (B) + P (C ) P (B C ) = {ober} = P (B) + P (C ) P (B)P (C ) = P (B) + (1 P (C)) P (B)(1 P (C)) = 0.3 + 1 0.4 0.3(1 0.4) = 0.72. P (A B C ) = P (A (B C )) P (B C ) = P (A C ) P (B C ) = {ober} = P (A)P (C ) P (B C ) = P ((A B) (A C )) P (B C ) = 0.5 0.6 0.72 = {disj} = 5/12 = 0.42. b) (i) (ii) Detta ger 1 = 1 0 E(X) = 3 2 k x dx = k 2 3 k = 3 2. 1 0 E(X 2 ) = 3 2 x 3/2 dx = 3 2 2 5 = 3 5. 1 V (X) = 3 7 ( 3 5) 2 D(X) = 0 x 5/2 dx = 3 7. 3 7 ( ) 2 3 12 = 5 175 = 0.26. Uppgift 2 (a) X = totala antalet skador under ett år är Bin(7 200, 0.002)-fördelad. Då 0.002 < 0.1 så är X approximativt Po(7 200 0.002) = Po(2.8)-fördelad. Detta ger P (X > 3) = 1 P (X 3) 1 0.69 = 0.31. (b) På samma sätt som i (a) följer att X k = antalet skador under ett år för arbetare nr k är Bin(200, 0.002) Po(200 0.002) = Po(0.4)-fördelad. Detta medför att P (någon skadas mer än tre gånger) = 1 P (ingen skadas mer än tre gånger) =
forts tentamen i SF1901 (f d 5B1501) 09 08 17 2 1 7 P (X k 3) = 1 0.99922 7 0.005. k=1 Uppgift 3 Låt X i beteckna den i :te personens betjäningstid, i = 1, 2,, 28. Dår är X 1, X 2,, X 28 oberoende med E(X i ) = 0.8 och D(X i ) = 0.3. Enligt centrala gränsvärdessatsen gäller att S 28 = X 1 + X 2 + X 28 är approximativt normalfördelad. Vi har E(S 28 ) = 28 0.8 och V (S 28 ) =(p g a oberoende)= 28 0.3 2 = 28 0.09. Alltså får vi att den sökta sannolikheten är P (S 28 < 20) = P ( S28 28 0.8 28 0.09 < 20 28 0.8 28 0.09 ) Φ( 1.51) = 1 Φ(1.51) 1 0.9345 0.0655 Uppgift 4 Två oberoende stickprov. Observationerna från katalysator 1 antas vara N(µ 1, 3) och de från katalysator 2 N(µ 2, 3). Konfidensintervall för µ 1 µ 2 ges av x ȳ ± λ 0.025 σ där x är 1 n 1 + 1 n 2 medelvärdet av data från katalysator 1, ȳ är medelvärdet för observationerna från katalysator 2, σ 2 = 3 2 = 9 och n 1 = n 2 = 10 (kombinera FS 11.1 och 10.2 a)). Eftersom λ 0.025 = 1.96 erhåller vi intervallet 65.22 68.48 ± 1.96 3 1/10 + 1/10 = 3.2 ± 2.63. Eftersom 0 inte tillhör intervallet kan vi på signifikansnivån 5% dra slutsatsen att katalysatorerna skiljer sig åt. Uppgift 5 Vår modell är att antalet Ja -anhängare är Bin(198, p 1 ) respektive Bin(198, p 2 ). Vi vill beräkna ett 95%-igt konfidensintervall för p 1 p 2. Vi skattar p 1 med p 1 = 107/198 0.540 och p 2 med p 2 = 95/198 0.480. Eftersom np i (1 p i ) är approximativt 50 i båda fallen kan vi alltså approximera binomial-fördelningarna med normalfördelningar. Vi får att p i är approximativt N(p i, p i (1 p i )/198) för i = 1, 2 och ser att p 1 p 2 är approximativt ( ) p1 (1 p 1 ) N p 1 p 2, + p 2(1 p 2 ) 198 198 som med approximativa metoden (FS 11.3) ger ett (approximativt) 95%-igt konfidensintervall för p 1 p 2 till p p 1 p 2 ± λ 1 (1 p 1) 0.025 + p 2(1 p 2) 198 198 0.54 0.46 + 0.49 0.51 0.540 0.480 ± 1.9600 0.060 ± 0.098. 198 Eftersom 0 ingår i konfidensintervallet kan vi inte förkasta H 0 : p 1 = p 2 och undersökningen visar alltså inte att fråge-formuleringen spelar någon roll. Kommentar: Testet (men inte konfidensintervallet) kan utföras som homogenitetstest.
forts tentamen i SF1901 (f d 5B1501) 09 08 17 3 Uppgift 6 a) Täthetsfunktionen är derivatan av fördelningsfunktionen, f X (x) = F X (x). Denna är F X (x) = P (X x) = 1 P (X > x) = 1 e a xc varför f X (x) = F X(x) = ac x c 1 e a xc, x 0 b) Kalla observationerna x 1, x 1,..., x n. Likelihoodfunktionen är L(x 1, x 2,..., x n ; a) = n f X (x i ) = n (2a x i e a x2 i ) = 2 n a n e a P n x2 i Vi skall beräkna det värde på a som maximerar L. Det är lättare att då betrakta logaritmen av L som har maximum för samma a-värde. Logaritmen blir ln(l) = n ln(2) + n ln(a) a n x2 i + ln( n x i). Derivera logaritmen: d ln(l) da = n a n vilken är 0 för a = a = P n n. Detta värde ger maximum (se teckenväxling) och är alltså x2 i ML-skattningen. Med n = 5 och observationsvärdena insatta får a = 2.90. c) Vi har 0.1 = P (X L 10 ) = 1 P (X > L 10 ) = 1 e a Lc 10 vilket ger e a L c 10 = 0.9 och således a L c 10 = ln(0.9). Vi löser ut L 10 = ( ln(0.9)/a) 1/c. Vi skattar a med a = 2.90, och eftersom c = 2 erhåller vi skattningen L 10 = 0.191 x 2 i n x i