Avd. Matematisk statistik TENTAMEN I SF1901, SANNOLIKHETSLÄRA OCH STATISTIK I, MÅNDAGEN DEN 15 AUGUSTI 2016 KL 08.00 13.00. Examinator: Tatjana Pavlenko, 08 790 84 66. Kursledare: Thomas Önskog, 08 790 84 55. Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook (Beta), hjälpreda för miniräknare, miniräknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 10 poäng. Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för tentander med, preliminärt, 22 23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Det ankommer på dig själv att ta reda på om du har rätt att komplettera. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Uppgift 1 Låt A och B beteckna två händelser. Givet är P (A) = 3/5, P (B A) = 2/3 och P (B A ) = 1/3, där A betecknar komplementet till händelsen A. (a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat. (5 p) Uppgift 2 I den organiska kemin spelar smältpunktsbestämningar en stor roll för identifiering av en substans eller för bedömning av dennas renhet. För att undersöka om renheten hos två olika partier av hydrokinon skiljer sig åt tar man därför åtta prover från vardera partiet och bestämmer smältpunkten för vart och ett av dessa prov. Parti 1 174.0 173.5 173.0 173.5 171.5 172.4 173.5 173.5 Parti 2 173.0 173.0 172.0 173.0 171.0 172.0 171.0 172.0 Vi antar att variationen mellan smältpunkterna i respektive prov är normalfördelad med en varians som är densamma för de båda partierna. Undersök på lämpligast sätt om vi kan anta att partierna skiljer sig åt. Välj signifikansnivån 5%. Ange tydligt vilka de uppställda hypoteserna är och vad slutsatsen är. (10 p) Var god vänd!
forts tentamen i SF1901 2016-08-15 2 Uppgift 3 Ett spel går till på följande sätt: Man satsar 1 krona i en spelautomat. Om man vinner får man 3 gånger insatsen tillbaka, men om man förlorar så förlorar man sin satsade krona. Sannolikheten att vinna vid en spelomgång är 25%. (a) Beräkna väntevärdet och standardavvikelsen för nettovinsten om man spelar en omgång. Med nettovinst menas utbetalt belopp minus insats. (4 p) (b) Beräkna med välmotiverad approximation sannolikheten att man går med nettovinst om man spelar 120 omgångar av spelet. (6 p) Uppgift 4 I en studie undersöktes hår- och ögonfärg hos slumpmässigt utvalda tyska män. Resultatet redovisas i följande tabell. Brunt eller svart hår Blont eller rött hår Bruna ögon 726 131 Grå eller gröna ögon 2133 999 Blå ögon 996 1815 Utför ett test på signifikansnivån 0.1% av om det finns ett statistiskt säkerställt samband mellan ögonfärg och hårfärg hos tyska män. Ange tydligt de uppställda hypoteserna och motivera tydligt vilken slutsats som dras från testet. (10 p) Uppgift 5 I bilar av modell GK-Roadrunner som tillverkas av GK-Motors Inc., kan kretskort inbyggda i den elektroniska servostyrningen innehålla skador som leder till att extra styrkraft behövs speciellt vid låga hastigheter, vilket ökar risken för olyckor. Antalet skador per kretskort som leveras för tillverkning av GK-Roadrunner antas vara Poisson-fördelat med µ = 0.014. Antalet skador i ett kretskort antas vara oberoende av antalet skador i ett annat. Den elektroniska servostyrningen i en GK-Roadrunner innehåller 100 dylika kretskort. (a) Bestäm sannolikheten för att antalets skador i en elektronisk servostyrning med 100 kretskort är mindre än eller lika med ett? Ledning: Sätt U i = antalet skador på kretskort nr. i. Då är U i Po(0.014). Vi söker P (U 1... U 100 1). (5 p) (b) GK-Motors utreder med egna resurser 10 av de bilolyckor som drabbat modellen GK- Roadrunner. Dessa tio olycksbilar är slumpmassigt valda ur ett mycket större antal ( 1000) olycksbilar. Om man upptäcker att minst åtta av dessa 10 bilar har två eller fler skador hos kretskorten i den elektroniska servostyrningen, så kommer en hel årspoduktion att återkallas för åtgärd hos GKs återförsäljare. Beräkna sannolikheten för att en hel årsproduktion av GK-Roadrunner kommer att återkallas. Välmotiverade approximationer är tillåtna. Om Du inte klarat av att lösa deluppgift (a), får Du använda P (U 1... U 100 1) = 0.6. (5 p)
forts tentamen i SF1901 2016-08-15 3 Uppgift 6 I ett lotteri med 50 miljoner lotter är sannolikheten för vinst p. Varje dag, under 20 på varandra följande dagar, så köper en person lotter, en i taget, till dess att hen vinner. Antalet lotter som personen köper under de 20 dagarna ges av följande tabell. 1 26 19 6 6 1 2 3 1 23 19 3 6 8 4 1 18 34 1 8 (a) Låt slumpvariabeln X beteckna antalet lotter som personer köper en given dag (av de 20 dagarna). Bestäm sannolikhetsfunktionen p X för X. Motivera dina resonemang utförligt. (3 p) (b) Bestäm Maximum Likelihood-skattningen av sannolikheten p. (4 p) (c) Bestäm Minsta Kvadrat-skattningen av sannolikheten p. (3 p) Lycka till!
Avd. Matematisk statistik LÖSNINGSFÖRSLAG TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK I. MÅNDAGEN DEN 15 AUGUSTI 2016 KL 08.00 13.00. Uppgift 1 (a) Först bestäms På samma sätt fås Sålunda får vi att P (A B) = P (B A) P (A) = 2 3 3 5 = 2 5. P (A B) = P (B A ) P (A ) = 1 3 (1 3 5 ) = 1 3 2 5 = 2 15. Eftersom P (A B) = 2/5, medan P (B) = P (A B) P (A B) = 2 5 2 15 = 8 15. P (A) P (B) = 3 5 så är händelserna A och B beroende. (b) Eftersom 8 15 = 8 25 2 5, så är P (A B) = P (A) P (B) P (A B) = 3 5 8 15 2 5 = 11 15. P (A någon av A eller B inträffar) = P (A A B) = = 11 15 P (A (A B)) P (A B) 3 P (A) P (A B) = 5 = 9 11 = 0.82.
forts tentamen i SF1901 2016-08-15 2 Uppgift 2 Vi har standardsituationen två oberoende stickprov från normalfördelningar med gemensam varians, dvs avsnitt 11.2 i formelsamlingen. Låt x 1,..., x 8 och y 1,..., y 8 vara de uppmätta smältpunkterna i parti 1 respektive parti 2. Dessa smältpunkter är observationer av stokastiska variabler X 1,..., X 8 respektive Y 1,..., Y 8 (alla oberoende) med fördelningar N(µ X, σ) respektive N(µ Y, σ). Vi vill utföra hypotesprövning med två oberoende stickprov och ställer upp hypoteserna H 0 och H 1 H 0 : µ X = µ Y Vi bildar konfidensintervallet där I µx µ Y = H 1 : µ X µ Y ( x ȳ ± t α/2 (n X n Y 2) s s 2 = (n X 1)s 2 X (n Y 1)s 2 Y n X n Y 2 1 1 ) n X n Y Med n X = n Y = 8, x = 173.11, ȳ = 172.12, s X = 0.80256, s Y = 0.83452, s = 0.81870 och t 0.025 (14) = 2.14 får vi att I µy µ X = 0.99 ± 0.88. Eftersom 0 inte ingår i konfidensintervallet kan man förkasta H 0 på signifikansnivån 5%. Detta innebär att man med 5% felrisk kan påstå att det föreligger systematisk skillnad mellan de två partierna vad gäller smältpunkten. Svar: På risknivån 5 % skiljer sig partiernas smältpunkter åt. Uppgift 3 Låt X = nettovinsten vid en spelomgång. X antar värdet 2 med sannolikheten 1/4 och värdet 1 med sannolikheten 3/4. a) E(X) = 2 1 4 ( 1) 3 4 = 1 4. V (X) = E(X 2 ) (E(X)) 2 = 2 2 1 4 3 ( 1)2 4 27 D(X) = 16 1.30.. ( 1 ) 2 = 27 4 16. b) Låt X i = nettovinst omgång i, i = 1, 2,..., 120. X i :na antas oberoende. Centrala gränsvärdessatsen ger att Y = 120 X i är approximativt normalfördelad med E(Y ) = 120 E(X) = 30 och V (Y ) = 120 V (X) = 202.5, dvs Y N( 30, 202.5). ( Y 30 P (Y > 0) = P > 30 ) 1 Φ(2.11) 0.017. 202.5 202.5
forts tentamen i SF1901 2016-08-15 3 Uppgift 4 Vi gör här ett oberoendetest. Nollhypotesen H0 är då att det inte finns ett samband mellan ögonfärg och hårfärg hos tyska män. Mothypotesen H1 är då att det finns ett sådant samband. Vi gör här en tabell med observerade antal enligt Observerade antal Bruna ögon Grå eller Gröna ögon Blå ögon Totalt Mörkt hår 726 2133 996 3855 Ljust hår 131 999 1815 2945 Totalt 857 3132 2811 Teststorheten blir Q = 857 3855 (726 ) 2 857 3855 3132 3855 (2133 ) 2 2132 3855 (996 2811 3855 ) 2 2811 3855 857 2945 (131 ) 2 857 2945 3132 2945 (999 ) 2 3132 2945 (1815 2811 2945 ) 2 2811 2945 = 957.6756 Om H 0 är sann så är 957.6756 ett utfall från en stokastisk variabel som approximativt har en χ 2 -fördelning med (3 1)(2 1) = 2 frihetsgrader. Eftersom χ 2 0.001(2) = 13.8 < 957.6756 så kan H 0 förkastas på nivån 0.1%. Alternativt kan vi beräkna sannolikheten att en χ 2 (2)- variabel är större än eller lika med 957.6756 (X2cdf på en TI-räknare). Denna sannolikhet, dvs p-värdet för testet, är 0.000. Detta p-värde är så lågt att vi förkastar H 0 på risknivån 0.1%. Både teststorheten och p-värdet fås direkt med funktionen X2-Test på en TI-räknare. Svar: Sambandet mellan hårfärg och ögonfärg för tyska män är statistiskt säkerställt på risknivån 0.1%. Uppgift 5 (a) Eftersom U i Po(0.014) är oberoende, gäller det att U 1... U 100 Po(100 0.014) d.v.s. U 1... U 100 Po(1.4). Då fås med kursens tabell för fördelningsfunktionen för Po(1.4) att P (U 1... U 100 1) = 0.59. Matlab TM levererar >> 1 poisscdf(1, 1.4) = 0.5918 (b) Om X = antalet olycksbilar behäftade med mer än två skador i den elektroniska servostyrningens 100 kretskort för ett stickprov av 10 bilar ur 1000, så är X Hyp(1000, 10, p) 1, där p =sannolikheten för mer än två skador. Eftersom 10/1000 = 1 Vi plockar tio bland 1000, där 100 p är procentandelen av servostyrningar med två eller fler skador.
forts tentamen i SF1901 2016-08-15 4 0.01 < 0.1 (jfr. formelbladet), kan vi approximera Hyp(1000, 10, p) med Bin(10, p). Vi har från deluppgift (a) att p = 1 P (U 1... U 100 1) = 0.41 Vi tar p 0.4 för att kunna slå upp i kursens tabellsamling. Detta ger P (X 8) = 1 P (X 7) = 1 0.98771 = 0.0123 0.01. Matlab TM ger eller exaktare >> 1 binocdf(7, 10, 0.4) = 0.0123 >> 1 binocdf(7, 10, 0.41) = 0.0146 0.01. Uppgift 6 (a) Sannolikheten att första lotten ger vinst är p. Sannolikheten att vinna för första gången på den andra lotten är (1 p)p och sannolikheten att vinna för första gången på den tredje lotten är (1 p) 2 p osv. På detta sätt inses att sannolikheten att vinna för första gången på lott nummer k är (1 p) k 1 p. Sannolikhetsfunktionen för slumpvariabeln X, som betecknar antalet lotter som personen köper en given dag, ges därmed av dvs X är ffg-fördelad. p X (k) = (1 p) k 1 p, (b) Låt k 1,..., k 20 vara observationerna av antalet inköpta lotter. Likelihoodfunktionen är L(p) = 20 och loglikelihoodfunktionen blir därmed (1 p) ki 1 p = (1 p) ( 20 ki 20) p 20, 20 ln L(p) = ( k i 20) ln(1 p) 20 ln p. Vi söker det värde på p som maximerar likelihoodfunktionen och sätter därför derivatan av loglikelihoodfunktionen med avseende på p till noll. Detta ger 0 = d ln L(p) dp = 20 k i 20 20 1 p p = ( 20 k i 20)p 20(1 p), p(1 p) vilket reduceras till 20 p k i 20 = 0 p ML = 20 20 k. i För det givna datat är Maximum Likelihood-skattningen 20 k i = 190, så p ML = 20/190 = 0.105.
forts tentamen i SF1901 2016-08-15 5 (b) Eftersom X är ffg-fördelad, så vet vi från formelsamlingen att E(X) = 1/p. Vi önskar minimera kvadratsumman 20 Q(p) = (k i 1 p )2, och derivering med avseende på p ger som i sin tur ger 20 dq dp = 2 (k i 1 p )( 1 p ) = 0 20 k 2 i 20 p = 0, p MK = 20 20 k. i Även Minsta Kvadrat-skattningen uppfyller därmed p MK = 20/190 = 0.105.