Avd. Matematisk statistik TENTAMEN I SF191, SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 1:A JUNI 216 KL 8. 13.. Kursledare: Thomas Önskog, 8-79 84 55 Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook (Beta), Hjälpreda för miniräknare, räknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 1 poäng. Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för tentander med, preliminärt, 22 23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Det ankommer på dig själv att ta reda på om du har rätt att komplettera. Poäng från kontrollskrivning och laborationer under kursomgång period 4 VT216 tillgodoräknas. Obs! Man måste på denna tentamen erhålla minst 2 poäng (av 6) utan medräknad bonus för att bonuspoängen skall räknas med. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Uppgift 1 I faderskapsmål undersöks ofta blodgrupper hos moder, barn och den utpekade fadern. För enkelhets skull betraktar vi bara det s.k. AB-systemet (i verkligheten undersöks ett flertal sådana blodgruppssystem). För barn vars moder har blodgrupp ges den av faderns blodgrupp betingade sannolikheten för att barnet skall få blodgrupp A av följande tabell: Faderns blodgrupp Sannolikheten för att barnet skall få blodgrupp A A 1/2 AA 1 AB 1/2 Övriga Sannolikheten att en på måfå vald man skall ha blodgrupp A, AA, AB respektive övriga är.36,.8,.2 respektive.54. Beräkna sannolikheten att fadern har AA när barnet har A och modern. (1 p) Uppgift 2 I ett stort bostadsområde är 1/6 av lägenheterna ettor, 1/3 tvåor, 2/5 treor och 1/1 fyror. Bestäm med hjälp av en lämplig och välmotiverad approximation sannolikheten att 6 slumpvis utvalda lägenheter tillsammans har minst 135 rum. (1 p)
forts tentamen i SF191 216-6-1 2 Uppgift 3 En slumptalsgenerator är avsedd att simulera en diskret Poissonfördelad sannolikhetsfördelning på de hela talen,1,2,3. Om slumptalsgeneratorn fungerar borde den ge slumptal med den diskreta sannolikhetsfördelningen p = e µ, p 1 = µe µ, p 2 = µ2 2 e µ och p 3 = 1 p 2 p 1 p, för något värde på µ >. I en testkörning skapades 1 slumptal med hjälp av den aktuella generatorn, varvid följande resultat erhölls k 1 2 3 x k 7 25 45 5 där x k anger antalet gånger generatorn har gett heltalet k =, 1, 2, 3 vid de tusen gjorda försöken. Testa baserat på dessa resultat på signifikansnivån 5% huruvida generatorn i fråga faktiskt kan anses ge Poissonfördelade slumptal. Ange tydligt de uppställda hypoteserna och motivera tydligt vilken slutsats som dras från testet. (1 p) Uppgift 4 Ett lysrörs livslängd mätt i år antas vara Exp(5/12)-fördelad. (a) Åtta nya lysrör monteras in i lokal A. Lysrörens livslängder antas oberoende av varandra. Belysningen i lokal A anses vara acceptabel om sex eller fler lysrör lyser. Bestäm sannolikheten att belysningen är acceptabel efter ett år under förutsättning att inga lysrör byts ut. (5 p) (b) Ett nytt lysrör monteras in i lokal B. Om lysröret går sönder byts det omedelbart ut mot ett nytt lysrör. Bestäm sannolikheten att minst två byten av lysrör har skett i lokal B efter ett år? (5 p) Ledning: Summan Z = X 1... X n av n oberoende Exp(λ)-fördelade stokastiska variabler har täthetsfunktionen f Z (z) = λn (n 1)! zn 1 e λz. Uppgift 5 Tabellen visar hur många personer som i Sifos väljarbarometrar från april 216 respektive april 215 sade att de skulle ha röstat på alliansen, de rödgröna partierna respektive övriga partier om det vore riksdagsval den dag då de tillfrågades om sina partisympatier. Alliansen Rödgröna Övriga Totalt April 216 724 686 311 1721 April 215 672 78 269 Vi vill undersöka utvecklingen för de rödgröna partierna.
forts tentamen i SF191 216-6-1 3 (a) Skatta förändringen i stödet för de rödgröna partierna samt medelfelet för denna skattning. (3 p) (b) Bestäm ett approximativt konfidensintervall för förändringen i stödet för de rödgröna partierna mellan de båda undersökningstillfällena. (4 p) (c) Utför ett test på signifikansnivå 5% om det varit någon statistiskt säkerställd förändring i stödet för de rödgröna partierna. Ange tydligt de uppställda hypoteserna och motivera tydligt vilken slutsats som dras från testet. (3 p) Uppgift 6 Antag att x 1, x 2,..., x n är observationer från oberoende Maxwellfördelade stokastiska variabler, dvs från variabler med täthetsfunktionen 2 x 2 /2α π α f(x) = 3/2 e x2, x >, x där α > är en parameter. Denna fördelning har väntevärde 8α/π och varians α(3 8 π ). (a) Härled Maximum Likelihood-skattningen av α samt beräkna denna om vi fått observationerna x 1 = 1.3, x 2 = 1.47, x 3 = 1.68. (6 p) (b) Undersök om denna skattning är väntevärdesriktig. Din slutsats skall klart framgå och vara väl motiverad! (4 p) För att få poäng på b-delen krävs att a-delen är i allt väsentligt korrekt löst. Lycka till!
Avd. Matematisk statistik LÖSNINGSFÖRSLAG TENTAMEN I SF191 MATEMATISK STATISTIK. ONSDAGEN DEN 1:A JUNI 216 KL 8. 13. Uppgift 1 Vi väljer händelsen att modern har blodgrupp som utfallsrum Ω, eftersom detta är givet som förutsättning för de redovisade sannolikheterna. Vi inför händelserna och vi söker P (H 2 A). Enligt texten är och A = {barnet har blodgrupp A}, H 1 = {fadern har blodgrupp A}, H 2 = {fadern har blodgrupp AA}, H 3 = {fadern har blodgrupp AB}, H 4 = {fadern har en annan blodgrupp}, P (H 1 ) =.36, P (H 2 ) =.8, P (H 3 ) =.2, P (H 4 ) =.54, P (A H 1 ) = 1/2, P (A H 2 ) = 1, P (A H 3 ) = 1/2 och P (A H 4 ) =. Från Bayes sats och satsen om total sannolikhet får vi P (H 2 A) = P (A H 2)P (H 2 ) P (A) = = P (A H 2)P (H 2 ) = 4 P (A H i )P (H i ) 1.8 1/2.36 1.8 1/2.2.54 =.8.27 = 8 27.296. Uppgift 2 Låt X vara den stokastiska variabeln antal rum för en på måfå observerad lägenhet. Vi får då och σ = D(X) = µ = E[X] = 1 6 1 1 3 2 2 5 3 1 1 4 2.433 1 6 (1 2.433)2 1 3 (2 2.433)2 2 5 (3 2.433)2 1 1 (4 2.433)2.883 Låt X vara medelvärdet av 6 oberoende observationer av X, dvs. genomsnittliga antalet rum av 6 slumpvis utvalda lägenheter. Enligt CGS är Z = X µ σ/ approximativt N(, 1), så vi får 6 P (totalt antal rum 135) = P (X 2.25) = P (Z 1.653) = Φ(1.653).946.
forts tentamen i SF191 216-6-1 2 Uppgift 3 Här tillämpas med fördel ett χ 2 -test. Vi bildar teststorheten Q = 3 (x k 1 p k ) 2 k= 1 p k, där p k är en funktion av den okända parametern µ. Vi bestämmer en punktskattning av µ och använder denna för att bestämma värden på p k. Eftersom parametern µ för en Poissonfördelad slumpvariabel är lika med väntevärdet, så använder vi stickprovsmedelvärdet som punktskattning för µ. Detta ger µ 7 1 25 2 45 3 5 = = 355 1 1 =.355 Insättning av µ obs i uttrycken för p k ger p = e µ obs =.712, p1 = µ obse µ obs =.2489, p2 = (µ obs )2 e µ obs =.442, 2 p 3 = 1 p 2 p 1 p =.57. Små värden på Q tyder på en bra överenstämmelse mellan en Poissonfördelning och de observerade frekvenserna. Insättning av de givna värdena x k och sannolikheterna p k ger Q = (7 71.2)2 71.2 (25 248.9)2 248.9 (45 44.2)2 44.2 (5 5.7)2 5.7.174. Eftersom 1 p k 5 och vi har skattat en okänd parameter, så gäller det att teststorheten Q är approximativt χ 2 (4 1 1)-fördelad. Vi testar slumpgeneratorns egenskaper genom att kontrollera huruvida det erhållna värdet på Q skiljer sig för mycket från noll eller ej. Detta test har risknivån 5% om vi som gräns för stora avvikelser från noll tar observerade värden större än χ 2.5(2) = 5.99. Eftersom Q.174 < 5.99, klarar slumptalsgeneratorn detta test. Slumptalsgeneratorn kan anses fungera enligt ett χ 2 -test på risknivån 5%. Uppgift 4 (a) Livslängden mätt i år för ett lysrör kan betecknas med en slumpvariabel X Exp(5/12). Sannolikheten för att ett lysrör går sönder inom ett år är P (X 1) = f X (x)dx = 5 12 e 5x/12 dx = [ e 5x/12] 1 = 1 e 5/12.348. Antalet lysrör i lokal A som gått sönder inom ett år ges alltså av en slumpvariabel Y Bin(8,.348). Vi vill bestämma = P (antal fungerande lysrör 6) = P (Y 2) = 2 p Y (i) 8!!(8 )! (.348) (1.348) 8 8! 1!(8 1)! (.348)1 (1.348) 7 8! 2!(8 2)! (.348)2 (1.348) 6.45 i=
forts tentamen i SF191 216-6-1 3 (b) Minst två lysrörsbyten har skett i lokal B om Z = X 1 X 2 1, där X i är oberoende Exp(5/12)-fördelade slumpvariabler. Enligt ledningen har Z täthetsfunktionen ( ) 2 f Z (z) = (5/12)2 5 (2 1)! z2 1 e (5/12)z = ze 5z/12, 12 så den sökta sannolikheten ges, med hjälp av partiell integration, av ( ) 2 [ 5 P (Z 1) = ze 5z/12 dz = 5 ] 1 12 12 ze 5z/12 = 5 12 e 5/12 [ e 5z/12] 1 5 12 e 5z/12 dz = 5 12 e 5/12 e 5/12 1.66. Uppgift 5 (a) Antalet personer som sades sig vilja rösta på något av de rödgröna partierna i de två undersökningarna är utfall av X Bin(1721, p 1 ) respektive Y Bin(, p 2 ), där p 1 och p 2 är dessa partiers verkliga andelar i april 216 respektive april 215. Vi skattar dessa andelar med (p 1 ) obs = 686/1721.3986 respektive (p 2) obs = 78/.4294 och skattningen av förandringen är (p 1 ) obs (p 2 ) obs =.3986.4294 =.31. Medelfelet är en skattning av standardavvikelsen för skattningen. Vi skattar p 1 p 2 med X/1721 Y/ som har variansen V (X) 1721 V (Y ) 2 = p 1(1 p 1 ) 2 1721 p 2(1 p 2 ). Medelfelet får vi om vi ersätter de okända p 1 och p 2 med skattningarna (p 1 ) obs =.3986 respektive (p 2 ) obs =.4294. Vi erhåller då medelfelet (p1 ) obs (1 (p 1) obs ) (p 2) obs (1 (p 2) obs ) 1721.3986 (1.3986).4294 (1.4294).17 1721 (b) X/1721 och Y/ är approximativt normalfördelade N(p 1, p 1 (1 p 1 )/1721) respektive N(p 2, p 2 (1 p 2 )/), där det är tillåtet att göra normalapproximation ty (t ex) 25p 1 (1 p 1 ) 25.3986(1.3986) 1 med mycket bred marginal. Vi vill beräkna ett (approximativt) 95%-igt konfidensintervall för p 1 p 2 och får med approximativa metoden enligt FS 11.3 intervallet (p 1 ) obs (p 2 ) (p1 ) obs obs ± λ (1 (p 1) obs ).25 (p 2) obs (1 (p 2) obs ) 1721.3986.4294 ± 1.96.1697 =.38 ±.3326 = (.64,.2). (c) Vi testar nollhypotesen H : p 1 = p 2 mot mothypotesen H 1 : p 1 p 2 på signifikansnivån 5%. Eftersom konfidensintervallet i deluppgift (b) innehåller, så kan vi inte förkasta nollhypotesen. Förändringen i stödet för de rödgröna partierna är inte statistiskt säkerställd.
forts tentamen i SF191 216-6-1 4 Uppgift 6 (a) Vi har likelihoodfunktionen som ger L(α) = n f(x i ) = ( ) n ( 2 x 2 1 x 2 2 x 2 n exp 1 π α 3n/2 2α g(α) = ln L(α) = ln ( ) (2/π) n/2 x 2 1x 2 2 x 2 3n n 2 ln(α) 1 2α g(α) maximeras då g (α) = och vi har g (α) = 3n 2α 1 2α 2 x 2 i. x 2 i ) x 2 i. Villkoret g (αml ) = ger att ML-skattningen blir α ML = 1 n 3n x2 i. Insättning av de observerade värdena ger αml = 1 9 (1.32 1.47 2 1.68 2 ) =.742. (b) Vi får ( E(αML) 1 = E 3n X 2 i ) = 1 3n E(Xi 2 ) = 1 3 E(X2 1). Eftersom V (X) = E(X 2 ) (E(X)) 2 ser vi att E(X 2 ) = V (X) (E(X)) 2 som ger att E(X 2 1) = V (X 1 ) (E(X 1 )) 2 = ( 3 8 ) α π ( ) 2 8α = 3α. π Alltså gäller att E(αML ) = 1 3 E(X2 1) = α, så αml är en väntevärdesriktig skattning av α.