Avd. Matematisk statistik TENTAMEN I SF90 OCH SF905 SANNOLIKHETSTEORI OCH STATISTIK, FREDAGEN DEN 4:E MARS 204 KL 4.00 9.00. Kursledare: För D och Media: Gunnar Englund, 073 32 37 45 Kursledare: För F: Timo Koski, 070 237 00 47 Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook (Beta), Hjälpreda för miniräknare, räknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 0 poäng. Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för tentander med, preliminärt, 22 23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Det ankommer på dig själv att ta reda på om du har rätt att komplettera. Poäng från kontrollskrivning och laborationer under kursomgång period 3 HT 204 tillgodoräknas. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Uppgift Nollor och ettor sänds i en brusig miljö. Sannolikheten att en nolla respektive etta sänds är 0.4 respektive 0.6. Den mottagna signalen kan uppfattas som en stokastisk variabel X som är N(0, ) respektive N(, ) om noll respektive ett sänds. Mottagaren använder regeln: om X < 0.20 anses en nolla ha sänts, annars har en etta sänts. a) Beräkna sannolikheten att en nolla som sänds mottages som en nolla. (3 p) b) Beräkna sannolikheten att en mottagen nolla har sänts som en nolla. (7 p) Uppgift 2 I ett styrdiagram för kundanpassad (eller just-in-time) produktion behandlas ett mätvärde X av en producerad enhet så att man först subtraherar produktionsprocessens medelvärde från X och dividerar skillnaden med standardavvikelsen. Resultatet kallas ett Z-värde. Vi antar att Z N(0, ). Vi säger att en producerad enhet är systemiskt avvikande, om Z > 2.5758. De olika Z -värdena antas vara oberoende av varandra. Låt nu Y = antalet kvalitetsgranskade enheter t.o.m. den första systemiskt avvikande enheten uppträder. Beräkna sannolikheten P (Y 5). (0 p) j.f.r. Lars Sörqvist: Ständiga förbättringar. En bok om resultatorienterat förbättringsarbete, verksamhetsutveckling och Sex Sigma. Studentlitteratur 2004
forts tentamen i SF90 och SF905 204-03-4 2 Den s.k. logistiska funktionen g(θ), som ges av ψ = g(θ) = Uppgift 3 + e θ < θ < +, används ofta som transformation av en parameter θ. Antag att x,..., x är oberoende observationer på respektive stokastiska variabler X,..., X med E (X i ) = θ, V (X i ) = σ 2 för i =,...,. Vi skattar θ med punktskattningen θ obs = (x +... + x ) och σ 2 skattas med s 2 = 99 (x i θobs )2. För x,..., x erhölls värdena θobs s 2 = 4.2. Då har vi en punktskattning av ψ med =.5 och ψ obs = g (θ obs). a) Bestäm värdena på E (ψ ) och D (ψ ) med en approximativ metod. (8 p) b) Det finns en förutsättning på θobs, som bör gälla om och när Du använder felfortplantning i del a). Gäller denna förutsättning i detta fall? (2 p) Uppgift 4 En metallurg önskar skatta skillnaden mellan halterna av ett visst ämne i två prov A och B. Hon gör sju bestämningar på prov A och elva bestämningar på prov B och får resultaten x, x 2,..., x 7 resp. y, y 2,..., y. Hon beräknar medelvärdena av sina observationer och får x = 9.58, y = 8.35 och standardavvikelserna till s x = 2.25 respektive s y = 3.36. De sju resp. elva observationerna antas vara oberoende och komma från N(µ+, σ)- resp. N(µ, σ)- fördelningar. a) Bestäm ett 95% konfidensintervall för. (5 p) b) Ge ett 95% konfidensintervall för den okända standardavvikelsen σ. (5 p) Uppgift 5 Man ville undersöka om ögonfärg och hårfärg i en stor population kan anses oberoende, och tog därför ett slumpvis urval av 95 personer och klassade dem i sex grupper med avseende på hårfärg och ögonfärg. Av de 43 med mörkt hår hade 2 blå ögon, 22 bruna ögon och 9 annan ögonfärg ; Av de 52 med ljust hår hade 32 blå ögon, 4 bruna ögon och 6 annan ögonfärg ; Avgör om proportionerna för ögonfärger kan anses vara densamma för grupperna ljushåriga och mörkhåriga i den totala populationen. Kan man förkasta denna hypotes med felrisken %? (0 p)
forts tentamen i SF90 och SF905 204-03-4 3 Uppgift 6 Weibullfördelningen (uppkallad efter Wallodi Weibull, 887-979, professor i maskinelement vid KTH 2, är en av de mest använda fördelningarna för att beskriva livslängder av olika sorts komponenter. Den stokastiska variabeln X är Weibullfördelad om där a och c är givna positiva parametrar. P (X > x) = e a xc, x 0 a) Härled täthetsfunktionen till X. (3 p) För en viss sorts komponenter är c = 2, medan a är okänd. Man gör därför observationer av de oberoende livslängderna på 5 komponenter och erhåller värdena (enhet:år) 0.26 0.30 0.34 0.74 0.95 b) Beräkna maximum-likelihoodskattningen av a. (4 p) c) Skatta på lämpligt sätt percentilen L 0. Med L 0 menas det värde som uppfyller P (X L 0 ) = 0%. (3 p) Lycka till! 2 Se www.weibullnews.com/ybullbio.htm för en kort biografi.
Avd. Matematisk statistik LÖSNINGSFÖRSLAG TENTAMEN I SF90 OCH SF905 MATEMATISK STATISTIK. FREDAGEN DEN 4 MARS 204 KL 4.00 9.00 Uppgift a) Om noll sänds så är X N(0, ) och sökt sannolikhet blir P (X < 0.2) = Φ(0.2) = 0.58. b) Inför S 0 = nolla sänds, S = etta sänds, M 0 = nolla mottages. Med Bayes formel erhålls den sökta sannolikheten: = P (S 0 M 0 ) = P (S 0 )P (M 0 S 0 ) P (S 0 )P (M 0 S 0 ) + P (S )P (M 0 S ) 0.4P (X < 0.2 X N(0, )) 0.4P (X < 0.2 X N(0, )) + 0.6P (X < 0.2 X N(, )) = +.5Φ( 0.8)/Φ(0.2) = 0.65. Uppgift 2 Y = antalet kvalitetsgranskade enheter t.o.m. den första systemiskt avvikande enheten uppträder. är en ffg(p)-fördelad stokastisk variabel, där p = P ( Z > 2.5758). Vi har att p = P ( Z > 2.5758) = P (Z 2.5758) + P (Z 2.5758) och p.g.a. symmetrin hos fördelningen för Z fås = 2 P (Z 2.5758) = 2 0.005 = 0.0. ty 2.5758 = λ 0.005 enligt Tabell 2 i Formel- och tabellsamlingen. Den betraktade händelsen Y 5 är i själva verket lika med händelsen att få först fyra ickesystemiskt avvikande Z-värden efter varandra: P (Y 5) = ( p) 4 = 0.99 4 = 0.9606 0.96. Om vi vill checka detta mer omständligt med utnyttjande av sannolikhetsfunktionen för ffg(p), kan vi observera att P (Y 5) = P (Y 4). Eftersom p Y (k) = ( p) k p, med k =, 2,..., har vi att P (Y 4) = 4 p Y (k) = k= 4 ( p) k p k=
forts tentamen i SF90 och SF905 204-03-4 2 med variabelbytet j = k 4 3 = p ( p) k = p ( p) j k= j=0 och med summan av en geometrisk serie ( ) ( p) 4 = p = ( p) 4. ( p) Således P (Y 5) = P (Y 4) = ( ( p) 4) = ( p) 4. Uppgift 3 a) Enligt uttrycken för felfortplantning i avsnitt 9.4 i Formel- och tabellsamlingen har vi att E (ψ ) g (θ obs). Detta ger E (ψ ) = = 0.876 0.82. + e θ obs + e.5 Enligt samma avsnitt i Formel- och tabellsamlingen har vi att D(ψ ) g (θ obs) D (θ ) Eftersom θ = (X +... + X ) och vi antar oberoendet, erhåller vi Således har vi V (θ ) = 2 (V (X ) +... + V (X ) = σ2. D(ψ ) g (θ obs) D (θ ) = g (θ obs) σ. Här beror D (θ ) = σ på den okända statistiska parametern σ, vilket bör åtgärdas. Vi skattar σ som vanligt s med medelfelet = 2.05 = 0.205. Eftersom första derivatan av den logistiska funktionen ges av g (x) = e x ( + e x ) 2, fås att Detta ger g (θ obs) = g (θ obs) = e θ obs ( + e θ obs) 2 = e.5 ( + e.5 ) 2 = 0.49. D(ψ ) 0.49 0.205 0.0306 0.04.
forts tentamen i SF90 och SF905 204-03-4 3 b) Förutsättningen på θobs i del a) är att θ obs vi linjäriserar g(θ ) kring θ så att skall vara väntevärdesriktig. Detta handlar om att så att ψ = g (θ ) g (θ) + (θ θ) g (θ) E [ψ ] E [g (θ)] + g (θ)e [(θ θ)] = E [g (θ)] = g(θ), om E [(θ θ)] = E [θ ] θ = 0 d.v.s. att θobs är väntevärdesriktig. Vi gör sedan en s.k. plug-in så att E [ψ ] g (θobs). Men här gäller E [θ ] = (E [X ] +... + E [X ]) = θ d.v.s den efterfrågade förutsättningen på θ obs gäller. a) Den sammanvägda variansskattningen s 2 är Uppgift 4 s 2 = 6s2 x + 0s 2 y 6 = 8.954 Konfidensintervallet ges av I = x y ± t α/2 (n x + n y 2)s + = () n x n y = 9.58 8.35 ± t 0.025 (6)s 7 + ( =.23 ± 2.2 8.954 7 + ) =.23 ± 3.07. (2) b) Konfidensintervallet för σ 2 ges av ( ) 6s 2 I σ 2 = χ 2 0.025(6), 6s 2 = (4.97, 20.73) χ 2 0.975(6) eftersom kvantilerna χ 2 0.025(6) och χ 2 0.975(6) är 28.8 respektive 6.9. Drar vi roten ur gränserna så erhåller vi ett konfidensintervall för σ, dvs I σ = (2.23, 4.55). Uppgift 5 Vi har förjande kontingenstabell, med lätt insedda beteckningar Testvariabeln blir M L BL 2 32 44 BR 22 4 36 AN 9 6 5 43 52 95
forts tentamen i SF90 och SF905 204-03-4 4 Q = (2 43 44/95)2 (32 52 44/95)2 (22 43 36/95)2 + + 43 44/95 52 44/95 43 36/95 (4 52 36/95)2 (9 43 5/95)2 (6 52 5/95)2 + + + 52 36/95 43 5/95 52 5/95 0.72 Detta är en observation av en χ 2 (2)-variabel ((3 ) (2 ) = 2)). Kvantilen för % är 9.2, så hypotesen att proportionerna för ögonfärg är densamma för mörkhåriga och ljushåriga förkastas med felrisken %. Uppgift 6 a) Täthetsfunktionen är derivatan av fördelningsfunktionen, f X (x) = F X (x). Denna är F X(x) = P (X x) = P (X > x) = e a xc varför f X (x) = F X(x) = ac x c e a xc, x 0 b) Kalla observationerna x, x,..., x n. Likelihoodfunktionen är L(x, x 2,..., x n ; a) = n f X (x i ) = n (2a x i e a x2 i ) = 2 n a n e a n x2 i Vi skall beräkna det värde på a som maximerar L. Det är lättare att då betrakta logaritmen av L som har maximum för samma a-värde. Logaritmen blir ln(l) = n ln(2) + n ln(a) a n x2 i + ln( n x i). Derivera logaritmen: d ln(l) = n n da a x 2 i vilken är 0 för a = a n = n. Detta värde ger maximum (se teckenväxling) och är alltså x2 i ML-skattningen. Med n = 5 och observationsvärdena insatta får a = 2.90. c) Vi har 0. = P (X L 0 ) = P (X > L 0 ) = e a Lc 0 vilket ger e a L c 0 = 0.9 och således a L c 0 = ln(0.9). Vi löser ut L 0 = ( ln(0.9)/a) /c. Vi skattar a med a = 2.90, och eftersom c = 2 erhåller vi skattningen L 0 = 0.9 n x i