Avd. Matematisk statistik TENTAMEN I SF1906 (f d 5B1506) MATEMATISK STATISTIK GRUNDKURS, TORSDAGEN DEN 7 JUNI 2012 KL 14.00 19.00 Examinator:Gunnar Englund, 073 3213745 Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook (Beta), räknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 10 poäng. Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för tentander med 22 23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Det ankommer på dig själv att ta reda på om du har rätt att komplettera. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Uppgift 1 I en byggnad sitter ett brandlarm monterat. Under en tidsperiod är sannolikheten att larmet går 3%. Man vet att 98% av alla larm är falsklarm, dvs brandlarmet signalerar trots att det inte är någon eldsvåda. Eldsvådor uppstår under samma tidsperiod med sannolikhet 0.001. a) Bestäm sannolikheten att larmet går om en eldsvåda bryter ut. (5 p) b) Brandlarmet fungerar inte med sannolikhet 0.04 (ingen strömförsörjning, trasig siren, trasig detektor etc.). Ett trasigt brandlarm kan inte larma. Eldsvådor uppstår oberoende av om brandlarmet fungerar eller ej. Bestäm sannolikheten att larmet går om en eldsvåda bryter ut betingat att larmet fungerar. (5 p) Uppgift 2 Låt x 1,...,x n vara oberoende stickprov ur täthetsfunktionen f X (x) given av f X (x) där θ > 0 är en okänd parameter. { θ 2 x e θ x x > 0 0 för övrigt, a) Härled formeln för maximum likelihoodskattningen θ obs av θ på basis av x 1,...,x n. (8 p) b) Med n 4 har vi stickproven x 1 6.2,x 2 7.0,x 3 2.5,x 4 4.2. Beräkna värdet på maximum likelihoodskattningen θobs för dessa stickprov. (2 p)
forts tentamen i SF1906 2012 06 07 2 Uppgift 3 Två mäklare, A och B, bedömde marknadspriset på 12 stycken villor, 1,...,12. Resultatet blev så här (priser i miljoner kronor) villa 1 2 3 4 5 6 7 8 9 10 11 12 A: 2,4 3,0 4,1 1,95 0,7 5,0 4,5 2,8 1,6 3,1 1,9 2,5 B: 2,8 3,4 4,3 2,2 1,0 4,4 4,6 3,0 1,5 3,3 2,3 2,8 Avgör, med en lämplig metod, på konfidens-nivån 95 %, om det finns någon systematisk skillnad i de två mäklarnas bedömningar. (10 p) Uppgift 4 En markovkedja med tillstånden 1,2 och 3 startar i tillstånd 1 och har övergångsmatris 0.6 0.3 0.1 P 0.2 0.4 0.4 0.5 0.3 0.2 a) Motivera noggrant att en asymptotisk fördelning existerar samt beräkna denna. (5 p) b) Beräkna förväntat antal gånger kedjan varit till tillstånd 3 innan den för första gången når tillstånd 2. Ledning. Sätt u i förväntat antal gånger kedjan varit i tillstånd 3 vid start i tillstånd i och innan den för första gången når tillstånd 2. (5 p) Uppgift 5 a) I en födelse-dödsprocess {X(t); t 0} där dödsintensiteterna ökar snabbt med populationsstorleken, är födelse- och dödsintensiteterna λ n (n+1)λ, n 0,1,2,... µ n n 2 µ, n 1,2,... Visa att en asymptotisk fördelning existerar samt beräkna denna. (5 p) b)antagλ 100µ.Beräkna P(X(t) 120)viden asymptotisk tidpunkt t. Välmotiverade approximationer tillåtes. (5 p) Uppgift 6 Ett system har den egenskapen att det efter en fullständig service fungerar en exponentialfördelad tid med väntevärde 1/λ 1. En sådan fullständig service tar en exponentialfördelad tid (med väntevärde 1/µ 1 ) att genomföra. Man kan kan också genomföra en partiell service, enbart syftande till att få systemet att fungera så snabbt som möjligt. En sådan partiell service tar en exponentialfördelad tid med väntevärde 1/µ 2 och systemet fungerar sedan en exponentialfördelad tid (väntevärde 1/ ). Fullständig service är givetvis dyrare än partiell service och därför utförs en fullständig service bara varannan gång systemfel uppträder. Beräkna sannolikheten att systemet fungerar efter lång tid uttryckt i parametrarna λ 1,,µ 1,µ 2. (10 p)
Avd. Matematisk statistik LÖSNINGSFÖRSLAG TENTAMEN I SF1906 2012-06-07 14-19 Uppgift 1 Låt L vara händelsen att larmet går och E händelsen att en eldsvåda bryter ut. Då är P(L E) P(L E) P(E) P(E L)P(L) P(E) 0.02 0.03 0.001 0.600 Låt B vara händelsen att brandlarmet fungerar. Eftersom L B är P(L B E) P(L E) 0.0006 enligt tidigare. Vidare så är P(B E) P(B)P(E) 0.96 0.001 på grund av oberoendet så P(L B E) P(L B E) P(E B) 0.0006 0.96 0.001 0.625 Uppgift 2 För de oberoende stickproven x 1,...,x n definieras likelihoodfunktionen L(θ) som L(θ) f X (x 1 ) f X (x 2 ) f X (x n ) θ 2 e θ x1 x 1 θ 2 e θ x2 x 2 θ 2 e θ xn. x n θ n 2 n e x 1 x 2 x θ ( x1 +...+ x n) n θ n 2 n n e θ ( n xi). xi Det är praktiskt att maximera L(θ) genom att ekvivalent maximera dess naturliga logaritm ln L(θ). Vi logaritmerar och erhåller lnl(θ) nlnθ nln2 ln n xi θ n xi. Låt oss även observera att lnθ är definierad p.g.a att θ > 0. Vi deriverar med avseende på θ och får d dθ lnl(θ) n n θ xi. Vi sätter d lnl(θ) 0, vilket ger dθ n n θ xi 0 n n θ xi.
forts tentamen i SF1906 2012 06 07 2 Om vi löser den sista ekvationen m.a.p. θ får vi maximum likelihoodskattningen θobs basis av x 1,...,x n som θobs n n. xi av θ på Eftersom alla x i > 0, är summan i nämnaren > 0. SVAR a):θobs n n. xi b) Insättning av stickproven x 1 6.2,x 2 7.0,x 3 2.5,x 4 4.2 och n 4 i den i del a) ovan härledda formeln ger SVAR b):θ obs 0.46. θ obs 4 4 xi 4 6.2+ 7.0+ 2.5+ 4.2 4 2.49+2.6548+1.5811+2.0494 4 8.7663 0.4563. Uppgift 3 Observationer i par. Den bästa modellen är att modellera skillnaderna ln(x B ) ln(x A ) som observationer från en normalfördelning. Men vi utgår från modellen att X A X B är observationer från en normalfördelning och gör ett t-test för att denna fördelnings väntevärde är noll. Vi får att medelvärdet av de parvisa skillnaderna är x 0.1708 och stickprovs-standardavvikelse s 0.2816.Alltsåärteststorhetent 0.1708 12 2.101. antalet frihetsgrader är 11. Eftersom 0.2816 t-kvantilen 0.025 för 11 frihetsgrader är 2.2 > 2.101 kan vi inte ur dessa data avgära om det finns någon systematisk skillnad i de två mäklarnas bedömningar. Uppgift 4 a) Kedjan är ändlig, aperiodisk (t.ex. p 11 > 0) och irreducibel 1 2 3 1. Därför är kedjan ergodisk och har en asymptotisk fördelning oberoende av starttillstånd. Den fås som den stationära fördelningen, som ges av π πp π 1 0.6π 1 +0.2π 2 +0.5π 3 π 2 0.3π 1 +0.4π 2 +0.3π 3 π 3 0.1π 1 +0.4π 2 +0.2π 3 1 π 1 +π 2 +π 3 som har lösningen π 1 4/9, π 2 3/9 och π 3 2/9. b) Gör om tillstånd 2 till ett absorberande tillstånd och sätt u i förväntat antal gånger kedjan varit i tillstånd 3 vid start i tillstånd i och innan den för första gången är tillstånd 2 (u 1 söks). Om kedjan vid en tidpunkt är i tillstånd 1 och går till tillstånd 1 är det förväntade antalet gånger kedjan är i tillstånd 3 detsamma både före och efter hoppet. Om man hoppar
forts tentamen i SF1906 2012 06 07 3 till tillstånd 3 är förväntat antal gånger istället 1 mer än innan hoppet. Samma om man vid tidpunkten står i tillstånd 3. Det ger oss ekvationssystemet u 1 0.6u 1 +0.1(1+u 3 ) u 3 0.5u 1 +0.2(1+u 3 ) vilket har lösningen u 1 1/2.7 0.37 (och u 3 5/2.7). Med sedvanliga beteckningar har vi Uppgift 5 ρ n λ 0λ 1 λ n 1 µ 1 µ 2 µ n n 1 k0 (k +1)λ n k1 k2 µ n!λn (n!) 2 µ (λ/µ)n n n! Härav erhålls n0 ρ n (λ/µ) n n0 (taylorutveckling!) e λ/µ <. Vidare ser man lätt n! 1 att ρ nλ n och därmed erhålls att en asymptotisk fördelning existerar. Denna ges av den stationära och p k ρ k e (λ/µ)(λ/µ)k ρn k! Den asymptotiska fördelningen är alltså Po(λ/µ). b) För stort t är X(t) Po(λ/µ) Po(100) som är approximativt N(100,10). Vi erhåller P(X(t) 120) Φ( 120 100 10 ) Φ(2) 0.97725. Uppgift 6 Vi inför tillstånden E 1 funktion efter fullständig service, E 2 funktion efter partiell service, E 3 fullständig service samt E 4 partiell service. Om X(t)tillståndet vid tiden t, t 0, så inser man att(x(t); t 0) är en Markovkedja i kontinuerlig tid med övergångsintensitetsmatris Q λ 1 0 0 λ 1 0 0 µ 1 0 µ 1 0 0 µ 2 0 µ 2 Kedjan är uppenbarligen irreducibel (löper ju successivt igenom alla tillstånd) och den är därför ergodisk eftersom den är ändlig. Den asymptotiska fördelningen p (p 1,p 2,p 3,p 4 ) finner vi genom att lösa ekvationssystemet 0 pq tillsammans med normeringsvillkoret, dvs ekvationssystemet 0 λ 1 p 1 +µ 1 p 3 0 p 2 +µ 2 p 4 0 p 2 µ 1 p 3 Man erhåller lätt 0 λ 1 p 1 µ 2 p 4 1 p 1 +p 2 +p 3 +p 4 p 4 λ 1 µ 2 p 1, p 2 µ 2 p 4 λ 1 p 1 samt p 3 λ 1 µ 1 p 1
forts tentamen i SF1906 2012 06 07 4 som i normeringsekvationen ger p 1 (1+ λ 1 + λ 1 µ 1 + λ 1 µ 2 ) 1 Systemet fungerar om det är i tillstånd E 1 eller E 2 vilket ger att sannolikheten för systemfunktion efter lång tid är p 1 +p 2 1+ λ 1 1/λ 1 +1/ 1+ λ 1 + λ 1 + λ 1 1/λ 1 +1/ +1/µ 1 +1/µ 2 µ 1 µ 2