Avd. Matematisk statistik TENTAMEN I SF90,SF907,SF908,SF9 SANNOLIKHETSTEORI OCH STATISTIK TORSDAGEN DEN 7:E JUNI 0 KL 4.00 9.00. Examinator: Gunnar Englund, tel. 07 7 45 Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook (Beta), räknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 0 poäng. Gränsen för godkänt är preliminärt 4 poäng. Möjlighet att komplettera ges för tentander med poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Det ankommer på dig själv att ta reda på om du har rätt att komplettera. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Uppgift X,X,...,X 00 är oberoende stokastiska variabler, alla med en tẗhet given av f(x) x, < x <. Låt Y X +X +...+X 00. Bestäm approximativt sannolikheten P(Y > 40). (0 p) Uppgift I en byggnad sitter ett brandlarm monterat. Under en tidsperiod är sannolikheten att larmet går %. Man vet att 98% av alla larm är falsklarm, dvs brandlarmet signalerar trots att det inte är någon eldsvåda. Eldsvådor uppstår under samma tidsperiod med sannolikhet 0.00. a) Bestäm sannolikheten att larmet går om en eldsvåda bryter ut. (5 p) b) Brandlarmet fungerar inte med sannolikhet 0.04 (ingen strömförsörjning, trasig siren, trasig detektor etc.). Ett trasigt brandlarm kan inte larma. Eldsvådor uppstår oberoende av om brandlarmet fungerar eller ej. Bestäm sannolikheten att larmet går om en eldsvåda bryter ut betingat att larmet fungerar. (5 p)
forts tentamen i SF90,SF907,SF908,SF9 0-06-07 Uppgift Enligt SIFOs opinionsmätning i maj 0 var opinionen så här (%): 90 personer var tillfrågade. I januari var motsvarande siffror 890 personer var tillfrågade. V S MP C FP M KD SD Övr 4,6,4 8,8 5,4 6,6 0,4,6 6,8 0.4 V S MP C FP M KD SD Övr 4, 7,8 0, 4,7 7,,9 4,4 6,9 0.6 Vi är intresserade av opinionen för MP. Kan vi utifrån dessa data dra någon slutsats om huruvida sympatierna för MP har ökat, minskat eller är oförändrade från januari till maj? Använd felrisken 5%. (0 p) Uppgift 4 Vissa problem i partikelfysik ger upphov till följande sannolikhetstäthet (+θx) x, f(x) 0 för övrigt, där θ är en okänd parameter. a) Varför måste vi kräva att olikheterna θ skall gälla? ( p) b) Antag att X,...,X n är oberoende stokastiska variabler som alla har denna fördelning. En i statistikfrågor välbevandlad vän till Dig föreslår en skattningsfunktion för θ av formen θ c n (X +...+X n ). Hur bör konstanten c väljas för att θobs blir en väntevärdesriktig punktskattning? ( p) c) Antag att X,...,X n är oberoende stokastiska variabler som alla har denna fördelning. Bestäm MK-skattningen θmk (Minsta kvadrat-skattningen) av θ. (5 p)
forts tentamen i SF90,SF907,SF908,SF9 0-06-07 Uppgift 5 Låt x,...,x n vara oberoende stickprov ur täthetsfunktionen f X (x) given av där θ > 0 är en okänd parameter. f X (x) { θ x e θ x x > 0 0 för övrigt, a) Härled formeln för maximum likelihoodskattningen θ obs av θ på basis av x,...,x n. (8 p) b) Med n 4 har vi stickproven x 6.,x 7.0,x.5,x 4 4.. Beräkna värdet på maximum likelihoodskattningen θobs för dessa stickprov. ( p) Uppgift 6 Två mäklare, A och B, bedömde marknadspriset på stycken villor,,...,. Resultatet blev så här (priser i miljoner kronor) villa 4 5 6 7 8 9 0 A:,4,0 4,,95 0,7 5,0 4,5,8,6,,9,5 B:,8,4 4,,,0 4,4 4,6,0,5,,,8 Avgör, med en lämplig metod, på konfidens-nivån 95 %, om det finns någon systematisk skillnad i de två mäklarnas bedömningar. (0 p)
Avd. Matematisk statistik LÖSNINGAR TILL TENTAMEN I SF90, SF907, SF908 samt SF9 SANNOLIKHETSLÄRA OCH STATISTIK, TORSDAGEN DEN 7:E JUNI 0 Uppgift EftersomX,...,X 00 äroberoende,likafördeladeochmångatillantaletkanmananvändacentrala gränsvärdessatsen (CGS) för att approximera fördelningen för deras summa. Enligt CGS är Y appr N(nµ,σ n) där µ E(X ), σ D(X ) och n 00 här. Beräkna µ och σ. µ E(X ) xf(x)dx E(X ) x f(x)dx x ] [ln x x dx ln. x x dx dx. V(X ) E(X ) (E(X )) (ln) 0.078 σ D(X ) 0.078 0.796 Alltså är fördelningen till Y approximativt N(00 ln, 0.796 00) eller N(8.6,.796). Den sökta sannolikheten är därmed P(Y > 40) P(Y 40) Φ( 408.6 ) Φ(0.490) 0.6879 0..796 Den sökta sannoliheten är 0.. Uppgift Låt L vara händelsen att larmet går och E händelsen att en eldsvåda bryter ut. Då är P (L E) P (L E) P (E) P (E L)P (L) P (E) 0.0 0.0 0.00 0.600 Låt B vara händelsen att brandlarmet fungerar. Eftersom L B är P (L B E) P (L E) 0.0006enligt tidigare. Vidareså är P (B E) P (B)P (E) 0.96 0.00på grundavoberoendet så P (L B E) P (L B E) 0.0006 P (E B) 0.96 0.00 0.65 Uppgift De enda data som är relevanta är givetvis de för MP. I maj-mätningen var 68 av 90 personer MP-sympatisörer, i januari-mätningen 95 av 890. Det gäller alltså att 68 är en observation
forts tentamen i SF90,SF907,SF908,SF9 0-06-07 ur en Bin(90,p )-fördelning, och att 95 är en observation ur en Bin(890,p )-fördelning, och nollhypotesen är nu att P p. En möjlig lösning är att göra ett konfidensintervall för skillnaden p p på vanligt sätt och se om noll ligger i intervallet. Intervallet blir 0.09 p p 0.0048, så vi kan inte dra någon slutsats om förändringen av sympatier för MP med felrisken 5%. En annan möjlighet är att göra ett homogenitetstest. Detta ger Q.546 och antalet frihetsgrader är. χ -kvantilen för 5% är.84 >.546, så resultatet är detsamma som ovan. Uppgift 4 a) I sannolikhetskalkylen krävs av en sannolikhetstäthet att för alla x För tätheten i denna uppgift innebär detta att f(x) 0. (+θx) 0 +θx 0 θx. Om alltså θx gäller för alla x [,], så fås för x att θ, dvs. θ. Nu gäller igen för alla x [,] att θx θx och med x fås θ () dvs. θ. Således har vi sett att θ för att f(x) 0 skall gälla. b) Definitionsmässigt är θobs en väntevärdesriktig punktskattning, om E[θ ] θ. Med avseende på den kunniga vännens förslag noterar vi att E[θ ] c n (E[X +...+X n ]) c n (E[X ]+...+E[X n ]). Eftersom X,...,X n har samma fördelning, gäller E[X ]... E[X n ]. Då fås för i,,...,n [ [x ] E(X i ) [ [ x +θ x (+θx)dx ] ] x f(x)dx ] [ [( ) +θ x (+θx)dx xdx+θ ( Med andra ord E[θ ] c n n θ c θ. Således gäller E[θ ] θ om och endast om c. SVAR:c. ( ] x dx ))] θ θ.
forts tentamen i SF90,SF907,SF908,SF9 0-06-07 c) MK-skattningen fås som det varde på θ som minimerar Q(θ) (x i E[X i ]). Från uppgiftens del b) har vi att E[X i ] θ. Således vill vi minimera Q(θ) ( x i θ ). Vi deriverar med avseende på θ och sätter derivatan till noll, Q (θ) ( x i θ ) 0, vilket ger eller Detta ger x i n θ θ obs n θ 0, x i. x i, vilket är den väntevärdesriktiga punktskattningen i del b). SVAR:θ obs n n x i. Uppgift 5 För de oberoende stickproven x,...,x n definieras likelihoodfunktionen L(θ) som L(θ) f X (x ) f X (x ) f X (x n ) θ e θ x x θ e θ x x θ e θ xn. x n θ n n e x x x θ ( x +...+ x n) n θ n n n e θ ( n xi). xi Det är praktiskt att maximera L(θ) genom att ekvivalent maximera dess naturliga logaritm ln L(θ). Vi logaritmerar och erhåller n lnl(θ) nlnθ nln ln xi θ xi.
forts tentamen i SF90,SF907,SF908,SF9 0-06-07 4 Låt oss även observera att lnθ är definierad p.g.a att θ > 0. Vi deriverar med avseende på θ och får d dθ lnl(θ) n θ xi. Vi sätter d lnl(θ) 0, vilket ger dθ n θ xi 0 n θ xi. Om vi löser den sista ekvationen m.a.p. θ får vi maximum likelihoodskattningen θobs av x,...,x n som θobs n n. xi av θ på basis Eftersom alla x i > 0, är summan i nämnaren > 0. SVAR a):θobs n n. xi b) Insättning av stickproven x 6.,x 7.0,x.5,x 4 4. och n 4 i den i del a) ovan härledda formeln ger SVAR b):θ obs 0.46. θ obs 4 4 xi 4 6.+ 7.0+.5+ 4. 4.49+.6548+.58+.0494 4 8.766 0.456. Uppgift 6 Observationer i par. Den bästa modellen är att modellera skillnaderna ln(x B ) ln(x A ) som observationer från en normalfördelning. Men vi utgår från modellen att X A X B är observationer från en normalfördelning och gör ett t-test för att denna fördelnings väntevärde är noll. Vi får att medelvärdet av de parvisa skillnaderna är x 0.708 och stickprovs-standardavvikelse s 0.86. Alltså är teststorheten t 0.708.0. antalet frihetsgrader är. Eftersom 0.86 t-kvantilen 0.05 för frihetsgrader är. >.0 kan vi inte ur dessa data avgöra om det finns någon systematisk skillnad i de två mäklarnas bedömningar.