Avd. Matematisk statistik TENTAMEN I SF90/SF9 SANNOLIKHETSTEORI OCH STATISTIK, ONSDAG 5 JUNI 09 KL 4.00 9.00. Examinator: Björn-Olof Skytt, 08-790 86 49. Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik (utdelas vid tentamen), miniräknare. Tentamen består av två delar, benämnda del I och del II. Del I består av uppgifterna -. På denna del skall endast svar anges, antingen i form av ett numeriskt värde med tre värdesiffrors noggrannhet eller i form av val av ett av de möjliga svarsalternativen. Studenter som är godkända på kontrollskrivningen behöver ej besvara uppgift -3, utan får tillgodoräkna sig dessa tre uppgifter. Gränsen för godkänt är preliminärt 9 poäng. Möjlighet att komplettera ges för tentander med, preliminärt, 8 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Del II består av uppgifterna 3-6 och varje korrekt lösning ger 0 poäng. Del II rättas bara för studenter som är godkända på del I och poäng på del II krävs för högre betyg än E. På denna del skall resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Införda beteckningar skall förklaras och definieras och numeriska svar skall anges med minst två värdesiffrors noggrannhet. Studenter som är godkända på datorlaborationen får 4 bonuspoäng på del II på ordinarie tentamenstillfället och det första omtentamenstillfället. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Del I Uppgift Låt A och B vara händelser sådana att P (B) /5, P (A B) /6 och P (A B ) /7. Beräkna P (B A). A: 0.6 B: 0.48 C: 0.774 D: 0.033
forts tentamen i SF90/SF9 09-06-05 Uppgift En stokastisk variabel X har täthetsfunktionen 0, x < 0 f X (x) x, 0 x 3, < x 3 0, x > 3 Bestäm väntevärdet för X 3, dvs E(X 3 ). Uppgift 3 De tre stokastiska variablerna X, Y och Z uppfyller V (X) V (Y ) V (Z), samt C(X, Y ) C(X, Z) C(Y, Z) /. Låt W X + Y + Z. Beräkna D(W + 3). A:.45 B: 3.00 C:. D:.73 Uppgift 4 Låt X och Y vara två oberoende stokastiska variabler sådana att X Bin(5, 0.) och Y Po(). Beräkna P (X + Y ). A: 0.678 B: 0.36 C: 0.86 D: 0.5 Uppgift 5 Antag att X N(6, ). Beräkna sannolikheten P (4 X 8). A:.000 B: 0.383 C:.683 D: 0.683
forts tentamen i SF90/SF9 09-06-05 3 Uppgift 6 Låt X Exp (/4), d v s intensiteten är en fjärdedel. Bestäm sannolikheten att X antar ett värde större än 5, givet att värdet är större än. A: 0.58 B: 0.87 C: 0.30 D: 0.47 Uppgift 7 Låt x 37.0, ȳ 08.0, s x 9.5, s y 63.0, n x 500 och n y 300 vara givet och antag att X i :na alla har samma okända fördelning, och att Y j :na alla har samma okända fördelning (kanske dock ej samma som X i :na). Antag vidare att alla dessa stokastiska variabler är oberoende. Ange undre gränsen för det approximativt 99%-iga tvåsidiga konfidensintervallet I µx µ y. A: -97.48 B: -94.9 C: -73.0 D: -7.99 Uppgift 8 Antag att X,..., X n utgör ett stickprov på N (µ, σ), där σ är känd. Evert önskar testa nollhypotesen H 0 : µ mot H : µ < med hjälp av ett lämpligt konfidensintervall för µ. Vilket av nedanstående konfidensintervall för µ skall väljas för att testets signaifikansnivå skall bli α? A: I µ (, x + n σ ) λ α B: I µ C: I µ D: I µ (, x + s ) t α (n ) n ( x s ) t α (n ), n ( x σ ) λ α, n
forts tentamen i SF90/SF9 09-06-05 4 Uppgift 9 Antag att att vi har två oberoende observationer x och x av X i Bin(n i, p), i,. Ange ML-skattningen av p. ( x A: + x ) n n B: C: D: x + x n + n n x + n x n + n n x + n x n + n Uppgift 0 Antag att vi har N stokastiska variabler X i som är oberoende och tillhör Γ -fördelningen Γ(k, Θ). Då är E(X i ) k Θ och V (X i) k Θ Maximum-likelihood-skattningen av Θ är Θ obs ML Σx i k N Vad är variansen av denna skattning? A: B: C: D: k N Θ N Θ N Θ k N Θ Uppgift Vad menas med att en skattning av en parameter är väntevärdesriktig? A: Skattningen sammanfaller med stickprovsmedelvärdet. B: Skattningen är ett viktat medelvärde av observationerna. C: Skattningen ger alltid rätt parametervärde. D: Väntevärdet av stickprovsvariabeln är lika med det rätta parametervärdet.
forts tentamen i SF90/SF9 09-06-05 5 Uppgift Man misstänkte att ett roulettebord på ett kasino var manipulerat och genomförde ett test med 8000 försök. Om rouletten är korrekt skall röd, svart och grön (nollan) komma upp i proportionerna 8:8:. Testresultatet gav röd: 377, svart: 400, grön: 7. För att testa nollhypotesen H 0 : beräknar man teststorheten Q och får Q 7.4. Bestäm testets P -värde. A: % B:.46% C: 97.5% D: 5% P (röd) 8 8, P (svart) 37 37, P (grön) 37,
forts tentamen i SF90/SF9 09-06-05 6 Del II Uppgift 3 Vid en tillverkningsprocess kontrolleras de tillverkade enheterna i en datorstyrd sensor. Härvid klassificeras defekta enheter som defekta med sannolikheten 0.9 och som korrekta med sannolikheten 0.. Vidare klassificeras korrekta enheter som korrekta med sannolikheten 0.85 och som defekta med sannolikheten 0.5. Vad är den betingade sannolikheten att en enhet är defekt givet att den klassificerats som defekt,om processens felsannolikhet är 0.? Uppgift 4 I ett planerat bostadsområde med 80 lägenheter bygger man 80 parkeringsplatser. Hur stor är den approximativa sannolikheten att antalet parkeringsplatser skall räcka till, om vi antar att sannolikheten att en slumpvald lägenhet i denna typ av bostadsområde behöver 0 parkeringsplatser, parkeringsplats respektive parkeringsplatser är 0.4, 0.4 respektive 0.? Uppgift 5 Vid en undersökning av om hållfastheten hos en viss typ av cement verkar bero av härdningstiden bestämdes hållfastheten hos 4 olika provkroppar, som hade härdats under respektive 7 dagar. Man fick följande resultat (i kp/m ) Härdningstid Hållfasthet dagar.8.7 0.0.5.0..9 7 dagar 3.4 3.8 34.5 33.9 34.4 34. 34.9 Hållfastheten vid de båda härdningstiderna kan antas vara normalfördelad med samma standardavvikelse σ, och vi kan anta oberoende mellan samtliga observationer. Testa om det verkar spela någon roll för hållfastheten hos denna typ av cement om vi härdar den dagar eller 7 dagar. Använd signifikansnivån 0%. Ange tydligt vilka de uppställda hypoteserna är. Din slutsats skall tydligt motiveras. (0 p) Uppgift 6 För att bestämma längden av en cirkels diameter d har man gjort n mätningar av diametern och m mätningar av cirkelns omkrets. Mätningarna kan uppfattas som utfall av oberoende normalfördelade stokastiska variabler vilkas väntevärden överensstämmer med de sanna längderna och vilkas standardavvikelse är σ, där σ är ett känt tal. Detta svarar emot att mätutrustningen inte har något systematiskt fel och att den är beprövad så att man vet standardavvikelsen. Skatta cirkelns diameter d med MK-metoden utgående från. de n mätningarna av cirkelns diameter,. de m mätningarna av cirkelns omkrets, 3. alla n + m mätningar. v.g.v.
forts tentamen i SF90/SF9 09-06-05 7 Man kan visa att om θ obs och θ obs är två oberoende och väntevärdesriktiga punktskattningar av θ med de kända varianserna σ respektive σ så fås den mest effektiva skattningen på formen då θ obs aθ obs + ( a) θ obs () a σ. σ + σ Använd ovanstående för att visa att MK-skattningen av d baserat på alla n + m mätningar är den effektivaste skattningen man kan få då man kombinerar ihop skattningen baserat på de n mätningarna av cirkelns diameter och de m mätningarna av cirkelns omkrets enligt formel (). Du behöver inte kontrollera väntevärdesriktigheten. (0 p) Lycka till!
Avd. Matematisk statistik LÖSNINGSFÖRSLAG TENTAMEN I SF90/SF9 SANNOLIKHETSTEORI OCH STATISTIK, ONSDAG 5 JUNI 09 KL 4.00 9.00. Del I Uppgift Eftersom B och B utgör en partition av Ω kan vi använda lagen om total sannolikhet på A P (A) P (B) P (A B) + P (B ) P (A B ) 5 6 + 4 5 7 55 30 35 Enligt definitionen av betingad sannolikhet har vi P (B A) P (A B) P (A) P (B) P (A B) P (A) 5 6 55 30 35 35 55 0.6 Till slut använder vi lagen om komplementhändelsen på den betingade sannolikheten för B givet A. P (B A) P (B A) 35 55 0 55 0.774 Väntevärdet blir E ( X 3) Uppgift 0 x 3 f X (x) dx x 3 x dx + ] ] 3 3 x 3 3 dx [ [ x 6 x 4 + 6 0 [ 3 4 6 + ] 6 + 80 4/6 6.83
forts tentamen i SF90/SF9 09-06-05 Uppgift 3 Vi har att D(W + 3) D(W ). Vi beräknar först variansen för W och tar kvadratroten sist. V (X + Y + Z) V (X) + V (X) + V (X) + C (X, Y ) + C (X, Z) + C (Y, Z) 3 + 3 6 Alltså blir D(W ) 6.45 Uppgift 4 P (X + Y ) [ober] p X (0) p Y () + p X () p Y () + p X () p Y (0) 0.3768 0.8394 + 0.40960 0.36788 + 0.0480 0.36788 0.86 Uppgift 5 ( 4 6 P (4 X 8) P P X 6 ( X 6 Φ () Φ ( ) Φ () ( Φ ()) Φ () 0.843 0.686 8 6 ) ) Uppgift 6 P.g.a. exponentialfördelningens minneslöshet gäller att [se härledningen i Blom et al sid 6] P (X > 5 X > ) P (X > 5 ) P (X > 3) e λ 3 e 3/4 0.47
forts tentamen i SF90/SF9 09-06-05 3 Uppgift 7 P.g.a. C.G.S. är både ΣX i och ΣY i approximativt Normalfördelade. P.g.a. att alla linjärkombinationer av ober Normalfördelade stokastisska variabler är Normalfördelade så är Ȳ X det och vi kan använda.3 i F.S. och får: s I µx µ y x ȳ ± x + s y λ α/ n x n y Med insatta numeriska värden och λ α/ λ 0.005.5758 fås: D.v.s. undre gränsen är -73.0 Alternativ A är rätt. Se läroboken. I µx µ y 7 ±.0 Uppgift 8 x Uppgift 9 Eftersom vi har två oberoende observationer kommer Likelihoodfunktionen att se ut på följande sätt. ( ) ( ) n L(p) f X (x ) f X (x ) p x ( p) n n x p x ( p) n x lnl(p) ln (( n x ) ( n x )) + (x + x )lnp + (n + n x x )ln( p) d dp lnl(p) x + x + n + n x x ( ) 0 p p ( p)(x + x ) + p(x + x n n ) 0 x x + x p(n + n ) 0 p obs ML x + x n + n Uppgift 0 V (Θ ) V ( kn ) ΣX i k N V (ΣX i) [ober] k N N V (X i) k N k Θ kn Θ
forts tentamen i SF90/SF9 09-06-05 4 Rätt svar är D. Se övnuppg. i läroboken. Uppgift Uppgift P -värdet är P(förkasta H 0 ) om H 0 är sann P (X > Q) där Q χ (3 ) Tab 4 P (X > χ () > 7.38) 0.05, P (X > χ () > 9.) 0.0 Alltså måste P(X 7.4) ligga mellan 0.0 och 0.05. Det enda alternativet som gör det är B P-värdet.46%.
forts tentamen i SF90/SF9 09-06-05 5 Del II Uppgift 3 Inför följande beteckningar: K en enhet är korrekt; D en enhet är defekt; K en enhet klassificeras som korrekt; D en enhet klassificeras som defekt. Enligt uppgiften vet vi att P (D) 0., P ( D D) 0.9, P ( K D) 0. och P ( K K) 0.85, P ( D K) 0.5. Vi söker den betingade sannolikheten för att en enhet är defekt givet att den klassificerats som defekt, d.v.s. med beteckningarna ovan, P (D D). För att bestämma denna sannolikhet utnyttjar vi Bayes sats, som ger P (D D) P ( D D) P (D) P ( D) Enligt lagen om total sannolikhet fås P ( D) P ( D D) P (D) + P ( D K) P (K) 0.9 0. + 0.5 ( 0.) 0.5, ty P (K) P (D). Detta ger P (D D) 0.9 0. 0.5 0.4. Uppgift 4 Inför beteckningen X i för antal bilar tillhörande lägenhet nr i och Y för totala antal bilar, vi har också att 80 Y X i X + X +... + X 80. i Den sökta sannolikheten är P (Y 80). Vi antar att X i :na är oberoende och likafördelade. Y blir då en summa av många, oberoende och likafördelade variabler vilket leder till att CGS kan användas. Y N(n µ, n σ), där n 80, µ E (X i ) och σ D (X i ) E (X i ) kp (X i k) 0 0.4 + 0.4 + 0. 0.8 k0 E ( ) X i k P (X i k) 0 0.4 + 0.4 + 0.. k0 V (X i ) E ( ) X i E (Xi ). 0.8 0.56 D (X i ) V (X i ) 0.56
forts tentamen i SF90/SF9 09-06-05 6 Vi får då att Y N(80 0.8, 80 0.56) och den sökta sannolikheten blir ( ) Y 80 0.8 80 80 0.8 6 P (Y 80) P Φ( ) 80 0.56 80 0.56 80 0.56 Φ(.39) 0.99 Svar: Antalet bilplatser räcker med sannolikheten 0.99. Uppgift 5 Två oberoende stickprov med N(µ A, σ)- respektive N(µ B, σ)-fördelade observationer. Ett 90%-igt konfidensintervall för µ A µ B blir med t-metoden (FS.) x ȳ ± t 0.005 (7 + 7 )s 7 där x 33.785743 och ȳ.74857. Vidare får vi s A.6578977 s B 0.7988086367 som ger s (7 )s A + (7 )s B 7 + 7 s 0.999854587 och vi får intervallet till.04 ±.78 0.999854587 /7.04 ± 0.95. Vi tar H 0 : µ A µ B och H : µ A µ B. Vi förkastar H 0 på signifikansnivån 0% eftersom konfidensintervallet inte innehåller 0. Slutsatsen är alltså att det spelar roll om man härdar cementen eller 7 dagar. Uppgift 6 Låt x, x,..., x n beteckna data från mätningarna av cirkelns diameter. Dessa är observationer av X, X,..., X n som är N(d, σ), medan data y, y,..., y m från mätningar av cirkelns omkrets är observationer av Y, Y,..., Y m som är N(πd, σ). Samtliga X i :n och Y i :n är oberoende av varandra. ) För att beräkna MK-skattningen av d baserat enbart på observationerna x, x,..., x n betraktar vi Q(d) (x i d) Derivering map d ger Q (d) Sätter vi derivatan till 0 fås ekvationen i (x i d) i
forts tentamen i SF90/SF9 09-06-05 7 x i nd 0. i Löser man denna för d får man att MK-skattningen av d baserat på observationerna x, x,..., x n är d obs x i. n ) För att beräkna MK-skattningen av d baserat enbart på observationerna y, y,..., y m betraktar vi Q(d) (y i πd) Derivering map d ger Sätter vi derivatan till 0 fås ekvationen Q (d) i i π(y i πd) i y i mπd 0. i Löser man denna för d får man att MK-skattningen av d baserat på observationerna y, y,..., y m är d obs y i. mπ 3) Slutligen för att beräkna MK-skattningen av d baserat på samtliga observationer, dvs baserat på x, x,..., x n och y, y,..., y m betraktar vi i Q(d) (x i d) + i (y i πd). i Derivering map d ger Q (d) (x i d) + i Sätter vi derivatan till 0 fås ekvationen π(y i πd) i x i nd + π i y i mπ d 0. i Löser man denna för d får man att MK-skattningen av d baserat på observationerna x, x,..., x n och y, y,..., y m är n d MK i obs x i + π m i y i. n + π m
forts tentamen i SF90/SF9 09-06-05 8 Vi beräknar nu variansen för den till d obs hörande stickprovsvariabeln d. Vi får ( ) V (d ) V X i n i V (X n i ) i n nσ σ n. Här har vi utnyttjat att X i :na är oberoende för att få andra likheten och att X i N(d, σ) för att få tredje. Variansen för stickprovsvariabeln svarande mot d obs ges av ( ) V ( d) V Y i πm π m i V (Y i ) i π m mσ σ π m. Här har vi utnyttjat att Y i :na är oberoende för att få andra likheten och att Y i N(πd, σ) för att få tredje. Om vi nu låter σ V (d ) och σ V ( d) så får vi att Insatt i formel () får vi nu a σ σ + σ σ /(π m) σ /n + σ /(π m) n n + π m. d obs σ d obs d σ + σ obs + σ σ + σ n n + π m x i + π m n n + π m πm i π x n + π i + y m n + π i m i i i y i och därmed ser vi att d MK obs d obs, dvs MK-skattningen av d baserat på alla n + m mätningar är den effektivaste skattningen man kan få då man kombinerar ihop skattningen baserat på de n mätningarna av cirkelns diameter och de m mätningarna av cirkelns omkrets linjärt.