Avd. Matematisk statistik TENTAMEN I SF11/SF114/SF115/SF116 SANNOLIKHETSTEORI OCH STATISTIK, TORSDAGEN DEN 0:E DECEMBER 018 KL 8.00 13.00. Examinator för SF114/SF116: Tatjana Pavlenko, 08-70 84 66 Examinator för SF115: Björn-Olof Skytt, 08-70 86 4. Examinator för SF11: Per-Jörgen Säve-Söderbergh, 08-70 65 85. Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik utdelas vid tentamen), miniräknare. Tentamen består av två delar, benämnda del I och del II. Del I består av uppgifterna 1-1. På denna del skall endast svar anges, antingen i form av ett numeriskt värde med tre värdesiffrors noggrannhet eller i form av val av ett av de möjliga svarsalternativen. Svaren på uppgifterna i Del I dvs uppgifterna 1-1) skall anges på den bifogade svarsblanketten! Studenter som är godkända på kontrollskrivningen behöver ej besvara uppgift 1-3, utan får tillgodoräkna sig dessa tre uppgifter. Gränsen för godkänt är preliminärt poäng. Möjlighet att komplettera ges för tentander med, preliminärt, 8 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Del II består av uppgifterna 13-16 och varje korrekt lösning ger 10 poäng. Del II rättas bara för studenter som är godkända på del I och poäng på del II krävs för högre betyg än E. På denna del skall resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Införda beteckningar skall förklaras och definieras och numeriska svar skall anges med minst två värdesiffrors noggrannhet. Studenter som är godkända på datorlaborationen får 4 bonuspoäng på del II på ordinarie tentamenstillfället och det första omtentamenstillfället. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Del I Uppgift 1 P A B) = 0.. P B A) = 0.4. P B) = 0.5. Vad är P A B)? A: 0.65 B: 0.75 C: 0.85 D: 0.5
Uppgift Tyko och hans syskon har fått en ask marmeladkulor som julklapp. Det finns två smaker, den ena sorten är gröna kulor och den andra sorten är röda. Tykos mamma har givit honom lov att äta upp fyra kulor efter maten. Tyko vill väldigt gärna ha lika många röda som gröna kulor. Tyko tar fyra kulor ur asken på ett slumpmässigt sätt. Beräkna sannolikheten att Tykos önskan går i uppfyllelse om asken innehåller sex gröna och fyra röda kulor. A: 0.071 B: 0.6 C: 0.375 D: 0.4 Uppgift 3 Låt X och Y vara stokastiska variabler sådana att DX) =, DY ) = 3 och CX, Y ) = 1. Bestäm DZ) där Z = X Y + 1. Uppgift 4 Tiden mellan två översvämningar i ett flodområde anses vara exponentialfördelad med väntevärde 8 månader. Beräkna medianen för tiden mellan två översvämningar. A: 5.545 B: 8.000 C: 8.63 D: 10.455 Uppgift 5 I en kvalitetskontroll av tillverkade enheter tas slumpmässigt 15 enheter ut och partiet avskiljs om mer än 1 enhet är felaktig. Vad är konsumentrisken om felandelen i partiet är 0.10, dvs vad är sannolikheten att ett så pass dåligt parti godkänns i kontrollen?
3 Uppgift 6 Vid ett reningsverk mäts dagligen syrekoncentrationen i vattnet mg/l). Mätningarnas resultat anses vara utfall av oberoende stokastiska variabler som följer Nµ, σ)-fördelning där σ betecknar standardavvikelsen. För en månads mätningar blev summan av de 31 mätvärdena 6.70 och stickprovsvariansen 1.77. Ange den övre gränsen till det tvåsidiga 5%-iga konfidensintervallet för µ. A:.5 B:.66 C:.64 D:.7 Uppgift 7 Antag att X N0, 1). Bestäm konstanten a så att P X > a) = 0.10. Uppgift 8 Antag att X ffgp) där 0 < p < 1 är okänd parameter. Vi har två utfall av X, x 1 = 1 och x = 1. Ta fram Minsta-Kvadrat skattningen av p med hjälp av dessa två utfall. Uppgift Antalet samtal som inkommer till ett kontor anses vara en stokastisk variabel som är Poissonfördelad med intensiteten 0.5 samtal per minut. Beräkna sannolikheten att det inkommer högst ett samtal till kontoret under en 5 min period. A: 0.08 B: 0.05 C: 0.87 D: 0.503
4 Uppgift 10 Vid renovering av sovrum har man följande nollhypotes H 0 : 4/ av kunderna föredrar blåa tapeter, 3/ föredrar gröna och resten vill ha gula. 33 kunder tillfrågas om vad de vill ha för färg på tapeterna i sovrummet. Det visar sig att 1 kunder vill ha blåa, 10 vill ha gröna och resten vill ha gula. A: H 0 kan varken förkastas på risknivån 1% eller risknivån 5% B: H 0 kan både förkastas på risknivån 1% och risknivån 5% C: H 0 kan förkastas på risknivån 1%, men inte på risknivån 5% D: H 0 kan förkastas på risknivån 5%, men inte på risknivån 1% Uppgift 11 Låt X i, i = 1,, 3 vara oberoende stokastiska variabler med väntevärde µ och standardavvikelse σ. Antag att µ skattas med µ obs = x 1 + x + x 3 )/4 och σ skattas med stickprovsstandardavvikelsen s. Låt utfallen på X i vara x 1 = 5, x = och x 3 = 7. Bestäm medelfelet för skattningen av µ. A: 0.866 B: 1. C:.00 D:.45 Uppgift 1 Låt X i, i = 1,..., 5 vara oberoende, Poissonfördelade stokastiska variabler med väntevärde µ. Med fem utfall på X i får man x = 16. Ange nedre gränsen till det ensidigt nedåt begränsade konfidensintervallet för µ med den approximativa konfidensgraden 5%. A: 1.4 B: 13.06 C: 14.43 D: 14.68
5 Del II Uppgift 13 Försäkringsbolaget BilTrygg skriver försäkringskontrakt med nya bilförare enligt följande modell: 50% av bilförarna klassificeras som lågriskförare, 30% som mediumriskförare och resten som högriskförare. Bolaget vet inte vilken kategori en bilförare tillhör, men bedömer att försäkringsbolaget behöver betala ut ersättning till 5% av lågriskförarna det närmaste året. Motsvarande andel för mediumriskförarna är 10% samt för högriskförarna 0%. a) Om försäkringsbolaget har betalat ersättning till en på måfå vald bilförare under föregående år, vad är då sannolikheten att personen är en högriskförare? 4 p) b) Bestäm sannolikheten att försäkringsbolaget måste betala ut ersättning till en på måfå vald bilförare under minst två av de nästkommande fem åren. 6 p) Uppgift 14 Av erfarenhet vet man att antalet däck som måste bytas ut under en vecka på ett transportbolag har följande fördelning: Antal trasiga däck en vecka 0 1 Sannolikhet 0.50 0.5 0.5 Beräkna med en lämplig och välmotiverad approximation sannolikheten att 40 däck räcker för transportbolagets förbrukning under ett år. Antag att ett år består av exakt 5 veckor). 10 p) Uppgift 15 Antag att maximala våghöjden på ett visst ställe ett visst år beskrivs med en stokastisk variabel X med täthetsfunktionen { x x e θ för x 0 f X x) = θ 0 för x < 0, där θ > 0 är en okänd parameter. Man har under 8 år observerat följande maximala våghöjder i meter):.5. 1.8 0. 1.7.1..8. a) Bestäm Maximum-Likelihood-skattningen av θ under förutsättningen att de 8 uppmätta våghöjderna kan anses vara utfall av oberoende observationer av X. 4 p) b) Beräkna med hjälp av skattningen av θ i a)-uppgiften 1000-årsvågens höjd, med vilket menas en våghöjd som överträffas i genomsnitt bara en gång per 1000 år. 6 p) Uppgift 16 Läkemedel kan ge nedsatt salivkörtelproduktion, vilket är en riskfaktor för karies och andra sjukdomar i munhålan. På 7 slumpmässigt valda patienter som alla fick samma medicin mätte man den så kallade tuggstimulerade saliven. Resultat ml/min): 1.06 0.65 0.70 0.7 0.86 1.11 0.38.
6 Normal mängd saliv under dessa förhållanden är 1 ml/min. Som modell antog man att salivmängden är normalfördelad med väntevärde µ och standardavvikelse σ, där σ anses vara 0.4 ml/min. a) Stödjer data vår misstanke att medicinen sänker salivproduktionen? Svara på frågan genom att utföra ett lämpligt test på signifikansnivån α = 0.05. 3 p) b) Antag att medicinen ger upphov till det sanna värdet 0.8 ml/min på salivproduktionen. Hur stor är sannolikheten att man kommer att missa den nedsatta salivproduktionen med testet i a)-uppgiften. 4 p) c) Hur många patienter ska man mäta på om man vill att testet ska upptäcka en nedsatt salivproduktion på 0.7 ml/min med sannolikheten 0.0. Fortsätt anta att signifikansnivån är 0.05. 3 p)
Avd. Matematisk statistik LÖSNINGSFÖRSLAG TENTAMEN I SF11/SF114/SF115/SF116 SANNOLIKHETSTEO- RI OCH STATISTIK. TORSDAGEN DEN 0:E DECEMBER 018 KL 8.00 13.00. Uppgift 1 Multiplikationssatsen ger att P A B) = P A B)P B) = 0. 0.5 = 0.1 Vidare har vi från definitionen av betingad sannolikhet P B A) = P B A) P A) P A) = P A B) P B A) = 0.1 0.4 = 0.5 Till sist ger additionsformeln P A B) = P A) + P B) P A B) = 0.5 + 0.50 0.10 = 0.65 Uppgift Låt X stå för antal gröna marmeladkulor vid urvalet. Eftersom Tyko äter upp kulorna drar vi kulorna utan återläggning. Om Tyko får två gröna kulor när han tar ut fyra kulor, så måste han få två gröna och två röda vilket är vad han önskar. P X = ) = 4 10 4 ) 6 ) ) = 6 15 10 = 3 7 = 0.4 Uppgift 3 Alltså blir DZ) = = 5.3. V Z) = V X Y + 1) = V X Y ) = 4V X) + V Y ) CX, Y ) = 4 4 + 1) = Uppgift 4 Fördelningsfunktionen för exponentialfördelningen med väntevärde åtta ges som F X x) = 1 e x 8. Medianen är lösningen till ekvationen F X x) = 1. Alltså löser vi 1 e x 8 = 1 x = 8) ln ) = 5.545
Uppgift 5 Låt X=antal felaktiga enheter i partiet. Vi känner inte till partiets storlek, så vi kan inte beräkna den exakta sannolikheten med hjälp av den hypergeometriska fördelningen. Därför gör vi en binomialapproximation av fördelningen för X. Då är X Bin15, 0.1). P partiet godkänns) = P X 1) = [se tab 6 : n = 15, p = 0.1, x = 1] = 0.54 Uppgift 6 Ett 5%-igt konfidensintervall för µ då ett stickprov betraktas som observationer på Nµ.σ) ges som 31 x i ± t 0.05 n 1) s n n Då n = 31, s = 1.77 och 31 x i = 6.70, samt t 0.05 30) =.04 blir den övre gränsen för µ 6.70 1.77 31 +.04 =.66 31 Uppgift 7 Vad betyder olikheten X > a? Den betyder att X < a eller att X > a. Eftersom X är symmetrisk, så räcker det att bestämma den ena av dessa. Vi väljer den sista. Den måste vara 5% eftersom den är endast halva biten. Ur en tabell hittar vi 5%-kvantilen λ 0.05 = 1.644. Väljer vi a = 1.644 blir det rätt. Uppgift 8 Väntevärdet i ffg-fördelningen är 1/p. Därför blir Qp) = x 1 p) 1 + x p) 1 = d dp Qp) = x i 1 ) ) 1 = 0 p p Då x i = 31 har vi att p obs = /31. Uppgift x i 1 ) = 0 p x i 1 ) p x i = p p obs = x i Låt X=antalet händelser under tiden t. Då är X P o λt) Tiden mäts i minuter, så t = 5. Intensiteten per minut är λ = 1. Därför är X P o ) 5 P X 1) = P X = 0) + P X = 1) = e 5 + e 5 5 = e 5 1 + 5 ) = e 5 7 = 0.87
3 Uppgift 10 Situationen är den som beskrivs i avsnitt 13.10 a) Test av given fördelning. Vi har att r = 3 och n = 33. Dessutom är x 1 = 1, x = 10 och x 3 = 4. Slutligen är p 1 = 4, p = 3 samt p 3 =. Detta ger Q obs = 3 j=1 x j np j ) np j = ) 1 33 4 33 4 + ) 10 33 3 33 3 + ) 4 33 33 =.886364 5%- och 1%-kvantilerna på χ -fördelningen med r 1 = frihetsgrader är 5. och.1. Alltså kan vi inte förkasta H 0 på vare sig 1%- eller 5%-nivån. Uppgift 11 V µ obs) = V ) X1 + X + X 3 4 = 1 16 V X 1) + V X ) + 4V X 3 )) = 1 16 σ + σ + 4σ ) Alltså blir = 3 8 σ D µ obs) = 3 8 σ Vi uppskattar σ med s, så att d µ obs ) = 3 s. 8 Då x 1 = 3, x = 5 och x 3 = 7 blir 3 x i x) = + =. Eftersom n = 3 blir s = 3 x i x) / = och således s =. Alltså blir 3 3 d µ obs) = 8 s = 8 = a) Vi inför beteckningarna samt Uppgift 1 3 = 1. x λ 0.05 x n = 16 1.644 16 5 = 13.06 Uppgift 13 E = Försäkringsbolaget betalar ut ersättning, L = Lågriskförare, M = Mediumriskförare samt H = Högriskförare.
4 Vi vet från uppgiftsformuleringen att P L) = 0.50, P M) = 0.30 samt P H) = 0.0. Vidare gäller det att P E L) = 0.05, P E M) = 0.10 samt P E H) = 0.0. Med hjälp av Bayes sats fås P H E) = = P H)P E H) P L)P E L) + P M)P E M) + P H)P E H) 0.0 0.0 0.50 0.05 + 0.30 0.10 + 0.0 0.0 = 0.41056316 Svar: Sannolikheten att en på måfå vald bilförare som försäkringsbolaget betalat ut ersättning till under föregående år är en högriskförare är 4.1%. b) Sannolikheten att försäkringsbolaget måste betala ut ersättning beror på om föraren ifråga är lågriskförare, mediumriskförare eller högriskförare. För en lågriskförare ges antalet år som bolaget behöver betala ut ersättning under de nästkommande fem åren av en Bin5, 0.05)- fördelad stokastisk variabel X L. På liknande sätt ges antalet år som bolaget behöver betala ut ersättning till en mediumriskförare av en Bin5, 0.1)-fördelad stokastisk variabel X M och antalet år som bolaget behöver betala ut ersättning till en högriskförare av en Bin5, 0.1)- fördelad stokastisk variabel X H. Låt X beteckna antalet år som bolaget behöver betala ut ersättning till en godtyckligt vald bilförare. Lagen om total sannolikhet ger då P X ) = P X L)P L) + P X M)P M) + P X H)P H) = P X L )P L) + P X M )P M) + P X H )P H). Med hjälp av sannolikhetsfunktionen för binomialfördelningen fås ) ) 5 5 P X L ) = 1 P X L 1) = 1 0.05 0 0.5 5 0.05 1 0.5 4 = 0.05, 0 1 och på analogt vis P X M ) = 0.08146 samt P X H ) = 0.67. Sammanfattningsvis fås P X ) = 0.05 0.5 + 0.08146 0.3 + 0.67 0. = 0.0888. Svar: Sannolikheten att försäkringsbolaget måste betala ut ersättning till en på måfå vald bilförare under minst två av de fem nästkommande åren är 8.8%. Uppgift 14 a) Om X= antalet trasiga däck under en vecka så gäller att EX) = 3 k=1 kp X k) = 0 1 + 1 1 4 + 1 4 = 0.75 EX ) = 3 k=1 k p X k) = 0 1 + 1 1 4 + 1 4 = 1.5 V X) = EX ) EX)) = 1.5 0.75 = 0.6875
5 b) För en vecka har vi att X i = antalet trasiga däck under vecka i med EX i ) = µ = 0.75 och V X i ) = σ = 0.6875. Totalet antalet trasiga däck under 5 veckor är 5 X i. Eftersom vi summerar många oberoende stokastiska variabler, alla med samma fördelning, gäller enligt centrala gränsvärdessatsen: P 5 5 ) X i 40 = P X i N 5 µ, ) 5 σ = N 5 X i 5 0.75 5 0.6875 Uppgift 15 5 0.75, ) 5 0.6875 40 5 0.75 5 0.6875 ) = Φ 0.17) = 0.5675 a) Varje enskild observation x i antas utgöra en observation på en stokastisk variabel X i med täthetsfunktionen f X x) = x x e θ, x 0 θ Då blir likelihooden en funktion i θ: Lθ) = f X1 x 1 ) f X x ) f Xn x n ) = x 1 x θ e 1 θ x θ e n ) = θ n x i x θ x n n e x θ Logaritmering och derivering med avseende på θ ger n ) ln Lθ) = n ln θ + ln x i θ e i x n θ n x i θ d dθ ln Lθ) = n θ + 1 θ n x i = 0 θ = Från data har vi att n x i = 38.6. Då blir n θobs = x i n = 38.6 8 =.41815 n x i n b) Höjden på 1000-årsvågen är höjden h sådan att P X > h) = 1 P X > h) = = x x h θ e θ dx ] x=r [ e x θ = e R θ x=h + e h θ e h θ då R. 1000.
6 Alltså ska vi lösa ekvationen e h θ = 1 1000 i h. h θ = ln 1000 h = θ ln 1000 h = θ ln 1000 Vi uppskattar h med hjälp av ML-skattningen från a). Detta ger h obs = θ obs ln 1000 =.41815) ln 1000 = 5.78 Uppgift 16 a) De sju mätningarna x 1,..., x 7 är observationer av X= salivproduktion ; X N µ, 0.4). ) Intressanta hypoteser är H 0 : µ = 1 mot H 1 : µ < 1. H 0 förkastas på nivå α om x 1) / 0.4 7 < λ α vilket är ekvivalent med att x < 1 λ α 0.4 7 = k. Med α = 0.05 fås λ 0.05 = 1.65 och k = 1 1.65 0.4 7 = 0.751. Eftersom x = 0.71 gäller att x < k och H 0 förkastas på nivå 0.05. Ja, data stöder misstanken att läkemedlet minskar salivproduktionen. b) Testets styrkefunktion ger P missa nedsatt salivproduktion µ = 0.8) = P ej förkasta H 0 : µ = 1 µ = 0.8) = P X > 1 1.65 0.4 ) µ = 0.8 7 = P X > 0.751 X N 0.8, 0.4 )) 7 ) 0.751 0.8 = 1 Φ 0.4 7 = Φ0.3) = 0.66 c) Bestäm n så att P upptäcka nedsatt salivproduktion µ = 0.7) = 0.0. Men P upptäcka nedsatt salivproduktion µ = 0.7) = P förkasta H 0 : µ = 1 µ = 0.7) = P X < 1 1.65 0.4 ) µ = 0.7 n = P X < 0.751 X N 0.7, 0.4 )) n ) 0.751 0.7 = Φ 0.4 n Då detta uttryck ska vara lika med 0.0 innebär det att 0.751 0.7 0.4 n = λ 0.10
7 vilket ger Man måste ha 101 patienter. n = ) 0.4 λ 0.10 = 100.8 0.751 0.7