Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK I Uppgift 1 I en byggnad sitter ett brandlarm monterat. Under en tidsperiod är sannolikheten att larmet går 3%. Man vet att 98% av alla larm är falsklarm, dvs brandlarmet signalerar trots att det inte är någon eldsvåda. Eldsvådor uppstår under samma tidsperiod med sannolikhet 0.001. a) Bestäm sannolikheten att larmet går om en eldsvåda bryter ut. (5 p) b) Brandlarmet fungerar inte med sannolikhet 0.04 (ingen strömförsörjning, trasig siren, trasig detektor etc.). Ett trasigt brandlarm kan inte larma. Eldsvådor uppstår oberoende av om brandlarmet fungerar eller ej. Bestäm sannolikheten att larmet går om en eldsvåda bryter ut betingat att larmet fungerar. (5 p) Uppgift 2 Ett arbetslag vid ett bygge består av sju man. Detta arbetslag antages arbeta 200 dagar under ett år. Erfarenheten visar att risken för att en arbetare skadas vid bygget en viss dag är 2 o / oo 2 dvs. Trots att arbetslaget arbetar tillsammans antages skadorna hos de olika medlemmarna 1000 vara oberoende. Vidare antages antalet skador under olika dagar vara oberoende. a) Beräkna sannolikheten för att det totala antalet skador hos arbetslaget under ett år överstiger tre. (4 p) b) Beräkna sannolikheten för att någon av arbetslagets medlemmar skadas mer än tre gånger under ett år. (6 p) I både a)- och b)-delen är lämpliga och välmotiverade approximationer tillåtna. Uppgift 3 Ett flygplan av viss typ tar 100 passagerare. Passagerarnas vikter kan ses som oberoende stokastiska variabler med väntevärde 75 (kg) och standardavvikelse 10. Vikterna på passagerarnas bagage är också oberoende stokastiska variabler men med väntevärde 15 och standardavvikelse 5. Korrelationskoefficienten mellan en passagerares vikt och vikten av hans bagage är 0.1. Det finns alltså ett visst beroende mellan en passagerares vikt och vikten av hans bagage. Beräkna sannolikheten att den sammanlagda vikten för passagerarna och bagaget överstiger 9300 kg. Rimliga och väl motiverade approximationer får göras. (10 p) Uppgift 4 Sannolikheten att en bränslecell räcker i 5 timmar är e 0.2θ där θ > 0. Av n = 200 oberoende bränsleceller räckte x = 27 denna tid. Tag fram Maximum-likelihoodmetodens skattning av θ. (10 p)
forts tentamen i SF1901 00 00 00 2 Uppgift 5 I ett växthus beskrivs mängden gödnings- och mineral-lösning en sond doserar ut i bevattningssystemet av en normalfördelad stokastisk variabel med väntevärde m och standardavvikelse σ [enhet mg]. Efter n = 30 oberoende doseringar skall den totala mängden utdoserad lösning inte understiga 500 mg med sannolikhet 90%. Dock får endast 1% av doseringarna vara större än 25 mg. Bestäm m och σ så att dessa villkor är uppfyllda. (10 p) Uppgift 6 Från en punkt O har man mätt vinklarna AOB, BOC och AOC och därvid erhållit värdena: 43.2,29.2 och 70.1. Punkternas läge framgår av figuren. C B O A De tre mätningarna kan uppfattas som utfall av oberoende normalfördelade stokastiska variabler vilkas väntevärden överensstämmer med de sanna vinklarna och vilkas standardavvikelse är 2. Detta svarar emot att mätutrustningen inte har något systematiskt fel och att den är beprövad så att man vet standardavvikelsen. Skatta vinkeln AOB med MK-metoden samt bestäm ett 95% konfidensintervall för vinkeln AOB utgående från MK-skattningen. (10 p) Observera: För att lösningen ska ge poäng måste alla mätningarna utnyttjas. Uppgift 7 Antalet snödagar under ett år beskrivs av en Poissonfördelad stokastisk variabel, och antalet snödagar under olika år beskrivs av oberoende stokastiska variabler. Åren 1980 1989 var det i medeltal 134.8 snödagar per år. a) Bestäm ett konfidensintervall för det genomsnittliga antalet snödagar under ett år med konfidensgrad (approximativt) 95%. (5 p) b) Bestäm approximativt sannolikheten att det skiljer mer än 40 snödagar mellan två olika år. (5 p)
forts tentamen i SF1901 00 00 00 3 Uppgift 8 Kroppen behöver järn för att bilda hemoglobin och röda blodkroppar och brist på järn kan leda till anemi. Järnbrist kan behandlas med blodtransfusioner, järntabletter, dropp eller mediciner. I en förstudie av effekten av en viss järntablett ingår n = 5 patienter. Deras järnhalt i blodet mäts före och efter medicinering med tabletter och mätresultaten sammanfattas av före, x 1,...,x n : 92.1 89.6 100.4 79.7 88.3 efter, y 1,...,y n : 141.0 121.4 141.9 126.9 108.6 enhet: gram/liter Låt m vara den genomsnittliga höjningen av järnhalten i blodet för en patient. Ansätt modellen att förändringarna i järnhalt beskrivs av oberoende normalfördelade stokastiska variabler. a) Om man skall bevisa att tabletterna väsentligt höjer järnhalten i blodet, vilken av följande två hypotesprövningar skall man utföra? eller H 0 : m 50 mot H 1 : m < 50 H 0 : m 25 mot H 1 : m > 25. Motivering krävs naturligtvis. (3 p) b) Utför testet på nivå α = 0.05. (7 p) Uppgift 9 Enligt en modell har en tillverkad enhet fel av typ A med sannolikhet 0.03 och fel av typ B med sannolikhet 0.07 och A-fel och B-fel uppträder oberoende av varandra. Man tillverkar n = 3000 enheter och delar in enheterna i kategorier baserat på deras fel: Enbart Enbart Både felfria A B A och B Observationer, x i : 2659 120 210 11 n = 3000 Testa med ett χ 2 -test på nivå α = 0.05 ifall modellen är förenlig med mätningarna. (10 p) Uppgift 10 Man vill jämföra oktanhalten i två olika oljetyper A och B. Därför har man tagit ut 4 prover av vardera oljetypen och mätt oktanhalten på dessa. Man fick då följande värden Oljetyp A: 81 84 79 83 Oljetyp B: 76 78 79 80 Man misstänker att oktanhalten inte är densamma för de båda oljetyperna. Mätvärdena på de olika oljetyperna anses vara oberoende och normalfördelade med väntevärde µ A respektive µ B (där µ A och µ B är respektive oktanhalt) och med samma standardavvikelse σ. a) Beräkna ett 95%-igt symmetriskt konfidensintervall för µ A µ B. (7 p) b) Formulera lämpliga hypoteser för att avgöra om oktanhalten är densamma för de båda oljetyperna eller inte, samt utför hypotesprövningen på nivå 5%. Dina slutsatser skall klart framgå. (3 p)
1 Lösningsförslag Uppgift 1 Låt L vara händelsen att larmet går och E händelsen att en eldsvåda bryter ut. Då är P(L E) = P(L E) P(E) = P(E L)P(L) P(E) = 0.02 0.03 0.001 = 0.600 Låt B vara händelsen att brandlarmet fungerar. Eftersom L B är P(L B E) = P(L E) = 0.0006 enligt tidigare. Vidare så är P(B E) = P(B)P(E) = 0.96 0.001 på grund av oberoendet så P(L B E) P(L B E) = = 0.0006 P(E B) 0.96 0.001 = 0.625 Uppgift 2 a) X = totala antalet skador under ett år är Bin(7 200, 0.002)-fördelad. Då 0.002 < 0.1 så är X approximativt Po(7 200 0.002) = Po(2.8)-fördelad. Detta ger P(X > 3) = 1 P(X 3) 1 0.69 = 0.31. b) På samma sätt som i a) följer att X k = antalet skador under ett år för arbetare nr k är Bin(200, 0.002) Po(200 0.002) = Po(0.4)-fördelad. Detta medför att P(någon skadas mer än tre gånger) = 1 P(ingen skadas mer än tre gånger) = 1 7 P(X k 3) = 1 0.99922 7 0.005. k=1 Uppgift 3 Låt X j =person j:s vikt och Y j =vikten av person j:s bagage. Låt vidare Z j = X j + Y j. Vi får E(Z j ) = E(X j ) + E(Y j ) = 75 + 15 = 90 för j = 1,2,,100. Vi får V(Z j ) = V(X j + Y j ) = V(X j ) + V(Y j ) + 2C(X j,y j ) = 10 2 + 5 2 + 2 (X j,y j )D(X j )D(Y j ) = 100 + 25 + 2 0.1 10 5 = 135. Totala vikten blir S = Z 1 + Z 2 + + Z 100 som är approximativt normalfördelad enligt Centrala gränsvärdessatsen ty Z 1,,Z 100 är oberoende och likafördelade. S är approximativt N(100 90, 100 135) och vi får ( S 9000 P(S > 9300) = P > 9300 9000 ) 13500 13500 1 Φ(300/ 13500) 1 Φ(2.58) 1 0.99506 4.94 10 3. Uppgift 4 Låt X beskriva antalet bränsleceller som räcker längre än 5 timmar. Modell: X är binomialfördelad, Bin(n,p) = Bin(200,e 0.2θ ). Maximum-likelihoodmetodens skattning av θ är det värde på θ som maximerar: ( ) n (e L(θ) = P(X = x) = ) 0.2θ x( ) 1 e 0.2θ n x. x
2 Logaritmering ger ln(l(θ)) = ln (( )) n 0.2θx+(n x)ln(1 e 0.2θ ). x Lösning av ger 0 = d dθ [ ] 0.2(n x)e 0.2θ n x ln(l(θ)) = 0.2x+ = 0.2 1 e 0.2θ e 0.2θ 1 x ( x θ = 5ln, n) dvs θ (x) = 5ln(x/n) = 5ln(27/200) = 10.012. Uppgift 5 Den totala halten doserad lösning Y = n X i är normalfördelad N(nm, nσ). Vi söker m och σ så att ( Y nm Φ( λ 0.10 ) = 0.10 = P(Y 500) = P 500 nm ) ( ) 500 nm = Φ, nσ nσ nσ och vilket ger ( X m 1 Φ(λ 0.01 ) = 0.01 = P(X > 25) = P σ 500 nm nσ = λ 0.10 25 m σ = λ 0.01 > 25 m ) ( 25 m = 1 Φ σ σ m = 500λ 0.01+25λ 0.10 n λ 0.10 n+λ0.01 n σ = 25n 500 λ 0.10 n+λ0.01 n = 3.2548 = 17.4282 ) Uppgift 6 Låt θ 1 vara vinkeln AOB och θ 2 vinkeln BOC. Detta innebär att θ 1 + θ 2 är vinkeln AOC. Låt vidarex,y,z vararesp.mätvärden, dvsx = 43.2,y = 29.2ochz = 70.1.Dessauppfattassomutfall av oberoende stokastiska variabler X,Y,Z som är N(θ 1,2)-, N(θ 2,2)- och N(θ 1 +θ 2,2)-fördelade. För att beräkna MK-skattningen av θ 1 betraktar vi Derivation ger och Q(θ 1,θ 2 ) = (x θ 1 ) 2 +(y θ 2 ) 2 +(z θ 1 θ 2 ) 2. Q(θ 1,θ 2 ) θ 1 = 2(x θ 1 ) 2(z θ 1 θ 2 ) = 2(x+z 2θ 1 θ 2 ) Q(θ 1,θ 2 ) θ 2 = 2(y θ 2 ) 2(z θ 1 θ 2 ) = 2(y +z θ 1 2θ 2 ). Sätter vi derivatorna = 0 fås således ekvationssystemet
3 2θ 1 +θ 2 = x+z (1) θ 1 +2θ 2 = y +z. (2) Bildar vi 2 (1) (2) fås 3θ 1 = 2x y +z = 2x+(z y) och således är MK-skattningen av θ 1 given av θ1 2x+(z y) = = 2 43.2+(70.1 29.2) = 127.3 = 42.4. 3 3 3 Vi betraktar nu den till θ1 hörande stickprovsvariabeln θ1(x,y,z). För denna gäller E(θ 1 (X,Y,Z)) = E ( 2X +(Z Y) 3 ) = 2θ 1 +(θ 1 +θ 2 θ 2 ) 3 = θ 1, dvs skattningen är väntevärdesriktig. Vidare har vi ( ) 2X +(Z Y) V(θ1 (X,Y,Z)) = V 19 (4+1+1) 22 = (4V(X)+V(Z)+V(Y)) = 3 9 Ett 95% konfidensintervall fås således av 24 I θ1 = θ1 ±λ 0.025 9 = 42.4±1.96 1.63 = 42.4 ±3.2. Uppgift 7 = 24 9. Under n = 10 år erhölls i medeltal x = 134.8 snödagar per år, där x 1,...,x n är utfall av oberoende Po(m)-fördelade stokastiska variabler. Väntevärdet m skattas med m (x 1,...,x n ) = x där m (X 1,...,X n ) = X = 1 n X i. n }{{} Po(nm) Eftersom nm skattas med 10x = 1348 vilket är större än 15 (med råge!) kan Poissonfördelningen approximeras med normalfördelningen. Alltså är X approximativt N(m, m/ n) och ett konfidensintervall för m, med konfidensgrad 1 α = 0.95 ges av m m m (x 1,...,x n ) (x 1,...,x n )±λ α/2 n = x±λ 0.025 x n = 134.8±1.96 134.8 10 = 134.8±7.2 ( 95%) b) Låt X 1 och X 2 beskriva antalet snödagar olika år. Eftersom m skattas med x = 134.8 vilket är större än 15 så är X 1 och X 2 approximativt normalfördelade och X 1 X 2 är approximativt N(0, 2m). Sålunda är ( X1 X 2 P( X 1 X 2 > 40) = P > 40 ) ( ( )) 40 2 1 Φ 2m 2m 2m dvs knappt 1.5%. = 2(1 Φ(2.44)) = 0.0147,
4 Uppgift 8 Järnhaltshöjningarna z i = y i x i är utfall av oberoende N(m,σ)-fördelade stokastiska variabler där m och σ skattas med z = 37.94 och s z = 11.91. För att se ifall pillret höjer järnhalten är grundinställningen (nollhypotesen som skall motbevisas) atthöjningenär liteneller måttlig (m 25)ochalternativhypotesen att höjningenär storm > 25. Att förkasta H 0 betyder att nollhypotesen är orimlig och alternativhypotesen mer trolig, dvs vi kan anse att en stor höjning av järnhalten är bevisad. Vi förkastar H 0 till förmån för H 1 för stora värden på t = z 25 s z / n somomh 0 ärsannär ettutfall frånent(n 1) = t(4)-fördelning. Urt(4)-tabellfåsattt 0.05 = 2.13. Alltså, förkasta H 0 om t > 2.13. Vi observerar utfallet t = z 25 s z / n = 2.43 och förkastar H 0 på nivå 5%. Tabletterna höjer järnhalten med mer än 25 gram/liter. Uppgift 9 Låt A och B vara händelserna att en tillverkad enhet har A-fel resp. B-fel. Enligt modellen är P(A B ) = P(A )P(B ) = 0.9021 P(A B ) = P(A)P(B ) = 0.0279 P(A B) = P(A )P(B) = 0.0679 P(A B) = P(A)P(B) = 0.0021 så Enbart Enbart Både felfria A B A och B Observationer, x i : 2659 120 210 11 3000 Hypotes, p i :.9021.0279.0679.0021 1 Förväntat, np i : 2706.3 83.7 203.7 6.3 3000 Notera att np i 5, i = 1,...,4. De observerade antalen jämförs mot de förväntade med q = 4 (x i np i ) 2 np i som om modellen stämmer är ett utfall från en approx. χ 2 (4 1) = χ 2 (3)-fördelning. Ur tabell fås att χ 2 0.05 (3) = 7.81. Vi observerar utfallet q = 4 (x i np i ) 2 np i = 0.83+15.74+0.195+3.51 = 20.3 > 7.81 så vi förkastar hypotesen om att A- och B-fel uppträder oberoende med de givna sannolikheterna.
5 Uppgift 10 Två oberoende stickprov med N(µ A,σ)- respektive N(µ B,σ)-fördelade observationer. Ett 95%-igt konfidensintervall för µ A µ B blir med t-metoden 1 x y ±t 0.025 (4+4 2)s 4 + 1 4 där x = (81+84+79+83)/4 = 81.75 och y = (76+78+79+80)/4 = 78.25. Vidare får vi ( 4 ) s 2 1 x = x 2 i 4 ( x) 2 = 1 ( ) 26747 4 (81.75) 2 = 4.9167 4 1 3 ( 4 ) s 2 1 y = yi 2 4 (ȳ) 2 = 1 ( ) 24501 4 (78.25) 2 = 2.9167 4 1 3 s 2 = 3s2 x +3s2 y 3+3 s = 1.98 = 3.9167 och vi får intervallet till 81.75 78.25±2.45 1.98 2/4 = 3.5±3.4 = (0.1,6.9). b) Vi tar H 0 : µ A = µ B och H 1 : µ A µ B. Vi förkastar H 0 på signifikansnivån 5% eftersom konfidensintervallet i a-delen inte innehåller 0. Slutsatsen är att en skillnad i oktanhalterna är påvisad (A har högre oktanhalt)!