TMSK17 Matematisk statistik 181020 Lösningsförslag Tid: 9.00-14.00 Telefon: hos tentavakten Examinator: F Abrahamsson 1. För att bestämma den genomsnittliga halten µ av dioxin (lämplig enhet) i sik från Vättern provfiskar man och mäter dioxinhalten i de fångade fiskarna. Man kan anta att dioxinhalten är normalfördelad N(µ,0.3). (a) Man fångar sikar och beräknar medelvärdet på dioxinhalten till 3.81. Beräkna ett tvåsidigt 90% konfidensintervall för µ. (b) Hur många sikar måste man minst fånga om man vill ha ett tvåsidigt 90% konfidensintervall för µ som har bredden 0.? (c) Livsmedelsverket vill beräkna ett ensidigt intervall för µ. Avgör vilket slags intervall som borde vara av intresse och beräkna detta med 90% konfidensgrad (med stickprovet från (a)). Lösning: (a) (b) Vi söker n så att om vi avrundar uppåt. I µ = x±λ 0.05 σ = 3.81±1.64 0.3 [3.66,3.96] 2λ 0.05 σ n = 0. n = ( ) 2 2λ0.05 σ = 0. ( ) 2 2 1.64 0.3 68 0. (c) Eftersom höga dioxinhalter är farliga så vill vi bestämma ett uppåt begränsat konfidensintervall; vi får I µ =],x+λ 0.1 σ ] =],3.81+1.28 0.3 ] ],3.93] 2. För en viss ovanlig sjukdom har man ett initialt test och man vet att sannolikheten för ett positivt testresultat för en sjuk person är 0.85 och sannolikheten för ett positivt testresultat för en frisk person är 0.1. Antag att sannolikheten för att en person har sjukdomen är 0.006. (a) Beräkna sannolikheten att en person som testas får ett positiv resultat. (b) Beräkna sannolikheten att en person som fått ett positivt testresultat är sjuk. (c) Beräkna sannolikheten att en person som får ett negativt testresultat är frisk. Lösning: (a) Låt A vara händelsen att testet är positivt och låt B vara händelsen att en person har sjukdomen. Då är P(B) = 0.006, P(A B) = 0.85 och P(A B c ) = 0.1. Lagen om total sannolikhet ger att (b) Bayes lag ger att P(A) = P(A B)P(B)+P(A B c )P(B c ) 0.1045 P(B A) = P(A B)P(B) P(A) = 0.85 0.006 0.1045 0.0488
TMSK17 Matematisk statistik sida 2 av 6 (c) Nu söker vi P(B c A c ) = P(Ac B c )P(B c ) P(A c ) = (1 P(A Bc ))P(B c ) 1 P(A) = (1 0.1) 0(1 0.006) 1 0.1045 0.999 3. En kaffeproducent paketerar sitt kaffe i förpackningar som skall innehålla 450g kaffe. Vi kan anta att maskinen som förpackar kaffet fyller på en mängd X gram som är N(µ,σ) (där σ är okänd). Det är viktigt att den genomsnittliga kaffemängden är minst 450g och för att kontrollera detta så väljs 9 kaffepaket ut på måfå och vägs, resultatet presenteras nedan; 435 444 438 463 434 435 438 406 472 (a) Använd detta stickprov till att avgöra om maskinen är felaktigt inställd så (3p) att den genomsnittliga kaffemängden i själva verket understiger 450g. Ange ett lämligt hypotestest och genomför det på 1% signifikansnivå. (b) Avgör samma fråga som i (a) men genom att beräkna ett lämpligt konfidensin- tervall. (c) Bestäm ett 95% tvåsidigt konfidensintervall för standardavvikelsen σ. Lösning: (a) Vi vill genomföra testet på 1% signifikansnivå. Med testvariabeln H 0 : µ = 450 H 1 : µ < 450 T 0 = X 450 S/ 9 kommer H 0 att förkastas om t 0 < t 0.01 (8) = 2.896. Med vårt stickprov beräknas x = 440.56 och s = 18.762 som innebär att t 0 = 1.51 dvs. H 0 kan ej förkastas på 1% signifikansnivå. (b) Vi beräknar ett uppåt begränsat ensidigt 99% konfidensintervall I µ =],x+t 0.01 s 9 ] =],458.7] Eftersom µ 0 = 450 I µ så kan ej H 0 förkastas på 1% signifikansnivå. (c) [ ] (9 1)s I σ = 2 χ 2 0.025(9 1), (9 1)s 2 [ ] 160.61, 91.85 [.6, 36.0] χ 2 0.975(9 1) 4. En affär hårt drabbad av snatterier väger kundernas väskor vid entrén och en gång till vid utgången. Om viktskillnaden VIKT utgång VIKT ingång överstiger 200 g så får kunden visa upp innehållet i sin väska. Antag att vågens mätfel är normalfördelat med väntevärde 0 och en standardavvikelse 75 g.
TMSK17 Matematisk statistik sida 3 av 6 (a) Vad är sannolikheten att en person som inte snattat något ändå får visa upp (3p) innehållet i sin väska? (b) Vad är sannolikheten att bland 10 kunder som inte snattat något, minst två får (3p) visa upp innehållet i sin väska? Lösning: (a) Om X u, X i är vågens mätresultat för en oskyldig kunds väska med vikt µ så gäller att X u,x i N(µ,75) och därmed är X u X i N(0, 2 75). Sannolikheten att denna kund får visa upp innehållet i sin väska är därför ( ) 200 0 P(X u X i > 200) = 1 Φ 0.03 2 75 (b) Om Y är antalet av de 10 oskyldiga kunderna som får visa upp sin väska så är Y Bin(10,0.03) enligt (a), och således 1 ( ) 10 P(Y 2) = 1 P(Y 1) = 1 0.03 k (1 0.03) 10 k 0.0345 k k=0 5. Antalet teaterbiljetter som köps till teaterscenen på Spira under en säsong av ett (6p) hushåll i jönköping är en stokastisk variabel som kan anta värdena 0,1 resp. 2 med sannolikheter 0.6, 0.3 resp. 0.1. (Vi antar att dessa sannolikheter är konstanter så länge biljettpriset är någorlunda rimligt). Om antalet hushåll är 50000, beräkna ett (approximativt) biljettpris så att sannolikheten att de totala intäkterna överstiger 8 miljoner kronor skall vara 90%. Biljettpriset skall försökas sättas så lågt som möjligt. Lösning: Om biljettpriset är K kr så är de totala intäkterna X K kr där X = X 1 + +X 50000 är det totala antalet köpta biljetter av de 50000 hushållen i Jönköping. Låt X 0 vara det antal biljetter som vi minst säljer med 90% sannolikhet, dvs. låt X 0 uppfylla att P(X X 0 ) = 0.9 Centrala gränsvärdessatsen ger att approximativt är X N(50000µ, 50000σ) där µ = E(X i ) = x xp(x i = x) = 0 0.6+1 0.3+2 0.1 = 0.5 och σ 2 = V(X i ) = x x 2 P(X i = x) µ 2 = 0 2 0.6+1 2 0.3+2 2 0.1 0.5 2 = 0.45. Detta ger att X N(25000,150) och då är ( ) X0 25000 P(X X 0 ) = 0.9 1 Φ 150 Tabell ger X 0 25000 1.28 X 0 = 24808 150 Alltså måste vi sätta ett biljettpris K så att 24808K = 8 10 6 K 323 kr ( = 0.9 Φ X ) 0 25000 = 0.9 150
TMSK17 Matematisk statistik sida 4 av 6 6. Ett lotteri har 2000 lotter och påstår att andelen vinstlotter är 5%. Ebba köper 980 (5p) lotter och får 35 vinster, och blir då tveksam till lotteriets påstående. Formulera och genomför ett lämpligt hypotestest som Ebba kan använda om hon vill hävda att andelen vinstlotter är lägre än 5%. Eventuella approximationer skall motiveras. Använd signifikansnivån 1%. Lösning: Om p är andelen vinstlotter så vill vi genomföra testet H 0 : p = 0.05 H 1 : p < 0.05 på 1% signifikansnivå. Med testvariabeln X = antalet vinstlotter av de 980 köpta lotterna så är då X Hyp(2000, 980, 2000p) Om H 0 sann, så att p = 0.05 så är V(X) = σ 2 = 2000 980 980 0.05(1 0.05) 23.75 > 10 2000 1 vilket motiverar att vi kan approximativt anta att X N(49, 23.75). Vi beräknar då testets approximativa P värde till P(X 35 X N(49, ( ) 35 49 23.75)) = Φ 1 Φ(2.88) 0.002 23.75 och eftersom detta är (betydligt) mindre än testets signifikansnivå 0.01 så förkastas H 0. 7. För länge sedan var det i Sverige tradition att den äldste sonen skulle få ärva famil- (4p) jegodset. Antag att Martin är en son i en familj med tre barn. Vad är sannolikheten att Martin får ärva familjegodset enligt de gamla reglerna? (Antag att varje födsel ger en son eller dotter med lika stor sannolikhet). Lösning: Låt X vara antalet systrar som martin har. Då är X Bin(2, 1 ) och om 2 M är händelsen att Martin är äldsta sonen i familjen så följer att P(M) = P(M X = 0)P(X = 0)+P(M X = 1)P(X = 1)+P(M X = 2)P(X = 2) = 1 3 1 4 + 1 2 1 2 +1 1 4 = 7 8. Vattenprover från de två åarna norrån resp. söderån analyseras beträffande ph-värdet (5p) och man fick följande resultat: Norrån 7. 6.81 6.74 6.82 6.94 Söderån 7.02 7.11 6.87 6.60 Genomför ett Wilcoxon rangsummatest på 5% signifikansnivå för att avgöra om det är någon skillnad i ph-värde mellan vattnet från de olika åarna.
Lösning: Vi vill genomföra testet Vi noterar rangtalen enligt nedan; Norrån 7. 6.81 6.74 6.82 6.94 Rangtal 9 3 2 4 6 Söderån 7.02 7.11 6.87 6.60 Rangtal 7 8 5 1 TMSK17 Matematisk statistik sida 5 av 6 H 0 : ph(norrån) = ph(söderån) H 1 : ph(norrån) ph(söderån) Eftersom det mindre stickprovet kommer från söderån så summerar vi rangtalen därifrån och får testvariabeln w söderån = 7+8+5+1 = 21 Enligt tabell så skall H 0 förkastas på 5% signifikansnivå om w söderån w 0.025 = 11 eller om w söderån w + 0.025 = 29. Ingen av dessa olikheter är uppfylld och vi kan således inte förkasta H 0 på 5% signifikansnivå. 9. Man testar en våg och mäter upp 5 stycken vikter som alla väger 100 kg. Man får (5p) resultatet enligt nedan. Viktintervall Antal uppmätta resultat 0 99.6 5 99.6 99.8 20 99.8 100.0 34 100.0 100.2 38 100.2 100.4 22 100.4 6 Man tror att en vägning kan ses som en observation från en normalfördelningn(100,0.25). Testa denna hypotes med ett χ 2 test på 5% signifikansnivå. Lösning: Om X N(100, 0.25) så beräknar vi sannolikheterna p 1 = P(X 99.6) = Φ( 99.6 100 0.25 ) = 1 Φ(1.6) = 0.055 p 2 = P(99.6 X 99.8) = Φ( 0.8) Φ( 1.6) = Φ(1.6) Φ(0.8) = 0.157 p 3 = P(99.8 X 100.0) = Φ(0) Φ( 0.8) = Φ(0) 1+Φ(0.8) = 0.288 p 4 = P(100.0 X 100.2) = p 3 = 0.288 p 5 = P(100.2 X 100.4) = p 2 = 0.157 p 6 = P(X 100.4) = p 1 = 0.055 Sedan kan vi beräkna antalet förväntade observationer i viktintervall i som 5p i och vi får resultatet Viktintervall Antal uppmätta resultat O i Förväntat antal E i = 5p i 0 99.6 5 6.875 99.6 99.8 20 19.625 99.8 100.0 34 36 100.0 100.2 38 36 100.2 100.4 22 19.625 100.4 6 6.875
Nu kan testvariabeln beräknas som TMSK17 Matematisk statistik sida 6 av 6 χ 2 = 6 (O i E i ) 2 E i=1 i = (5 6.875)2 6.875 + (20 19.625)2 19.625 +... (6 6.875)2 6.875 1.1395 Enligt tabell så skall vi förkasta H 0 : Mätningarna kommer från N(100,0.25) om χ 2 χ 2 0.05(5) = 11.070 vilket inte är uppfyllt här. Vi kan således acceptera hypotesen att mätningarna kommer från en N(100,0.25). Betygsgränser: 20-29 poäng ger betyg 3 30-39 poäng ger betyg 4 40-50 poäng ger betyg 5