Avd. Matematisk statistik TENTAMEN I SF1901, SF1905, SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 17:E AUGUSTI 2015 KL 8.00 13.00. Kursledare: Tatjana Pavlenko, 08-790 84 66 Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook (Beta), Hjälpreda för miniräknare, räknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 10 poäng. Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för tentander med, preliminärt, 22 23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Det ankommer på dig själv att ta reda på om du har rätt att komplettera. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Uppgift 1 a) En svart och en röd tärning kastas. Låt A vara händelsen att ögonsumman är 6 och B händelsen att den svarta tärningen visar 2 ögon. Undersök om A och B är oberoende eller ej. Noggrann motivering krävs. (5 p) b) För en viss region gäller följande: 20% av befolkningen är rökare. Sannolikheten att en rökare får lungcancer är 10 gånger så hög som att en icke-rökare får lungcancer. Antag att sannolikheten att få lungcancer för en slumpmässigt vald person är 0.006. Vad är då sannolikheten att en person får lungcancer givet att personen i fråga är rökare? (5 p) Uppgift 2 Erik får i uppgift att addera 120 tal, vardera med 10 decimaler. Av lathet bryr sig Erik dock inte om decimalerna vid additionen. Antag att decimaldelarna av de 120 talen kan uppfattas som likformigt fördelade på enhetsintervallet (0, 1) och dessutom oberoende av varandra. Låt X beteckna felet vid additionen som uppkommer på grund av strykningen av decimalerna (definierad så att X 0). Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p) Uppgift 3 Man har två observationer, x från X Exp(1/a), och y från Y Exp(2/a) där a > 0. X och Y är oberoende stokastiska variabler. a) Härled minsta kvadrat-skattningenskattningen a MK av parametern a. (3 p) b) Härled maximum likelihood-skattningen a ML av a. (3 p)
forts tentamen i SF1901, SF1905 2015-08-17 2 c) Undersök om skattningarna i a) och b) är väntevärdesriktiga. Undersök vidare vilken av a MK och a ML som är effektivast? Svaret skall motiveras. Om du inte har svarat på a) och b) så får du anta i del c) att a MK,obs. = 2x+y och a 2.5 ML,obs. = x+2y. (4 p) 2 Uppgift 4 I en veckotidning beskrivs en bantningskur som påstås ge en viktminskning av ungefär 7 kg på 14 dagar. En grupp på åtta personer bestämmer sig för att pröva kuren. Deras vikter (i kg) före och efter genomgången kur ges nedan: Före 108 88 82 103 98 100 90 85 Efter 110 85 78 101 91 99 90 82 Vikterna kan anses vara observationer av oberoende normalfördelade stokastiska variabler. Det är dock inte rimligt att anta att samtliga personer har samma förväntad vikt före kuren, eller att de har samma förväntad vikt efter kuren. a) Beräkna ett konfidensintervall av grad 95% för den förväntade viktminskningen efter genomgången kur. (7 p) b) Testa på signifikansnivån 5% hypotesen att den förväntade viktminskningen är 7 kg. Slutsatsen av testet skall klart framgå. (3 p) Uppgift 5 Inom medicinsk forskning används den så kallade VAS-skalan (Visuell Analog Skala) för att mäta smärta. Skalan är konstruerad som en 100 mm lång linje på vilken patienten får markera sin upplevda smärtnivå, varpå resultaten kan analyseras statistiskt. För att undersöka smärtnivån vid olika typer av kirurgi väljer en kirurg att dela upp VAS-skalan i tre kategorier: låg smärta ( 25) mm, acceptabel smärta 26-74 mm samt hög smärta ( 75) mm. Vidare valde kirurgen slumpmässigt ut 89 patienter vars smärta mättes 48 timmar efter en viss typ av operation. Av de 89 patienter som valdes ut i stickprovet var 42 som opererades med titthålskirurgi, och resten med traditionell kirurgi. Följande resultat erhölles. Låg smärta Accept. smärta Hög smärta Titthålskirurgi 13 23 6 Traditionell kirurgi 7 28 12 Kan man hävda att smärtnivå skiljer sig åt mellan olika typ av kirurgi? Svara på frågan med hjälp av ett lämpligt statistiskt test på nivån 5%. (10 p) Uppgift 6 Den naturliga bakgrundsstrålningen (uttryckt som antalet registrerade pulser per sekund, Bq) vid en viss mätpunkt har en intensitet av λ = 1 sek 1 och antalet registrerade pulser under ett tidsintervall (t 1, t 2 ) beskrivs med Poissonfördelning med väntevärde λ(t 2 t 1 ). På grund av en olycka i ett land misstänker man att intensiteten har ökat. a) Antag att man mäter under 15 sek och därvid registrerar 20 pulser. Pröva hypotesen H 0 : λ = 1 sek 1 med ett ensidigt test på nivån 5%. (2 p) b) Antag att intensiteten i själva verket har ökat till λ = 1.2 sek 1. Hur länge skall man mäta för att ha 50% chans att upptäcka detta om man gör ett approximativt test på nivån 5%. (8 p)
Avd. Matematisk statistik LÖSNINGSFÖRSLAG TENTAMEN I SF1901, SF1905, MATEMATISK STATISTIK. MÅNDAGEN DEN 17:E AUGUSTI 2015 KL 8.00 13.00 Uppgift 1 a) Vi har 36 möjliga utfall, vardera med sannolikheten 1/36. Ur figuren fås: P (A) = 5/36, P (B) = 6/36 = 1/6 och P (A B) = 1/36. Detta ger att P (A B) P (A) P (B), så A och B är inte oberoende. Svar: A och B är inte oberoende. b) Inför beteckningarna R = personen är rökare resp. C = personen får cancer. Enligt texten är P (R) = 0.2, P (C) = 0.006 och P (C R) = 10 P (C R ). Lagen om total sannolikhet ger P (C) = P (C R)P (R) + P (C R )P (R ) dvs 0.006 = P (C R) 0.2 + 1 P (C R) (1 0.2) = 0.28 P (C R) 10 och således Svar: P (C R) 0.021. P (C R) = 0.006 0.28 0.021. Uppgift 2 Strykningsfelen U 1, U 2,..., U 120 är oberoende och U(0, 1). Det totala felet X = 120 k=1 U k är enligt centrala gränsvärdessatsen approximativt normalfördelad med väntevärdet 120/2 = 60 och variansen 120/12 = 10. Härav Svar: P (X > 50) 0.999. P (X > 50) 1 Φ((50 60)/ 10) = Φ(3.16) = 0.999. Uppgift 3 För X Exp(1/a) har vi E(X) = a och respektive för Y Exp(2/a) är E(Y ) = a/2, se FSM, avsn. 4. a) MK-skattningen minimerar Q(a) = (x E(X)) 2 + (y E(Y )) 2 = (x a) 2 + (y a/2) 2. Med dq(a)/da = 2(x a) 2 1/2 (y a/2) får man minimum för a = (2x + y)/2.5. Svar: a MK,obs. = (2x + y)/2.5. b) Likelihoodfunktionen blir L(a) = 1 x 2 2y a e a a e a
forts tentamen i SF1901, SF1905 2015-08-17 2 som ger ln L(a) = 2 ln a + ln 2 x a 2y a. Med d ln L(a) da får man maximum för a = (x + 2y)/2. Svar: a ML,obs. = (x + 2y)/2. = 2 a + x a 2 + 2y a 2 = 0 c) Väntevärde och varians för Exp(λ) är 1/λ resp. 1/λ 2. Vi finner för MK-skattningen att ( ) 2X + Y 2a + a/2 E = = a. 2.5 2.5 För ML-skattningen har vi ( ) X + 2Y E 2 = a + 2a/2 2 = a, dvs både a MK och a ML är väntevärdesriktiga. Man finner vidare för MK-skattningen att ( ) 2X + Y V = X och Y är ober. = 1 ( 2a 2 2.5 2.5 2 + (a/2) 2) = 17 25 a2, och för ML-skattningen att ( ) X + 2Y V = 1 2 4 ( a 2 + 4(a/2) 2) = 17 25 a2 = a2 2. Svar: Både a MK och a ML är väntevärdesriktiga. Eftersom V (a MK ) > V (a ML ) så är a ML effektivast. Uppgift 4 a) Beteckna person nr. i:s vikt före resp. efter genomgången kur med x i resp. y i, för i = 1,..., 8. Vikterna är observationer av stokastiska variabler X 1,..., X 8 resp. Y 1,..., Y 8, och lämpliga modellantaganden är att X i N(µ i, σ 1 ) och Y i N(µ i, σ 2 ), för i = 1,..., 8, där är den förväntade viktminskningen, och alla parametrar är okända (modellen stickprov i par). Vi bildar de parvisa differenserna Z i = X i Y i, och motsvarande observerade värden z i = x i y i, för i = 1,..., 8. Då är z i en observation av Z i N(, σ z ), där σ z = σ 2 1 + σ 2 2. De observerade värdena z 1,..., z 8 är 2 3 4 2 7 1 0 3 Eftersom σ z är okänt så är I = z ± t α/2 (n 1) s z n ett konfidensintervall för av grad 1 α. I vårt fall gäller z = 2.25 s z = 2.7124 n = 8 t 0.025 (7) = 2.36 vilket ger I = 2.25 ± 2.36 2.7124 8 = 2.25 ± 2.26 = ( 0.01, 4.51).
forts tentamen i SF1901, SF1905 2015-08-17 3 Svar: I = ( 0.01, 4.51). b) Eftersom 7 / I, så måste denna hypotes förkastas på nivån 5%. Uppgift 5 Vi använder ett χ 2 -oberoendetest för att pröva nollhypotesen att smärtnivån är oberoende av typ av kirurgi. Låt p ij vara andelen av hela populationen av patienter som opererades med typ i av kirurgi (i = 1 för titthålskirurgi, i = 2 för traditionell kirurgi) som har upplevt typ j smärtnivån (j = 1 för låg smärta, och j = 2, 3 för acceptabel resp. hög smärta). Nollhypotesen H 0 är nu p ij = p i p j där p i är andelen av hela populationen av patienter som opererades med typ i av kirurgi, och p j är andelen av samma hela population som har upplevt smärtnivån j enligt ovan. Mothypotesen H 1 är p ij p i p j för något i och j. Vi får Teststorheten blir j = 1 j = 2 j = 3 Totalt i = 1 13 23 6 42 i = 2 7 28 12 47 Totalt 20 51 18 89 Q = + (13 42 20/89)2 (23 42 51/89)2 (6 42 18/89)2 + + 42 20/89 42 51/89 42 18/89 (7 47 20/89)2 (28 47 51/89)2 (12 47 18/89)2 + + 47 20/89 47 51/89 47 18/89 + = 4.02 Under H 0 är detta en observation från en χ 2 -fördelning med (2 1)(3 1) = 2 frihetsgrad, och vi skall förkasta H 0 för stora värden. Då χ 2 0.05(2) = 5.991 och 4.02 < 5.991 finns det inte stöd (på signifikansnivån 5%) för slutsatsen att det finns ett beroende mellan smärtnivån och typ av kirurgi. Det går också utmärkt att använda funktionen χ 2 -test på räknare, med det inre av tabellen ovan som indata. Vi får då teststorheten 4.02 som ovan, och p-värdet 0.059. Eftersom p-värdet är > 0.05 så kan vi inte förkasta nollhypotesen om oberoende på nivån 5%. Uppgift 6 Låt X(t) vara antalet registrerade pulser under (0, t), enligt uppgift är X(t) P o(λt). a) Vi vill testa H 0 : λ = 1 mot H 1 : λ > 1. Om H 0 är sann och t = 15 så är X(t) P o(15). x = 20 är en uttfall av X. Direktmetoden ger p-värde P (X > 20 om H 0 är sann) = P (X > 20 X P o(15)) = 1 P (X 19) = 1 0.8752 = 0.1248. Eftersom 0.1248 > α = 0.05 kan H 0 inte förkastas.
forts tentamen i SF1901, SF1905 2015-08-17 4 b) Normalapproximation ger X(t) N(λt, λt), approximativt. Om H 0 är sann så är X(t) N(t, t). Test: Förkasta H 0 om x(t) t t > λ 0.05 = 1.64. Styrkan för λ = 1.2 ges av 0.5 = h(1.2) = P (Förkasta H 0 om λ = 1.2) = P ) P (X(t) > t + λ 0.05 t λ = 1.2 = standardisera = P ( ) λ0.05 t 0.2t 1 Φ. 1.2t ( ) X(t) t > λ 0.05 λ = 1.2 = t ( X(t) 1.2t > λ ) 0.05 t + t 1.2t = 1.2t 1.2t Detta ger vidare vilket vi löser för t Vi får alltså t = 67.64 sek. ( ) λ0.05 t 0.2t 0.5 = 1 Φ, 1.2t λ 0.05 0.2t 1.2t = 0 t = λ 0.05 0.2.