Tentamentsskrivning: Matematisk statistik TMA32 Tentamentsskrivning i Matematisk statistik TMA32, 4.5 hp. Tid: Onsdag den 2 jan, 20 kl 4:00-8:00 Examinator och jour: Erik Broman, tel. 772-354, mob. 073 732079, MVhuset rum L3080. Hjälpmedel: valfri räknare, egenhändigt handskriven formelsamling (4 sidor på 2 blad A4) samt utdelade tabeller. Tentamen består av 8 frågor om sammanlagt 30 poäng. Preliminära betygsgränser är satta till: betyg 3: 2 till 7 poäng betyg 4: 8 till 23 poäng betyg 5: 24 eller er poäng.. (4 poäng) Avgör i följande fall om F (x) är en cdf. OBS Motivera ditt svar! a. F (x) = e x( x) för x 0 och 0 annars. b. F (x) = e x( x) för x 0 och 0 annars. c. F (x) = e x( x) för x och 0 annars. d. För vilka funktioner g(x) är F (x) = e g(x) en cdf? a. F (0) = > F (2) visar att det inte är en cdf. b. F (/2) = e /4 < 0 ger att det inte är en cdf. c. F () = 0, F (x) och F (x) = ( 2x)e x( x) 0 ger att F (x) är en cdf. d. Vi måste ha att lim x g(x) = 0, att lim x g(x) = och att g(x) är icke-avtagande. 2. (4 poäng) Låt A = [, 3] [, 2] och (X, Y ) vara likformigt fördelade på A. a. Vad är den gemensamma pdf:en f(x, y) för (X, Y )? b. Vad är marginalpdf:en f X (x) för X? Låt A vara samma som ovan men antag att den gemensamma pdf:en för (X, Y ) är f(x, y) = cxy då (x, y) A.
Tentamentsskrivning: Matematisk statistik TMA32 2 c. Bestäm c så att detta blir en cdf. d. Var är marginalpdf:en f X (x) för X? a. Vi har att f(x, y) =, för (x, y) A. 2 b. Vi har att f X (x) = 2 2 dy =, för x [, 3]. 2 c. Vi har att = 2 3 så att c = /6. d. Vi har att cxydxdy = c[x 2 /2] 3 [y 2 /2] 2 = c(2 /2)(9/2 /2) = c24 4, f X (x) = 2 cxydy = cx[y 2 /2] 2 = cx(2 /2) = 3 2 x = x 4 för x [, 3]. 3. (5 poäng) Betrakta följande pdf med två parametrar θ och x 0 f(x x 0, θ) = θx θ 0x θ, x x 0, θ >. Antag att oberoende samplingar X,..., X n tas från denna fördelning. a. Bestäm MME (method of moments estimate) skattaren för x 0 (uttryckt i θ). b. Bestäm MLE (maximum likelihood estimate) skattaren för θ. c. Antag att x 0 =. Låt Y = X, bestäm pdf:en (sannolikhetsfördelningen) för Y. 3.
Tentamentsskrivning: Matematisk statistik TMA32 3 a. Vi har: MME ger: ur vilket följer att [ x E[X] = θx θ 0xx θ dx = θx θ θ+ 0 x 0 θ ( ) = θx θ 0 0 x θ+ 0 = θx 0 θ θ. X = θ ˆx 0 θ, ˆx 0 = X(θ ). θ ] x 0 b. Vi har att f(x,..., X n x0, θ) = θ n x nθ 0 n i= X θ i {Xi x 0 } = {min(x,...,x n}) x 0 e n log θ e nθ log x0 e (+θ) n Om vi deriverar och sätter likamed 0, får vi: ur vilket följer att vår MLE blir: n = θ(n log x 0 ˆθ = n log X i ), i= n n i= log X i n log x 0. i= log Xi. c. Låt F X (x) vara cdf:en för X: Vi får: så att F X (x) = x θy θ dy = [ y θ ] x = x θ +, x. F Y (y) = P(Y y) = P(X y 2 ) = y 2θ, f Y (y) = F Y (y) = 2θy 2θ. 4. (3 poäng) I ett experiment uppmättes följande 2 datapunkter (x,y):
Tentamentsskrivning: Matematisk statistik TMA32 4 a. Plotta data i en gur. x : 0 5 20 25 30 35 y : 72 97 83 27 26 53 x : 40 45 50 55 60 65 y : 200 256 235 282 295 347 b. Använd minsta kvadratmetoden för att bestämma regressionslinjen y = b 0 + b x. Rita även in denna i din gur. c. Skulle du säga att ett linjärt samband är rimligt? Förklara utifrån resultaten i a och b. 4. a. Plotten ses i separat gur. och b. Vi använder oss av: b = 2 2 i= x iy i 2 i= x i 2 i= y i 2 2 i= x2 i ( 2 i= x i) 2 b 0 = Ȳ b X. Vi får att b 5.089 och b 0.2086, för plotten se separat gur. c. Från guren ses att ett linjärt samband är rimiligt, det är ungefär lika många punkter över som under linjen och positionen för avvikelserna är jämnt utspridda. 5. (4 poäng) Det snöar mycket i Sverige i år. För att ta reda på hur mycket det snöat i en ort i skåne mättes snödjupet på ertalet ställen nära orten. Då det knappt nns träd i skåne blåser snön omkring och bildar vallar och andra ojämnheter. Man bestämde sig därför för att avläsa djupet på 6 ställen, noga utmätt i ett rutnät på en åker. Man ck följande datamängd. mätställe 2 3 4 5 6 7 8 snödjup (cm): 5.5 23.3 23.9 24.5 8.7 2.8 5.2 28.6 mätställe 9 0 2 3 4 5 6 snödjup (cm): 6.4 24.6.5 6.7 25.5 30.4 8.8 32.6 De som utför mätningarna antar att de uppmätta snödjupen är oberoende och normalfördelade. a. Skatta µ och σ. b. Ge ett 95 % CI (kondensintervall) för din skattning av µ.
Tentamentsskrivning: Matematisk statistik TMA32 5 a. µ skattas med hjälp av X = 9.875 och σ 2 skattas med hjälp av s 2, där så att s 8.4465. s 2 = 5 6 i= (X i X) 2 7.3433. b. Vi har att T = X µ s X = X µ s/ 6 t 5. 6 prover är för få för att använda normalapproximation, därför blir vårt 95 % CI för µ: [ X s t α/2,5, X + s t α/2,5 ] 6 6 [9.875 8.4465 2.3/4, 9.875 + 8.4465 2.3/4] [5.375, 24.375]. Vilket är ett ganska så brett intervall. Variationerna är stora! 6. (3 poäng) En tärning kastas till första gången man inte får en sexa. Låt värdet på slumpvariablen X vara summan av alla tärningslag. (Om man t.ex. slår serien 6, 6, 5 får man att X = 7 och om man istället slog 3 första gången så blir X = 3.) a. Hitta fördelningarna för två oberoende slumpvariabler Z, R så att dessa uppfyller X = 6Z + R. b. Beräkna E[X]. c. Beräkna Var(X) a. Låt Z Geom(5/6) och R U({,..., 5}) där Z representerar antalet gånger man slår en sexa, medan R är värdet på det tärningsslag som inte är en sexa. b. Vi får att E[X] = 6E[Z] + E[R] = 6 6 5 + 3 = 5 5. c. Vi får att Vidare gäller att Var(X) = 36Var(Z) + Var(R). Var(Z) = /6 (5/6) 2 = 6 25
Tentamentsskrivning: Matematisk statistik TMA32 6 och Svaret blir därför Var(R) = E[(R 3) 2 ] = 5 5 (k 3) 2 = 0 5 = 2. k= Var(X) = 36 6 25 + 2 = 266 25. 7. (3 poäng) I en skidtävling deltar 4 svenskar, 4 norrmän, 3 nländare och en tysk. a. På hur många sätt kan de 2 deltagarna placeras i resultatlistan som individer? b. På hur många sätt kan de 2 deltagarna placeras i resultatlistan om vi enbart tar hänsyn till nationaliteterna? c. På hur många sätt kan de 2 deltagarna delas upp i två heat om sex personer vardera på ett sådant sätt att inga nationer har mer än två deltagare i något heat? a. 2! b. 2! 4!4!3! c. Det skall vara två svenskar och två norrmän i grupp, och dessa kan väljas på ( 4 2 2) sätt. De övriga två platserna kan fyllas på 3 + 3 = 6 (en tysk och en av tre nländare eller två av tre nländare) olika sätt. Sammanlagt får vi 6 6 6 = 26 sätt som vi kan välja deltagare till grupp. Om vi inte gör skillnad på grupp och grupp 2 får vi därför 08 olika sätt. 8. (4 poäng) I ett experiment undersöktes huruvida ett nytt läkemedel kunde användas som bromsmedicin mot HIV. I en preliminär studie med 6 patienter mättes antalet T-celler i blodprov vid två tillfällen med sex månaders mellanrum. patient nummer: 2 3 4 5 6 7 8 skillnad i antalet T-celler: 2 30 28 28 3 24 4 33 patient nummer: 9 0 2 3 4 5 6 skillnad i antalet T-celler: 0 2 5 6 6 6 8 23
Tentamentsskrivning: Matematisk statistik TMA32 7 a. Sätt upp ett hypotestest för att undersöka om läkemedlet har någon verkan. b. Välj signikansnivå 0.05, kan du förkasta din nollhypotes på denna nivå? c. Vad är p-värdet av ditt test? d. Diskutera huruvida experimentet är korrekt utfört, kan du hitta något att kritisera med upplägget? a. Vi tar H 0 : µ = 0 och H : µ 0 och låter X vara vår test-statistika. b. Då vi inte har någon information om fördelningen på data får vi anta att X är normalfördelat med µ = 0 (under H 0 ) och okänt σ X. Vi kan skatta σ X med s/ 6 där s 2 = 6 (X i 5 X) 2 343.33, i= så att s 8.5 och därmed σ X 4.6255. Vidare gäller att mätdata gav ett värde på X som var 9.0625. Därför får vi att P( X/σ X 9.0625/4.6255) 2P(Z.9592) = 0.05, så det är precis på gränsen. c. p-värdet är 0.05. d. Testet har väldigt få deltagare och dessutom tar det inte hänsyn till vad som hade hänt om man inte gav medicinen. Man måste ha med en kontrollgrupp som får placebo.