Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2014-01-17 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 15.00 20.00 Lärare: Adam Jonsson, Mykola Shykula och Jesper Martinsson Jourhavande lärare: Adam Jonsson Tel: 0920-491948 Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in lösningar och bifogas oavsett om du lämnat in lösningar eller ej. Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 23 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (7)
Tentamen i Matematisk statistik, S0001M, del 1 2014-01-17 1. Antag att 4 % av alla personer i en population har en viss sjukdom. Sannolikheten att en sjuk person får eksem är 0.25. Motsvarande sannolikhet för en frisk person är 0.015. Man väljer slumpmässigt ut en person, som visar sig ha eksem. Vad är sannolikheten att den personen har sjukdomen? 2. Trots att Vera är duktig på att skriva maskin så händer det att hon gör feltryckningar. Antalet feltryck per sida är Poissonfördelat, där hon i genomsnitt gör 4.4 fel per sida. Bestäm sannolikheten att Vera gör högst 5 feltryck på en sida. 3. Stephanie kastar ett symmetriskt mynt om och om igen. Låt ξ beteckna numret på det kast som ger den första klaven. De möjliga värdena på ξ är alltså de positiva heltalen 1, 2, 3,.... Beräkna sannolikheten att Stephanie behöver göra minst 2 kast för att få en klave, dvs beräkna P (ξ 2). 4. Antag att ξ 1,..., ξ 10 är ett stickprov från N(0, 1). Beräkna sannolikheten att mer än 2 av dom 10 stickprovsvariablerna antar ett värde vars absolutbelopp är större än 1.96. (3p) 5. De kontinuerliga slumpvariablerna ξ 1, ξ 2, ξ 3 är oberoende och har alla frekvensfunktionen { 2x om 0 x 1, f(x) = 0 annars. Låt ξ = ξ 1 + ξ 2 + ξ 3. Bestäm väntevärdet E(ξ). 6. Livslängderna ξ 1,..., ξ 100 (enhet: timmar) för elektroniska komponenter av en viss typ är oberoende och Exponentialfördelade med väntevärdet 1 timme. Beräkna sannolikheten att den sammanlagda livslängden för de 100 komponenterna blir minst 80 timmar. (3p) 7. En läkare vill veta om svenska män har större underarmsmått på den dominanta sidan eller om måttet på höger och vänster sida i genomsnitt är detsamma. Hon hittar en undersökning av 12 män som genomförts av en kollega. Kollegan har dock inte noterat de faktiska mätvärdena, utan endast angivit (med +) om personens dominanta underarmsmått var större. Resultatet återges nedan: Man nr 1 2 3 4 5 6 7 8 9 10 11 12 Mätning + + - + + - - + + + - + Läkaren tycker att det är rimligt att använda antalet minus-tecken för att testa H 0 : ingen genomsnittlig skillnad H 1 : dominant sida är större i genomsnitt. 2 (7)
Tentamen i Matematisk statistik, S0001M, del 1 2014-01-17 Hon tillämpar beslutsregeln Förkasta H 0 om antalet minus-tecken är högst 2, och kan därmed inte påvisa att dominant sida är större i genomsnitt. Vilken signifikansnivå har det test som läkaren tillämpat? 8. En forskare vill testa H 0 : σ 1 = 2σ 2 mot H 1 : σ 1 2σ 2 på 5% risknivå, där σ 1 och σ 2 är standardavvikelserna i två populationer. En kollega till forskaren har kommit på en metod för att beräkna ett 95 % konfidensintervall I för parametern β = σ 1 /σ 2. Forskaren vill nu använda intervallet för att testa H 0 mot H 1. Hjälp forskaren att välja ett av följande: Förkasta H 0 om... a)... intervallet I inte innehåller 0. b)... intervallet I inte innehåller 1/2. c)... intervallet I inte innehåller 1. d)... intervallet I inte innehåller 2. e)... intervallet I inte innehåller β. 9. En geolog undersöker halterna av hur järn (enhet: mg/l) i skogsmark påverkas av ett visst gift. Geologen gör mätningar på sex angivna platser. Sedan behandlar hon var och en av dessa platser med miljögiftet och återkommer en dag senare för att undersöka om järnhalten förändrats. Järnhalterna som observerades följande: Plats # 1 2 3 4 5 6 Utan miljögift 14.21 13.08 13.92 10.63 24.86 16.69 Med miljögift 19.77 17.41 18.81 11.09 26.08 19.43 Beräkna ett 95% konfidensintervall för hur mycket större järnhalten i genomsnitt är då miljögift används under lämpliga normalfördelningsantaganden. Svara med den nedre gränsen. 10. Vid en amerikansk undersökning studerades hur livslängden, Y, hos ett skärverktyg på en svarv kunde relateras till svarvens maxhastighet, X 1, och till verktygstyp, X 2, där två olika verktygstyper A (X 2 = 0) och B (X 2 = 1) förekommer, samt samspelsvaribeln X 3 = X 1 X 2. Man gjorde 20 observationer på livslängden (enhet: timmar), maxhastigheten (enhet: 100 varv per minut) samt verktygstyp. Resultatet framgår av Tabell 1 nedan. Av särskilt intresse var att studera svarvar av typ A vars maxhastighet var 700 varv per minut. (a) Bestäm residualspridningen s e. (b) Hur stor är den genomsnittliga livslängden för svarvar av typ A vars maxhastighet är 700 varv per minut? Besvara frågan genom att ange ett lämpligt intervall med 95 % konfidensgrad. Svara med den övre gränsen. (1p) 3 (7)
Tentamen i Matematisk statistik, S0001M, del 1 2014-01-17 (c) För att avgöra om maxhastighetens effekt på livslängden beror på verktygstypen skall en t-kvot beräknas och sedan jämföras med ett visst tal. Vad är värdet på t-kvoten? Kan man på 10 % signifikansnivå påstå att maxhastighetens effekt beror på verktygstypen? För 2 poäng krävs både t-kvoten och rätt svar (ange JA eller NEJ på svarsbladet). Tabell 1: Regression Analysis: Livslangd versus Hastighet; Verktyg; Hastighet*Verktyg The regression equation is Livslangd = 32,8-2,10 Hastighet + 24,0 Verktyg - 1,19 Hastighet*Verktyg Predictor Coef SE Coef T P Constant 32,775 4,633?? Hastighet -2,0970 0,6074?? Verktyg 23,971 6,769?? Hastighet*Verktyg -1,1944 0,8842?? S =? R-Sq = 91,0 % R-Sq(adj) = 89,4% Analysis of Variance Source DF SS MS F P Regression?? 478,04 54,25 0,000 Residual Error? 140,98 8,81 Total 19 1575,09 Predicted Values for New Observations New Obs Fit SE Fit 95% CI 95% PI 1 18,096 0,981 (16,016; 20,175) (11,468; 24,723) Values of Predictors for New Observations New Obs Hastighet Verktyg Hastighet*Verktyg 1 7,00 0,000000 0,000000 Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 4 (7)
Tentamen i Matematisk statistik, S0001M, del 1 2014-01-17 Tabell för svar till del 1 Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter skall anges som ett tal mellan 0 och 1 i decimalform. Fråga Svar Poäng 1 Sannolikhet (två decimaler) 0.41 2 2 Sannolikhet (två decimaler) 0.72 2 3 Sannolikhet (två decimaler) 0.50 2 4 Sannolikhet (två decimaler) 0.01 3 5 Väntevärde (två decimaler) 2.00 2 6 Sannolikhet (tre decimaler) 0.977 (Φ(2)) 3 7 Signifikansnivå (tre decimaler) 0.019 2 8 a, b, c, d eller e d 2 9 Nedre gräns (två decimaler) 1.03 2 10 a Residualspridning (två decimaler) 2.97 2 b Övre gräns (tre decimaler) 20.175 1 c t-kvot (två decimaler) -1.35 (1.35 OK) JA eller NEJ NEJ 2 Totalt antal poäng 25 5 (7)
Tentamen i Matematisk statistik, S0001M, del 1 2014-01-17 6 (7)
Tentamen i Matematisk statistik, S0001M, del 2 2014-01-17 11. I uppgift 2 mötte vi Vera, som i snitt gjorde 4.4 feltryckta tecken per sida. Målet med denna uppgift är att motivera det fördelningsantagande som gjordes i uppgift 2 genom att använda vissa approximationsregler som ingår i kursen. (a) Vilka antaganden om Veras sätt att skriva maskin leder till att antalet feltryck per sida har Bin(n, p)-fördelning, där n är antalet tecken på en sida. (b) Varför borde antalet feltryck som Vera gör per sida åtminstone approximativt kunna beskrivas med Poissonfördelningen? Varför är normalfördelningen inte en lämplig modell för att beskriva antalet feltryckningar per sida? (8p) 12. Antag att du har ett observerat stickprov x 1,..., x n1 från N(µ 1, σ 1 ) och ett observerat stickprov y 1,..., y n2 från N(µ 2, σ 2 ), där µ 1, µ 2 är okända, σ 1, σ 2 är kända och där stickproven är oberoende. (a) Föreslå en skattning av µ 1 2µ 2. Ange skattningens fördelning. (b) Bestäm ett 90 % konfidensintervall för µ 1 2µ 2. (5p) (5p) 13. Tänk dig att du arbetar på ett mycket stort internationellt företag och att du fått i uppgift att undersöka om personalen arbetar önskvärt mycket. Att en person arbetar önskvärt mycket betyder att han eller hon arbetar minst 80 procent av sin arbetstid. I en undersökning visade sig 93 av 120 personer arbeta önsvärt mycket. Finns det anledning att tro att andelen anställda som arbetar önskvärt mycket är mindre än 80 procent? Tips: Direktmetoden. (10p) 7 (7)