Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2013-10-29 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Mykola Shykula och Jesper Martinsson Jourhavande lärare: Mykola Shykula Tel: 0920-493056 Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in lösningar och bifogas oavsett om du lämnat in lösningar eller ej. Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 23 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (8)
1. Man har en viss dag observerat en grupp på 26 studenter och upptäckt att 12 stycken har jeans, 11 har gymnastikskor och 1 har både gymnastikskor och jeans. Vad är sannolikheten att en slumpmässigt vald student i gruppen vare sig har gymnastikskor eller jeans? 2. Antag att 5 % av alla bilförare kör berusat. Sannolikheten att en berusad person somnar under bilkörningen kan sägas vara 25 %. Motsvarande sannolikhet för en nykter person är 1 %. En olycka inträffar, och det konstateras att bilföraren somnat vid ratten. Vad är sannolikheten att den personen var berusad? 3. Slumpvariablerna ξ 1 och ξ 2 är oberoende och har samma fördelning. Fördelningen definieras av tabellen nedan. x 0 1 2 3 P (ξ i = x) 0.1 0.25 0.25 0.4 Låt ξ = ξ 1 + ξ 2. Beräkna sannolikheten P (ξ = 1). 4. Antag att du har ett stickprov av storlek 14 från en kontinuerlig fördelning och att medianen m i fördelningen är lika med 0.65. Beräkna sannolikheten att minst 8 av dom 14 stickprovsvärdena tar ett värde som är större än m. (3p) 5. En varuhiss har konstruerats för transport av partier som består av tre olika sorters enheter. Vikten (i kilo) för enheter av de tre sorterna kan antas vara oberoende och fördelade enligt N(110, 7), N(170, 12) respektive N(190, 18). Antag att hissen har en maxkapacitet på 520 kilo. Hur stor andel (i procent) av partierna klarar hissen av att transportera i det långa loppet? (3p) 6. Livslängden för en viss typ av lysrör har Exponentialfördelning med väntevärdet 250 timmar. Man vill ange en tid sådan att röret håller i minst T timmar med sannolikhet 0.99. Bestäm denna tid T. 7. Ett nordiskt land ska skicka 20 hjälparbetare till Laos. Först ska dom lära sig språket laotiska. Personerna delas slumpmässigt in i två grupper om 10 individer. Under 3 månader får personerna i den ena gruppen lära sig laotiska enligt A-metoden. Personerna i den andra gruppen lär sig under samma tid laotiska enligt B-metoden. Efter avslutad språkkurs genomförs ett gemensamt prov, som gav följande resultat: Person # 1 2 3 4 5 6 7 8 9 10 Metod A 65 57 74 43 39 87 62 69 70 73 Metod B 85 97 92 98 90 88 75 72 60 93 2 (8)
En Minitab analys gav medelvärden och stickprovsstandardavvikelser: Descriptive Statistics: Metod A; Metod B Variable N Mean StDev Metod A 10 63,90 14,49 Metod B 10 85,00 12,27 Antag att man vill undersöka om metod B är effektivare än metod A. Beräkna ett 95% konfidensintervall för den genomsnittliga resultatskillnaden mellan metod A och B (metod A - metod B) under lämpliga normalfördelnings antaganden. Svara med den nedre gränsen. 8. Antag att du har ett stickprov ξ 1,..., ξ 8 från N(µ, 1.7). För att genomföra ett test av H 0 : µ = 3 mot H 1 : µ = 4 så skall du utgå från medelvärdet ξ. Om ditt test skall ha 1 % signifikansnivå, vad blir då det kritiska värdet? 9. En rysk forskare mäter radioaktiv strålning på en viss plats. Antalet pulser som forskarens Geiger-Muller-rör registrerar under ett dygn är P o(λ)-fördelat. Konstanten λ, som är okänd, ger samhällsviktig information. För att testa H 0 : λ = 5 mot H 1 : λ > 5 räknar forskaren antalet pulser under ett dygn och förkastar H 0 om minst 9 pulser registreras. Beräkna testets styrka då λ = 10. 10. Vid en amerikansk undersökning studerades hur livslängden, Y, hos ett skärverktyg på en svarv kunde relateras till svarvens hastighet, X 1, och till verktygstyp, X 2, där två olika verktygstyper A (X 2 = 0) och B (X 2 = 1) förekommer. Man gjorde 20 observationer på livslängden (enhet: timmar), svarvhastigheten (enhet: 100 varv per minut) samt verktygstyp. Resultatet framgår av Tabell 1 nedan. (a) Bestäm den justerade förklaringsgraden. (1p) (b) Hur mycket ändras livslängden i genomsnitt om maxhastigheten ökar med 1 enhet? Besvara frågan genom att beräkna ett lämpligt 99 % konfidensintervall. Ange den nedre gränsen. (c) För att avgöra om verktygstypen har en genomsnittlig effekt på livslängden skall en t-kvot beräknas och sedan jämföras med ett visst tal. Vad är värdet på t-kvoten? Kan man påstå på 10 % signifikans nivå att verktygstypen har en genomsnittlig effekt på livslängden? För 2 poäng krävs både t-kvoten och rätt svar (ange JA eller NEJ på svarsbladet). Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 3 (8)
Tabell 1: Regression Analysis: Livslangd versus Hastighet; Verktyg Regression Analysis: Livslangd versus Hastighet; Verktyg The regression equation is Livslangd = 37,0-2,66 Hastighet + 15,0 Verktyg Predictor Coef SE Coef T P Constant 36,986 3,510? 0.000 Hastighet -2,6607 0,4520? 0.000 Verktyg 15,004 1,360? 0.000 S = 3,03949 R-Sq = 90,0% R-Sq(adj) =? Analysis of Variance Source DF SS MS F P Regression 2 1418,03??? Residual Error 17 157,05? Total?? 4 (8)
Tabell för svar till del 1 Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter skall anges som ett tal mellan 0 och 1 i decimalform. Fråga Svar Poäng 1 Sannolikhet (tre decimaler) 0.154 2 2 Sannolikhet (tre decimaler) 0.568 2 3 Sannolikhet (tre decimaler) 0.050 2 4 Sannolikhet (tre decimaler) 0.395 3 5 Procent (en decimal) 98.6 3 6 Tiden T (en decimal) 2.5 2 7 Nedre gräns (tre decimaler) -33.715 2 8 Kritiska värdet k (fyra decimaler) 4.3982 2 9 Styrka (fyra decimaler) 0.6672 2 10 a Justerad förklaringsgrad i procent (en decimal) 88.8 1 b Nedre gräns (två decimaler) -3.97 2 c t-kvot (fyra decimaler) 11.0324 JA eller NEJ JA 2 Totalt antal poäng 25 5 (8)
6 (8)
Tentamen i Matematisk statistik, S0001M, del 2 2013-10-29 Vid bedömningen av lösningarna av uppgifterna i del 2 läggs stor vikt vid hur lösningarna är motiverade och redovisade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden. 11. En partikel utför slumpvandring på heltalen. Partikeln startar på talet 0 och hoppar sedan ett steg (av längd 1) varje sekund. Hoppet görs i negativ respektive positiv riktning med sannolikhet 0.5. Vad är sannolikheten att partikeln efter en timmes slumpvandring befinner sig i spannet från -120 till 120? Lösningsskiss Låt ξ beteckna partikelns position efter t = 3600 s. Det gäller att ξ = 3600 j=1 ξ j, där ξ j tar värdena -1 och 1 med sannolikhet 0.5 och där ξ 1, ξ 2,... är oberoende slumpvariabler. Direkt uträkning från definitionen av väntevärde och varians för diskreta fördelningar ger E(ξ j ) = 0 och V (ξ j ) = 1, så t j=1 ξ j N(0, t), approximativt, enl. centrala gränsvärdessatsen. Alltså har vi ξ = 3600 j=1 ξ j N(0, 60), approximativt, vilket ger att den sökta sannolikheten är ca 0.95. (10p) 12. Antag att ξ 1, ξ 2,..., ξ 10 är ett stickprov från N(, 0.2), där är okänd, och att man vill testa H 0 : = 0 mot H 1 : > 0. Ingenjören Kaj använder beslutsregeln: Förkasta H 0 om minst 9 av variablerna i stickprovet är större än 0. (a) Bestäm styrkan för Kajs test då = 0.1. (b) Kaj undrar om man inte skulle kunna använda en beslutsregel som ger en högre styrka än testet i (a). Föreslå ett nytt test, dvs en ny beslutsregel, som också baseras på stickprovet ξ 1, ξ 2,..., ξ 10 och som likt testet i (a) har en signifikansnivå på 1%. För full poäng skall du förutom att definiera det nya testet antingen visa att ditt test har högre styrka eller ge en förklaring till varför dess styrka borde vara högre. (6p) (6p) Lösningsskiss (a) Då = 0.1 har vi P (ξ i > 0) = 0.691... och antalet positiva variabkler i stickprovet är Bin(10, 0.691... ). Det ger att styrkan P (minst nio positiva värden = 0.1) = 0.136. (b) Eftersom stickprovet kommer från en normalfördelning borde Kaj utgå från medelvärdet ξ och använda beslutsregeln: Förkasta H 0 om ξ k, där k = λ 0.01 σ/ 10 = 0.147 bestäms av signifikansnivån. Detta test har högre styrka än testet i (a). (T.ex. har vi P ( ξ k = 0.1) = 0.228.) Det beror på att medelvärdet är den bästa skattningen av väntevärdet då vi har normalfördelat data. 13. Vi fortsätter med problemet med skärverktyg från del 1. Man ville undersöka om maxhastighetens effekt på livslängden kan sägas bero på verktygstypen. Beskriv ett tillvägagångssätt för att undersöka detta. 7 (8)
Tentamen i Matematisk statistik, S0001M, del 2 2013-10-29 Ange modellantagandet för den analys som du föreslår samt lämpliga hypoteser. Lösningsskiss Vi inför X 3 = X 1 X 2 och betraktar modellen (8p) Y i = β 0 + β 1 X 1,i + β 2 X 2,i + β 3 X 3,i + ε i, i = 1, 2,..., n, där ε 1, ε 2... är oberoende och N(0, σ)-fördelade. Då har vi β 0 + β 1 X 1 om X 2 = 0, E(Y ) = β 0 + β 2 + (β 1 + β 3 )X 1 om X 2 = 1. så maxhastighetens effekt på livslängden är β 1 förverktygs typ 0 och β 1 +β 3 för verktygstyp 1. För att se om effekten beror av verktygstypen skall vi alltså testa om β 3 0, dvs om variabeln X 3 ska vara med i modellen. Detta görs genom att analysera modellen och genomföra t-testet av H 0 : β 3 = 0 mot H 1 : β 3 0. 8 (8)