Tentamen i Matematisk statistik Kurskod S0001M



Relevanta dokument
Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Kompletterande kursmaterial till kursen Matematisk statistik.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Matematisk statistik Kurskod S0001M

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Tentamen i Matematisk statistik Kurskod S0001M

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Matematisk statistik, Föreläsning 5

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Läs noggrant informationen nedan innan du börjar skriva tentamen

, s a. , s b. personer från Alingsås och n b

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Stockholms Universitet Statistiska institutionen Termeh Shafie

TVM-Matematik Adam Jonsson

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

LABORATION 3 - Regressionsanalys

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

tentaplugg.nu av studenter för studenter

Läs noggrant informationen nedan innan du börjar skriva tentamen

LABORATION 3 - Regressionsanalys

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Statistisk undersökningsmetodik (Pol. kand.)

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

TENTAMEN I MATEMATISK STATISTIK

Uppgift a b c d e Vet inte Poäng

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Metod och teori. Statistik för naturvetare Umeå universitet

Tentamen i Matematisk statistik Kurskod S0001M

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

F3 Introduktion Stickprov

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

Tentamen i matematisk statistik

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

TENTAMEN I STATISTIKENS GRUNDER 2

0 om x < 0, F X (x) = c x. 1 om x 2.

Resultatet anslås senast 10 juni på institutionens anslagstavla samt på kurshemsidan.

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Statistisk försöksplanering

Avd. Matematisk statistik

Transkript:

Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (6 uppgifter) Tentamensdatum 2010-06-04 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Ove Edlund Adam Jonsson Mikael Stenlund Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik, Kursmaterialet Vännman: Regressionsanalys, Kursmaterialet Några ofta förekommande fördelningar, Tabeller Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, ska enbart svar lämnas in, men lösningar får bifogas. Observera dock att dessa kommer ej att bedömas utan enbart användas vid gränsfall för att avgöra om någon uppgift kan rättas upp på grund av slarvfel. På del 1 ges inga delpoäng på uppgifterna. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Detta blad måste lämnas in. Lägg detta blad först bland lösningarna. Om inte det ifyllda svarsbladet har lämnats in så bedöms tentamen som underkänd. För godkänt krävs minst 19 poäng på del 1. Med 4 extrapoäng från laborationerna och KGB så räcker det med 15 poäng av de 25 möjliga för godkänt. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 23 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för uppgifterna 7, 8 eller 9. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (10)

Tentamen i Matematisk statistik, S0001M, del 1 2010-06-04 1. En bilverkstad har kommit fram till att bilar av ett visst märke kan ha följande motorfel. Feltyp A är trasigt spjäll. Feltyp B som är fel i elektroniken för motorstyrning. Sannolikheten att en slumpmässigt vald bil har feltyp A resp. B är 0.6 och 0.3. Sannolikheten att en bil har feltyp A, men ej feltyp B är 0.36. (a) Beräkna sannolikheten att en slumpmässigt vald bil av märket i fråga har båda feltyperna. (b) Feltyp C, fel i elektroniken för bromssystemet, är oberoende av feltyp A. Sannolikheten att en bil har både feltyp C och feltyp A är 0.24 medan sannolikheten att en bil har både feltyp C och feltyp B är 0.28. Givet att en slumpmässigt vald bil har fel i elektroniken för bromssystemet, vad är sannolikheten att elektroniken för motorstyrning är inte fungerar? 2. En viss typ av lysrör har en Exp(10 4 )-fördelad livslängd, dvs den förväntade livslängden är 10000 timmar. Beräkna sannolikheten att 2 eller fler lysrör i en förpackning av 3 rör lyser mer än 10000 timmar. 3. Den stokastiska variabeln ξ representerar tidsåtgången för att tillverka en viss enhet i en fabrik. Frekvensfunktion för ξ ges av där c är en konstant. f(x) = { cx 2, 0 x 3 0 för övrigt, (a) Bestäm c. (b) Beräkna sannolikheten att det tar mellan 1 och 2 minuter att tillverka en enhet av den aktuella typen. (1p) 4. Eva har sedan länge ägnat sin fritid åt att handla med aktier. Hon är duktig, så hennes förväntade vinst (enghet: kr) per dag är positiv. Med hjälp av Normalfördelningsdiagram, som hon lärt sig använda när hon läste matematisk statistik, och uppgifter om sina vinster det senaste året drar Eva slutsatsen att vinsterna de olika dagarna kan betraktas vara observationer på oberoende normalfördelade stokastiska variabler med väntevärde µ = 225 och standardavvikelse σ = 155. Vinsten kan alltså vara negativ, vilket tolkas som att hon då gör en förlust. Anmärkning: (a),(b),(c) och (d) nedan bygger inte på varandra. (a) Beräkna sannolikheten att Evas totala vinst under en arbetsvecka, som består av fem dagar, blir minst 1500 kr. (b) Eva vill övertyga sin vän Anna om att hon i långa loppet gör en vinst 90 procent av alla dagar. Hjälp Eva att beräkna det tal a för vilket gäller att vinsten i långa loppet är större än a under 90 procent av alla dagar. (Om du räknat rätt så kommer ditt värde på a att vara positivt, vilket ger stöd åt Evas påstående.) 2 (10)

Tentamen i Matematisk statistik, S0001M, del 1 2010-06-04 (c) Med hjälp av Normalfördelningstabellen i Evas gamla kursbok beräknar hon enkelt att sannolikheten att göra en vinst på minst 200 kronor under en dag till 0.564. Eva vill veta standardavvilkelsen σ för andelen 1 5 η dagar under en arbetsvecka som vinsten är minst 200, där η är antalet dagar med en vinst på minst 200. Eva inser att η är Binomialfördelad, men hon fastnar när hon skall beräkna standardavvikelsen för andelen. Bestäm σ. (d) Evas vän Anna går med på att betrakta Evas vinster som normalfördelade, men tror att väntevärdet µ är mindre än 225. Anna tror inte heller att standardavvikelsen σ är lika med 155 utan betraktar den som okänd. För att testa sin hypotes så bestämmer Anna sig för att beräkna Evas vinster under fem dagar och sedan förkasta sin nollhypotes om värdet på testvariabeln x 225 s/ 5 är mindre än 4.6, där s är stickprovsstandardavvikelsen. Bestäm sannolikheten att Anna kommer att förkasta nollhypotesen trots att Eva har rätt, dvs om µ i själva verket är lika med 225. 5. Två barnläkare har sina mottagningar i olika stadsdelar. Stadsdel 1 är ett utpräglat villaområde medan bostäderna i stadsdel 2 i huvudsak är flerfamiljshus. Alla barn i staden genomgår en särskild undersökning, som äger rum när barnen är ungefär ett år gamla. På grund av diverse slumpartade skäl, är inte alla barn exakt lika gamla vid undersökningen. De båda läkarna vill ta reda på om barn i den ena stadsdelen generellt sett blir undersökta vid lägre ålder än i den andra. Under en månads tid noterar läkarna åldern på de barn som undersöks. Det råkar bli 8 barn hos läkare nummer ett och 7 barn hos läkare nummer två, och deras åldrar är (enhet: månader) Läkare 1 12.2 13 11.5 14.4 10.8 11.4 10 11.5 Läkare 2 8.2 8 9.7 9.3 8.9 12 8.7 Stickprovens observerade medelvärden och standardavvikelser beräknas till: Medelvärde observerad standardavvikelse Läkare 1 11.850 1.359 Läkare 2 9.257 1.345 Antag att stickproven kommer från normalfördelningar. (a) Beräkna ett konfidensintervall för den genomsnittliga åldern för barn som undersöks av läkare 2. Använd 99 procents konfidensgrad. Ange intervallets övre ändpunkt. För att genomföra ett tvåsidigt hypotestest av H 0 :''ingen genomsnittlig åldersskillnad'' på en procents signifikansnivå så kan man beräkna ett 99 procentigt konfidensintervall för den genomsnittliga ålderskillnaden mellan barn som undersöks av läkare 1 och läkare 2 och förkasta nollhypotesen om intervallet inte täcker noll. (1p) 3 (10)

Tentamen i Matematisk statistik, S0001M, del 1 2010-06-04 (b) Beräkna ett 99 procentigt konfidensintervall för den genomsnittliga ålderskillnaden mellan barn som undersöks av läkare 1 resp. läkare 2. Ange intervallets nedre ändpunkt. Ange även om nollhypotesen skall förkastas om man använder beslutsregeln ovan. För 2p krävs rätt värde och rätt slutsats. 6. I en amerikansk undersökning mättes under 1951 1953 hur glasskonsumtionen påverkades av pris, temperatur och inkomst. Varje mätresultat är en sammanställning av glassförsäljningen under fyra veckor i enheten pint/person, medelpriset för glass i dollar/pint, medeltemperaturen i F, och veckomedelinkomsten i dollar per hushåll, under respektive period. Totalt består datamaterialet av 30 mätresultat. Regressionsanalysen på datamaterialet ges i minitabutskriften i tabell 1, med vissa borttagna kvantiteter. (a) Bestäm residualspridningen s e. (b) Bestäm den justerade förklaringsgraden R 2 a. (c) För att testa om glasspriset har inverkan på glassförsäljningen jämförs en t-kvot med ett värde från t-fördelningstabellen. Bestäm denna t-kvot. Svara med tre decimaler. (d) Bestäm ett 95 % konfidensintervall för koefficienten för den genomsnittliga ökningen av glasskonsumtionen (IC) då temperaturen (temp) ökas med en enhet. Redovisa den undre gränsen. (1p) (1p) (1p) Tabell 1: Regression Analysis: IC versus price; temp; income The regression equation is IC = 0,197-1,04 price + 0,00346 temp + 0,00331 income Predictor Coef SE Coef T P Constant 0,1973 0,2702?? price -1,0444 0,8344?? temp 0,0034584 0,0004455?? income 0,003308 0,001171?? S =? R-Sq =? R-Sq(adj) =? Analysis of Variance Source DF SS MS F P Regression? 0,090251 0,030084 Residual Error? 0,035273 0,001357 Total? 0,125523 Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 4 (10)

Tentamen i Matematisk statistik, S0001M, del 1 2010-06-04 Tabell för svar till del 1 Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:........................................................... Fråga Svar Poäng 1 a Sannolikhet 24.0 % 2 (procent, en decimal) b Sannolikhet 70.0 % 2 (procent, en decimal) 2 Sannolikhet 30.6 % 2 (procent, en decimal) 3 a c (två decimaler) 0.11 1 b Sannolikhet 25.9 % 2 (procent, en decimal) 4 a Sannolikhet 14.01 % 2 (procent, två decimaler) b a (en decimal) 26.4 2 c Standardavvikelse (två decimaler) d Sannolikhet (procent, en decimal) 5 a Övre gräns (två decimaler) b Undre gräns (två decimaler) 0.22 2 0.5 % 2 11.15 1 0.48 Ja eller nej Ja 2 6 a Residualspridning 0.0368 1 (fyra decimaler) b Ra 2 68.66 % 1 (procent, två decimaler) c t-kvot (tre decimaler) -1.252 1 d Undre gräns 0.0025 2 (fyra decimaler) Totalt antal poäng 25 5 (10)

Tentamen i Matematisk statistik, S0001M, del 1 2010-06-04 6 (10)

Tentamen i Matematisk statistik, S0001M, del 2 2010-06-04 Vid bedömningen av lösningarna av uppgifterna i del 2 läggs stor vikt vid hur lösningarna är motiverade och redovisade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden. 7. En dag i september 2009 erbjöds alla som åt lunch i Centrumrestaurangen på Luleå tekniska universitet att spela ett spel. Spelet gick till på följande sätt: två sexsidigar tärningar kastades, och man vann om tärningarna visade samma antal prickar. Vinst på spelet innebar att man slapp betala sin lunch, som kostade 55 kr. Man räknade med att 600 personer skulle äta på lunch på restaurangen den aktuella dagen. Budgetansvarig var intresserad av att veta hur stor kostnaden för förlorad intäkt högst skulle bli. Beräkna K så att kostnaden är högst K med 90 procents säkerhet. Välmotiverade approximationer godtas. (10p) 8. I en fabrik har man ett kvalitetskrav för produktionen som säger att andelen defekta enheter som en maskin producerar inte får överstiga 0.02 i det långa loppet. Man misstänker att en viss maskin inte uppfyller kravet, och som anställd får du i uppgift att konstruera en statistisk metod som baserat på ett stickprov om 18 producerade enheter skall upptäcka om maskinen inte uppfyller kvalitetskravet. (a) Formulera ett lämpligt hypotestest. Inför lämpliga beteckningar och motivera de fördelningsantaganden som du gör. Hypoteser, testvariabel samt beslutsregel skall tydligt framgå. Välj beslutsregeln så att testet får en signifikansnivå som ligger så nära fem procent som möjligt. (b) Beräkna styrkan för ditt test i det fall att andelen felaktiga enheter i det långa loppet är lika med 0.04. Kommentera resultatet. (c) Att undersöka producerade enheter är billigt, medan det i slutändan blir kostsamt för företaget om maskinen producerar för många defekta enheter. För att få ett test med bättre statistiska egenskaper, dvs ett test som med större sannolikhet upptäcker om maskinen inte uppfyller kvalitetskravet, föreslår en kvalitetskonsult att du skall basera ditt test på 350 undersöka enheter. Bestäm det nya testet, även i detta fall med en signifikansnivå som ligger så nära fem procent som möjligt. Beräkna testets styrka då andelen felaktiga enheter (i det långa loppet) är lika med 0.04. Jämför det nya testet med testet från (a). Kommentera. (4p) (4p) För full poäng på deluppgift (c) skall Poissonfördelningen användas för att förenka beräkningarna. 9. I en artikel i Journal of the American Medical Association 1 undersöks bl.a. om människokroppens normala temperatur verkligen är 37 C (i artikeln 98.6 F). Datamaterialet består av noggranna mätningar av slumpvis utvalda personers kroppstemperatur. Kroppstemperaturerna är här uttryckta i C, och presenteras i tabell 2. 1 Mackowiak, P. A., Wasserman, S. S., and Levine, M. M. (1992), A Critical Appraisal of 98.6 Degrees F, the Upper Limit of the Normal Body Temperature, and Other Legacies of Carl Reinhold August Wunderlich, Journal of the American Medical Association, 268, 1578-1580. 7 (10)

Tentamen i Matematisk statistik, S0001M, del 2 2010-06-04 (a) Bestäm ett 99 % konfindensintervall för den förväntade kroppstemperaturen under normalfördelningsantagande, och tolka resultatet. Var noga med att formulera modellantagandet. Medelvärde och skattad standardavvikelse för kroppstemperaturen för datamaterialet beräknas i Minitab till x = 36.805 och s = 0.40724. Till din hjälp i denna deluppgift, och de efterföljande, har du också tabell 3 med t-fördelningsvärden vid speciella frihetsgrader. (2 p) Tabell 2: Kroppstemperatur och vilopuls för 65 män (kodade 0 ) och 65 kvinnor (kodade 1 ). C puls kön C puls kön C puls kön C puls kön C puls kön 35.72 70 0 35.94 71 0 36.06 74 0 36.11 80 0 36.17 73 0 36.17 75 0 36.17 82 0 36.22 64 0 36.28 69 0 36.33 70 0 36.33 68 0 36.33 72 0 36.33 78 0 36.39 70 0 36.39 75 0 36.44 74 0 36.44 69 0 36.44 73 0 36.5 77 0 36.56 58 0 36.56 73 0 36.56 65 0 36.56 74 0 36.61 76 0 36.61 72 0 36.67 78 0 36.67 71 0 36.67 74 0 36.67 67 0 36.67 64 0 36.67 78 0 36.72 73 0 36.72 67 0 36.78 66 0 36.78 64 0 36.78 71 0 36.78 72 0 36.83 86 0 36.83 72 0 36.89 68 0 36.89 70 0 36.89 82 0 36.89 84 0 36.94 68 0 36.94 71 0 37 77 0 37 78 0 37 83 0 37 66 0 37 70 0 37 82 0 37.06 73 0 37.06 78 0 37.11 78 0 37.11 81 0 37.11 78 0 37.17 80 0 37.22 75 0 37.22 79 0 37.22 81 0 37.28 71 0 37.33 83 0 37.39 63 0 37.44 70 0 37.5 75 0 35.78 69 1 35.94 62 1 36 75 1 36.22 66 1 36.22 68 1 36.33 57 1 36.44 61 1 36.5 84 1 36.5 61 1 36.56 77 1 36.56 62 1 36.56 71 1 36.61 68 1 36.61 69 1 36.61 79 1 36.67 76 1 36.67 87 1 36.67 78 1 36.67 73 1 36.67 89 1 36.72 81 1 36.78 73 1 36.78 64 1 36.78 65 1 36.78 73 1 36.78 69 1 36.78 57 1 36.83 79 1 36.83 78 1 36.83 80 1 36.89 79 1 36.89 81 1 36.89 73 1 36.89 74 1 36.89 84 1 36.94 83 1 37 82 1 37 85 1 37 86 1 37 77 1 37.06 72 1 37.06 79 1 37.06 59 1 37.06 64 1 37.06 65 1 37.06 82 1 37.11 64 1 37.11 70 1 37.11 83 1 37.11 89 1 37.11 69 1 37.11 73 1 37.11 84 1 37.17 76 1 37.22 79 1 37.22 81 1 37.28 80 1 37.28 74 1 37.33 77 1 37.33 66 1 37.39 68 1 37.44 77 1 37.72 79 1 37.78 78 1 38.22 77 1 Tabell 3: t-fördelningen vid speciella frihetsgrader Tabellen ger det x-värde för vilket P (ξ > x) = α givet antalet frihetsgrader f. α f 0.1 0.05 0.025 0.01 0.005 0.001 0.0005 125 1.2884 1.6571 1.9791 2.3565 2.6157 3.1567 3.3701 126 1.2883 1.6570 1.9790 2.3563 2.6154 3.1562 3.3694 127 1.2883 1.6569 1.9788 2.3561 2.6151 3.1556 3.3688 128 1.2882 1.6568 1.9787 2.3558 2.6148 3.1551 3.3682 129 1.2881 1.6568 1.9785 2.3556 2.6145 3.1546 3.3675 130 1.2881 1.6567 1.9784 2.3554 2.6142 3.1541 3.3669 8 (10)

Tentamen i Matematisk statistik, S0001M, del 2 2010-06-04 (b) I datamaterialet i tabell 2 finns uppgifter om vilopulsen för varje person i undersökningen. För att undersöka om kroppstemperaturen beror av vilopulsen, görs en regressionsanalys i Minitab enligt tabell 4 och figur 1. Redovisa modellantagande och de slutsatser du drar ifrån tabell och grafer, med motiveringar. Som en del i din undersökning ska du finna ett 95 % konfidensintervall för den genomsnittliga ökningen av temperatuern då vilopulsen ökas med en enhet. (4 p) Tabell 4: Regression Analysis: tempc versus heartrate The regression equation is tempc = 35,7 + 0,0146 heartrate Predictor Coef SE Coef T P Constant 35,7282 0,3654 97,79 0,000 heartrate 0,014604 0,004931 2,96 0,004 S = 0,395505 R-Sq = 6,4% R-Sq(adj) = 5,7% Analysis of Variance Source DF SS MS F P Regression? 1,3722 1,3722 8,77 0,004 Residual Error? 20,0223 0,1564 Total? 21,3944 Figur 1: Grafer vid regressionanalysen med vilopulsen som förklarande variabel. 9 (10)

Tentamen i Matematisk statistik, S0001M, del 2 2010-06-04 (c) För att besvara frågan om könet påverkar hur temperaturen beror av vilopulsen, så införs en dummyvariabel för könet, som är 0 för män och 1 för kvinnor, samt en samspelsvariabel som är produkten av vilopulsen och könet. Regressionsanalysen från Minitab med dessa förklarande variabler redovisas i tabell 5 och figur 2. Redovisa två skattade regressionslinjer, en för varje kön, samt undersök om riktningskoefficienterna för de linjer som skattas är signifikant skilda från varandra på 5 % signifikansnivå. Redovisa också modellantagande och de slutsatser du drar ifrån tabell och grafer, med motiveringar. (4 p) Tabell 5: Regression Analysis: tempc versus heartrate; gender; gender*heartrate The regression equation is tempc = 35,8 + 0,0129 heartrate + 0,022 gender + 0,0017 gender*heartrate Predictor Coef SE Coef T P Constant 35,7803 0,6127?? heartrate 0,012875 0,008325?? gender 0,0224 0,7602?? gender*heartrate 0,00173 0,01028?? S = 0,391270 R-Sq = 9,8% R-Sq(adj) = 7,7% Analysis of Variance Source DF SS MS F P Regression? 2,1048 0,7016 Residual Error? 19,2896 0,1531 Total? 21,3944 Figur 2: Residualplottar vid regressionanalysen med vilopuls, kön och samspelsvariabel. 10 (10)

Lösningar till tentamen i Matematisk statistik, S0001M, del 2 2010-06-04 7. Sannolikheten att vinna sin lunch är 1/6. Vi har därför η Bin(600, 1/6), där η är antalet personer som vinner. Enligt CGS har vi approximativt η N(100, 9.129). Kostnaden ξ = 55η uppfyller ξ K om η K/55. K skall därför uppfylla 0.9 = P (η K K 55 ) Φ( 55 100 9.129 ), vilket ger ( K 55 100)/9.129 = 1.28 K = 6143 kr. 8. (a) Låt p beteckna andelen defekta enheter (i det långa loppet). För att testa H 0 : p = 0.02(H 0 : p 0.02 går också bra) mot H 1 : p > 0.02 används testvariabeln ξ =antalet defekta enheter i stickprovet. Vi antar att maskinen ``saknar minne'' så att händelern att de olika enheterna är defekta är oberoende, vilket ger ξ Bin(18, p). Beslutsregel: förkasta H 0 om ξ k, där k bestäms av signifikansvnivån: P (ξ k p = 0.02) = 0.05. Vi har P (ξ 1 p = 0.02) = 0.305, P (ξ 2 p = 0.02) = 0.0495 och P (ξ 3 p = 0.02) = 0.0052 så k = 2 passar bäst för ändamålet. (b) Styrkan P (ξ 2 p = 0.04) = 0.16 i punkten p = 0.04 är usel. (c) Vi använder samma beslutsregel som ovan, förkasta H 0 om ξ k, fast med ett annat k. Om p < 0.1 använder vi approximationen ξ P (350p). k bestäms av signifikansvnivån: P (ξ k p = 0.02) = P (ξ k ξ P o(7)) = 0.05. Poissonfördelningstabellen i boken ger att k = 12 passar bäst. (Vi har P (ξ 12 ξ P o(7)) = 0.0533.) Styrkan i punkten p = 0.04 är P (ξ 12 ξ P o(14)) = 0.74. En klar förbättring! 1 (3)

Lösningar till tentamen i Matematisk statistik, S0001M, del 2 2010-06-04 9. (a) I modellvärlden, låt kroppstemperaturen för individ i betecknas av ξ i. Under följande antaganden om ξ i gör vi ett konfidensintervall för väntevärdet: ξ i N(µ, σ),dvs kroppstemperaturen för alla människor har en variation som ges av normalfördelningen, med väntevärde µ och standardavvikelse σ. Alla ξ i är oberoende av varandra. Eftersom spridningen σ är okänd, får vi ett konfidensintervall för µ med konfidensgrad 1 α av ξ ± t α/2 (n 1) σ n där n är storleken på stickprovet och σ är den skattade standardavvikelsen. Vi applicerar den formeln i observationsvärlden, x ± t α/2 (n 1) s n där x = 36.805, s = 0.40724 och n = 130.Konfidensgraden 99 % ger α = 0.01 och t 0.005 (129) = 2.6145 från tabell 3, vilket ger intervallet [36.71, 36.90] dvs med 99 % säkerhet ligger människokroppens normala kroppstemperatur mellan 36.71 och 36.90 grader celsius. (b) Låt X i vara vilopulsen, och Y i vara kroppstemperaturen för person i, då antar vi att förhållandet mellan dem beskrivs av relationen: Y i = β 0 + β 1 X i + ε i, ε i N(0, σ) dvs avvikelserna från linjen β 0 +β 1 X i antas vara normalfördelade med konstant standardavvikelse, dessutom antar vi att avvikelserna ε är oberoende. Normalfördelningsplotten i figur 1 visar att normalfördelningsantagandet är rimligt, och residualplotten styrker ytterligare resultatet. Modellfunktionen verkar vara rimlig och antagandet om konstant standardavvikelse är också rimligt. Förklaringsgraden är mycket låg, endast 6.4%, vilket tyder på att variationerna i kroppstemperatur i hög utsträckning är slumpmässiga, eller i alla fall inte förklaras i någon hög utsträckning av vilopulsen. Kan man ändå säga att vilopulsen påverkar kroppstemperaturen? Ja det kan man, ty p-värdet för heartrate visar att på 1% signifikansnivå är koefficienten för heartrate skilld från 0, eftersom 0.004 < 0.01. Det finns flera studentiserade residualer som ligger utanför intervallet [ 2, 2], som därmed är misstänkta uteliggare, samt en studentiserad residual som är större än 3 och därmed mycket avvikande. Den mycket avvikande observationen motsvarar en kroppstemperatur på 38.22 C, vilket tyder på att den uppmätta personen vid detta tillfälle kan ha haft feber. Detta bör studeras närmare. 2 (3)

Lösningar till tentamen i Matematisk statistik, S0001M, del 2 2010-06-04 (c) De två regressionslinjerna, för respektive kön blir, för män (kön=0) och för kvinnor (kön=1) tempc = 35.7803 + 0.01288 heartrate tempc = 35.8027 + 0.01461 heartrate Modellantagandet är att kroppstemperaturerna Y i beskrivs av sambandet Y i = β 0 + β 1 X 1i + β 2 X 2i + β 3 X 1i X 2i + ε i, ε i N(0, σ) där X 1i är vilopulserna, X 2i är dummyvariabler som beskriver könet, och ε i är oberoende stokastiska variabler. Linjernas riktningskoefficienter skiljer sig åt om vi kan påvisa att koefficienten för gender*heartrate är signifikant skild från 0. t-kvoten för denna koefficient ges av 0.00173/0.01028 = 0.168. Om beloppet av t-kvoten är större än t 0.025 (126) är koefficienten skild från noll med signifikansnivå 5%. Tabell 3 ger att t 0.025 (126) = 1.9790, så vi kan inte hävda att koefficienten är skilld från 0. En motsvarande analys av koefficienten för gender visar att inte heller den är signifikant skilld från noll. Vi kan alltså inte påvisa att det finns någon skillnad mellan könen. Residualplottarna i figur 2 visar för övrigt att modellantagandena är väl uppfylld. Uteliggarna ligger väsentligen på samma sätt som i uppgift (b). 3 (3)