Tentamen i Matematisk statistik Kurskod S0001M

Relevanta dokument
Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Tentamen i Matematisk statistik Kurskod S0001M

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Kompletterande kursmaterial till kursen Matematisk statistik.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i Matematisk statistik Kurskod S0001M

Regressions- och Tidsserieanalys - F1

Tentamen i matematisk statistik

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F1

Antal P(ξ = x)

Matematisk statistik, Föreläsning 5

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

LABORATION 3 - Regressionsanalys

Stockholms Universitet Statistiska institutionen Termeh Shafie

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3

TENTAMEN I STATISTIKENS GRUNDER 2

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

TENTAMEN I MATEMATISK STATISTIK

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

Matematisk statistik TMS064/TMS063 Tentamen

Examinationsuppgifter del 2

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Matematisk statistik LKT325 Tentamen med lösningar

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

LABORATION 3 - Regressionsanalys

0 om x < 0, F X (x) = c x. 1 om x 2.

Lufttorkat trä Ugnstorkat trä

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Föreläsningsanteckningar till kapitel 8, del 2

10.1 Enkel linjär regression

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

4 Diskret stokastisk variabel

Avd. Matematisk statistik

TENTAMEN Datum: 14 feb 2011

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Avd. Matematisk statistik

Tentamen Tillämpad statistik A5 (15hp)

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Regressions- och Tidsserieanalys - F7

Föreläsning 12, FMSF45 Hypotesprövning

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Transkript:

Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2013-03-28 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson Jourhavande lärare: Adam Jonsson Tel: 1948 Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in lösningar och bifogas oavsett om du lämnat in lösningar eller ej. Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 23 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (9)

1. Antag att 6 % av alla bilförare kör berusat och att sannolikheten att en berusad person somnar under bilkörningen är 0.33. Motsvarande sannolikhet för en nykter person är 0.01. En olycka inträffar, och det konstateras att bilföraren somnat vid ratten. Vad är sannolikheten att personen varit berusad? 2. Vid etsning av kretskort är andelen defekta ofta hög, och därför kontrolleras de färdiga korten. Kort läggs ihop i förpackningar om 21 kort. 5 av dessa ska tas ut för undersökning. Om det bland de 21 finns 2 defekta hur stor är sannolikheten att det i urvalet finns exakt 1 defekt kort? 3. I planeringen av ett nytt kösystem på ett bankkontor har man tyckt sig kunna beskriva antalet människor per minut som kommer in på banken ett visst intervall med en Poissonfördelad variabel med väntevärdet 3.2 kunder per minut. Hur stor är sannolikheten att det under dessa förutsättningar kommer in minst 4 människor på en minut? 4. Antag att dom två stokastiska variablerna ξ 1 och ξ 2 har samma kontinuerliga fördelning, vars frekvensfunktion ges av { 2x om 0 x 1, f(x) = 0 annars. Låt ξ beteckna summan ξ 1 + ξ 2. Bestäm väntevärdet av ξ. (3p) 5. Ett företag köper in 100 motstånd av en viss typ. Varje motstånd har en resistans (i ohm) som kan beskrivas med en normalfördelning med väntevärde 200 och standardavvikelse 15. För att ett motstånd skall kunna användas i produktionen krävs att resistansen är minst 190. Beräkna sannolikheten att minst 80 motstånd kan användas. Tips: Använd en lämplig approximativ metod. (3p) 6. I en viss bank samlas uppgifter in om handläggningstiden av olika slags ärenden från alla lokalkontor. För ett givet rutinärende har det visat sig att handläggningstiden kan beskrivas med en normalfördelning där den förväntade handläggningstiden är 7 timmar och standardavvikelsen 1.5 timmar. Hur lång är den längsta tiden för de 2 % kortaste handläggningstiderna? 7. Boxaren Anna har två vågar, våg 1 och våg 2, och misstänker att våg 2 i genomsnitt visar en högre vikt. För att undersöka saken noterar Anna sin vikt på de två vågarna en gång i veckan under ett sju veckor långt träningsläger. Resultatet i kg ges nedan: Vecka nr 1 2 3 4 5 6 7 Våg1 62,53 59,88 57,08 55,48 54,87 55,74 54,57 Våg 2 62,82 60,10 57,20 55,47 55,07 55,77 54,57 2 (9)

Beräkna ett lämpligt 95% konfidensintervall för den genomsnittliga skillnaden (våg 2 - våg 1) under rimliga normalfördelningsantaganden. Svara med den nedre gränsen. Räknehjälp: x 1 = 57, 16, s 1 = 2, 97, x 2 = 57, 28, s 2 = 3, 07. För differenserna gäller: z = 0, 1200, s z = 0, 1206. 8. Antag att x 1, x 2,..., x 24 är ett observerat stickprov av storlek 24 från en normalfördelning där µ och σ är okända. För att testa H 0 : µ = 130 mot H 1 : µ 130 på 10% signifikansnivå skall kvoten t = x 130 s/ 24 beräknas varpå H 0 förkastas om t > c, där x är medelvärdet, s är stickprovsstandardavvikelsen och där c är en konstant. Beslutsregeln är alltså: Förkasta H 0 om beloppet av kvoten är större än c. Vilket värde på c skall användas? 9. En forskargrupp vill testa H 0 mot H 1. Forskargruppen består av tio personer. Var och en av dom tillämpar ett test med 10% signifikansnivå som baseras på ett stickprov av storlek 35. De tio stickproven är oberoende. Antag att H 0 är sann. Hur stor är sannolikheten att minst en forskare ändå drar slutsatsen att H 0 är falsk. 10. Vid en amerikansk undersökning studerades hur livslängden, Y, hos ett skärverktyg på en svarv kunde relateras till X 1 =svarvens hastighet och till X 2 =verktygstypen, där X 2 = 0 eller 1. Man gjorde 20 observationer på livslängden (enhet: timmar), svarvhastigheten (enhet: 100 varv per minut), samt verktygstyp. Analys av en multipel regressionsmodell med de två variablerna X 1 och X 2 gav resultatet i tabell 1 nedan. Maxhastigheten för de utvalda verktygen varierade mellan 5 och 10. (a) Bestäm förklaringsgraden. (b) För att undersöka om maxhastigheten påverkar livslängden skall ett test på 1% signifikansnivå genomföras genom att beräkna värdet på en lämplig t-kvot och jämföra denna med ett visst tal. Vad är värdet på t-kvoten? Kan man påstå att maxhastigheten påverkar livslängden på 1% signifikansnivå? För 2 poäng krävs både t-kvoten och rätt svar (ange JA eller NEJ på svarsbladet). (c) För verktyg med en given maxhastighet, vad är den genomsnittliga skillnaden i livslängden för verktyg av typ 1 jämfört med verktyg av typ 0? Besvara frågan genom att beräkna ett 99%-igt konfidensintervall. Redovisa den undre gränsen. (1p) Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 3 (9)

Tabell 1: Regression Analysis: Y versus X1; X2 The regression equation is Y = 37,0-2,66 X1 + 15,0 X2 Predictor Coef SE Coef T P Constant 36,986 3,510 10,54? X1-2,6607 0,4520-5,89? X2 15,004 1,360 11,04? S = 3,03949 R-Sq =? R-Sq(adj) =? Analysis of Variance Source DF SS MS F P Regression 2 1418,03 709,02 76,75 0,000 Residual Error 17 157,05 9,24 Total 19? 4 (9)

Tabell för svar till del 1 Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter skall anges i decimalform som ett tal mellan 0 och 1. Fråga Svar Poäng 1 Sannolikhet (tre decimaler) 0.678 2 2 Sannolikhet (tre decimaler) 0.381 2 3 Sannolikhet (tre decimaler) 0.397 2 4 Väntevärde (tre decimaler) 1.333 3 5 Sannolikhet (tre decimaler) 0.113 3 6 Den kortarste tiden (tre decimaler) 3.925 (3.919) 2 7 Nedre gräns (fyra decimaler) 0.0085 2 8 Konstanten c (tre decimaler) 1.714 2 9 Sannolikhet (fyra decimaler) 0.6513 2 10 a Förklaringsgrad (fyra decimaler) 0.9003 1 b t-kvot (fyra decimaler) -5.8865 JA eller NEJ JA 2 c Nedre gräns (fyra decimaler) 11.0627 2 Totalt antal poäng 25 5 (9)

6 (9)

Tentamen i Matematisk statistik, S0001M, del 2 2013-03-28 Vid bedömningen av lösningarna av uppgifterna i del 2 läggs stor vikt vid hur lösningarna är motiverade och redovisade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden. 11. I en fabrik vill man bestämma sannolikheten p att lysrör av en viss typ fungerar minst i 1000 timmar. För att skatta p planerar man att mäta livslängden för 20 lysrör och beräkna p = andelen rör som håller i minst 1000 timmar. (a) Bestäm sannolikhetsfunktionen för p. (b) Visa att p är väntevärdesriktig. (5p) (5p) Obs! Parametern p kommer att ingå i uttrycket för sannolikhetsfunktionen på (a). Lösningsskiss (a) Vi kan skriva p = η/20, där η=antalet rör som håller i minst 1000 timmar. Dom möjliga värdena på p är 0, 1/20, 2/20,..., 19/20, 1. Att p = x är samma sak som att η = 20x. Vi har η Bin(20, p). Så P (p = x) = P (η = 20x) = ( 20 20x)p 20x (1 p) 20 20x, där x = 0, 1/20, 2/20,..., 1. (b) För Binomialfördelningen gäller att väntevärdet är np. Så E(η) = 20p. Sats 5A (a) ger E(p ) = E(η/20) = E(η)/20 = p. 12. Torsten är intresserad av övernaturliga förmågor hos människor. Han anser att en person har en sådan förmåga om denne eller denna fem gånger i rad kan förutsäga utfallet av ett tärningskast. Torsten utsätter 10000 personer för experimentet, varav 2 stycken klarar det. Han drar därför slutsatsen att förekomsten av övernaturliga förmågor har bevisats 1. Håller du med Torsten när det gäller hur resultatet skall tolkas? Använd begrepp och metoder från statistisk hypotesprövning för att besvara frågan. Lösningsskiss Inför p=sannolikheten att en slumpmässigt vald person klarar testet. Om det inte finns människor med övernaturliga förmågor har vi p = (1/6) 5. Om det däremot finns människor med (denna typ av) övernaturliga förmågor så har vi p > (1/6) 5. Så vi vill testa H 0 : p = (1/6) 5 mot H 1 : p > (1/6) 5. Testvariabel: η =antal personer som klarar testet. Beslutsregel: Förkasta H 0 om η k, där k bestäms av risknivån. Med direktmetoden: P- värdet är P (η 2) givet H 0 sann. Då H 0 är sann har vi att η är Bin(10000, (1/6) 5 ). Eftersom n är väldigt stort och p mycket litet kör vi Poisson-approximation. Vi har η P o(10000 (1/6) 5 )) = 1 Den typ slutledning som Torsten använder kallas ibland för anekdotal bevisföring (13p) 7 (9)

Tentamen i Matematisk statistik, S0001M, del 2 2013-03-28 P o(1.28) P o(1.3). Poissontabellen ger sannolikheten är ungefär 0.15. Så vi kan inte påvisa övernaturliga förmågor på dom vanliga risknivåerna. 13. För problemet med skärverktyget på uppgift 10 ville man se om det går att påstå att maxhastighetens effekt på Y beror av verktygstypen. Analys av en multpel regressionsmedell med de tre variablerna X 1, X 2 och X 3 = X 1 X 2 gav resultatet i tabell 2 på nästa sida. (a) Ange fullständigt modellantagande för analysen på nästa sida. (b) Ställ upp ett hypotestest som skall avgöra om maxhastighetens effekt på livslängden är större för verktygstyp 0 än för typ 1. Hypoteser, testvariabel samt slutsats skall tydligt framgå. Använd 10% signifikansnivå. (5p) Tabell 2: Regression Analysis: Y versus X1; X2; X3 The regression equation is Y = 32,8-2,10 X1 + 24,0 X2-1,19 X3 Predictor Coef SE Coef T P Constant 32,775 4,633 7,07 0,000 X1-2,0970 0,6074-3,45 0,003 X2 23,971 6,769 3,54 0,003 X3-1,1944 0,8842-1,35 0,196 S = 2,96833 R-Sq = 91,0% R-Sq(adj) = 89,4% Analysis of Variance Source DF SS MS F P Regression 3 1434,11 478,04 54,25 0,000 Residual Error 16 140,98 8,81 Total 19 1575,09 Lösningsskiss (a) Modellantagandet är Y i = β 0 + β 1 X 1,i + β 2 X 2,i + β 3 X 3,i + ɛ i, där Y i är livslängden verktyg i, där X 1,i =hastighet, X 2,i =typ=0 eller 1, X 3,i = X 1,i X 2,i och där ɛ 1,..., ɛ 20 är oberoende och N(0, σ)-fördelade. Modellen är definierad för 5 X 1 10. (b) Om vi sätter X 2 = 0 respektive 1 i modellantagandet ovan får vi för typ 0 och E(Y ) = β 0 + β 1 X 1 E(Y ) = β 0 + β 2 + (β 1 + β 3 )X 1 8 (9)

Tentamen i Matematisk statistik, S0001M, del 2 2013-03-28 för typ 1. Maxhastighetens effekt för de två typerna är lika med koefficienten framför X 1, dvs β 1 för typ 0 och β 1 + β 3 för typ 1. Att effekten är större för typ 0 är alltså samma sak som att β 3 < 0. Så vi vill testa H 0 : β 3 = 0 mot H 0 : β 3 < 0. Eftersom mothypotesen är ensidig jämför vi t-kvoten med t 0.1 (16) och förkastar H 0 om t-kvoten< t 0.1 (16). Alternativt kan vi dela P - värdet för det tvåsidiga testet med 2. Vi får då 0.098. Dvs H 0 kan förkastas. 9 (9)