Tentamen i Matematisk statistik Kurskod S0001M

Relevanta dokument
Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i Matematisk statistik Kurskod S0001M

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

FÖRELÄSNING 7:

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Matematisk statistik TMS064/TMS063 Tentamen

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

TENTAMEN Datum: 14 feb 2011

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Tentamen i Matematisk statistik Kurskod S0001M

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

FÖRELÄSNING 8:

0 om x < 0, F X (x) = c x. 1 om x 2.

Tentamen i Matematisk statistik Kurskod S0001M

Avd. Matematisk statistik

Föreläsningsanteckningar till kapitel 8, del 2

Avd. Matematisk statistik

Föreläsning 11: Mer om jämförelser och inferens

Stockholms Universitet Statistiska institutionen Termeh Shafie

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE302 Sannolikhet och statistik

Kompletterande kursmaterial till kursen Matematisk statistik.

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

b) Beräkna sannolikheten för att en person med språkcentrum i vänster hjärnhalva är vänsterhänt. (5 p)

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

TMS136. Föreläsning 10

Tentamen MVE301 Sannolikhet, statistik och risk

Avd. Matematisk statistik

Uppgift a b c d e Vet inte Poäng

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Tentamen MVE301 Sannolikhet, statistik och risk

Avd. Matematisk statistik

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Tentamen MVE302 Sannolikhet och statistik

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Lufttorkat trä Ugnstorkat trä

F9 Konfidensintervall

Matematisk statistik, Föreläsning 5

Föreläsning 12, FMSF45 Hypotesprövning

Tentamen MVE300 Sannolikhet, statistik och risk

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamen i Matematisk Statistik, 7.5 hp

Matematisk statistik TMS063 Tentamen

F13 Regression och problemlösning

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Avd. Matematisk statistik

F3 Introduktion Stickprov

TMS136. Föreläsning 13

TENTAMEN I STATISTIKENS GRUNDER 2

Transkript:

Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (11 uppgifter) Tentamensdatum 2016-10-25 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson och Niklas Grip Jourhavande lärare: Adam Jonsson Tel: 0920-491948 Jesper Martinsson Tel: 0920-491425 Tillåtna hjälpmedel: Räknedosa, Kompendium om regressionsanalys Kursboken Vännman: Matematisk statistik. Kursboken och kompendiet får innehålla anteckningar och post-it lappar, men inte lösta exempel. Formelblad Tabeller Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs godkända webbuppgifter och minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in lösningar och bifogas oavsett om du lämnat in lösningar eller ej. Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 23 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (8)

1. Från en grupp om 10 studenter, varav 7 är socialdemokrater och 3 är moderater, ska ett utskott bestående av 5 studenter bildas. Var är sannolikheten att utskottet helt och hållet kommer att bestå av socialdemokrater? 2. Vid tillverkning av detaljer till en maskin är felfrekvensen 4%. För att begränsa antalet reklamationer beslutar man att alla detaljer ska passera en kontroll. Vid denna kontroll kasseras felaktiga detaljer med sannolikheten 0.94, och felfria kasseras med sannolikheten 0.04. Vad är sannolikheten att en detalj kasseras? 3. Fredrik har fått i uppdrag att bestämma 8 olika parametrar. Han beräknar 8 stycken 90%-iga konfidensintervall som baseras på 8 oberoende stickprov. Vad är sannolikheten att exakt 6 av de 8 intervallen täcker sin parameter. 4. Slumpvariabeln ξ kan anta värdena 1, 0, 1, 2 och 3 och har väntevärde lika med 0.75. Sannolikhetsfunktionen beskrivs delvis nedan, med två sannolikheter har medvetet tagits bort och ersatts med a och b. Vilka värden måste vi ha på a och b? x 1 0 1 2 3 P (ξ = x) 0.3 0.2 0.1 a b 5. Slumpvariabeln ξ är Exponentialfördelad. Väntevärdet är lika med 2. Bestäm kvartilståndet i fördelningen. (Kvartilavståndet definieras som differensen mellan den 75:e percentilen och den 25:e percentilen.) 6. I en viss bank samlas uppgifter in om handläggningstiden av olika slags ärenden från alla lokalkontor. För ett givet rutinärende har det visat sig att handläggningstiden kan beskrivas med en normalfördelning där den förväntade handläggningstiden är 9 timmar och standardavvikelsen 1.4 timmar. Hur lång är den längsta tiden för de 2% kortaste handläggningstiderna? 7. Ungefär 10 procent av rattfylleristerna är kvinnor, och den siffran har legat relativt konstant de senaste åren 1. Låt ξ beteckna andelen kvinnor bland 100 slumpmässigt utvalda rattfyllerister. Beräkna variansen av ξ. 8. En geolog undersöker halterna av hur järn (mg/l) i skogsmark påverkas av ett visst gift och gör därför mätningar på sex anvgivna platser. Hon mäter först järnhalten på var och en av dessa platser, behandlar dom med miljögiftet och återkommer en vecka senare för att undersöka om 1 Källa www.trafikverket.se 2 (8)

järnhalten förändrats. Halterna som observerades utan att miljögift använts var följande: 14.9 13.9 13.2 10.1 23.1 17.5 Och med miljögift blev värdena för respektive plats: 19.9 18.3 18.0 13.9 27.3 19.0 Bestäm ett 95% konfidensintervall för skillnaden mellan den genomsnittliga järnhalten då giftet används och den genomsnittliga järnhalten då giftet inte används, under lämpliga normalfördelningsantaganden. 9. I ett bostadsområde vill man se om halten av ett kemiskt ämne är för högt. Förväntad halt under normala förhållanden är 0.1 (enhet: procent). Om prov tas ut på 45 platser i området, hur stor är sannolikheten att genomsnittet i stickprovet då är minst 0.11? Utgå från att standardavvikelsen i ett prov av detta slag är 0.08. 10. Antag att x 1, x 2,..., x 5 är ett observerat stickprov från N(µ, 2). För att testa H 0 : µ = 125 mot H 1 : µ 125 på 5% signifikansnivå har man bestämnt sig för att använda testvariabeln z = x 125 2/ 5 och beslutsregeln: förkasta H 0 om z k, där k är en konstant. Din uppgift är att bestämma värdet på k och tillämpa testet för datamaterialet nedan: i 1 2 3 4 5 x i 123.6 123.8 125.9 123.3 120.6 För poäng på denna uppgift krävs rätt värde på k och rätt svar på frågan om H 0 ska förkastas: JA om H 0 ska förkastas och NEJ om H 0 inte ska förkastas. 11. Vid en amerikansk undersökning studerades hur livslängden, Y, hos ett skärverktyg på en svarv kunde relateras till svarvens hastighet, X 1, och till verktygstyp, X 2, där två olika verktygstyper A och B förekommer. Man gjorde 20 observationer på livslängden (enhet: timmar), svarvhastigheten mätt i 100-tals varv per minut, samt verktygstyp. Man använde en regressionsmodell där Y förklarades av X 1, X 2, där X 2 är en dummy-variabel definierad som X 2 = 0 för verktygs-typ A och X 2 = 1 för verktygs-typ B, och produkten X 3 = X 1 X 2. Resultatet från en analys av modellen anges nedan. b 0 = 32.77 s b0 = 4.63 b 1 = 2.097 s b1 = 0.607 b 2 = 23.97 s b2 = 6.77 b 3 = 1.194 s b3 = 0.884 3 (8)

(a) Låt θ beteckna den förväntade livslängden för verktyg av typ B vars hastighet är lika med 600 varv per minut. Gör en punktskattning av θ. (b) För att undersöka om hastighetens effekt på livslängden beror på verktygstypen ska ett hypotestest genomföras. Ett sätt att genomföra testet är att beräkna värdet på en lämplig t-kvot och jämföra denna t-kvot med ett tal från t-tabellen. Vad är värdet på t-kvoten? Vilket värde ska t-kvoten jämföras med om man vill att testet ska ha 10 % signifikansnivå? Ett annat sätt att genomföra testet är att utgå från ett lämpligt P-värde. Är detta P-värde i detta fall större eller mindre än 0.05 (dvs 5 %)? Svara STÖRRE eller MINDRE. För poäng på denna uppgift krävs rätt t-kvot, rätt tabell-värde och rätt svar på frågan om P-värdet. (1p) (c) Beräkna ett 98%-konfidensintervall för den genomsnittliga skillnaden i livslängd mellan verktyg av typ A vars hastighet är 6 (dvs 600 varv per minut) och verktyg av typ A vars hastighet är 7. Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 4 (8)

Tabell för svar till del 1 Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter skall anges som ett tal mellan 0 och 1 i decimalform om inte annat anges. Fråga Svar Poäng 1 Sannolikhet (tre decimaler) 0.083 2 2 Sannolikhet (tre decimaler) 0.076 2 3 Sannolikhet (tre decimaler) 0.149 2 4 Värden på a och b (tre decimaler) a = 0.25, b = 0.15 2 5 kvartilavstånd (tre decimaler) 2.197 2 6 Den längsta tiden (tre decimaler) 6.130 2 7 Varians (tre decimaler) 0.001 2 8 Undre och övre gräns (tre decimaler) 2.613, 5.287 2 9 Sannolikhet (tre decimaler) 0.200 2 10 Värdet på k (tre decimaler) 1.960 2 JA (förkasta H 0 ) eller NEJ NEJ 11 a punktskattning (tre decimaler) 36.994 1 b värde på t-kvoten (tre decimaler) -1.351 (1.351 OK) värde från t-tabellen (tre decimaler) 1.746 Ange STÖRRE eller MINDRE STÖRRE 2 c Undre och övre gräns (tre decimaler) -3.665, -0.529 2 Totalt antal poäng 25 5 (8)

1. Det finns m = ( 10 5 ) sätt att välja fem studenter. Det finns g = (7 5 ) sätt att välja fem studenter så att alla fem är socialdemokrater. Sannolikheten för att utskottet helt och hållet består av socialdemokrater är g/m = 0.08333. 2. Inför K =slumpmässigt vald enhet kasseras, F =slumpmässigt vald enhet är felaktig och H =slumpmässigt vald enhet är hel. Enligt uppgift har vi P (K F ) = 0.94, P (K H) = 0.04, P (F ) = 0.04 och således P (H) = 0.96. Vi har P (K) = P (K F )P (F ) + P (K H)P (H) = 0.076. 3. Inför ξ =antal intervall som täcker sin parameter. Vi har ξ Bin(8, p), där p =sannolikheten att ett intervall täcker sin parameter=0.9. Så P (ξ = x) = ( 8 x)0.9 x 0.1 8 x, x = 0, 1, 2,...8, P (ξ = 6) = 0.1488. 4. Villkoret 3 x= 1 P (ξ = x) = 1 kan skrivas a+b = 0.4 eller b = 0.4 a. Villkoret 0.75 = E(ξ) = 0.3 + 0.1 + 2a + 3b kan därför skrivas 0.75 = 0.2 + 2a + 3(0.4 a). Vi får a = 0.25 och b = 0.15. 5. Att E(ξ) = 2 betyder att λ = 1/2. Så ξ har fördelningsfunktion F (x) = 1 e x/2. Den p:te percentilen definieras via ekvationen p/100 = F (L p ) = 1 e Lp/2. Vi löser ut L p och får L p = 2ln(1 p/100). Kvartilavståndet är L 75 L 25 = 2.197. 6. Här måste metoden för stickprov i par användas eftersom proverna tas på olika platser. 7. Låt ξ stå för handläggningstiden för ett slumpmässigt valt ärende och T den längsta av de 2 % kortaste handläggningstiderna. För tiden T ska det alltså gälla att 0.02 = P (ξ T ) = P ( ξ 9 T 9 } 1.4 {{} 1.4 ) = Φ(T 9 1.4 ). N(0,1) Alternativt Φ( 9 T 1.4 ) = 0.98. Med hjälp av tabellen på sidan 309 får vi (9 T )/1.4 = 2.05 och T = 9 2.05 1.4 = 6.13. 8. Låt η =antal kvinnor bland de 100 utvalda. Vi har η Bin(100, 0.1). Så V (η) = 100 0.1 0.9 = 9. Eftersom ξ = η/100 ger Sats 5A att V (ξ) = (1/100) 2 9 = 0.0009. 9. Låt ξ 1,..., ξ 45 vara halterna på de 45 platserna och låt ξ = 45 i=1 ξ i/45. Vi söker P ( ξ 0.11). Enligt uppgift gäller att E(ξ i ) = 0.1 och V (ξ i ) = 0.08 2. Centrala gränsvärdessatsen ger att ξ approximativt är fördelad Det ger (approximativt) att N(0.1, 0.08/ 45). P ( ξ 0.11) = 1 P ( ξ 0.11) = 1 P ( ξ 0.11 0.08/ 0.11 0.1 45 0.08/ ) 45 }{{}}{{} N(0,1) 0.8385.. 1 Φ(0.84) = 0.20045. 6 (8)

10. Då H 0 är sann är z en observation från N(0, 1). Så för att få ett test med 5 % signfikansnivå ska H 0 förkastas om z λ 0.025 eller z λ 0.025, dvs om z λ 0.025 = 1.96. För det givna datamaterialet har vi x = 123.44 och z = 1.744. Så H 0 ska inte förkastas. 11. Modellantagandet för den skattade modellen kan förenklas E(Y ) = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3. (a) Den förväntade livslängden för verktyg av typ B (X 2 = 1) vars hastighet är 600 (X 1 = 6) varv per minut är β 0 + β 1 6 + β 2 + β 3 6. En punktskattning ges av b 0 + b 1 6 + b 2 + b 3 6 = 36.994. (b) Att hastighetens effekt på livslängden beror på verktygstypen är samma sak som att β 3 0. Så vi vill testa H 0 : β 3 = 0 mot H 1 : β 3 0. Vi kan använda beslutsregeln: förkasta H 0 om b 3 /s b3 > t 0.05 (n K), där n = 20 och K = 4. Vi har b 3 /s b3 = 1.351 och t 0.05 (16) = 1.746. Då vi utgår från P-värdet förkastas H 0 om P-värdet är mindre än signfiikansnivån. Att P-värdet är mindre än 0.05 är samma sak som att H 0 ska förkastas på signfiikansnivån 0.05. Det kritiska värdet för ett test på 5% signifikansnivå som baseras på t-kvoten är t 0.025 (16) = 2.120. Eftersom b 3 /s b3 = 1.351 ska H 0 inte förkastas. Det betyder att P-värdet är större än 0.05. (c) Den förväntade livslängden för verktyg av typ A (X 2 = 0) vars hastighet är 700 (X 1 = 7) varv per minut är β 0 + β 1 7. Den förväntade livslängden för verktyg av typ A vars hastighet är 600 är varv per minut är β 0 + β 1 6. Skillnaden i förväntade livslängd är β 1. Ett intervall för β 1 med 98% konfidensgrad ges av b 1 ± t 0.01 (16)s b1 = [ 3.664881, 0.529119]. 7 (8)

Tentamen i Matematisk statistik, S0001M, del 2 2016-10-25 Till uppgifterna på del 2 krävs fullständiga lösningar. 12. Förändringen av en aktiekurs från att börsen öppnar kl 09:00 kan beskrivas med följande tidserie η i = aη i 1 + ξ i för i 2 och η 1 = ξ 1 för i = 1, där i är hela minuter efter 09:00. Antag att ξ i är oberoende och normalfördelade med väntevärde 0 och standardavvikelse σ. (a) Vilken fördelning har η 3? (b) Vilken fördelning har η n? (c) Börsen stänger 17:30 och Figur 1 visar exempel på tre realiseringar av tidserien under en dag. Om σ = 0.1 och a = 0.99, beräkna ett symmetriskt intervall som kommer att innehålla förändringen av aktiekursen då börsen stänger med 95% sannolikhet? Ledning: använd gärna att n 1, för x 1. k=0 xk = 1 xn 1 x (5p) (5p) ηi 2.0 1.5 1.0 0.5 0.0 0.5 1.0 0 100 200 300 400 500 i (min) Figur 1: Tre realiseringar av tidserien under en dag (dvs. mellan 09:00 och 17:30), där µ = 0, σ = 0.1 och a = 0.99. 13. Studenten K är missnöjd med en tenta i ekonomi. K tycker att tentan var alldeles för svår. Hen studerar tidigare resultat på tentor i kursen och finner att andelen godkända i snitt varit 55 %. Den tenta som K själv skrev klarade endast 19 av 42 skrivande, dvs 45.2 %. Kan K påstå att tentan var ovanligt svår? Ställ upp och genomför ett lämpligt hypotestest för att besvara frågan. (10p) 14. Vi återvänder tilll uppgiften från del 1 där hastigeten för skärverktyg relaterades verktygets livslängd. Regressionskvadratsumma och residualkvadratsumma för den skattade modellen blev 1434.11 respektive 140.98. (a) Ange fullständigt modellantagande för den skattade modellen. (b) Beräkna ett 98%-konfidensintervall för den genomsnittliga skillnaden i livslängd mellan verktyg av typ A vars hastighet är 600 varv per minut och verktyg av typ B vars hastighet är 600 varv per minut. (1p) (7p) 8 (8)