Tentamen i Matematisk statistik Kurskod S0001M

Relevanta dokument
Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i Matematisk statistik Kurskod S0001M

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Matematisk statistik TMS064/TMS063 Tentamen

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Matematisk statistik, Föreläsning 5

Matematisk statistik TMS063 Tentamen

Lufttorkat trä Ugnstorkat trä

Tentamen MVE302 Sannolikhet och statistik

TENTAMEN Datum: 14 feb 2011

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Lycka till!

Tentamen i Matematisk statistik Kurskod S0001M

Stockholms Universitet Statistiska institutionen Termeh Shafie

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Föreläsningsanteckningar till kapitel 8, del 2

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen den 11 april 2007 i Statistik och sannolikhetslära för BI2

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Avd. Matematisk statistik

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

TENTAMEN I STATISTIKENS GRUNDER 2

Kompletterande kursmaterial till kursen Matematisk statistik.

0 om x < 0, F X (x) = c x. 1 om x 2.

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Avd. Matematisk statistik

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Tentamen MVE302 Sannolikhet och statistik

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Föreläsning 11: Mer om jämförelser och inferens

Uppgift 1. f(x) = 2x om 0 x 1

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004, TEN

Avd. Matematisk statistik

Tentamen LMA 200 Matematisk statistik,

Föreläsning 12, FMSF45 Hypotesprövning

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Mer om konfidensintervall + repetition

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Avd. Matematisk statistik

Avd. Matematisk statistik

Uppgift a b c d e Vet inte Poäng

Tentamen MVE301 Sannolikhet, statistik och risk

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

σ 12 = 3.81± σ n = 0.12 n = = 0.12

FÖRELÄSNING 7:

Transkript:

Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (11 uppgifter) Tentamensdatum 2016-08-23 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson Jourhavande lärare: Adam Jonsson Tel: 0920-491948 Jesper Martinsson Tel: 0920-491425 Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs godkända webbuppgifter och minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in lösningar och bifogas oavsett om du lämnat in lösningar eller ej. Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 23 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (9)

1. En skytteförening består av 11 damer och 8 herrar som presterat likvärdigt under säsongen. Man väljer slumpmässigt ut ett lag bestående av 5 deltagare av dessa 19, som ska få representera klubben i ett mästerskap. Vad är sannolikheten att majoriteten i laget är herrar? 2. Kalle singlar slant två gånger. (a) Givet att det första myntet visar en krona, vad är sannolikheten att båda mynten visar krona? (b) Givet att ett av dessa två mynt visar en krona, vad är sannolikheten att båda mynten visar krona? 3. För att bestämma kvalitén på en plastdetalj räknas antalet synliga bubblor på ytan. Låt ξ P o(λ 7) beskriva antalet synliga bubblor på en plastdetalj. Ett premiumexemplar får maximalt ha 4 st synliga bubblor. Vad är sannolikheten att få ett premiumexemplar? 4. Vid tillverkning av karbiner blir felfrekvensen 2%. För att reducera denna låter man alla karbiner genomgå en kontroll. Vid kontrollen kasseras felaktiga karbiner med sannolikhet 0.95 och helt felfria med sannolikhet 0.01. (a) Vilken felfrekvens har vi bland dom godkända efter kontrollen? (b) Vilken felfrekvensen har vi bland dom som kasserats efter kontrollen? 5. Ungefär 10 procent av rattfylleristerna är kvinnor, och den siffran har legat relativt konstant de senaste åren 1. Vad är sannolikheten att minst 8 av totalt 10 st personer som påträffats rattfull i en slumpmässig kontroll är män? 6. Vad är det förväntade antalet herrar i laget i första uppgiften? 7. LKAB:s malmtåg består av 68 malmvagnar med en lastkapacitet på 100 ton per styck. Den verkliga lasten för en vagn varierar med en standardavvikelse på 3 ton runt den förväntade lastkapaciteten. Vad är sannolikheten att totallasten i tågsättet väger mer 6850 ton? 8. En läkare är intresserad av att ta reda på om en viss behandling av högt kolesterolvärde har en positiv (dvs dämpande) effekt. Till sin hjälp har läkaren uppgifter från en undersökning gjord på 6 personer. För var och en av patienterna anges kolesterolvärde före behandling samt om värdet var lägre efter behandling, där + betyder att värdet var lägre efter behandlningen och betyder att värdet var detsamma eller högre efter behandlingen. 1 Källa www.trafikverket.se 2 (9)

För att testa mot Patient 1 2 3 4 5 6 Värde 4.7 5.1 6.4 5.2 4.9 7.1 Effekt + + + + H 0 : behandlingen har ingen effekt i genomsnitt H 1 : behandlingen har i genomsnitt en positiv effekt så tillämpar läkaren följande beslutsregel: förkasta H 0 om minst 5 av 6 patienter har lägre kolesterolvärde efter behandling. Vilken signifikansnivå har den beslutsregel som läkaren har tillämpat? 9. Antag att ξ 1,..., ξ n är ett stickprov av storlek n från N(µ, 0.15). För att testa H 0 : µ 2.1 mot H 1 : µ 2.2 på 1 % signifikansnivå kan man använda beslutsregeln: förkasta H 0 om ξ k, där k är en konstant. Hur stort måste n minst vara för att detta test ska få en styrka som är minst 90%? 10. Den dagliga malmproduktionen (enhet: ton) i en viss gruva kan antas vara normalfördelad N(µ, σ), där µ och σ är okända. Produktionen från 6 dagar ges nedan. Dag 1 2 3 4 5 6 Produktion 14.7 15. 1 16.4 15.2 14.9 18.1 De dagliga produktionskostnaderna i gruvan består dels av en fast kostnad på 200 000 kr och dels en rörlig kostnad på 11 500 kr per ton. En ekonom vill bestämma ett konfidensintervall för den genomsnittliga produktionskostnaden per dag. Bestäm ett sådant intervalll. Använd 99 % konfidensgrad. 11. Man vill använda regressionsanalys för att studera samband mellan produktionskostnader (X 1, miljoner dollar), marknadsföringskonstnader (X 2, miljoner dollar) och biljettintäkter under första året (Y, miljoner dollar) för amerikanska filmer. Tio filmer studerades för att få den skattade regressionsmodellen Resulatet anges nedan. Ŷ b 0 + b 1 X 1 + b 2 X 2. b 0 11.848 s b0 6.765 b 1 4.228 s b1 1.153 b 2 7.436 s b2 1.806 Regressionskvadratsumman och residualkvadratsumman blev 9798.3 respektive 475.4. 3 (9)

(a) En av dom 10 filmerna var The last battle. Den drog in 290 miljoner dollar från biljettförsälningen. Den kostade 25 miljoner dollar och 33 miljoner användes i marknadsföringen. Vad är residualen för den filmen? (b) För att undersöka om kostnaderna för marknadsföring påverkar biljettintäkterna på 1% signifikansnivå kan man beräkna värdet på en lämplig t-kvot och jämföra denna t-kvot med ett tal från t-tabellen. Vad är värdet på t-kvoten? Vilket värde ska t-kvoten jämföras med? Ett annat sätt att genomföra testet är att utgå från ett lämpligt P-värde. Är detta P-värde i detta fall större eller mindre än 0.01 (dvs 1 %)? Svara STÖRRE eller MINDRE. För poäng på denna uppgift krävs rätt t-kvot, rätt tabell-värde och rätt svar på frågan om P-värdet. (c) Vad är den förväntade ökningen av biljettintäkterna om marknadsföringskonstnaderna ökar med 500 000 dollar medan produktionskostnaderna hålls konstanta? Besvara frågan genom att bestämma ett 90%-konfidensintervall. Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 4 (9)

Tabell för svar till del 1 Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter skall anges som ett tal mellan 0 och 1 i decimalform om inte annat anges. Fråga Svar Poäng 1 Sannolikhet (tre decimaler) 0.3359 2 2 a Sannolikhet (tre decimaler) 0.5 1 b Sannolikhet (tre decimaler) 0.333 2 3 Sannolikhet (tre decimaler) 0.173 1 4 a Felfrekvens (%, tre decimaler) 0.001 1 b Felfrekvens (%, tre decimaler) 0.660 1 5 Sannolikhet (tre decimaler) 0.9298 2 6 Väntevärde (tre decimaler) 2.105 2 7 Sannolikhet (tre decimaler) 0.022 2 8 Signifikansnivå (procent, tre decimaler) 0.109 2 9 Antal observationer (heltal) 30 2 10 Undre och övre gräns (tre decimaler) 356261.000, 2 405606.000 11 a residual (tre decimaler) -72.936 1 b värde på t-kvoten (tre decimaler) 4.117 värde från t-tabellen (tre decimaler) 3.499 Ange STÖRRE eller MINDRE MINDRE 2 c Undre och övre gräns (tre decimaler) 2.007, 5.429 2 Totalt antal poäng 25 5 (9)

1. Låt ξ antal herrar i laget. Man väljer utan återläggning n 5 deltagare från totalt N 19, där en andel p 8/19 är herrar. Så ξ är Hyp(19, 5, 8/19)-fördelad. Vi får P (majoriteten i laget är herrar) 5 P (ξ x) x3 5 x3 ( 8 x)( 11 8 x ) ( 19 5 ) 0.3359 2. Låt A 1 vara händelsen att det första myntet visar krona och låt A 2 vara händelsen att det andra myntet visar krona. (a) Vi söker P (A 1 A 2 A 1 ) /P (A 1 ) P (A 1 A 2 )/P (A 1 ). Då kasten antas oberoende har vi P (A 1 A 2 ) P (A 1 )P (A 2 ). Så P (A 1 A 2 A 1 ) P (A 1 )P (A 2 )/P (A 1 ) P (A 2 ) 0.5. (b) Vi söker P (A 1 A 2 A 1 A 2 ) P ((A 1 A 2 ) (A 1 A 2 ))/P (A 1 A 2 ). Det gäller att (A 1 A 2 ) (A 1 A 2 ) A 1 A 2. Så vi söker P (A 1 A 2 )/P (A 1 A 2 ). Vi har P (A 1 A 2 ) 0.25 och P (A 1 A 2 ) 0.75. Så den sökta sannolikheten är 1/3. Kommentar: En bild underlättar för att lösa uppgiften. 3. Eftersom ξ P o(7) har vi P (få ett premiumexemplar) P (ξ 4) 4 x0 P (ξ x) 4 x0 7x e 4 /x! 0.1730. Ett alternativ är att använda tabellen för att bestämma P (ξ 4). 4. Låt K, G, F, H stå för händelsen att en enhet kasseras, godkännes, är felaktig respektive är hel. (a) Vi har (b) Vi har P (F G) P (F K) P (F G) P (G) P (F K) P (K) P (G F )P (F ) P (G F )P (F ) + P (G H)P (H) 0.02 0.05 0.02 0.05 + 0.98 0.99 0.001. P (K F )P (F ) P (K F )P (F ) + P (K H)P (H) 0.02 0.95 0.02 0.95 + 0.98 0.01 0.65972. 5. Låt ξ antal kvinnor bland de 10 slumpmässigt utvalda rattfylleristerna. Vi har ξ Bin(10, 0.1). Sökt är P (minst 8 av dom 10 utvalda är män) P (ξ 2). Sannolikheten P (ξ 2) 0.9298 fås med hjälp av miniräknare eller tabell. 6. Antalet herrar i laget har ξ är Hyp(19, 5, 8/19)-fördelning. Väntevärdet i fördelningen (enligt formelbladet) är n p 5 8/19 2.105. 6 (9)

7. Låt ξ 1,..., ξ 68 vara lasten i ton för de 68 vagnarna och låt ξ 68 i1 ξ i vara den totala lasten. Vi söker P (ξ > 6850). Centrala gränsvärdessatsen ger att ξ approximativt är N(6800, 683) N(6800, 24.73863). Det ger (approximativt) att P (ξ > 6850) 1 P (ξ 6850) 1 P ( ξ 6850 } 24.73863 {{} N(0,1) 1 Φ(2.02) 0.0217. 6850 6800 24.73863 } {{ } 2.02113 8. Låt ξ vara antalet patienter av dom 6 som har ett lägre kolesterolvärde efter behandling. Vi har ξ Bin(6, p), där p är sannolikheten att en person har ett lägre kolesterolvärde efter behandling. Då H 0 är sann har vi p 0.5. Beslutsregeln är: förkasta H 0 om ξ 5. Signfikansnivån P ( H 0 sann) P (ξ 5 H 0 sann) P (ξ 5 ξ Bin(6, 0.5)) 0.1093 9. För testet i fråga skall gälla att signifikansnivån är 1%: och att styrkan är 90%: Det första villkoret ger ekvationen Det andra villkoret ger ekvationen P ( ξ k µ 2.1) 0.01 P ( ξ k µ 2.2) 0.9. k 2.1 + 0.15λ 0.01 / n. k 2.2 0.15λ 0.1 / n. Då vi löser för n och k får vi n 29.29. Så det krävs minst 30 observationer. 10. Den genomsnittliga produktionskostnaden per dag är 11500µ+200000, µ den genomsnittliga (förväntade) malmproduktionen. Konfidensintervall för µ med 99% konfidensgrad: [a, b] [ x t 0.005 (5)s/ 6, x+t 0.005 (5)s/ 6] [ x 4.032s/ 6, x+4.032s/ 6], där x 15.733 och där s 1.303. Detta ger [a, b] [13.588, 17.879]. Så den genomsnittliga produktionskostnaden per dag finns i intervallet [1150a+200000, 1150b+200000] [356261, 405606] med 99% säkerhet. 11. (a) Residualen är Y Ŷ 290 (b 0 + 25b 1 + 33b 2 ) 72.936. (b) Modellantagandet för den skattade modellen kan förenklas E(Y ) β 0 + β 1 X 1 + β 2 X 2. Att marknadsföringskostnaderna påverkar intäkterna är alltså samma sak som att β 2 0. Så vi vill testa H 0 : β 2 0 mot ) 7 (9)

H 1 : β 2 0. Vi kan använda beslutsregeln: förkasta H 0 om b 2 /s b2 > t 0.005 (n K), där n 10 och K 3. Här har vi b 2 /s b2 4.1173 och t 0.005 (n K) 3.499. Så H 0 förkastas. Då vi utgår från P-värdet förkastas H 0 om P-värdet är mindre än 0.01. Eftersom H 0 ska förkastas är P-värdet mindre än 0.01. (c) Från den skattade modellen ser vi att den förväntade ökningen av intäkterna då X 2 ökar med 1 miljon dollar är lika med β 2. Det betyder att den förväntade ökningen av intäkterna då X 2 ökar med en halv miljon dollar är lika med β 2 /2. Ett intervall för β 2 ges av b 2 ± t 0.05 (28)s b2. Ett intervall för β 2 /2 ges av b 2 /2 ± t 0.05 (28)s b2 /2 [2.006815, 5.429185]. 8 (9)

Tentamen i Matematisk statistik, S0001M, del 2 2016-08-23 Till uppgifterna på del 2 krävs fullständiga lösningar. 12. Ett godtyckligt tal kan skrivas som en summa av ett heltal och en icke-heltalsdel. För icke-heltalsdelen av ett tal a, som vi här betecknar [a], gäller att 0 [a] < 1. Dvs om a 3.25 så har vi [a] 0.25. Om a 6.667, så har vi [a] 0.667. Låt ξ 1 och ξ 2 vara oberoende och R(0, 1)-fördelade. Deras summa ξ ξ 1 + ξ 2 har följande frekvensfunktion (behöver inte visas): x om 0 x < 1, f(x) 2 x om 1 x 2, 0 annars. Låt ζ [ξ] vara icke-heltalsdelan av ξ. Beräkna fördelningsfunktion och frekvensfunktion för ζ. (10p) 13. Två personer, A och B, skall mäta en fysikalisk konstant θ. De gör en mätning var med olika metoder. Metoderna ger mätfel som är fördelade R( 1, 1) respektive R( 1.5, 1.5). De stokastiska variablerna ξ 1 och ξ 2 som betecknar mätvärdet från A respektive B kan antas oberoende. Som uppskattning av θ tänker man använda en linjär kombination av ξ 1 och ξ 2, nämligen η cξ 1 + (1 c)ξ 2. (a) Visa att η är en väntevärdesriktig skattning av θ för varje värde på c. (b) Vilket värde på c ger minst varians för η? (4p) (8p) 14. Det är inte ovanligt att man använder statistik för att framställa olika förhållanden på ett fördelaktigt sätt. Det kan gälla t.ex. diskussioner som rör förhållanden på arbetsmarknaden. Där kan man ibland höra uttalanden som att inom en tioårsperiod kommer 20 % av dom anställda i den här yrkeskategorin att gå i pension för att påtala behovet av framtida rekrytering. Din uppgift här är att med hjälp av rimliga fördelningsantaganden och statistiska resonemang bedöma och kommentera detta uttalande. (8p) 9 (9)