Tentamen i Matematisk statistik Kurskod S0001M

Relevanta dokument
Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Tentamen i matematisk statistik

TENTAMEN Datum: 14 feb 2011

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Kompletterande kursmaterial till kursen Matematisk statistik.

Tentamen Tillämpad statistik A5 (15hp)

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Föreläsning G60 Statistiska metoder

Tentamen i Matematisk statistik Kurskod S0001M

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

10.1 Enkel linjär regression

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Examinationsuppgifter del 2

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Läs noggrant informationen nedan innan du börjar skriva tentamen

Stockholms Universitet Statistiska institutionen Termeh Shafie

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

F3 Introduktion Stickprov

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Föreläsningsanteckningar till kapitel 9, del 2

Tentamen i Dataanalys och statistik för I den 28 okt 2015

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Antal P(ξ = x)

Statistik B Regressions- och tidsserieanalys Föreläsning 1

7.5 Experiment with a single factor having more than two levels

Tentamen MVE302 Sannolikhet och statistik

Tentamen den 11 april 2007 i Statistik och sannolikhetslära för BI2

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Föreläsningsanteckningar till kapitel 8, del 2

Läs noggrant informationen nedan innan du börjar skriva tentamen

Metod och teori. Statistik för naturvetare Umeå universitet

Räkneövning 3 Variansanalys

Tentamen i matematisk statistik

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning 12, FMSF45 Hypotesprövning

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Tentamen i matematisk statistik

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Regressions- och Tidsserieanalys - F3

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Tentamen i matematisk statistik

Regressions- och Tidsserieanalys - F4

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Transkript:

Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2018-01-12 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Mykola Shykula, Niklas Grip Jourhavande lärare: Mykola Shykula Tel: 0920-493056 Examinator: Mykola Shykula Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen (del 1), som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in även lösningar och bifogas oavsett om du lämnat in lösningar eller ej. OBS! Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen (del 2), som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på del 1 samt minst 13 poäng på del 2. För betyg 5 krävs godkänt på del 1 samt minst 23 poäng på del 2. OBS! Det går inte att kompensera underkänt på del 1 av tentamen med poäng från del 2. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (8)

Tentamen i Matematisk statistik, S0001M, del 1 2018-01-12 1. Händelser A, B, C har följande sannolikheter: P (A) = 0.1, P (B) = 0.2, P (C) = 0.3. (a) Om händelserna är disjunkta, vad är då sannolikheten att minst en av dem inträffar? (1 p) (b) Om händelserna är oberoende, vad är då sannolikheten att minst en av dem inträffar? (1 p) 2. En nationell folkhälsoenkät visade att 14% av kvinnorna och 19% av männen i åldersgruppen 16-64 år i den studerade nationen led av soleksem. I populationen är 53% kvinnor. Vad är sannolikheten för att en slumpmässigt utvald person lider av soleksem. 3. Livslängden ξ (i timmar) för en viss typ av elektroniska komponenter kan antas vara exponentialfördelad med parameter λ = 0.001. Vad är sannolikheten att bland 8 sådana komponenter minst 2 har en livslängd som överstiger 600 timmar? Antag att livslängden hos de olika komponenterna är oberoende. 4. När Kalle skiver på sin dator så händer det att han trycker på fel tangent. Antalet feltryckningar per 5-minutersperiod är Poissonfördelat. Det förväntade antalet feltryckningar under 5 minuter är lika med 8. Beräkna sannolikheten att Kalle gör minst 10 feltryckningar på en 5-minutersperiod. 5. Antag att ξ 1, ξ 2 N(1, 1) och ξ 3 N(2, 1) är oberoende. Beräkna sannolikheten P (5ξ 1 ξ 2 1 2ξ 3 1). 6. Vid tillverkningen av mattor hade det visat sig att förväntat antal fel per kvadratmeter var 30 och att standardavvikelsen för antalet fel per kvadratmeter var 7. Inom företaget diskuteras olika procedurer för provtagning av mattor. Ett förslag är att ta ut 49 kvadratmeterstora prov ur tillverkningen, räkna antalet fel på dessa och beräkna medelvärdet av antalet fel per kvadratmeter. Med en sådan procedur, hur stor är då den approximativa sannolikheten att medelvärdet kommer att vara mellan 28 och 31 fel per kvadratmeter? 2 (8)

Tentamen i Matematisk statistik, S0001M, del 1 2018-01-12 7. Du har fått i uppdrag att studera skillnaden i förväntad sjukfrånvaro bland kvinnor och män i en viss organisation. Du vet sedan tidigare undersöknignar att det är rimligt att betrakta sjukfrånvaro mätt i antal dagar per år i de två grupperna som normalfördelad och att standardavvikelsen kan förutsättas vara lika stor i båda grupperna. Undersökningen görs så att två slumpmässiga urval om 12 män och 12 kvinnor tas ut, varefter dessa personers sjukfrånvaro undersöks. I gruppen av män blev medelvärdet för sjukfrånvaro 7.5 och standardavvikelsen blev 5.3 dagar per år. Bland kvinnor blev medelvärdet 8.8 och standardavvikelsen 4.4 dagar per år. (a) Bestäm ett konfidensintervall med konfidensgrad 90% för skillnaden mellan de två gruppernas förväntade sjukfrånvaro. Ange den nedre gränsen för detta intervall. Använd kvinnornas sjukfrånvaro som den första termen i den differens som beräknas mellan de två grupperna. (b) Du vill även göra en hypotesprövning och använder en nollhypotes H 0 : Det finns ingen skillnad i förväntad sjukfrånvaro bland kvinnor och män mot mothypotesen H 1 : Det finns en skillnad. Ger observationerna stöd för att påstå att det finns en skillnad mellan de två gruppernas förväntade sjukfrånvaro på 10% signifikansnivå? (svara JA eller NEJ) 8. Veckoutgifterna (i kronor) för mat hos en viss familj kan anses vara normalfördelad N(µ, σ) med känd standardavvikelsen σ = 300 kr. Man vill utföra ett test där man testar nollhypotesen H 0 : µ = 1800 mot mothypotesen H 1 : µ > 1800. Som testvariabel används medelvärdet x som är baserat på observationer av utgifterna under 9 olika veckor valda på måfå. Beslutsstrategin är följande: om x > k så förkastas H 0. (a) Bestäm k för testet med 5% felrisk. (b) Bestäm testets styrka då den verkliga genomsnittliga veckoutgiften är 2100 kr. 9. Slumpvariabeln ξ har en kontinuerlig fördelning vars frekvensfunktion ges av { cx 2 om 2 x 2, f(x) = 0 annars, där c är en viss konstant. (a) Bestäm värdet på konstanten c. (b) Bestäm medianen för ξ. 3 (8)

Tentamen i Matematisk statistik, S0001M, del 1 2018-01-12 10. Pris (tkr) och månadsavgift (kr) har samlats in för 32 lägenheter i en stad. Regressionsanalys med Minitab ger följande resultat. Regression Analysis: Pris versus Avgift Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression 1 14778039 14778039 47,62 0,000 Avgift 1 14778039 14778039 47,62 0,000 Error 30 9310733 310358 Total 31 24088772 Model Summary S R-sq R-sq(adj) R-sq(pred) 557,098 61,35% 60,06% 55,65% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant 1426 265 5,38 0,000 Avgift 0,4912 0,0712 6,90 0,000 1,00 Regression Equation Pris = 1426 + 0,4912 Avgift Prediction for Pris Regression Equation Pris = 1426 + 0,4912 Avgift Variable Setting Avgift 3500 Fit SE Fit 95% CI 95% PI 3144,98 98,5285 (2943,76; 3346,21) (1989,58; 4300,39) (a) Kan man med 1% felrisk påstå att avgiften påverkar priset? Svara JA eller NEJ. (b) Vilken effekt har avgiften på priset med 98% säkerhet? Bestäm konfidensintervall för effekten. Svara med den övre gränsen. (c) Bestäm ett intervall som med 95% säkerhet innehåller priset på en slumpvis vald ny lägenhet med månadsavgift 3500 kr. Svara med den övre gränsen (enhet: tkr). Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 4 (8)

Tentamen i Matematisk statistik, S0001M, del 1 2018-01-12 Tabell för svar till del 1 Lägg detta blad först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter anges som ett tal mellan 0 och 1 i decimalform om inte annat anges. Fråga Svar Poäng 1 a Sannolikhet (tre decimaler) 0.600 1 b Sannolikhet (tre decimaler) 0.496 1 2 Sannolikhet (fyra decimaler) 0.1635 2 3 Sannolikhet (tre decimaler) 0.982 2 4 Sannolikhet (fyra decimaler) 0.2834 1 5 Sannolikhet (två decimaler) 0.50 2 6 Sannolikhet (två decimaler) 0.82 2 7 a Undre gräns (tre decimaler) -2.115 2 b JA eller NEJ NEJ 1 8 a Värde på k (en decimal) 1964.5 2 b Styrka (fyra decimaler) 0.9131 (0.9123 OK) 2 9 a Värde på c (fyra decimaler) 0.1875 1 b Median (en decimal) 0.0 1 10 a JA eller NEJ JA 1 b Övre gräns (tre decimaler) 0.666 2 c Övre gräns (en decimal) 4300.4 (4300.8 OK) 2 Totalt antal poäng 25 5 (8)

Tentamen i Matematisk statistik, S0001M, del 2 2018-01-12 Till uppgifterna på del 2 krävs fullständiga lösningar. 11. Glidegenskaperna hos en längdskida för klassisk åkning beror bland annat av den så kallade spannhöjden. En doktorand vid LTU vill undersöka om det finns fog att rekommendera elitskidåkare att mäta upp spannet i samma temperaturer som de skall tävla i. Därför väljs slumpvis 16 skidor från olika elitåkare, för vilka spannhöjden x i mäts upp i rumstemperatur, i = 1, 2, 3,..., 16. För samma 16 skidor mäts även spannhöjden y i vid temperatur -15 grader, och skillnaden d i = y i x i räknas ut (enhet millimeter). Stickprovens medelvärden och standardavvikelser blir då x =1.1331, y =1.0306, d = 0.1025, s x =0.2901, s y =0.1950, s d =0.1460. Mätningarna anses vara statistiskt oberoende för de olika skidorna och doktoranden vill räkna ut ett konfidensintervall som säger något om eventuella skillnader i spannhöjd vid de två temperaturerna. a) Antag först att alla variabler är normalfördelade, och räkna ut ett 95 % konfidensintervall med den metod du finner bäst lämpad under dessa förutsättningar. (För full poäng krävs rätt val av metod.) (5 p) b) När resultaten redovisades i en vetenskaplig tidskrift så beräknades ett konfidensintervall för relativa förändringen z k = y k x k x k uttryckt i %. Normalfördelningsdiagram gav inget tydligt stöd för normalfördelningsantagande. Därför användes ett teckenintervall baserat på femte minsta och femte största observerade värdet z(5) = 15.38 % och z(12) = 0.89 %. Räkna ut konfidensgraden för detta konfidensintervall. (5 p) Lösningsförslag: a) Eftersom fördelningens standardavvikelse är okänd och eftersom man gör två mätningar på varje skida så är det lämpligt att använda metoden för stickprov i par med t-fördelning med 16 1 = 15 frihetsgrader. Från tabell fås t 0.025 (15) = 2.131. Ändpunkter för ett 95 % konfidensintervall är då d ± t 0.025 (15) s d = 0.1025 ± 2.131 0.1460 0.1025 ± 0.0778 16 4 Detta ger konfidensintervallet [-0.180 ; -0.024]. (Den genomsnittliga spannhöjden är alltså med 95 % säkerhet mellan 0.024 och 0.818 millimeter lägre vid -15 grader än i rumstemperatur.) b) När man inte kan anta normalfördelning är teckenintervall en mer passande metod. Den förutsätter enbart oberoende ζ k, k = 1, 2, 3,, 16 med samma median m: P(ζ k m) = 0.5, k = 1, 2, 3,, 16. 6 (8)

Tentamen i Matematisk statistik, S0001M, del 2 2018-01-12 Låt ζ(1), ζ(2),..., ζ(16) vara variablerna ζ k sorterade i växande ordning. Det valda konfidensintervallet är då I = [ζ(5), ζ(12)]. Låt α vara antalet ζ k m och låt β vara antalet ζ k m. De har båda binomialfördelning α, β Bin(16, 0.5). Alltså är P(m I) = 1 P(m I) = 1 P ((m < ζ(5)) (m > ζ(12))) = 1 P(m < ζ(5)) P(m > ζ(12)) = 1 P(α 4) P(β 4) 4 ( ) 16 = 1 2 0.5 k 0.5 n k k k=0 4 ( ) 16 = 1 2 0.5 n 0.923. k k=0 Konfidensgraden blir alltså 92.3%. (Sannolikheterna P(α 4) = P(β 4) hade förstås lika gärna kunnat läsas av ur tabell.) 12. En universitetskurs har tre kursmoment A, B och C, som kan ge en bonuspoäng vardera på tentamen. En student kan därför få maximalt 3 bonuspoäng. Andelen studenter som klarar kursmoment A, B och C och får motsvarande bonuspoäng är 92%, 95% respektive 90%. Antag att de tre händelserna A, B och C är statistiskt oberoende. Som ett mått på genomsnittsstudentens prestation, räkna ut väntevärde och standardavvikelse för antalet bonuspoäng för en slumpvisvald student. Lösningsförslag: Låt ξ vara antalet bonuspoäng för en slumpvis vald student. Vi behöver först räkna ut sannolikhetsfunktionen för ξ: (10p) P (ξ = 0) = P (A c B c C c ) = 0.08 0.05 0.10 = 0.0004. P (ξ = 1) = P ((A B c C c ) (A c B C c ) (A c B c C)) = 0.92 0.05 0.10 + 0.08 0.95 0.10 + 0.08 0.05 0.90 = 0.0158. P (ξ = 2) = P ((A c B C) (A B c C) (A B C c )) = 0.08 0.95 0.90 + 0.92 0.05 0.90 + 0.92 0.95 0.10 = 0.1972. P (ξ = 3) = P (A B C) = 0.92 0.95 0.90 = 0.7866. Detta ger att E(ξ) =0 0.0004 + 1 0.0158 + 2 0.1972 + 3 0.7866 = 2.77, V (ξ) =(0 2.77) 2 0.0004 + (1 2.77) 2 0.0158 + (2 2.77) 2 0.1972 + (3 2.77) 2 0.7866 =0.2111, σ = 0.2111 0.4595. 7 (8)

Tentamen i Matematisk statistik, S0001M, del 2 2018-01-12 13. Låt ξ vara en Poissonfördelad variabel med parameter λ. a) Bevisa att väntevärdet E(ξ) = λ. Ledning: ställ upp E(ξ) som en oändlig summa. (5 p) b) Bevisa att variansen V (ξ) = λ. Ledning: ställ upp V (ξ) som en oändlig summa. (5 p) Lösningsförslag: Sannolikhetsfunktionen för ξ är a) P (ξ = n) = e λ λ n, n = 0, 1, 2,... n! E(ξ) = np (ξ = n) = np (ξ = n) = n e λ λ n n(n 1)! e λ λ m+1 e λ λ m = [m = n 1] = = λ m! m! =λ P (ξ = n) = λ 1 = λ. b) För variansen slipper man första tre raderna i följande uträkning om man utgår från formeln V (ξ) = E(ξ 2 ) E(ξ) 2. där V (ξ) = (n λ) 2 P (ξ = n) = (n 2 2λn + λ 2 )P (ξ = n) = n 2 P (ξ = n) 2λ np (ξ = n) + λ 2 = n 2 P (ξ = n) 2λE(ξ) + λ 2 1 = S λ 2, P (ξ = n) S = n 2 P (ξ = n) = n 2 P (ξ = n) = n 2 e λ λ n n(n 1)! = n e λ λ n (n 1)! = [m = n 1] = (m + 1) e λ λ m+1 m! ( ) =λ (m + 1)P (ξ = n) = λ mp (ξ = n) + P (ξ = n) =λ(λ + 1) = λ 2 + λ. Alltså följer att V (ξ) = λ. 8 (8)