Tentamen i Matematisk statistik Kurskod S0001M

Relevanta dokument
Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Tentamen i Matematisk statistik Kurskod S0001M

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Kompletterande kursmaterial till kursen Matematisk statistik.

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tentamen i Matematisk statistik Kurskod S0001M

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys

Antal P(ξ = x)

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Examinationsuppgifter del 2

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

tentaplugg.nu av studenter för studenter

Matematisk statistik, Föreläsning 5

Tentamen i matematisk statistik

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Övningstentamen 2 Uppgift 1: Uppgift 2: Uppgift 3: Uppgift 4: Uppgift 5: Uppgift 6: i ord

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Tentamen i matematisk statistik

Regressions- och Tidsserieanalys - F3

Exempel 1 på multipelregression

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Regressions- och Tidsserieanalys - F1

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamen i matematisk statistik

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Läs noggrant informationen nedan innan du börjar skriva tentamen

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F1

TENTAMEN Datum: 14 feb 2011

Tentamen i Matematisk statistik, S0001M, del 1,

Regressions- och Tidsserieanalys - F3

Statistik för teknologer, 5 poäng Skrivtid:

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Statistisk försöksplanering

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

0 om x < 0, F X (x) = c x. 1 om x 2.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

TENTAMEN I MATEMATISK STATISTIK

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Metod och teori. Statistik för naturvetare Umeå universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

, s a. , s b. personer från Alingsås och n b

Tentamen Tillämpad statistik A5 (15hp)

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Föreläsningsanteckningar till kapitel 8, del 2

10.1 Enkel linjär regression

Tentamen LMA 200 Matematisk statistik,

Matematisk statistik LKT325 Tentamen med lösningar

Transkript:

Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2012-10-30 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson och Ove Edlund Jourhavande lärare: Adam Jonsson Tel: 0920-491948 Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in lösningar och bifogas oavsett om du lämnat in lösningar eller ej. Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 23 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (8)

1. En idrottsman som misstänks för doping får göra två test, A och B. För en dopad idrottsman är resultaten i test A och B oberoende. Test A är positivt med sannolikheten 0.75 när idrottsmannen är dopad. Motsvarande sannolikhet för test B är 0.64. Vad är sannolikheten att minst ett av testen ger positivt resultat för en dopad idrottsman? 2. Vid etsning av kretskort är andelen defekta kort ofta hög, och därför kontrolleras de färdiga korten. Kort läggs ihop i förpackningar om 21 kort. 8 av dessa ska tas ut för undersökning. Om det bland de 21 finns 6 defekta hur stor är sannolikheten att det i urvalet finns exakt 4 defekta kort? Ange ditt svar i procent med minst två decimaler. 3. Antalet defekter i visst tyg kan betraktas som en observation på en slumpvariabel med Poissonfördelning. Om det är känt att det i genomsnitt finns 2.4 defekter per kvadratmeter tyg, vad är då sannolikheten att en 1 m 2 stor tygbit har mer än 4 fel? 4. Livslängden för en viss typ av elektronrör är exponentailfördelad, där den förväntade livlängden för ett rör är lika med 185 timmar. Vad är sannolikheten att ett slumpmässigt valt lysrör håller i 150 timmar? 5. En forskargrupp vill bestämma medianen i en kontinuerlig fördelning med hjälp av ett stickprov ξ 1,..., ξ 15 av storlek 15. Bestäm konfidensgraden för intervallet [ξ(3), ξ(13)]. (3p) 6. Den stokastiska variabeln ξ beskriver ett företags årliga kostnader (enhet: kkr) för en viss typ av skada. Dess sannolikhetsfördelning anges nedan. x 0 100 250 P (ξ = x) 0.3 0.6 0.1 (a) Bestäm väntevärdet av ξ. (b) Företaget har även en konstant utgift om 75 kkr per år för skador av en annan typ. Beräkna standardavvikelsen för företagets totala utgifter för skador under ett år. (1p) 7. Aluminiumburkar återvinns genom att burkar krossas och körs till smältverk där detta blir en del av råvaran i tillverkningen av ny aluminium. Prover tas regel-bundet ut på inkommande burkkross, och en viktig egenskap är smältpunkten. Anta att det har visat sig rimligt att beskriva smältpunkten med en normalfördel-ning. I en sändning av burkkross tas fem prover ut slumpmässigt där man mäter smältpunkten. Följande värden erhölls (enhet Celcius): 660 667 654 663 662 2 (8)

Vad blir den övre gränsen i ett tvåsidigt 99 % konfidensintervall för den förväntade smältpunkten? (1p) 8. Antag att du har ett stickprov ξ 1,..., ξ 10 från N(µ, 1). För att genomföra ett test av H 0 : µ = 4 mot H 1 : µ = 3.5 så kan man utgå från medelvärdet ξ och förkasta H 0 om ξ k. (a) Bestäm k så att testet får 1% signifikansnivå. (b) Om man har ett större stickprov så får testet samma form, men det kritiska värdet för testet med 1% signifikansnivå beror på n. Hur stort måste stickprovet vara för att detta test ska få en styrka på 90%? (1p) 9. En gruvingenjör vill ta reda på den genomsnittliga tiden mellan stopp efter att en ny arbetsrutin införts. En normalfördelningsplot för stopptiderna x i, i = 1,..., 20, gav följande resultat. Figur 1: Normalfördelningsplot Ingenjören väljer mellan två metoder. Metod A går ut på att ett teckenintervall beräknas medan Metod B baseras på intervallet [ x t α/2 (19)s/ 20, x + t α/2 (19)s/ 20], där s är stickprovsstandardavvikelsen. Vilket av följande påståenden stämmer (välj ett alternativ). Ingenjören bör välja Metod (1)... B eftersom standardavvikelsen är okänd. (2)... A eftersom vi har observationer från en kontinuerlig fördelning. (3)... A pga normalfördelningsplottens utseende. (4)... B pga normalfördelningsplottens utseende. (5)... A eftersom mätvärdena troligen har en t-fördelning. (6)... B eftersom mätvärdena troligen har en t-fördelning. 3 (8)

10. Vid en undersökning studerades hur Y =den totala glassförsäljningen (enhet: kkr) i en glass-kiosk kunde relateras till X 1 =utomhustemperaturen och X 2 =glass-kioskens placering, där två olika placeringar testas för vilka X 2 = 0 respektive X 2 = 1. Resultatet av en regressionsanalys för 20 glassköp redovisas i tabell 1. (a) Bestäm den justerade förklaringsgraden. (b) För att undersöka om temperaturen påverkar försäljningen för en given placering skall ett test på 1% signifikansnivå genomföras genom att beräkna värdet på en lämplig t-kvot och jämföra denna med ett visst tal. Vad är värdet på t-kvoten? Kan man påstå att kostnaderna för marknadsföring påverkar biljettintäkterna på 1% signifikansnivå? (Ange JA eller NEJ på svarsbladet.) (c) Vad är den genomsnittliga förändingen av försäljningen om man flyttar kiosken från placering 0 till placering 1? Besvara frågan genom att beräkna ett 99%-igt konfidensintervall. Redovisa den undre gränsen. (1p) Tabell 1: Regression Analysis: Y versus X1; X2 The regression equation is Inkomst = - 42,8 + 2,66 Temp + 15,0 Placering Predictor Coef SE Coef T P Constant -42,84 10,23?? Temp 2,6607 0,4520?? Placering 15,004 1,360?? S = 3,03949 R-Sq =?% R-Sq(adj) =?% Analysis of Variance Source DF SS MS F P Regression 2???? Residual Error 17?? Total 19 1575,09 Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 4 (8)

Tabell för svar till del 1 Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:.......................................................... Fråga Svar Poäng 1 Sannolikhet (fyra decimaler) 0.9100 2 2 Sannolikhet (fyra decimaler) 0.1006 2 3 Sannolikhet (fyra decimaler) 0.0959 2 4 Sannolikhet (fyra decimaler) 0.4445 2 5 Konfidensgrad (fyra decimaler) 0.9926 3 6 a Väntevärde (kkr, en decimal) 85.0 1 b Standardavvikelse (två decimaler) 70.8872 2 7 Övre gräns (fyra decimaler) 671.0100 2 8 a kritiskt värde k (fyra decimaler) 3.2643 1 b antal observationer (heltal) 53 2 9 1,2,3,4,5 eller 6 3 2 10 a Just. förklaringsgrad (fyra decimaler) 0.8886 2 b t-kvot (fyra decimaler) 5.8865 JA eller NEJ JA 1 c Nedre gräns (fyra decimaler) 11.0627 2 Totalt antal poäng 25 5 (8)

6 (8)

Tentamen i Matematisk statistik, S0001M, del 2 2012-10-30 Vid bedömningen av lösningarna av uppgifterna i del 2 läggs stor vikt vid hur lösningarna är motiverade och redovisade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden. 11. En mindre bank söker en stokastisk modell för antalet inkommande kunder per timme. Man vet att det i genomsnitt inkommer 3 kunder varje timme. Vidare anser man följande antaganden vara rimliga. Det kan komma högst en kund per sekund. Kunderna kommer till banken oberoende av varandra. (a) Argumentera för Poissonfördelningen som stokastisk modell för antalet kunder per timma. Ange värdet på λ. (b) Föreslå en modell för antalet kunder under två timmar. (5p) (5p) Lösningsskiss (a) ξ =antal kunder på en timme Bin(n, p) under bankens antaganden, p sannolikheten att en kund kommer in under ett 1- sekundersintervall, n = 3600 sekunder på en timme. Måste gälla att 3 = E[ξ] = np. Alltså är p litet och ξ P (np) = P o(3) approximativt. (b) ξ =antal kunder på två timmar är Bin(n, p) under samma givna antaganden, p sannolikheten att en kund kommer in under ett 1- sekundersintervall, n = 7200 sekunder på två timme. Måste gälla att 6 = E[ξ] = np. Alltså ξ P (np) = P o(6) approximativt. 12. Efter att ha kastat en enkrona 10000 gånger har Stefan fått 5088 klave och 4912 krona. Han misstänker att myntet i genomsnitt ger fler klave än krona, men vet inte hur han ska gå tillväga. Föreslå en metod som Stefan kan använda för att avgöra om myntet i genomsnitt ger fler klave än krona. Vad ger din metod för slutsats? (10p) Lösningsskiss Lämpliga hypoteser H 0 : p = 0.5 mot H 1 : p > 0.5, där p är sannolikheten för klave. Testvariabel är ξ =antal klave på 10000 kast och beslutsregel: förkasta H 0 om ξ k. Approximationen B(10000, p) N(1000p, 100 p(1 p)) ger att det kritiska värdet k för testet på t.ex. 5 % signifikansnivå är 5082. Så på den risknivån kan Stefan inte påstå att myntet ger fler klave i genomsnitt. 13. Vi jobbar vidare med problemet med glassförsäljning från del 1. För att undersöka om modellen blir bättre om man tillåter temperaturens effekt på försälningen att bero på glass-kioskens placering utökades modellen genom att man la till produkten X 3 = X 1 X 2 som förklarande variabel. En regressionsanalys av samma datamaterial som i del 1 genomfördes. Temperaturen varierade mellan 20.1 och 25.3 (Enhet: Celcius). Resultatet återges i tabell 2 nedan, residualplottarna i Figur 2,3 och 4. (a) Ange fullständingt modellantagande. Verkar modellen rimlig? (3p) 7 (8)

Tentamen i Matematisk statistik, S0001M, del 2 2012-10-30 Tabell 2: Regression Analysis: Y versus X1; X2 Regression Analysis: Y versus X1; X2; X1*X2 The regression equation is Y = - 30,1 + 2,10 X1-11,9 X2 + 1,19 X1*X2 Predictor Coef SE Coef T P Constant -30,14 13,72-2,20 0,043 X1 2,0970 0,6074 3,45 0,003 X2-11,86 19,93-0,60 0,560 X1*X2 1,1944 0,8842 1,35 0,196 S = 2,96833 R-Sq = 91,0% R-Sq(adj) = 89,4% (b) Man kan beskriva den skattade modellen med hjälp av två linjer. Ange dessa linjer. (c) Kan man påstå temperaturens effekt på försäljningen beror av glass-kioskens placering? För att besvara frågan skall du genomföra ett lämpligt test. Testvariabel, beslutsregel och slutsats skall tydligt framgå. Lösningsskiss (a) Modellantagande: (b) Y i = β 0 + β 1 X 1,i + β 2 X 2,i + β 3 X 3,i + ɛ i, i = 1,..., 20 Y =glassförsäljning, X 1 =temp, 20.1 X 1 25.3, X 2 =placering =0 eller 1, X 3 = X 1 X 2, ɛ 1, ɛ 20 oberoende och N(0, σ 2 ). Det finns inget i residualplottarna som tyder på att modellantagandet är orimligt. och för placering 0 respektive 1. Y = 30, 1 + 2, 10X1 Y = 42, 0 + 3, 29X1 (c) Att temperaturens effekt på försäljningen beror av glass-kioskens placering är samma sak som att β 3 0. Test av H 0 : β 3 = 0 mot H 1 : β 3 0 kan göras t.ex. med direktmetoden. Då P -värdet är ca 0.2 blir slusatsen att man inte kan påstå att temperaturens effekt på försäljningen beror av placeringen på dom vanliga risknivåerna. (5p) 8 (8)

Tentamen i Matematisk statistik, S0001M, del 2 2012-10-30 99 Normal Probability Plot (response is Y) Percent 95 90 80 70 60 50 40 30 20 10 5 1-5,0-2,5 0,0 Residual 2,5 5,0 7,5 Figur 2: Residuals Versus X1 (response is Y) 5,0 2,5 Residual 0,0-2,5-5,0 20 21 22 X1 23 24 25 Figur 3: Residuals Versus X2 (response is Y) 5,0 2,5 Residual 0,0-2,5-5,0 0,0 0,2 0,4 X2 0,6 0,8 1,0 Figur 4: 9 (8)