Tentamen i Matematisk statistik Kurskod S0001M

Relevanta dokument
Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Matematisk statistik Kurskod S0001M

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Tentamen i Matematisk statistik Kurskod S0001M

TENTAMEN Datum: 14 feb 2011

Tentamen i Matematisk statistik Kurskod S0001M

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Tentamen i Dataanalys och statistik för I den 28 okt 2015

Matematisk statistik, Föreläsning 5

TENTAMEN I MATEMATISK STATISTIK 19 nov 07

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Tentamen i Matematisk statistik Kurskod S0001M

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Avd. Matematisk statistik

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

0 om x < 0, F X (x) = c x. 1 om x 2.

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Avd. Matematisk statistik

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

Avd. Matematisk statistik

Lufttorkat trä Ugnstorkat trä

Tentamen LMA 200 Matematisk statistik,

Avd. Matematisk statistik

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Matematisk statistik TMS063 Tentamen

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Stockholms Universitet Statistiska institutionen Termeh Shafie

Tentamen den 11 april 2007 i Statistik och sannolikhetslära för BI2

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004, TEN

Matematisk statistik TMS064/TMS063 Tentamen

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

Matematisk statistik, LMA 200, för DAI och EI den 25 aug 2011

Tentamen i matematisk statistik (92MA31, STN2) kl 08 12

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Matematisk statistik KTH. Formelsamling i matematisk statistik

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Lösningar till tentamen i Matematisk Statistik, 5p

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Avd. Matematisk statistik

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004, TEN

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Uppgift a b c d e Vet inte Poäng

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

Lycka till!

TENTAMEN I STATISTIKENS GRUNDER 2

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Uppgift 1. f(x) = 2x om 0 x 1

Tentamen i Matematisk Statistik, 7.5 hp

Matematisk statistik LKT325 Tentamen med lösningar

Transkript:

Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2016-01-15 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 15.00 20.00 Lärare: A Jonsson, J Martinsson, M Shykula Jourhavande lärare: Mykola Shykula Tel: 0920-493056 Jesper Martinsson Tel: 0920-491425 Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs godkända webbuppgifter och minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in lösningar och bifogas oavsett om du lämnat in lösningar eller ej. Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 23 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (9)

1. Vid tillverkning av detaljer till en maskin är felfrekvensen 1%. För att begränsa antalet reklamationer beslutar man att alla detaljer ska passera en kontroll. Vid denna kontroll kasseras felaktiga detaljer med sannolikheten 0.96, och felfria kasseras med sannolikheten 0.02. Vad är sannolikheten att en detalj som har kasserats faktiskt är felaktig? 2. I ett parti om 5000 tillverkade enheter är 3% defekta. Man väljer på måfå 200 enheter. Låt ξ beteckna antalet defekta enheter bland dom 200 utvalda. Bestäm det minsta heltal k, för vilket det gäller att P (ξ > k) < 0.01. 3. Tim har ingen brådska med att ta examen. Han tänker skriva sin sista tenta tills han klarar den, men han orkar inte plugga. Han bedömer därför att hans chans att klara tentan varje gång är 20%. Bestäm sannolikheten att han behöver skriva tentan minst 2 men högst 5 gånger. 4. På ett stort företag diskuteras den förväntade mängden köp per kund i ett visst kundsegment. I tidigare undersökningar var förväntat antal köp per kund och år 15.1 stycken, och standardavvikelsen var 5.5. Om ett urval av 66 kunder görs i en kommande undersökning, hur stor är då approximativt sannolikheten att de utvalda personerna i genomsnitt gör högst 15.2 köp per år? 5. Betrakta funktionen { 1 2c om c x + c, f(x) = 0 annars. Funktionen f är en frekvensfunktion för alla positiva värden på c och. Det finns dock endast ett par av värden på c och för vilka väntevärdet och variansen är 11 respektive 12. Vilka är dessa värden på c och? 6. Slumpvariablerna ξ 1,..., ξ 10 är oberoende och har samma kontinuerliga fördelning. Den 20:e percentilen fördelningen, som betecknas L 20, är lika med 0.15. Beräkna sannolikheten att fler än 3 av dom 10 variablerna antar ett värde som är mindre än 0.15. 7. Låt ξ vara livslängden hos en elektronisk komponent. Antag att ξ Exp(λ) där λ = 0.1. Beräkna P (ξ 3 ξ > 2). 8. En geolog studerar hur järnhalten (mg/l) i skogsmark påverkas av ett visst gift och gör därför mätningar på sex anvgivna platser. Sedan behandlar hon var och en av dessa platser med giftet och återkommer en dag senare för att undersöka om järnhalten förändrats. Järnhalterna som observerades med och utan miljögift var följande: 2 (9)

Mätning 1 2 3 4 5 6 Med 14.41 13.3 12.15 10.63 23.19 17.64 Utan 18.73 17.12 18.04 13.77 27.05 19.26 Beräkna, under rimliga normalfördelningsantaganden, ett 95% konfidensintervall för genomsnittlig skillnad i järnhalt då giftet används jämfört med om det inte används. Kan man med 95% säkerhet påstå att giftet har en effekt på järnhalten? För poäng på denna uppgift krävs rätt intervall och rätt svar (JA eller NEJ). 9. Mätvärdena i tabellen nedan kan betraktas som observerade värden på ξ 1,..., ξ 6, där ξ i N(µ, 0.15), i = 1, 2,..., 6. Man vill testa H 0 : µ = 0.75 mot H 1 : µ > 0.75. (a) Antag att man har bestämt sig för en beslutsregel som innebär att H 0 förkastas då z > 2.3, där z = ξ 0.75 σ/ 6. Bestäm testets styrka då µ = 0.95. (b) Antag att man istället för beslutsregeln i (a) bestämt sig för en beslutsregel som innebär att H 0 förkastas då ζ 5, där ζ är antalet variabler bland dom sex som antar ett värde som är större än 0.75. Bestäm testets signifikansnivå. 10. I ett avancerat växthus utförs ett experiment för att avgöra om mängden belysning påverkar hur mycket jordgubbar växer. Belysningen mäts med hjälp av ett belysningsindex och jordgubbarnas vikt mäts i gram. De första fyra erhållna observationerna följer nedan Jordgubbsvikt (g) Belysningsindex 20 5 26 10 34 10 40 15 Det är rimligt att tro att det föreligger ett linjärt samband mellan variablerna. Utifrån datamateriler ovan skattas en regressionsmodell där Y =jordgubbsvikt (g) beror av X =belysningsindex. Tabellen nedan innehåller minsta-kvadrat skattningarna av regressionskoefficienterna samt deras skattade standardavvikelser: b 0 = 10 s b0 = 6 b 1 = 2 s b1 = 0.5657 Regressionskvadratsumman och den totala kvadratsumman är 4 (Ŷi Ȳ )2 = 200 respektive i=1 4 (Y i Ȳ )2 = 232. i=1 3 (9)

(a) Skapa ett 95% konfidensintervall för den effekt som belysningsindex har på jordgubbsvikten. Svara med den nedre gränsen. Avrunda till en decimal. (b) Beräkna förklaringsgraden. (c) Beräkna residualspridningen. (d) Beräkna korrelationen mellan belysningsindex och jordgubbarnas vikt. (1p) (1p) (1p) Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 4 (9)

Tabell för svar till del 1 Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter skall anges som ett tal mellan 0 och 1 i decimalform om inte annat anges. Fråga Svar Poäng 1 Sannolikhet (tre decimaler) 0.327 2 2 minsta värdet på k (heltal) 12 2 3 Sannolikhet (tre decimaler) 0.472 2 4 Sannolikhet (tre decimaler) Φ(0.15) = 0.560 2 5 Värdena på c och (en decimal) = 11, c = 6, 2 6 Sannolikhet (tre decimaler) 0.121 2 7 Betingad sannolikhet (tre decimaler) 0.095 2 8 Undre och övre gräns (tre decimaler) ( 5.246, -2.304) JA eller NEJ JA 2 9 a Styrka (procent, en decimal) 83.4 2 b Signifikansnivå (procent, en decimal) 10.93 2 10 a Nedre gräns (tre decimaler) -0.434 2 b Förklaringsgrad (procent, en decimal) 86.2 1 c Residualspridning (tre decimaler) 4.000 1 d Korrelation (tre decimaler) 0.928 1 Totalt antal poäng 25 5 (9)

Lösningar till vissa av uppgifterna på del 1 2. Låt ξ vara antal defekta enheter bland dom 200 utvalda enheterna. Eftersom enheterna väljs utan återläggning har vi ξ Hyp(N, n, p) där N = 5000, n = 200, p = 0.03. Här gäller tumregeln p + 1/N < 0.1 för Poisson-approximation, så vi kan räkna som om ξ P o(λ), där λ = np = 6. Vi vill ha det minsta k för vilket P (ξ > k) < 0.01, dvs det minsta k som ger P (ξ k) > 0.99. Om vi prövar oss fram med hjälp av Poissonfördelningstabellen får vi att svaret är 12. 3. Låt ξ vara antal gånger Tim behöver skriva tentan. Vi har P (ξ = x) = 0.8 x 1 0.2, x = 1, 2,... och P (2 ξ 5) = 5 x=2 0.8x 1 0.2. 4. Låt ξ i vara antal köp för kund i, i = 1, 2,..., 66. Det genomsnittliga antalet köp per kund och år är då ξ = (ξ 1 + + ξ 66 )/66. Centrala gränsvärdessatsen ger ξ N(15.1, 5.5/ 66) approximativt. Så vi har (approximativt) P ( ξ 15.2) = P ( ξ 15.1 5.5/ 15.2 15.1 66 5.5/ 66 ) }{{} η N(0,1) Φ(0.15) = 0.5596. 5. Detta är frekvensfunktionen för R( c, +c)-fördelningen. Väntevärde och varians i den fördelningen är (enl. formelbladet) och (2c) 2 /12. Vi har = 11 och (2c) 2 /12 = 12 om = 11 och c = 6. 6. Låt η beteckna antalet variabler av dom 10 som antar ett värde som är mindre än 0.15. Eftersom variablerna är oberoende och P (ξ i < L 20 ) = 0.2 så gäller η Bin(10, 0.2). Vi har P (η > 3) = 1 P (η 3) där P (η 3) = 0.8791 t.ex. kan tas från tabell. 7. Enligt Exempel 4.5 i boken har vi P (ξ > 3 ξ > 2) = P (ξ > 1) = e 0.1 om ξ Exp(0.1). Så P (ξ 3 ξ > 2) = 1 P (ξ > 3 ξ > 2) = 1 e 0.1. 8 (a) Här ska metoden för stickprov i par användas. Detta eftersom mätningarna görs på olika platser. 6 (9)

9 (a) Styrkan då µ = 0.95 är P (förkasta H 0 µ = 0.95) = P (z > 2.3 µ = 0.95) = P ( ξ 0.75 σ/ 6 > 2.3 µ = 0.95) = P ( ξ 0.95 + 0.95 0.75 σ/ 6 > 2.3 µ = 0.95) = P ( ξ 0.95 σ/ 0.95 0.75 + 6 σ/ > 2.3 µ = 0.95) 6 }{{} η N(0,1) 0.95 0.75 = 1 P (η 2.3 σ/ η N(0, 1)) 6 = 1 Φ( 0.966). = Φ(0.966). Φ(0.97) = 0.8340. Ett annat sätt att lösa uppgiften är att först konstatera att z > 2.3 är samma sak som att ξ > 0.89... Då får man en styrkeberäkning som mer liknar bokens exempel. 9 (b) Signifikansnivån α ges av P (förkasta H 0 µ = 0.75) = P (ζ 5 µ = 0.75). Då µ = 0.75 har vi P (ξ i > 0.75) = 0.5. Så ζ Bin(6, 0.5) då µ = 0.75. Det ger att P (ζ 5 µ = 0.75) = 0.1094. 7 (9)

Tentamen i Matematisk statistik, S0001M, del 2 2016-01-15 Till uppgifterna på del 2 läggs stor vikt vid hur lösningarna är motiverade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden. 11. Jesper kastar ett mynt 10 gånger. (a) Låt ξ 1 vara antalet krona på dom första fem kasten, låt ξ 2 vara antalet krona på dom sista fem kasten, och låt ξ = ξ 1 +ξ 2. Bestäm fördelningen till ξ. (b) Om ξ 1 Bin(n 1, p) och ξ 2 Bin(n 2, p) är oberoende slumpvariabler så gäller att ξ 1 + ξ 2 Bin(n 1 + n 2, p). Detta resultat har inte nämts i kursen. Men det fullt möjligt att ge en tillfredställande förklaring till varför resultatet måste stämma. Din uppgift här är att göra det. Tänk på att tydligt redovisa dina förklaringar. (8p) Lösning: (a) Resultaten på kasten antas stokastiskt oberoende och sannolikheten att få krona är 0.5 på varje kast. Det betyder att antalet krona på tio kast, dvs ξ, är Binomialfördelad med n = 10 och p = 0.5. (b) Antag att ξ 1 Bin(n 1, p) och ξ 2 Bin(n 2, p) är oberoende slumpvariabler. Då kan vi betrakta ξ 1 som antal lyckade försök i en serie av n 1 försök där varje försök lyckas med sannolikhet p. Och vi betrakta ξ 2 som antal lyckade försök i en serie av n 2 försök, som är oberoende av den första försöksserien, och där varje försök lyckas med sannolikhet p. Då blir summan ξ 1 + ξ 2 antalet lyckade försök i en serie av n 1 + n 2 oberoende försök som alla lyckas med sannolikhet p. Alltså ξ 1 + ξ 2 Bin(n 1 + n 2, p). 12. Den 2 december 2015 rapporterades på Aktuellt att november månad var varmare än vad november månad i genomsnitt varit i Sverige under lång tid. I själva verket har november månad, under 9 av dom 10 senaste åren, varit varmare än genomsnittet. Undantaget var det ovanligt kalla 2010. Man skulle, baserat på ovanstående information, kunna genomföra ett mycket enkelt test av huruvida en förändring verkligen skett de senaste 10 åren. Din uppgift är att genomföra ett sådant test. Hypoteser, beslutsregel, slutsats och risknivå skall tydligt framgå. Lösning: Låt p vara sannolikheten att november är varmare än ett långtidsgenomsnitt. Vi antar att p varit konstant de senaste tio åren och att utfallen under de 10 åren varit oberoende. Om det inte skett en förändring de senaste 10 åren (jämfört med långtidsgenomsnittet) så har vi p = 0.5. Vi vill testa H 0 : p = 0.5 mot H 1 : p > 0.5. Vi använder testvariabel ξ =antal år de senaste 10 åren som november varit varmare än vanligt och beslutsregeln förkasta H 0 om ξ k, (10p) 8 (9)

Tentamen i Matematisk statistik, S0001M, del 2 2016-01-15 där k bestäms av signifikansnivån. Alternativt med direktmetoden så beräknar vi P-värdet α 0 = P (ξ 9) = 0.011. Man kan tycka att en liten signifikansnivå är lämpligt när det rör sig om viktiga miljöfrågor. På 1% signifikansnivå kan man inte förkasta H 0. 13. Vi fortsätter med problem 10 från del 1. (a) Oscar undrar hur stora hans jordgubbar blir om han använder belysning motsvarande belysningsindex 10. Han beräknar konfidensintervall och prognosintervall med täckningsgrad 95%. Vilket intervall kommer att bli bredast och varför? (b) En relevant fråga att ställa sig är om det förekommer ett positivt linjärt samband mellan belysningsindex och jordgubbarnas vikt. Formulera lämpliga hypoteser och besvara frågan på 5% signifikansnivå. (5p) (5p) 9 (9)