Matematisk statistik LKT325 Tentamen med lösningar

Relevanta dokument
Lösningsförslag till Matematisk statistik LKT325 Tentamen

Tillämpad matematisk statistik LMA522 (maskin/mekatroniks kurs) Tentamen

Övningstentamen i matematisk statistik för kemi

Tentamen LMA 200 Matematisk statistik,

Tentamen i Matematisk statistik Kurskod S0001M

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Matematisk statistik, LMA 200, för DAI och EI den 25 aug 2011

Tentamen i Matematisk statistik Kurskod S0001M

Lösningsförslag till Tillämpad matematisk statistik LMA521, Tentamen

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Dataanalys och statistik för I den 28 okt 2015

Tentamen LMA 200 Matematisk statistik,

Tentamen i Matematisk statistik Kurskod S0001M

Tillämpad matematisk statistik LMA521 Tentamen

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Statistisk försöksplanering

Matematisk statistik TMS063 Tentamen

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Statistisk försöksplanering

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik TMS064/TMS063 Tentamen

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

FÖRELÄSNING 8:

Uppgift 3: Den stokastiska variabeln ξ har frekvensfunktionen 0 10 f(x) =

Tentamen i Matematisk statistik Kurskod S0001M

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Avd. Matematisk statistik

Tentamen i Tillämpad matematisk statistik för MI3 den 1 april 2005

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen den 11 april 2007 i Statistik och sannolikhetslära för BI2

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Uppgift 1. f(x) = 2x om 0 x 1

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Tentamen i Matematisk Statistik, 7.5 hp

Föreläsning 5. Kapitel 6, sid Inferens om en population

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Tentamen i Matematisk statistik Kurskod S0001M

Avd. Matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Tentamen i Matematisk statistik Kurskod S0001M

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

TENTAMEN Datum: 14 feb 2011

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Tentamen i Matematisk statistik Kurskod S0001M

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

1 Reducerat faktorförsök rf f

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Avd. Matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

8 Inferens om väntevärdet (och variansen) av en fördelning

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

σ 12 = 3.81± σ n = 0.12 n = = 0.12

F9 SAMPLINGFÖRDELNINGAR (NCT

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Lycka till!

Statistik 1 för biologer, logopeder och psykologer

Lösningar till tentamen i Matematisk Statistik, 5p

4 Diskret stokastisk variabel

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004, TEN

AMatematiska institutionen avd matematisk statistik

Avd. Matematisk statistik

27,5 27,6 24,8 29,2 27,7 26,6 26,2 28,0 (Pa s)

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen LMA 200 Matematisk statistik, data/elektro

Individ nr Första testet Sista testet

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

LMA201/LMA521: Faktorförsök

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

TMS136. Föreläsning 13

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Föreläsning 12: Repetition

Transkript:

Matematisk statistik LKT325 Tentamen 2018-04-06 med lösningar Tid: 8.30-12.30. Tentamensplats: Lindholmen Hjälpmedel: Kursboken Matematisk Statistik av Ulla Dahlbom. Formelsamlingen Tabell- och formelsamling i matematisk statistik, försöksplanering och kvalitetsstyrning av Håkan Blomqvist. Boken och formelsamlingen får ej innehålla extra anteckningar, men understrykningar, sticks och markeringar är tillåtna. Chalmersgodkänd räknare. Till varje uppgift skall fullständig lösning lämnas! Betygsgränser: För betyg 3, 4 resp. 5 krävs minst 20, 30 resp. 40 poäng. 1. (2+4 poäng) Antag att mätvärdena 10.5, 11.8 och 9.6 kommer från en normalfördelning med väntevärde µ och standardavvikelse σ. Antag också att mätningarna är gjorda oberoende av varandra. (a) Beräkna ett 95% konfidensintervall för µ om σ = 1. (b) Beräkna ett 95% konfidensintervall för µ om σ okänt. (a) x = 10.6333. Intervallet blir 10.6333 ± 1.96 1/ 3 = 10.6333 ± 1.1316 = [9.5017, 11.7649]. (b) s = 1.10604. t-tabellen, rad 2, kolumn 0.05, ger värdet 4.30. Intervallet blir 10.6333±4.3 1.10604/ 3 = 10.6333 ± 2.7459 = [7.8874, 13.3792] 2. (3+3+4 poäng) Anna har fört statistik över hur långt hon går på en dag. Hon har kommit fram till att sträckan hon går på en dag kan betraktas som en kontinuerlig stokastisk variabel ξ med frekvensfunktion f(x) = Enheten är kilometer. { 1 2500 (30x2 3x 3 ) för 0 x 10 0 för övrigt (a) Beräkna väntevärde och standardavvikelse för ξ. (b) Beräkna approximativt sannolikheten att hon går mindre än eller lika med 620 kilometer under en tidsperiod på 100 dagar. Vi antar att sträckorna hon går under olika dagar kan betraktas som oberoende. (c) Antag igen att vi tittar på 100 dagar. Låt η vara lika med antalet dagar av de 100 dagarna på vilka hon går längre än 5 kilometer. Beräkna approximativt P (η > 65). 1

(a) E(ξ) = 10 0 xf(x)dx =... = 6. 10 σ = x 2 f(x)dx (E(ξ)) 2 =... = 40 36 = 2. 0 (b) Sätt ξ i = sträckan hon går dag nummer i, i = 1,..., 100. Totala sträckan hon går under 100 dagar betecknas med T. Då är T = 100 i=1 ξ i. Enligt centrala gränsvärdessatsen gäller att T är approximativt N(6 100, 2 100) = N(600, 20)-fördelad, så (T 600)/20 är approx N(0, 1)-fördelad. Så (c) P (T 620) = P ( T 600 20 P (ξ > 5) = 10 5 620 600 ) Φ(1) = 0.8413. 20 f(x) =... = 11 16. η är Bin(n = 100, p = 11/16)-fördelad. Eftersom np(1 p) = 21.5 > 10 är η approx N(np, np(1 p)) = N(68.75, 4.63512). Så P (η > 65) = 1 P (η 65) = 1 P ( η 68.75 65 68.75 4.65312 4.63512 ) 1 Φ( 0.809) = 1 (1 Φ(0.809)) = Φ(0.809) = 0.791. 3. (6 poäng) Antag att det i urna A finns 3 röda och 4 gröna bollar, och att det i urna B finns 2 röda och 5 gröna bollar. Först väljer man en boll slumpmässigt från urna A och lägger den i urna B. Sedan väljer man en boll slumpmässigt från urna B (som nu innehåller 8 bollar), och lägger den i urna A. I det sista och tredje steget drar vi slumpässigt en boll från urna A. Vad är sannolikheten att bollen vi drar i det sista steget är grön? Vi antar hela tiden att bollarna i urnorna är väl blandade. Det finns 4 fall som gör att vi drar en grön i sista och tredje steget. Vi betecknar fallen med A 1, A 2, A 3 och A 4. Fallet A 1 är följande sekvens av händelser: Först flyttas en grön, sedan en grön, och en grön dras i tredje steget. A 2 : grön - röd-grön. A 3 : röd - grön - grön. A 4 : röd - röd -grön. Sannolikheten för A 1 kan beräknas enligt följande: P (A 1 ) = 4 7 6 8 4 7 = 96 392. Den första faktorn kommer sig av att vi har 4 gröna bollar av 7 bollar när vi väljer i första steget. Den andra faktorn kommer från att vi har 6 gröna av 8 i andra steget, ifall det flyttades en grön i första. Det tredje faktorn kommer från att vi har 4 gröna bollar av 7 i tredje steget ifall det flyttades gröna bollar i de två första stegen. På liknande sätt fås att P (A 2 ) = 4 7 2 8 3 7 = 24 392, 2

P (A 3 ) = 3 7 5 8 5 7 = 75 392, P (A 4 ) = 3 7 3 8 4 7 = 36 392. Eftersom A 1, A 2, A 3, A 4 samtliga är disjunkta, fås P (grön dras i tredje steget) = P (A 1 )+P (A 2 )+P (A 3 )+P (A 4 ) = 231 392 = 33 56 0.5893. 4. (4+1 poäng) Tre ingenjörsstudenter har tillsammans fått sommarjobb på en biltidning. Som en del i ett reportage får de i uppdrag att testa om tre olika biltillverkare producerar bilar med liknande bensinförbrukning. Det ska bara testa en viss typ av bilar så alla testade bilar har liknande prestanda (vikt, motorkapacitet osv.). Var för sig testar studenterna varsitt bilmärke, fyra bilar från varje märke. De kör med varje bil två timmar i stadstrafik under liknande förhållanden. Här är bensinförbrukningen (i liter per mil) de uppmäter. Bilmärke 1 Bilmärke 2 Bilmärke 3 0.541 0.602 0.635 0.676 0.688 0.592 0.589 0.662 0.592 0.561 0.724 0.561 När de samlat in all data börjar de fylla i en ANOVA-tabell för testet. Variationskälla SS df M S F Mellan bilmärken 0.01527......... Inom bilmärken......... Totalt 0.03659... (a) Hjälp studenterna att komplettera ANOVA-tabellen. Utför ett hypotestest, tolka resultatet och dra slutsatser. Är det någon skillnad på den genomsnittliga bensinförbrukningen hos de olika bilmärkena? (b) Under testandet kör de tre studenterna bilar från varsitt bilmärke. Dvs observationerna från bilmärke 1 kommer från en student, observationerna från bilmärke 2 från en annan student, osv. Är detta ett problem? Motivera! (a) Den fullständiga ANOVA-tabellen bör se ut så här: Variationskälla SS df M S F Mellan bilmärken 0.01527 2 0.00764 3.22 Inom bilmärken 0.02132 9 0.00237 Totalt 0.03659 11 Vi använder de fem stegen. 3

Steg 1. Låt µ 1, µ 2 och µ 3 beteckna den genomsnittliga bilförbrukningen hos denna biltyp från de olika biltillverkarna. Våra hypoteser blir H 0 : µ 1 = µ 2 = µ 3 och H 1 : alla µ i är inte lika. Steg 2. Vi väljer signifikansnivå α = 0.05. (Man är fri att välja signifikansnivå men det är bara 0.05 som finns i tabellen så om man väljer någon annan nivå får man problem.) Steg 3. Testvariabeln vi vill använda är F = MSB MSE = (SSB)/(k 1) (SSE)/(n k). I vårt fall är k 1 = 3 1 = 2 och n k = 12 3 = 9 så vår testvariabel är F -fördelad med 2 och 9 frihetsgrader. Steg 4. Vi vill ta fram vårt observerade värde på F. För att göra det så fyller vi i ANOVA-tabellen succesivt. Vi vet att SSE = SST SSB så vi vet att SSE = 0.03659 0.01527 = 0.02132. Eftersom det är tre grupper och fyra observationer i varje grupp blir frihetsgraderna 2 och 9. Vi vet också att MSB = SSB/df = 0.00764 och att MSE = SSE/df = 0.00237. Tillslut får vi att F = MSB/MSE = 3.22. Steg 5. Vi tittar i F-fördelningstabellen med 2 och 9 frihetsgrader och ser att det kritiska värdet är 4.26. Eftersom vårt observerade värde är mindre än det kritiska värdet så förkastar vi inte H 0 på signifikansnivå α = 0.05. Slutsats: Vi kan inte utestluta att de olika biltillverkarn producerar bilar av denna typ med samma bensinförbrukning. (b) Det är ett potentiellt problem att de testar bilar från varsin biltillverkare. Det skulle kunna vara så att de olika studenternas körsätt påverkar bensinförbrukningen. Om det är stor skillnad i hur bensinsnål körteknik de har så påverkas oberoendet i observationerna och därmed påverkas även den statistiska analysen. I värsta fall är det större variation mellan studenternas körteknik än mellan bilarnas bensinförbrukning. I så fall säger vårt test mer om skillnaden mellan studenternas körteknik än om skillnaden i bensinförbrukningen. 5. (4+1 poäng) Ett renhållningsbolag hämtar sopor i ett lägenhetskomplex en gång i veckan. Bostadsföreningen och renhållningbolaget har en överenskommelse om att det ska i genomsnitt hämtas max 1100 kg sopor varje vecka. Renhållningsarbetarna misstänker dock att de faktiskt hämtar mer. Om så är fallet vill renhållningsbolaget ta mer betalt av bostadsföreningen. För att undersöka om det hämtas för mycket sopor så väger renhållningsarbetarna soporna som hämtas varje vecka under ett helt år (52 veckor på ett år). Stickprovsmedelvärdet blev x = 1146 och stickprovsstandardavvikelsen blev s = 106. (a) Hjälp renhållningsarbetarna att utföra ett hypotestest. Kan vi dra slutsatsen att de hämtar för mycket sopor i genomsnitt? (b) Beräkna p-värdet för testet. 4

(a) Låt µ beteckna den genomsnittliga mängd sopor som hämtas från lägenhetskomplexet varje vecka. Steg 1 Eftersom vi bara är intresserade av huruvida mängden sopor överstigs eller inte så gör vi ett ensidigt test. Hypoteserna blir alltså: H 0 : µ 1100 och H 1 : µ > 1100. Steg 2 Vi bestämmer signifikansnivå: α = 0.05. Man är fri att välja signifikansnivå själv här. Steg 3 Stickprovet är stort nog för att vi kan använda normalapproximationen, vi använder oss därför av testvariabeln Z = x µ 0 s/ n som är approximativt N(0, 1)-fördelad. Steg 4 I vårt fall är x = 1146, µ 0 = 1100, s = 106 och n = 52. Vår observerade teststatistika blir då 3.13. Steg 5 Det kritiska värdet tas fram genom att titta i normalfördelningstabellen: 1.645. Eftersom vår observerade teststatistika är större än det kritiska värdet så förkastar vi H 0 på signifkansnivå α = 0.05. Slutsats: Vi kan dra slutsatsen att det i genomsnitt hämtas mer än 1100 kg sopor från lägenhetskomplexet. Renhållningsbolaget borde ta mer betalt från bostadsföreningen! (b) Den observerade teststatistikan var 3.13. Från normalfördelningstabellen får vi då fram p-värdet: 1-0.9991 = 0.0009. 6. (2+2+2 poäng) Antag att ξ är en diskret stokastisk variabel. Det gäller att P (ξ = 1) = 0.3, P (ξ = 1) = 0.2, P (ξ = 0) = 0.5 och P (ξ = x) = 0 för övriga x. Vi definierar den diskreta stokastiska variabeln η genom sambandet η = 1 + ξ 2. (a) Beräkna väntevärdet för η. (b) Beräkna P (η = x) för alla heltal x. (Det vill säga, bestäm sannolikhetsfunktionen för η.) (c) Beräkna den betingade sannolikheten P (ξ = 1 η = 2). Lösningar: (a) E(ξ 2 ) = ( 1) 2 0.3 + 0 2 0.5 + 1 2 0.2 = 0.5. E(η) = 1 + E(ξ 2 ) = 1.5. (b) η kan anta värdena 1 och 2. Det gäller att P (η = 1) = P (ξ = 0) = 0.5 och P (η = 2) = P (ξ = 1) + P (ξ = 1) = 0.5 samt P (η = x) = 0 för alla övriga x. (c) P (ξ = 1 η = 2) = P ({ξ = 1} {η = 2}) P (η = 2) = P (ξ = 1) P (η = 2) = 0.2 0.5 = 2 5. 5

7. (6 poäng) Följande gäller för en viss typ av datachips. De flesta datachipsen genomgår en kvalitetskontroll innan de går till försäljning, och repareras om de är defekta. Ibland misslyckas reparationen. Dessutom finns det datachips som inte kontrolleras alls. Antag att sannolikheten att ett datachips genomgår kvalitetskontroll är 0.99. Sannolikheten att ett datachips som genomgått kvalitetskontroll är defekt är 0.02. Sannolikheten att ett datachips som inte genomgått kvalitetskontroll är defekt är 0.12. Antag att du köper ett datachips, och ser att det är defekt. Beräkna den betingade sannolikheten att datachipset genomgått kvalitetskontroll givet detta. Sätt D = {chips defekt} och K = {chips kontrollerat}. Vi vet att P (K) = 0.99, P (D K) = 0.02 och P (D K c ) = 0.12. Vi får att P (D) = P (D K)P (K)+P (D K c )P (K c ) = 0.02 0.99+0.12 0.01 = 0.021. Enligt Bayes sats blir P (K D) = P (D K)P (K) P (D) = 0.02 0.99 0.021 = 0.9429. 8. (2+4 poäng) Man genomförde ett fullständigt faktorförsök för att undersöka hur de 3 faktorerna A, B och C påverkade en speciell situation. Man fick följande resultat från de åtta försöken.: Nr. A B C Resultat y 1 - - - 41 2 + - - 51 3 - + - 42 4 + + - 51 5 - - + 38 6 + - + 55 7 - + + 40 8 + + + 51 (a) Beräkna huvudeffekten l A, två -faktorsamspelet l AB. (b) Antag att man också var intresserad av faktorerna D och E. Man har bara råd att göra 8 försök, så man får göra ett reducerat faktorförsök. Antag att man väljer teckenkolumner för A, B och C precis som ovan. Det finns sedan olika sätt att välja teckenkolumner för D och E. Ingenjörerna Benedikt och Beata har fått i uppdrag att lägga upp det reducerade faktorförsöket med kravet att A inte sammanblandas med BC. Benedikt väljer generatorerna D = AB och E = AC, medan Beata väljer generatorerna D = ABC och E = AB. Kommer Benedikts reducerade faktorförsök att uppfylla villkoret? Kommer Beatas reducerade faktorförsök att uppfylla villkoret? Beräkna också upplösningarna för de bägge planerna. Lösningar: (a) l A = 11.75, l AB = 1.75. 6

(b) Benedikt: I 1 = ABD, I 2 = ACE, I 3 = ABDACE = BCDE. Alias till A blir BD, CE och ABCDE. Uppfyller således kravet, och upplösningen blir III. Beata: I 1 = ABCD, I 2 = ABE, I 3 = ABCDABE = CDE. Alias till A blir BCD, BE och ACDE. Uppfyller således kravet, och upplösningen blir III. Lycka till! 7