MSG830 Statistisk analys och experimentplanering - Lösningar



Relevanta dokument
MSG830 Statistisk analys och experimentplanering

Lösningar till Tentafrågor

MSG830 Statistisk analys och experimentplanering - Lösningar

MSG830 Statistisk analys och experimentplanering

MSG830 Statistisk analys och experimentplanering

MSG830 Statistisk analys och experimentplanering

Övningstenta för MSG830

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 24 januari 2004, kl

Avd. Matematisk statistik

Datorlaboration 2 Konfidensintervall & hypotesprövning

ÖVNINGSUPPGIFTER KAPITEL 9

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p)

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 23 februari 2004, klockan

Exempel på tentafrågor MSG830 (Det kommer er)

MSG830 Statistisk analys och experimentplanering

Resultatet läggs in i ladok senast 13 juni 2014.

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 ( ) OCH INFÖR ÖVNING 9 ( )

Tentamen i Matematisk statistik, LKT325,

Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl

Blandade problem från väg- och vattenbyggnad

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Tentamen i Matematisk statistik Kurskod S0001M

9. Beräkna volymen av det område som begränsas av planet z = 1 och paraboloiden z = 5 x 2 y 2.

Är sjukvården jämställd och går det åt rätt håll?

Statistik 1 för biologer, logopeder och psykologer

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Statistik och epidemiologi T5

Räkna med variation - Digitala uppgifter Studiematerial i sannolikhetslära och statistisk inferens. Lena Zetterqvist och Johan Lindström

Tentamen i Matematisk statistik Kurskod S0001M

MSG830 Statistisk analys och experimentplanering

Övningssamling Internationella ekonomprogrammet Moment 1

F14 Repetition. Måns Thulin. Uppsala universitet Statistik för ingenjörer 6/ /15

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Tentamen MVE265 Matematisk statistik för V,

Tentamen i Matematisk statistik Kurskod S0001M

TAOP86/TEN 1 KOMBINATORISK OPTIMERING MED

(a) Hur stor är sannolikheten att en slumpvist vald person tror att den är laktosintolerant?

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

MSG830 Statistisk analys och experimentplanering

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''

TENTAMEN KVANTITATIV METOD (100205)

GPS-sändare: en ny era för studier av beteendeekologi hos vilda djur

Lösningar till Tentamen i Matematisk Statistik, 5p 22 mars, Beräkna medelvärdet, standardavvikelsen, medianen och tredje kvartilen?

Skanskas Kontorsindex våren 2005

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

KA RKUNSKAP. Vad vet samhällsvetarna om sin kår? Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc STAA31 HT14

PM NÄTAVGIFTER Sammanfattning.

PM Trafikbuller vid Malmgatan 3-5, Varberg. Sammanfattning. Uppdrag. Uppdragsnr: (5)

Linjär regressionsanalys. Wieland Wermke

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Formler och tabeller till kursen MSG830

Högskoleprovet. Block 4. Anvisningar. Övningsexempel. Delprovet innehåller 22 uppgifter.

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen för kursen Statististik för naturvetare 16 januari

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Sjukersättning - de bakomliggande skälen till ställningstagande

KLONING En kopiator för levande varelser?

Kundundersökning Mars - april 2011 Genomförd av CMA Research AB

Working Paper Series

Statistik 1 för biologer, logopeder och psykologer

Medelpensioneringsålder

Vad tycker de närstående om omvårdnaden på särskilt boende?

Känguru 2014 Benjamin (Åk 6 och 7) sida 1 / 7 och Pakilan ala-aste

(1) För att numrera alla sidor i tidningen, löpande från och med 1, krävs 119 siffror.

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Hur kör vi egentligen en undersökning om trafikanters beteende och nya hastighetsgränser utifrån en bussförares perspektiv?

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

8 Inferens om väntevärdet (och variansen) av en fördelning

Summor av slumpvariabler

Repetitionsuppgifter i Matematik inför Basår. Matematiska institutionen Linköpings universitet 2014

Föreläsning 7 och 8: Regressionsanalys

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU

Lokalbussen i Lycksele

Kompletterande lösningsförslag och ledningar, Matematik 3000 kurs A, kapitel 6

MSG830 Statistisk analys och experimentplanering

Statistik Lars Valter

Mätdatum (nr 1 9) resp ((nr 10 12)

G VG MVG Programspecifika mål och kriterier

Statistisk acceptanskontroll

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

ÖVNINGSUPPGIFTER KAPITEL 9

Exempel: Kolesterol. Skillnad? Skillnad? Förra årets kolesterolvärden. Δ total = 0,35 mmol/l Δ HDL = 0,87 mmol/l. = 0,35 mmol/l. Δ total

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Storräkneövning: Sannolikhetslära

Appendix 1A. Konsekvenser av nedsatt hörsel

KART- LÄGGNING. Ej verkställda beslut och domar enligt LSS och SoL. Handikappomsorg. Årsskiftet 2005/06. ISSN Dnr.

Tentamen i: Industriell ekonomi E

Mälardalens högskola Akademin för utbildning, kultur och kommunikation

Arbetsblad 1. Addition och subtraktion i flera steg = = = = = = =

Kvicksilver i gädda från insjöar i Göteborg

Problem i navelregionen hos växande grisar

Försök att rymma svaren i den platsen som finns. Skriv tydligt! Svara sammanhängande och med enkla, tydliga meningar.

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2

Kostnadsfri rådgivning för dig med enskilt avlopp

Konsoliderad version av. Styrelsens för ackreditering och teknisk kontroll (SWEDAC) föreskrifter och allmänna råd (STAFS 2006:10) om automatiska vågar

MJ1145-Energisystem VT 2015 Föreläsning om att hålla balans i elnät: L2-L3. Kraftsystemet = en lång cykel. Syftet med ett kraftsystem:

Transkript:

MSG830 Statistisk analys och experimentplanering - Lösningar Tentamen 15 Januari 2015, 8:30-12:30 Examinator: Staan Nilsson, telefon 073 5599 736, kommer till tentamenslokalen 9:30 och 11:30 Tillåtna hjälpmedel: Kalkylator Antal poäng totalt: 30. För betyget godkänd krävs minst 12 poäng, för väl godkänd 22 poäng 1. Vi har två händelser A och B. Om dessa vet vi att A sker med sannolikheten 0.4 och B med sannolikheten 0.2. (a) Anta först att A och B är oberoende och bestäm P (A B), P (B A) samt P (A B). Oberoendet ger P (A B) = P (A) P (B) = 0.4 0.2 = 0.08 och varefter P (B A) = P (B) = 0.2 P (A B) = P (A) + P (B) P (A B) = 0.2 + 0.4 0.08 = 0.52 (b) Nu får du informationen att P (A B) = 0.6. Då kan inte A och B vara oberoende. Bestäm på nytt P (A B), P (B A) samt P (A B) och och P (A B) = P (A B)P (B) = 0.6 0.2 = 0.12 P (B A) = P (A B) P (A) = 0.12 0.4 = 0.3 P (A B) = P (A) + P (B) P (A B) = 0.2 + 0.4 0.12 = 0.48 2. Lilla Lisa kan varje morgon köpa färskt bröd direkt av bagaren för 10 kronor styck. Hon kan sen sälja dem till sina 3 grannar för 20 kr stycket. Varje granne köper dock max ett bröd. Maximalt kan hon alltså tjäna 30 kronor på denna aär. För varje granne är dock sannolikheten att han köper ett bröd bara 60% och de köper helt oberoende av varandra. Lisa kan inte köpa er bröd om hon säljer slut och överblivna bröd matar hon änder med. (a) Bestäm de fyra sannolikheterna att 0,1,2, eller 3 grannar vill köpa en limpa Antalet grannar, S, som vill köpa bröd är binomialfördelat (bin(3,0.6)). Det innebär P (S = 0) = (1 0.6) 3 = 0.064 P (S = 1) = 3 0.6 (1 0.6) 2 = 0.288 P (S = 2) = 3 0.6 2 (1 0.6) = 0.432 P (S = 3) = 0.6 3 = 0.216 1

(b) Lisas beräknade kostnad om hon köper 1,2 eller 3 limpor är förstås 10,20 resp 30 kronor, men vad är hennes förväntade intäkt om hon köper 1,2 eller 3 limpor? Vi kallar de stokastiska intäkterna I 1, I 2, I 3 Då är E[I 3 ] = 0 0.064 + 20 0.288 + 40 0.432 + 60 0.216 = 36 E[I 2 ] = 0 0.064 + 20 0.288 + 40(0.432 + 0.216) = 31.68 E[I 1 ] = 0 0.064 + 20(0.288 + 0.432 + 0.216) = 18.72 (c) Beräkna Lisas förväntade vinst om hon köper 1,2 eller 3 limpor. Hur många bör hon alltså köpa? Vi kallar de stokastiska intäkterna V 1, V 2, V 3 E[V 3 ] = E[I 3 ] 30 = 36 30 = 6 E[V 2 ] = E[I 2 ] 20 = 31.68 20 = 11.68 E[V 1 ] = E[I 1 ] 10 = 18.72 10 = 8.72 Följaktligen bör Lisa köpa 2 bröd och tjänar då i genomsnitt 11.68 kronor. 3. Man vill jämföra två bottenfärger för båtar. På åtta båtar målar man ena sidan med färg A och andra sidan med färg B. Efter att de har legat i vattnet under båtsäsongen räknar man sedan antalet fastsittande kräftdjur per kvadratmeter på båtarna. 1 2 3 4 5 6 7 8 A 65 45 38 88 30 51 64 38 B 48 36 45 74 31 39 58 31 Utför ett lämpligt test för att avgöra om färgerna skiljer sig åt med avseende på förmågan att hålla kräftdjuren borta. Vi bör göra ett parat t-test med tvåsidig alternativhypotes. Dierenserna beräknas 1 2 3 4 5 6 7 8 A 65 45 38 88 30 51 64 38 B 48 36 45 74 31 39 58 31 δ 17 9-7 12-1 12 6 7 Vi beräknar en teststatistika 17 + 9 7 + 14 1 + 12 + 6 + 7 δ = = 7.125 8 1 s = 7 ((17 7.125)2 + + (7 7.125) 2 ) = 7.9 T = 7.125 7.9/ 8 = 2.55 som är t-fördelad med 7 frihetsgrader om nollhypotesen är sann. Kritiskt värde för ett tvåsidigt test på nivå 0.05 är 2.365. Det är alltså en signikant skillnad mellan bottenfärgerna. 4. En billtillverkare jämför två däckfabrikat med ett bromstest. Totalt utrustas 18 bilar med nya däck. Hälften med fabrikat A och hälften med fabrikat B. Bromsträckorna vid 100 km/h bestäms och anges för A till 32 ± 0.5 (m) och för B till 30 ± 0.5 (m) där ±0.5 syftar på standardfelet av skattningarna (SEM). 2

(a) Beräkna ett 95% kondensintervall för skillnaden i bromssträcka mellan fabrikat A och fabrikat B. Vi har fått SEM och behöver s. För både A och B gäller s = SEM 9 = 0.5 3 = 1.5 Då blir även den poolade standardavvikelsen s p = 1.5 och kondensintervallet beräknas med 1 32 30 ± 1.5 2.120 9 + 1 9 = 2 ± 1.5 vilket innebär (0.5, 3.5). konstanten 2.120 hämtades ur tabell för en t-fördelning med 9+9-2=16 frihetsgrader (b) Finns det en signikant skillnad på nivå 0.05 mellan fabrikat A och B med avseende på bromssträcka vid 100 km/h? Ja, enligt dualiteten mellan test och kondensintervall eftersom kondensintervallet inte täcker 0. 3

5. Mängden B-vitamin i grönt te bestämdes för 4 olika fabrikat - totalt 24 prover. Resultaten redovisas nedan. (a) Finns det överhuvudtaget några skillnader mellan tesorterna? Ange vilket test du åberopar. Ja, F-testet för ANOVAn ger P=0.028<0.05 (b) Vilka tesorter har signikant skilda B-vitaminhalter? Sort 1 och 4 är de enda som säkert skiljer sig åt (p=0.029<0.05) enligt Tukey post hoc test. (c) En liknande studie som bara studerade sort 1 och 3 fann en signikant skillnad (p=0.03) på 1.75 enheter mellan dessa. Hur bör vi se på det resultatet i ljuset av denna studien? 4

Vår studie stöder det resultatet då vi har ännu större skillnad (1.92). Att vi inte ck signikans berodde på att vi nödgades korrigera för multipel inferens. 6. För att undersöka betydelsen av bälte i bilen studeras 1000 olyckor där man klassicerade personskadan som ingen, lätt, svår eller död. I tabellen nedan visas resultatet förenklat i uppdelningen skada ja/nej. (3p) (a) Vad är skaderisken om man använder respektive inte använder bälte? Risken för skada utan bälte är 335/400=84% och risken med bälte är 465/600=78% (b) Undersök om det nns ett signikant samband mellan användning av bälte och skada Vi räknar ut det förväntade antalet nej-nej 200 400 1000 = 80 och får de övriga genom att subrtahera från marginalerna nej ja nej 80 120 200 ja 320 480 800 400 600 1000 och beräknar sen teststatistikan som har 1 frihetsgrad χ 2 = (65 80)2 80 + (135 120)2 120 + (320 335)2 320 + (465 480)2 480 = 5.86 Då det kritiska värdet för en chi2 fördelning med 1 frihetsgrad är 3.843 slår vi fast att det är signikant högre skaderisk om man inte använder bälte. 5

7. För att bestämma sambandet mellan bensinförbrukning (liter/mil) och hastighet (km/h) kördes en sträcka 10 gånger med varierande hastighet. Resultatet framgår av gurerna nedan. (a) Hur stor andel av variationen i bensinförbrukning beror på variation i hastighet? Det beskrivs av förklaringsgraden R 2 som i guren anges till 71.7% (b) Kan vi med hjälp av den här studien anse det vara statistiskt säkerställt att hastigheten påverkar bensinförbrukningen? Ja, p-värdet för lutningen är 0.002 (c) Suzanne kör i 90 km/h på en 2 mil lång 70-väg. Hur mycket bensin skulle hon spara om hon höll hastighetsbegränsningen? Skillnaden i bensinförbrukning är 20 0.0055 = 0.11 liter/mil. Om hon kör 2 mil tjänar hon alltså 2.2 dl. 8. En glödlampstillverkare vill pröva en ny modell av glödlampor. Den gamla beprövade har en medellivslängd på 1000 timmar med en standarddeviation på 100 timmar. Man hoppas på att den nya har en medellivslängd på 1100 timmar och gör ett preliminärt test av 9 glödlampor av den nya modellen. Standarddeviationen antas vara samma som för den beprövade modellen. Man beslutar sig för att fortsätta utvecklingen av den nya modellen om man åtminstone kan uppmäta en medellivslängd på 1050 timmar på de nio glödlamporna. När testet utfördes blev den genomsnittliga livslängden 1060 timmar. Betraktat som hypotesprövning kan detta test beskrivas som ett normalfördelningstest och medelvärdets fördelning under nollhypotesen respektive alternativhyposen illustreras med gurerna 1,2 och 3 nedan. (a) I gurerna nedan illustreras med svarta areor tre viktiga begrepp inom hypotesprövning. Ange för varje bild vilken det är. 6

Figur 1: Signikansnivå Figur 2: P-värde Figur 3: Styrka (b) Kunde nollhypotesen förkastas? Eftersom det observerade värdet 1060 är större än det kritiska värdet 1050 förkastar vi hypotesen att medellivslängden är lika (c) Vad var testets signikansnivå? P ( X > 1050) = P ( X 1000 100/ 9 1050 1000 > 100/ ) = P (Z > 1.5) = P (Z < 1.5) = 0.0668 9 (3p) 7