Övningstenta för MSG830

Relevanta dokument
Exempel på tentafrågor MSG830 (Det kommer er)

Lösningar till Tentafrågor

MSG830 Statistisk analys och experimentplanering - Lösningar

Formler och tabeller till kursen MSG830

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Statistik 1 för biologer, logopeder och psykologer

MSG830 Statistisk analys och experimentplanering

MSG830 Statistisk analys och experimentplanering - Lösningar

MSG830 Statistisk analys och experimentplanering

Föreläsning 11: Mer om jämförelser och inferens

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

MSG830 Statistisk analys och experimentplanering

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

FÖRELÄSNING 8:

MSG830 Statistisk analys och experimentplanering

(a) Undersök om A och B är oberoende. (b) Vad är den betingade sannolikheten P (A B)? F (x) = 1 e λx

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Sannolikheter och kombinatorik

MSG830 Statistisk analys och experimentplanering

TMS136. Föreläsning 13

MSG830 Statistisk analys och experimentplanering

, s a. , s b. personer från Alingsås och n b

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

TMS136. Föreläsning 11

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

F9 SAMPLINGFÖRDELNINGAR (NCT

8 Inferens om väntevärdet (och variansen) av en fördelning

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

MSG830 Statistisk analys och experimentplanering

Föreläsning 12: Regression

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning 5. Kapitel 6, sid Inferens om en population

Statistisk försöksplanering

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Thomas Önskog 28/

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Matematisk statistik för B, K, N, BME och Kemister

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

LKT325/LMA521: Faktorförsök

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

F3 Introduktion Stickprov

F13 Regression och problemlösning

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Lycka till!

Parade och oparade test

TMS136. Föreläsning 10

9. Konfidensintervall vid normalfördelning

MSG830 Statistisk analys och experimentplanering

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Matematisk statistik för B, K, N, BME och Kemister

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Lektionsanteckningar 11-12: Normalfördelningen

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

10. Konfidensintervall vid två oberoende stickprov

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Föreläsningsanteckningar till kapitel 9, del 2

Avd. Matematisk statistik

7.5 Experiment with a single factor having more than two levels

Föreläsning 4. Kapitel 5, sid Stickprovsteori

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

Hypotestestning och repetition

Lufttorkat trä Ugnstorkat trä

Uppgift a b c d e Vet inte Poäng

Matematisk statistik för D, I, Π och Fysiker

FÖRELÄSNING 7:

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

7.5 Experiment with a single factor having more than two levels

Avd. Matematisk statistik

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

FACIT: Tentamen L9MA30, LGMA30

Uppgift 1. f(x) = 2x om 0 x 1

Grundläggande matematisk statistik

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Avd. Matematisk statistik

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Föreläsning 12, FMSF45 Hypotesprövning

Matematisk statistik för B, K, N, BME och Kemister

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Transkript:

Övningstenta för MSG830 Max 30 p, för godkänt krävs 12 p 1. Vi har två händelser A och B. Om dessa vet vi att A sker med sannolikheten 0.2 och B med sannolikheten 0.5. Sannolikheten att varken A eller B händer är 0.4. (a) Undersök om A och B är oberoende. Vi vet att P (A) = 0.2,P (B) = 0.5 och P (A B) = 1 0.4 = 0.6. Av detta följer att P (A B) = P (A) + P (B) P (A B) = 0.2 + 0.5 0.6 = 0.1 = 0.2 0.5 = P (A) P (B) alltså är A och B oberoende (b) Vad är den betingade sannolikheten P (A B)? Eftersom A och B är oberoende gäller P (A B) = P (A) = 0.2 (c) Vad är den betingade sannolikheten P (A A B) P (A A B) = P (A (A B P (A B) = P (A) P (A B) = 0.2 0.6 = 1 3 2. En Chalmersstudent extraknäcker under sommaren genom att med god förtjänst sälja fotbollströjor med texten Messi, Ronaldo eller Ibrahimovic för enhetspriset 400 kronor. Tidigare statistik visar att 50% av kunderna köper Messi, 30% köper Ronaldo och 20% köper Ibrahimovic. Studenten beräknar kunna sälja 100 tröjor. Inköpspriserna för produkterna varierar dock så att Messi kostar220 kronor, Ronaldo kostar 200 kronor och Ibrahimovic kostar 150 kronor. Allt sker utan inblandning av skattemyndigheter. (a) Vad är den förväntade vinsten per såld tröja? Vinsterna för en såld tröja är 180, 200 och 250 för Messi, Ronaldo respektive Ibrahimovic. Om X betecknar vinsten för en såld tröja är E[X] = 0.5 180 + 0.3 200 + 0.2 250 = 200 (3p) (b) Vad är vinstens standardavvikelse för en såld tröja? Vinstens varians är σ 2 = 0.5(180 200) 2 + 0.3(200 200) 2 + 0.2(250 200) 2 = 700 och standardavvikelsen alltså σ = 700 = 26.5 (c) Studenten vill gärna tjäna åtminstone 19000 kronor på hela försäljningen. Vad är sannolikheten att lyckas med det om 100 tröjor säljs? För att tjäna 19000 på 100 sålda tröjor behöver studenten uppnå X 190. Vi utnyttjar centrala gränsvärdessatsen som säger att Z = X µ σ/ n = X 200 700/10 1

är approximativt standard normalfördelad. Då har vi att P ( X 190) = P (Z 190 200 700/10 ) = P (Z 3.78) Ligger utanför bifogad tabell, men alla svar av typ >99% är OK. (3p) 3. Två olika legeringar för pansarplåt jämfördes genom att beskjutas med succesivt ökande utgångshastighet tills kulorna tränger genom plåten. Legering A består bara av metaller, medan legering B också innehåller Teon. Man utförde 15 prov med legering A och 10 med legering B Legering n medel (m/s) sd A 15 1293 64 B 10 1404 48 (a) Ange ett 95%-igt kondensintervall för skillnaden i utgångshastighet vid penetrering? Vi antar att de uppmätta hastigheterna är normalfördelade och att variansen är lika i de båda grupperna. Skillnaden (µ B µ A ) i medelvärde är 1404 1293 = 111 m/s. Den poolade standardavvikelsen är s = (15 1)642 + (10 1)48 2 15 + 10 2 = 58.3 t-fraktilen för 95%-igt kondensintervall vid 23 frihetsgrader är 2.069, så kondensintervallet ges av 1 111 ± 2.069 58.3 10 + 1 15 111 ± 49.2 (b) Kan vi förkasta H 0 på signikansnivå 0.01? I (a) hade vi fått ett 99%igt kondensintervall om vi bytt ut 2.069 mot 2.807 vilket hade gett 111 ± 66.75 vilket inte täcker 0 och därmed kan vi förkasta H 0 på nivå 0.01 enligt dualiteten mellan test och kondensintervall. 4. En tillverkare (A) av insektsbekämningsmedel för druvor (Pinot noir) vill demonstrera att deras produkt är överlägsen en annan produkt tillverkad av konkurrenten (B). De gör 16 försök med sin egen produkt och 9 med konkurrentens. I alla försök mäter man förändringen δ av skördeutfallet jämfört med obesprutade plantor. (δ > 0 betyder förbättring) Tillverkare n δ sδ A 16 0.3 0.5 B 9 0.2 0.5 Därefter hävdar de att deras produkt är överlägsen konkurrentens eftersom den visade en signikant förbättring, men det gjorde inte konkurrentens. (a) Veriera påståendet att A var signikant bättre än obesprutat och att B inte var det. Vi ska alltså göra två parade test med ensidig mothypotes. Teststatistikorna är t- fördelade med 15 frihetsgrader för A och 8 frihetsgrader för B. De kritiska värden hämtas ut tabell. 0.3 T A = 0.5/ = 2.4 > 1.753 Vi kan förkasta nollhypotesen 16 2

T B = 0.2 0.5/ = 1.2 < 1.86 Vi kan inte förkasta nollhypotesen 9 (b) Förklara varför detta trots allt var ett dumt sätt att resonera och gör en relevant jämförelse mellan de två produkterna. Den relevanta jämförelsen bör göras med ett tvåstickprovstest mellan förbättringen av A och förbättringen av B. Den poolade standardavvikelsen blir 0.5 (självklart!) och den teststatistikan är t-fördelad med 16+9-2=23 frihetsgrader 0.3 0.2 T = 0.5 = 0.24 < 1.714 1/16 + 1/9 Vi kan alltså inte påstå att A är signikant bättre än B. 5. I en undersökning av sambandet mellan exponering för oljud (mätt i decibel) och blodtrycksstegring (mätt i mmhg) fann man med 8 mätningar följande regressionsformel stegring = 9.8 + 0.17(decibelnivå) Ett tvåsidigt signikanstest av lutningen gav ett p-värde på 0.05. (a) Vid vilken (o)ljudnivå förväntas blodtrycksstegringen uppgå till 10 mmhg? Invertering av regressionsformeln ger decibelnivå = stegring + 9.8 0.17 = 10 + 9.8 0.7 116 (b) En annan studie fann samma regressionsformel, hade 16 observationer och samma skattning på bruset (det statsitiska bruset, inte oljudet), men ck likväl inte någon signikans på lutningen (p=0.39). Ge en förklaring till vad det kunde bero på. Med ett dubbelt så stort stickprov borde signikansen vara betydligt bättre än 0.05 med tanke på att residualvariansen var samma. Den enda förklaringen är att den nadra studien har mätt inom ett snävare decibelområde vilket leder till att osäkerheten kring lutningen trots allt blir större. 3

6. Man har samlat data om felrapporter hos en satellit och vill undersöka om typen av fel kan beror på om satelliten ligger i skugga eller sol då felet uppstår. Man testar detta och resultatet framgår nedan. Figur 1 (a) Finns det något signikant samband mellan typ av fel och om satelliten ligger i skugga eller sol? Ja, Pearsons Chi-square test ger p=0.007<0.05 så alla grupper är inte lika. (b) Vi har ganska många celler här (10). Då brukar det ibland vara motiverat att använda ett trendtest. Kan det vara lämpligt att göra det här? Motivera! Trendtestet är lämpligt när man har ordinaldata. Subsystemet är inte av den typen. Mycket riktigt ser vi också att p-värdet för trendtestet (Linear-by-Linear) är större än den vanliga Pearson. (c) Har positionen någon signikant betydelse för felrisken om vi bara fokuserar på Data transmission och reception? Den förväntade värdena till 2 x 2 tabellen beräknas genom 54 17 = 9.1, 54 84 = 44.9, 47 17 Shadow Sunlight Data transmission 9.1 44.9 54 Reception 7.9 39.1 47 17 84 χ 2 (11 9.1)2 (43 44.9)2 = + + 9.1 44.9 så det är ingen signikant skillnad (6 7.9)2 7.9 = 7.9, + 47 84 (41 39.1)2 9.1 = 39.1 = 1.038 < 3.843 4

7. Bakterier kan tydligen vara behjälpliga även vid gruvdrift! En bergsingenjör samlade data om kopparutbytet i mineralprover som behandlats med 3 olika bakteriestammar. En analys av data som gjordes av en statsitiker presenteras nedan Figur 2 (a) Fanns det skillnad mellan grupperna? Ja, F-testet i ANOVAn ger p=0.021<0.05 så alla grupper är inte lika. (b) Vilka stammar skiljer sig signikant åt? 2 och 3 enligt Tukey post hoc testet (p=0.024<0.05) (c) Bergsingenjören gjorde själv tre test där han jämförde enbart två stammar åt gången. För jämförelsen mellan stam 1 och 3 fann han följande Figur 3 Förklara varför denna jämförelse mellan stam 1 och stam 3 skiljer sig mot den som statistikern gjorde. Bergsingenjören har inte bekymrat sig om multipel inferens. Post hoc testet tar hänsyn till att man gör tre parvisa jämförelser och korrigerar sina signikanser efter detta. 5

8. Vid ett test av H 0 : µ = 0 mot H 1 : µ > 0 av en normalfördelad variabel med känd varians σ 2 var stickprovsstorlekn n 1 = 20 och man lyckades precis få signikans på signikansnivå α = 0.05. Tyvärr ck man (obefogad) kritik för att ha använt en enkelsidig alternativhypotes och tvingades därför utöka sin studie till total stickprovsstorlek n 2. Hur stor behöver n 2 vara för att klara samma signikansnivå med en tvåsidig mothypotes om vi antar att man får samma medelvärde? De kritiska värdena för test med normalfördelad teststatistika på 5% nivå är 1.645 och 1.96 för en- respektive tvåsidig mothypotes. Från det första ensidiga testet hade man alltså X σ/ n 1 = 1.645 Om vi antar att vi får samma medelvärde krävs alltså X σ/ n 2 > 1.96 Tillsammans ger det och alltså Alltså behöver n 2 vara minst 29. X σ/ n2 = 1.645 > 1.96 n 2 n 1 n 2 > 20( 1.96 1.645 )2 = 28.4 6