BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 (2016-05-02) OCH INFÖR ÖVNING 9 (2016-05-09)



Relevanta dokument
BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Resultatet läggs in i ladok senast 13 juni 2014.

Utdrag ur: Räkna med variation - Digitala uppgifter. Lena Zetterqvist och Johan Lindström

Avd. Matematisk statistik

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 24 januari 2004, kl

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p)

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl

Tentamen i Matematisk statistik Kurskod S0001M

9. Beräkna volymen av det område som begränsas av planet z = 1 och paraboloiden z = 5 x 2 y 2.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 23 februari 2004, klockan

Räkna med variation - Digitala uppgifter Studiematerial i sannolikhetslära och statistisk inferens. Lena Zetterqvist och Johan Lindström

Statistik Lars Valter

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

ÖVNINGSUPPGIFTER KAPITEL 9

Statistik och epidemiologi T5

Beskriv hur du, utan att räkna alla pärlor, kan göra en god uppskattning av hur många pärlor som finns av respektive färg. 2/0/0

Lektion 1: Fördelningar och deskriptiv analys

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

TENTAMEN KVANTITATIV METOD (100205)

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Tentamen i Sannolikhetslära och statistik (lärarprogrammet) 12 februari 2011

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Datorlaboration 2 Konfidensintervall & hypotesprövning

Lärare 2. Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum

F3 Introduktion Stickprov

19. Skriva ut statistik

Namn: Pers.nr: G: Minst 65 % Kod: T5V16 -

Exempel från föreläsningar i Matematisk Statistik

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

1 Grundläggande begrepp vid hypotestestning

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl

Summor av slumpvariabler

Föreläsning 11: Mer om jämförelser och inferens

(a) Hur stor är sannolikheten att en slumpvist vald person tror att den är laktosintolerant?

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

Diskussionsproblem för Statistik för ingenjörer

TMS136. Föreläsning 13

Blandade problem från väg- och vattenbyggnad

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 1, OCH ÖVNING 2, SAMT INFÖR ÖVNING 3

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Lösningar till Tentamen i Matematisk Statistik, 5p 22 mars, Beräkna medelvärdet, standardavvikelsen, medianen och tredje kvartilen?

Tentamen i Matematisk statistik Kurskod S0001M

Attityder kring SBU:s arbete. Beskrivning av undersökningens upplägg och genomförande samt resultatredovisning

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Extra övningssamling i undersökningsmetodik. till kursen Regressionsanalys och undersökningsmetodik, 15 hp

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

, s a. , s b. personer från Alingsås och n b

MSG830 Statistisk analys och experimentplanering - Lösningar

F14 Repetition. Måns Thulin. Uppsala universitet Statistik för ingenjörer 6/ /15

Konfidensintervall, Hypotestest

Lennart Carleson. KTH och Uppsala universitet

Föreläsning 5. Kapitel 6, sid Inferens om en population

36 poäng. Lägsta poäng för Godkänd 70 % av totalpoängen vilket motsvarar 25 poäng. Varje fråga är värd 2 poäng inga halva poäng delas ut.

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Uppgift 1. Deskripitiv statistik. Lön

28 Lägesmått och spridningsmått... 10

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Konsekvenser av indelningar i områden för redovisning av försök i svensk sortprovning. Johannes Forkman, Saeid Amiri and Dietrich von Rosen

24 oktober 2007 kl. 9 14

Tentamen för kursen Statististik för naturvetare 16 januari

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Unghästprojektet på Wången

Senaste revideringen av kapitlet gjordes , efter att ett fel upptäckts.

Hur kör vi egentligen en undersökning om trafikanters beteende och nya hastighetsgränser utifrån en bussförares perspektiv?

Frågorna 1 till 6 ska svaras med sant eller falskt och ger vardera 1

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Lär dig sökmöjligheterna i Disgen 8

BEDÖMNINGSSTÖD. till TUMMEN UPP! matte inför betygssättningen i årskurs 6

Föreläsning 9: Hypotesprövning

En studie om konsumenters och handlares kännedom om CE-märket

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer. Thommy Perlinger

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Våga Visa kultur- och musikskolor

UTVECKLA SÅ UTVECKLAR NI ER FÖRENING!

Tentamen MVE265 Matematisk statistik för V,

Periodisering i Rebus

Kvalitetsbokslut Onkologiska kliniken Sörmland

Enkät till föräldrar och elever i årskurs 3, 5, 8 och Olsboskolan, vt 2015

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Villaägaren. MarkCheck ROT avdraget. December 2009

Tentamen i Tillämpad statistisk analys, GN, 7.5 hp. 23 maj 2013 kl. 9 14

Exempel: Kolesterol. Skillnad? Skillnad? Förra årets kolesterolvärden. Δ total = 0,35 mmol/l Δ HDL = 0,87 mmol/l. = 0,35 mmol/l. Δ total

LATHUND PA-WEBBEN KOMPETENSSÖKNING. Version Sida 1 av 7

Kunskapsstöd/Handlingsplan Barn och unga med övervikt och fetma

Bedöma elevers förmågor i muntlig uppgift

Utvärdering av väjningsplikt för bilister mot cyklister

Grunderna i stegkodsprogrammering

Provmoment: Allmän omvårdnad vuxna, barn och äldre, barnpsykologi, vårdandets pedagogik och didaktik. Ladokkod: 61SA01 Tentamen ges för: SSK10 A

BUDGETSYSTEM HYPERGENE EOS. Kompletterande PROGNOS MANUAL. För användare med utökad behörighet

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

Transkript:

LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 (2016-05-02) OCH INFÖR ÖVNING 9 (2016-05-09) Aktuella avsnitt i boken är Kapitel 7. Lektionens mål: Du ska kunna förklara de två modellerna två oberoende stickprov och stickprov i par (matchade data) som används för jämförelse mellan två väntevärden kunna identifiera de två modellerna utifrån en situation, beräkna lämpliga konfidensintervall (alternativt göra test) och dra korrekta slutsatser utifrån intervallen/testen Ofta har man i medicinsk/biologisk forskning situationen att man vill jämföra två populationer och därför tar ett stickprov från vart och en av dem. Vanligast är att man vill undersöka om de två populationsmedelvärdena μ 1 och μ 2 skiljer sig åt. Exempel: vi mäter stressindex hos 20 kvinnor och 30 män, vilka är slumpmässigt utvalda på en arbetsplats. Finns det någon skillnad mellan könen beträffande förväntat stressindex? 1 Enklast är analysen om observationerna i de två stickproven är matchade (kopplade). I exemplet ovan hade vi fått matchade data om det ena stickprovet bestått av stressindex på de 30 männen före en arbetsomläggning och det andra stickprovet varit stressindex på samma 30 män efter omläggningen. Läs om hur man behandlar matchade stickprov genom att studera exempel 7.1 på s. 160. Gör uppgift 5.37 i studiematerialet. 2 På s. 163 164 står principen för hur man jämför två oberoende (ej matchade) stickprov. Observera att man skiljer på två fall beroende på om de okända populationsvarianserna kan antas vara lika eller inte. Om de antas lika utnyttjar man de båda stickprovsvarianserna för att göra en gemensam estimator av σ 2, se längst ner på s. 165. I den inrutade texten på s. 166 ser ni hur testet ser ut och på s. 167 hur motsvarande intervall ska beräknas. Gör uppgift 5.45 i studiematerialet och Dig4. 3 Det är viktigt att kunna skilja på de två modellerna ( stickprov i par respektive två oberoende stickprov ). Träna på detta genom att göra uppgift Dig3 på bifogade blad. 4 Om de två populationsvarianserna σ 1 och σ 2 i modellen två oberoende stickprov inte kan anses lika blir det lite mer komplicerat se rutan på s. 170. Observera den krångliga beräkningen av antalet frihetsgrader i t-fördelningen. En omedelbar fråga följer: hur ska man utifrån de två stickproven kunna avgöra om σ 2 1 = σ2 2 (lika varians) eller om varianserna skiljer sig åt? Svaret ges i avsnitt 7.3 på s. 171. Observera att detta test introducerar en ny typ av fördelning F-fördelningen. Gör uppgift 5.52. 5 Vi har hela tiden begränsat oss till att jämföra stickprov från två populationer. Hur gör man om man har fler än två stickprov och vill jämföra flera populationsmedelvärden? Detta problem behandlas i kapitel 10 i boken och den metod som används kallas variansanalys. Om du vill träna mer på detta avsnitt eller när du repeterar är följande uppgifter lämpliga att titta på: samtliga Dig-uppgifter samt 5.46 och 5.49 i studiematerialet.

Biostatistisk grundkurs, VT-16, VT2 2 Inför övning 9 (2016-05-09): Aktuella avsnitt i boken är kapitel 8. A Läs avsnitt 8.1 8.5 och observera att metoderna i dessa avsnitt förutsätter att stickproven är så stora att vi kan approximera binomialfördelningen med en normalfördelning. B Läs 8.6 översiktligt vid en första genomläsning. C Avsnitt 8.7.1, fallet ett stickprov, är viktigt, studera exempel 8.7. Vanliga modeller, digitala frågor Inferens för μ i en normalfördelning 1. Koncentrationen av fosfor (mg/l) i en sjö varierar mellan olika mättillfällen.utifrån 40 oberoende fosforhaltmätningar vill man göra ett intervall för μ, förväntad fosforhalt i sjön men blir tveksam när man ser det sneda, icke-normala histogramet. Avgör om följande påståenden är sanna eller falska. (a) Eftersom fosforhalterna inte är normalfördelade går det inte att göra något konfidensintervall för μ. (b) Medelvärdet av de 40 mätningarna är approximativt normalfördelade vilket räcker för att kunna göra ett intervall för μ. (c) Man får ett intervall för μ med den approximativa konfidensgraden 0.95 genom intervallet ( x ± s n ), där x och s beräknas från data. λ 0.025 2. Vikten hos friska sjuåriga pojkar varierar enligt en normalfördelning med väntevärde 24.7 kg. Man mätte vikten hos 16 pojkar som fått en viss medicinsk behandling och ville undersöka om μ, förväntad vikt hos de behandlade pojkarna skiljer sig från normalgruppen. När data analyserades i ett datorprogram fick man bl.a. följande utskrifter: medelvärde 23.5 standardavvikelse 1.9 95 % intervall (22.5, 24.5) 99 % intervall (22.1, 24.9) Avgör om följande påstående är sanna eller falska. (a) I genomsnitt väger den behandlade gruppen 1.2 kg lägre än normalgruppen. (b) Utifrån intervallen följer att med en felrisk på 5 % kan vi säga att den behandlade gruppen har lägre genomsnittsvikt än normalgruppen. (c) Utifrån intervallen följer att med en felrisk på 1 % kan vi säga att den behandlade gruppen har lägre genomsnittsvikt än normalgruppen. (d) För P-värdet till det test som hör ihop med intervallen gäller att 0.01 < P-värde < 0.05. (e) Genom att studera intervallen testar vi hypoteserna H 0 : μ 24.7, H 1 : μ < 24.7. (f) Eftersom vi från data ser att 23.5 < 24.7 borde vi gjort uppåt begränsade intervall för μ.

Biostatistisk grundkurs, VT-16, VT2 3 Två stickprov 3. Ange vilken modell (stickprov i par eller två oberoende stickprov) som är lämlig i följande situationer: (a) För att mäta hastighetsskyltars effekt mäter man hastigheten hos 12 bilar före skylten och hastigheten hos 12 andra bilar efter skylten. (b) För att mäta hastighetsskyltars effekt mäter man hastigheten hos 12 bilar före skylten och hastigheten på samma 12 bilar efter skylten. (c) För att undersöka hur vattennivån i en brunn påverkats av en industrietablering jämförs 7 års mätningar av årsmedelnivån före etableringen med 7 års mätningar av årsmedelnivån efter. (d) För att undersöka om män och kvinnor upplever smärtlindring annorlunda mätte man på 10 män och 10 kvinnor tiden från intag av en medicin till dess personerna upplever väsentlig smärtlindring. (e) För att undersöka mängden utsläpp från en industri belägen vid en å mäter man under 6 måndagar halten av ett visst ämne både uppströms och nedströms industrin. (f) För att mäta mängden korta fettsyror (mmol/100g) vid fermentering av odigrerbara kolhydrater lät man en grupp om 16 råttor få kosten i ärtfiber medan en annan grupp om 16 råttor fick linfröfiber. (g) För att undersöka effekten av ett hälsoprogram (bl.a. regelbunden fysisk aktivitet, ändrade kostvanor och rökstopp) mätte man diastoliskt blodtryck (mm Hg) såväl före som efter programmet på 30 kvinnor. (h) I en klinisk studie vill man undersöka om diet D har effekt. Grupp A ska få D medan grupp B inte ska få den. Innan studien startar vill man försäkra sig om att det inte finns skillnader mellan grupperna och väger därför samtliga 25 i grupp A och samtliga 25 i grupp B. (i) I en klinisk studie vill man undersöka om diet D har effekt. Grupp A får D medan grupp B inte får den. Man mäter vikten hos samtliga 25 i grupp A både före och efter utförd diet. (j) I en klinisk studie vill man undersöka om diet D har effekt. Grupp A får D medan grupp B inte får den. Vid studiens slut jämför man viktförändringen hos de 25 i grupp A med viktförändringen hos de 25 i grupp B. 4. För att undersöka om något, eller eventuellt båda, av två längdinstrument är felinställt (felinställda) gör man med båda instrumenten tre mätningar på en sträcka som man vet är 100 mm. Sammanfattande mått beräknades liksom 95 % intervall för instrumentens förväntade utslag: Instrument medel std n intervall Instr 1 115 5 3 (102.6, 127.4) Instr 2 102 3 3 (94.4, 109.5) Ange om följande påstående är korrekta eller falska. (a) Med 95 % säkerhet kan vi påstå att instrument 1 är felinställt. (b) Med 95 % säkerhet kan vi påstå att instrument 2 är rätt inställt. (c) Ett 95 % intervall för felinställningen hos instrument 1 är (2.6, 27.4) mm. (d) Eftersom de två intervallen överlappar varandra kan vi dra slutsatsen att det inte finns en signifikant skillnad i de två instrumentens förväntade utslag.

Biostatistisk grundkurs, VT-16, VT2 4 (e) Om μ 1 och μ 2 står för respektive instruments förväntade utslag kan ett 95 % intervall för μ 1 μ 2 beräknas till (3.7, 22.3). Därmed kan vi dra slutsatsen att det finns en signifikant skillnad i de två instrumentens förväntade utslag. 5. På nyfödda barn togs blodprov, bl.a. för att bestämma barnets hemoglobinhalt. Traditionellt görs en kemisk bestämning av hemoglobinhalt på laboratorium men ett sjukhus ville prova en ny maskin HemoCuesom använder optiska sensorer. På 10 slumpmässigt utvalda barn gjordes hemoglobinbestämning(g/dl) med båda metoderna. I var och av deluppgifterna nedan presenteras fakta kring materialet. Avgör om tillhörande slutsats är korrekt. (a) Medelvärdet av de 10 halterna bestämda med den tradionella metoden blev 17.69 g/dl medan medelvärdet av de 10 halter som bestämdes med HemoCue blev 17.02 g/dl. Slutsatsen är: Eftersom det är så liten skillnad i medelvärdena mellan de två metoderna så man ser direkt att det inte finns någon systematisk skillnad. (b) Ett 95 % intervall för skillnaden mellan de två metodernas väntevärden blev ungefär (med modellen två oberoende stickprov) (-1.33, 2.67). Slutsatsen är: Intervallet täcker över 0, ingen skillnad är påvisad. (c) Ett 95 % intervall för skillnaden mellan de två metodernas väntevärden blev ungefär (med modellen stickprov i par (matchade data)) (-0.87, -0.47). Slutsatsen är: Intervallet täcker EJ över 0, skillnad är påvisad. Lösning till digitala frågor 1. (a) Falskt (b) Sant (c) Sant 2. (a) Sant (b) Sant. Från det angivna 95 % intervallet ser vi att μ är signifikant skilt från 24.7. För att avgöra om μ är signifikant lägre är 24.7 ska vi göra ett ensidigt uppåt begränsat intervall. Men eftersom den övre gränsen i det ensidigt uppåt begräsande intervallet kommer att vara lägre en den övre gränsen i det två sidiga intervallet kan vi dra slutsatsen att μ är signifikant lägre är 24.7. (c) Falskt. Ett 99 % ensidigt intervall för μ är (0, 27.4), vilket täcker över 24.7. Se även kommentaren i föregående deluppgift. (d) Sant (e) Falskt (f) Falskt. Hypoteserna får inte sättas upp efter vilka värden man fått på data. Däremot kan man av andra (medicinska) skäl ha anledning att sätta upp hypoteserna H 0 : μ 24.7, H 1 : μ < 24.7, vilket kan testas med ett uppåt begränsat intervall för μ. Dessa hypoteser sätts då upp innan data samlas in. 3. (a) Två oberoende stickprov (b) Stickprov i par (c) Två oberoende stickprov

Biostatistisk grundkurs, VT-16, VT2 5 (d) Två oberoende stickprov (e) Stickprov i par (f) Två oberoende stickprov (g) Stickprov i par (h) Två oberoende stickprov (i) Stickprov i par (j) Två oberoende stickprov 4. (a) Sant (b) Falskt (c) Sant (d) Falskt. Inga slutsatser kan dras genom att titta på om intervallen överlappar varandra eller inte. (e) Sant 5. Det är det sista alternativet som är korrekt. En lämplig modell i denna situation är stickprov i par (matchade data) där de två mätningarna på ett barn utgör ett par. Detta blir också tydligt i figuren där man ser att det finns stor variation i hemoglobinhalt mellan barn. Modellen är: X i = halt på barn i med Lab Y i = halt på barn i med HemoCue Z i = Y i X i = skillnaden i halt mellan de två metoderna då mätningar görs på barn i; Z i antas normalfördelad med väntevärde Δ och standardavvikelse σ(okänd). Intressanta hypoteser är H 0 : Δ = 0 (ingen systematisk skillnad); H 1 : Δ 0 (systematisk skillnad finns) Ett 95 % konfidensintervall för Δ fås genom IΔ = ( z ± t 0.975,9 10 ) = ( 0.67 ± 2.262 0.283 10 ) = ( 0.873, 0.468). s z Eftersom intervallet inte täcker över 0 drar vi slutsatsen att H 0 förkastas och att det finns det en systematisk skillnad mellan metoderna. Det tycks vara så att HemoCue anger en lägre halt än Lab. Med 95 %säkerhet ligger skillnaden ligger mellan 0.468 och 0.873 enheter.