BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 (2016-05-02) OCH INFÖR ÖVNING 9 (2016-05-09)

LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 (2016-05-02) OCH INFÖR ÖVNING 9 (2016-05-09) Aktuella avsnitt i boken är Kapitel 7. Lektionens mål: Du ska kunna förklara de två modellerna två oberoende stickprov och stickprov i par (matchade data) som används för jämförelse mellan två väntevärden kunna identifiera de två modellerna utifrån en situation, beräkna lämpliga konfidensintervall (alternativt göra test) och dra korrekta slutsatser utifrån intervallen/testen Ofta har man i medicinsk/biologisk forskning situationen att man vill jämföra två populationer och därför tar ett stickprov från vart och en av dem. Vanligast är att man vill undersöka om de två populationsmedelvärdena μ 1 och μ 2 skiljer sig åt. Exempel: vi mäter stressindex hos 20 kvinnor och 30 män, vilka är slumpmässigt utvalda på en arbetsplats. Finns det någon skillnad mellan könen beträffande förväntat stressindex? 1 Enklast är analysen om observationerna i de två stickproven är matchade (kopplade). I exemplet ovan hade vi fått matchade data om det ena stickprovet bestått av stressindex på de 30 männen före en arbetsomläggning och det andra stickprovet varit stressindex på samma 30 män efter omläggningen. Läs om hur man behandlar matchade stickprov genom att studera exempel 7.1 på s. 160. Gör uppgift 5.37 i studiematerialet. 2 På s. 163 164 står principen för hur man jämför två oberoende (ej matchade) stickprov. Observera att man skiljer på två fall beroende på om de okända populationsvarianserna kan antas vara lika eller inte. Om de antas lika utnyttjar man de båda stickprovsvarianserna för att göra en gemensam estimator av σ 2, se längst ner på s. 165. I den inrutade texten på s. 166 ser ni hur testet ser ut och på s. 167 hur motsvarande intervall ska beräknas. Gör uppgift 5.45 i studiematerialet och Dig4. 3 Det är viktigt att kunna skilja på de två modellerna ( stickprov i par respektive två oberoende stickprov ). Träna på detta genom att göra uppgift Dig3 på bifogade blad. 4 Om de två populationsvarianserna σ 1 och σ 2 i modellen två oberoende stickprov inte kan anses lika blir det lite mer komplicerat se rutan på s. 170. Observera den krångliga beräkningen av antalet frihetsgrader i t-fördelningen. En omedelbar fråga följer: hur ska man utifrån de två stickproven kunna avgöra om σ 2 1 = σ2 2 (lika varians) eller om varianserna skiljer sig åt? Svaret ges i avsnitt 7.3 på s. 171. Observera att detta test introducerar en ny typ av fördelning F-fördelningen. Gör uppgift 5.52. 5 Vi har hela tiden begränsat oss till att jämföra stickprov från två populationer. Hur gör man om man har fler än två stickprov och vill jämföra flera populationsmedelvärden? Detta problem behandlas i kapitel 10 i boken och den metod som används kallas variansanalys. Om du vill träna mer på detta avsnitt eller när du repeterar är följande uppgifter lämpliga att titta på: samtliga Dig-uppgifter samt 5.46 och 5.49 i studiematerialet.

Biostatistisk grundkurs, VT-16, VT2 2 Inför övning 9 (2016-05-09): Aktuella avsnitt i boken är kapitel 8. A Läs avsnitt 8.1 8.5 och observera att metoderna i dessa avsnitt förutsätter att stickproven är så stora att vi kan approximera binomialfördelningen med en normalfördelning. B Läs 8.6 översiktligt vid en första genomläsning. C Avsnitt 8.7.1, fallet ett stickprov, är viktigt, studera exempel 8.7. Vanliga modeller, digitala frågor Inferens för μ i en normalfördelning 1. Koncentrationen av fosfor (mg/l) i en sjö varierar mellan olika mättillfällen.utifrån 40 oberoende fosforhaltmätningar vill man göra ett intervall för μ, förväntad fosforhalt i sjön men blir tveksam när man ser det sneda, icke-normala histogramet. Avgör om följande påståenden är sanna eller falska. (a) Eftersom fosforhalterna inte är normalfördelade går det inte att göra något konfidensintervall för μ. (b) Medelvärdet av de 40 mätningarna är approximativt normalfördelade vilket räcker för att kunna göra ett intervall för μ. (c) Man får ett intervall för μ med den approximativa konfidensgraden 0.95 genom intervallet ( x ± s n ), där x och s beräknas från data. λ 0.025 2. Vikten hos friska sjuåriga pojkar varierar enligt en normalfördelning med väntevärde 24.7 kg. Man mätte vikten hos 16 pojkar som fått en viss medicinsk behandling och ville undersöka om μ, förväntad vikt hos de behandlade pojkarna skiljer sig från normalgruppen. När data analyserades i ett datorprogram fick man bl.a. följande utskrifter: medelvärde 23.5 standardavvikelse 1.9 95 % intervall (22.5, 24.5) 99 % intervall (22.1, 24.9) Avgör om följande påstående är sanna eller falska. (a) I genomsnitt väger den behandlade gruppen 1.2 kg lägre än normalgruppen. (b) Utifrån intervallen följer att med en felrisk på 5 % kan vi säga att den behandlade gruppen har lägre genomsnittsvikt än normalgruppen. (c) Utifrån intervallen följer att med en felrisk på 1 % kan vi säga att den behandlade gruppen har lägre genomsnittsvikt än normalgruppen. (d) För P-värdet till det test som hör ihop med intervallen gäller att 0.01 < P-värde < 0.05. (e) Genom att studera intervallen testar vi hypoteserna H 0 : μ 24.7, H 1 : μ < 24.7. (f) Eftersom vi från data ser att 23.5 < 24.7 borde vi gjort uppåt begränsade intervall för μ.

Biostatistisk grundkurs, VT-16, VT2 3 Två stickprov 3. Ange vilken modell (stickprov i par eller två oberoende stickprov) som är lämlig i följande situationer: (a) För att mäta hastighetsskyltars effekt mäter man hastigheten hos 12 bilar före skylten och hastigheten hos 12 andra bilar efter skylten. (b) För att mäta hastighetsskyltars effekt mäter man hastigheten hos 12 bilar före skylten och hastigheten på samma 12 bilar efter skylten. (c) För att undersöka hur vattennivån i en brunn påverkats av en industrietablering jämförs 7 års mätningar av årsmedelnivån före etableringen med 7 års mätningar av årsmedelnivån efter. (d) För att undersöka om män och kvinnor upplever smärtlindring annorlunda mätte man på 10 män och 10 kvinnor tiden från intag av en medicin till dess personerna upplever väsentlig smärtlindring. (e) För att undersöka mängden utsläpp från en industri belägen vid en å mäter man under 6 måndagar halten av ett visst ämne både uppströms och nedströms industrin. (f) För att mäta mängden korta fettsyror (mmol/100g) vid fermentering av odigrerbara kolhydrater lät man en grupp om 16 råttor få kosten i ärtfiber medan en annan grupp om 16 råttor fick linfröfiber. (g) För att undersöka effekten av ett hälsoprogram (bl.a. regelbunden fysisk aktivitet, ändrade kostvanor och rökstopp) mätte man diastoliskt blodtryck (mm Hg) såväl före som efter programmet på 30 kvinnor. (h) I en klinisk studie vill man undersöka om diet D har effekt. Grupp A ska få D medan grupp B inte ska få den. Innan studien startar vill man försäkra sig om att det inte finns skillnader mellan grupperna och väger därför samtliga 25 i grupp A och samtliga 25 i grupp B. (i) I en klinisk studie vill man undersöka om diet D har effekt. Grupp A får D medan grupp B inte får den. Man mäter vikten hos samtliga 25 i grupp A både före och efter utförd diet. (j) I en klinisk studie vill man undersöka om diet D har effekt. Grupp A får D medan grupp B inte får den. Vid studiens slut jämför man viktförändringen hos de 25 i grupp A med viktförändringen hos de 25 i grupp B. 4. För att undersöka om något, eller eventuellt båda, av två längdinstrument är felinställt (felinställda) gör man med båda instrumenten tre mätningar på en sträcka som man vet är 100 mm. Sammanfattande mått beräknades liksom 95 % intervall för instrumentens förväntade utslag: Instrument medel std n intervall Instr 1 115 5 3 (102.6, 127.4) Instr 2 102 3 3 (94.4, 109.5) Ange om följande påstående är korrekta eller falska. (a) Med 95 % säkerhet kan vi påstå att instrument 1 är felinställt. (b) Med 95 % säkerhet kan vi påstå att instrument 2 är rätt inställt. (c) Ett 95 % intervall för felinställningen hos instrument 1 är (2.6, 27.4) mm. (d) Eftersom de två intervallen överlappar varandra kan vi dra slutsatsen att det inte finns en signifikant skillnad i de två instrumentens förväntade utslag.

Biostatistisk grundkurs, VT-16, VT2 4 (e) Om μ 1 och μ 2 står för respektive instruments förväntade utslag kan ett 95 % intervall för μ 1 μ 2 beräknas till (3.7, 22.3). Därmed kan vi dra slutsatsen att det finns en signifikant skillnad i de två instrumentens förväntade utslag. 5. På nyfödda barn togs blodprov, bl.a. för att bestämma barnets hemoglobinhalt. Traditionellt görs en kemisk bestämning av hemoglobinhalt på laboratorium men ett sjukhus ville prova en ny maskin HemoCuesom använder optiska sensorer. På 10 slumpmässigt utvalda barn gjordes hemoglobinbestämning(g/dl) med båda metoderna. I var och av deluppgifterna nedan presenteras fakta kring materialet. Avgör om tillhörande slutsats är korrekt. (a) Medelvärdet av de 10 halterna bestämda med den tradionella metoden blev 17.69 g/dl medan medelvärdet av de 10 halter som bestämdes med HemoCue blev 17.02 g/dl. Slutsatsen är: Eftersom det är så liten skillnad i medelvärdena mellan de två metoderna så man ser direkt att det inte finns någon systematisk skillnad. (b) Ett 95 % intervall för skillnaden mellan de två metodernas väntevärden blev ungefär (med modellen två oberoende stickprov) (-1.33, 2.67). Slutsatsen är: Intervallet täcker över 0, ingen skillnad är påvisad. (c) Ett 95 % intervall för skillnaden mellan de två metodernas väntevärden blev ungefär (med modellen stickprov i par (matchade data)) (-0.87, -0.47). Slutsatsen är: Intervallet täcker EJ över 0, skillnad är påvisad. Lösning till digitala frågor 1. (a) Falskt (b) Sant (c) Sant 2. (a) Sant (b) Sant. Från det angivna 95 % intervallet ser vi att μ är signifikant skilt från 24.7. För att avgöra om μ är signifikant lägre är 24.7 ska vi göra ett ensidigt uppåt begränsat intervall. Men eftersom den övre gränsen i det ensidigt uppåt begräsande intervallet kommer att vara lägre en den övre gränsen i det två sidiga intervallet kan vi dra slutsatsen att μ är signifikant lägre är 24.7. (c) Falskt. Ett 99 % ensidigt intervall för μ är (0, 27.4), vilket täcker över 24.7. Se även kommentaren i föregående deluppgift. (d) Sant (e) Falskt (f) Falskt. Hypoteserna får inte sättas upp efter vilka värden man fått på data. Däremot kan man av andra (medicinska) skäl ha anledning att sätta upp hypoteserna H 0 : μ 24.7, H 1 : μ < 24.7, vilket kan testas med ett uppåt begränsat intervall för μ. Dessa hypoteser sätts då upp innan data samlas in. 3. (a) Två oberoende stickprov (b) Stickprov i par (c) Två oberoende stickprov

Biostatistisk grundkurs, VT-16, VT2 5 (d) Två oberoende stickprov (e) Stickprov i par (f) Två oberoende stickprov (g) Stickprov i par (h) Två oberoende stickprov (i) Stickprov i par (j) Två oberoende stickprov 4. (a) Sant (b) Falskt (c) Sant (d) Falskt. Inga slutsatser kan dras genom att titta på om intervallen överlappar varandra eller inte. (e) Sant 5. Det är det sista alternativet som är korrekt. En lämplig modell i denna situation är stickprov i par (matchade data) där de två mätningarna på ett barn utgör ett par. Detta blir också tydligt i figuren där man ser att det finns stor variation i hemoglobinhalt mellan barn. Modellen är: X i = halt på barn i med Lab Y i = halt på barn i med HemoCue Z i = Y i X i = skillnaden i halt mellan de två metoderna då mätningar görs på barn i; Z i antas normalfördelad med väntevärde Δ och standardavvikelse σ(okänd). Intressanta hypoteser är H 0 : Δ = 0 (ingen systematisk skillnad); H 1 : Δ 0 (systematisk skillnad finns) Ett 95 % konfidensintervall för Δ fås genom IΔ = ( z ± t 0.975,9 10 ) = ( 0.67 ± 2.262 0.283 10 ) = ( 0.873, 0.468). s z Eftersom intervallet inte täcker över 0 drar vi slutsatsen att H 0 förkastas och att det finns det en systematisk skillnad mellan metoderna. Det tycks vara så att HemoCue anger en lägre halt än Lab. Med 95 %säkerhet ligger skillnaden ligger mellan 0.468 och 0.873 enheter.