Analys av proportioner

Relevanta dokument
Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

EPIDEMIOLOGI. Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell)

Studiedesign: Observationsstudier

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

TMS136. Föreläsning 13

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Epidemiologi 2. Ragnar Westerling

Föreläsning G60 Statistiska metoder

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Föreläsning G60 Statistiska metoder

Grunderna i epidemiologi Felkällor.

Studiedesign och effektmått

, s a. , s b. personer från Alingsås och n b

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Grunderna i epidemiologi. Innehåll: Vad är epidemiologi? Epidemiologins tillämpningsområden

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Hur man tolkar statistiska resultat

Medicinsk statistik II

import totalt, mkr index 85,23 100,00 107,36 103,76

Föreläsning 5. Kapitel 6, sid Inferens om en population

Epidemiologi T5. Kursmål epidemiologi. Kursmål epidemiologi. Kunna förklara och använda grundläggande epidemiologiska begrepp

Hur skriver man statistikavsnittet i en ansökan?

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Parade och oparade test

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

Thomas Önskog 28/

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Att mäta hälsa och sjukdom. Kvantitativa metoder II: teori och tillämpning Folkhälsovetenskap 4, termin 6 Hanna Hultin hanna.hultin@ki.

Grunderna i epidemiologi.

År 2008 så kollar vi cancerregistret för att se i vilka av de i vår kohort som fått lungcancer.

Föreläsning G60 Statistiska metoder

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

FACIT (korrekta svar i röd fetstil)

Kvantitativa metoder del 2. Kandidatprogrammet i folkhälsovetenskap, HT -11

Jämförelse av två populationer

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Studietyper, inferens och konfidensintervall

F22, Icke-parametriska metoder.

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Epidemiologi (II) Läkarprogrammet Termin 5, VT Lars Rylander. Avdelningen för arbets- och miljömedicin, Lund

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Uppgift 1. f(x) = 2x om 0 x 1

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Hypotestestning och repetition

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Medicinsk statistik I


F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Datorlaboration 2 Konfidensintervall & hypotesprövning

Uppgift a b c d e Vet inte Poäng

a) Facit till räkneseminarium 3

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Föreläsningsanteckningar till kapitel 9, del 2

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Uppgift a b c d e Vet inte Poäng

Laboration 3 Inferens fo r andelar och korstabeller

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Kapitel 10 Hypotesprövning

FÖRELÄSNING 8:

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10

F3 Introduktion Stickprov

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

TENTAMEN I STATISTIKENS GRUNDER 2

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Temperatur (grader Celcius) 4 tim. och 32 min tim. och 12 min tim. och 52 min tim. och 1 min tim. och 4 min.

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Introduktion till Biostatistik. Hans Stenlund, 2011

Fel och fel. slumpmässiga och systema4ska fel i epidemiologiska studier Katja Fall Vetenskapligt förhållningssä>

ANOVA Mellangruppsdesign

TMS136. Föreläsning 11

Icke-parametriska/fördelningsfria test. Finansiell statistik, vt-05. Teckentest. Teckentest. Vi gör observationer för =1,, på variablerna.

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Medicinsk statistik III Läkarprogrammet, Termin 5 VT 2016

Epidemiologi 1. Ragnar Westerling

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

8 Inferens om väntevärdet (och variansen) av en fördelning

TENTAMEN I STATISTIKENS GRUNDER 2

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Föreläsning G60 Statistiska metoder

Konfidensintervall, Hypotestest

Tentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), STATISTIK

Lufttorkat trä Ugnstorkat trä

Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

27,5 27,6 24,8 29,2 27,7 26,6 26,2 28,0 (Pa s)

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig (ej fackspråklig) ordbok utan kommentarer. Formelsamling lånas i tentamenslokalen.

Transkript:

Analys av proportioner

Innehåll Proportion konfidensintervall Jämförelse av två proportioner Två oberoende stickprov Relativ risk Parvisa observationer Jämförelse av tre eller flera proportioner x² (chi-två) Jenny Selander, Kvant. metoder, FHV T1 december 2011 2

Proportion En proportion beskriver andelen av något i en population. Andelen rökare bland tjänstemän Andelen egenföretagare bland medelålder män Andelen arbetslösa ibland unga stockholmare I medicinska studier är det vanlig att mäta proportioner via Prevalens Kumulativ incidens Jenny Selander, Kvant. metoder, FHV T1 december 2011 3

Proportion -exempel I en undersökning studerades astmatisk andning hos små barn på bvc i en storstadkommun. Totalt var 245 barn med i undersökningen, 45 av barnen klassades med astmatisk andning. P = 45/245 = 0,18 = 18% Jenny Selander, Kvant. metoder, FHV T1 december 2011 4

Konfidensintervall för proportioner På ett likande sätt som för medelvärden kan vi räkna ut ett konfidensintervall för en proportion p ± 1.96 p 1 p n p = proportionen 1.96, z-värdet för ett 95% konfidensintervall n = totala studieantalet Jenny Selander, Kvant. metoder, FHV T1 december 2011 5

Konfidensintervall - exempel I det tidigare exemplet med barn med astmatisk andning blir konfidensintervallet p ± 1.96 p 1 p n = 0,18 ± 1.96 0,18 (1 0,18) 245 = 0,18 ± 0,05 P 18% (95% KI 13%-23%) Jenny Selander, Kvant. metoder, FHV T1 december 2011 6

Jämförelse av två proportioner I epidemiologiska studier jämförs ofta andelen sjuka i en exponerad grupp med motsvarande andel i en oexponerad grupp. Jämförelser av två proportioner kan göras genom Två oberoende stickprov Relativa risker Parvisa observationer Jenny Selander, Kvant. metoder, FHV T1 december 2011 7

Två oberoende stickprov När man vill jämföra två populationer med avseende på andelen med en viss egenskap. 1. ta ett stickprov från vardera population 2. beräknar andelen med egenskapen i respektive stickprov 3. räkna ut skillnaden mellan dessa andelar 4. beräkna konfidensintervall p 1 p 0 ± 1,96 p 1 1 p 1 n 1 + p 0 1 p 0 n 0 Jenny Selander, Kvant. metoder, FHV T1 december 2011 8

Två oberoende stickprov p 1 och p 0 = andelen med den studerade egenskapen i vart och ett av stickproven n 1 och n 0 är respektive stickprovsstorlekar Jenny Selander, Kvant. metoder, FHV T1 december 2011 9

Två oberoende stickprov - exempel I den tidigare nämnda undersökning där förekomsten av astmatisk andning hos små barn på bvc studerades, ställdes det även frågor om boendet. Astmatisk andning Krypgrund Ej krypgrund Totalt Ja 27 18 45 Nej 88 112 200 Totalt 115 130 245 Finns det en skillnad i förekomsten av astmatisk andning mellan barn boende i hus med krypgrund och barn boende i övriga hustyper? Jenny Selander, Kvant. metoder, FHV T1 december 2011 10

Två oberoende stickprov - exempel p 1 = 27/115=0,23 p 0 = 18/130=0,14 p 1 p 0 ± 1,96 p 1 1 p 1 n 1 + p 0 1 p 0 n 0 = 0,23 0,14 ± 1,96 9% skillnad (-1% till 10%) 0,23 1 0,23 115 + 0,14 1 0,14 130 = 0,09 ± 0,10 Jenny Selander, Kvant. metoder, FHV T1 december 2011 11

Relativ risk I epidemiologiska undersökningar jämför vi ofta sjukdomsförekomsten mellan en exponerad och en oexponerad grupp genom den relativa risken (RR), bl.a gällande den Kumulativa Incidensen: RR = A1 n1 A0 n0 = A = antalet insjuknade bland 1=exponerade respektive 0=oexponerade n = antalet individer fria från sjukdom vid periodens början Jenny Selander, Kvant. metoder, FHV T1 december 2011 12

Relativ risk - exempel I en undersökning av sambandet mellan fysisk aktivitet och risken för slaganfall följdes 1150 icke-rökande män under 20 års tid. Bland 600 personermed låg fysisk aktivitet insjuknade 48 personer i slaganfall och bland 550 personer med hög fysisk aktivitet insjuknade 22, vi beräknar den relativa risken till: RR = A1 n1 A0 n0 = 48 600 22 550 = 0,08 0,04 = 2,0 Risken att drabbas av slaganfall är dubbelt så stor för personer med låg fysisk aktivitet jämfört med personer med hög fysisk aktivitet. Jenny Selander, Kvant. metoder, FHV T1 december 2011 13

Konfidensintervall relativ risk e lnrr±1.96 n 1 A1 n A + n 0 A0 n A 1 1 0 0 Jenny Selander, Kvant. metoder, FHV T1 december 2011 14

Parvisa observationer Finns då vi studerar ett utfall genom upprepade mätningar på samma individ T.ex. före och efter behandling Observationerna är inte oberoende av varann Mättillfälle 1 Mättillfälle 2 Antal parvisa observationer Ja Ja a Ja Nej b Nej Ja c Nej Nej d Total n Jenny Selander, Kvant. metoder, FHV T1 december 2011 15

Parvisa observationer P 2 P 1 ±1.96 a+d b+c +4 b c n n P 1 = andelen med det aktuella utfallet vid det första observationstillfället P 2 = andelen med det aktuella utfallet vid det andra observationstillfället. Jenny Selander, Kvant. metoder, FHV T1 december 2011 16

Parvisa observationer - uträkning Räkna ut var och en för sig: P 1 = a+b n och P 2 = a+c n Räkna ut differansen: P 2 P 1 = a+b n a+c n att få ut differansen. = b c b c, d.v.s vi behöver endast räkna ut n n för Jenny Selander, Kvant. metoder, FHV T1 december 2011 17

Parvisa observationer - exempel På en arbetsplats ville man undersöka om bildskärmsarbete påverkade de anställdas benägenhet att få huvudvärk. Totalt 30 personer arbetade en vecka med bildskärm och en vecka utan bildskärm, huvudvärksymtom registrerades dagligen Bildskärm Ej bildskärm Antal individer Ja Ja 2 (a) Ja Nej 14 (b) Nej Ja 6 (c) Nej Nej 8 (d) Total 30 (n) P 2 P 1 = 14 6 30 = 0.27 Jenny Selander, Kvant. metoder, FHV T1 december 2011 18

X ² - chi-två Användbar om man vill jämföra tre eller flera proportioner samtidigt X 2 = (fg) O E 2 E O = observerat antal E = Förväntat antal om nollhypotesen är sann Jenny Selander, Kvant. metoder, FHV T1 december 2011 19

X ² - chi-två - exempel I en studie av sambandet mellan socialgruppstillhörighet och lungcancer undersöktes rökvanor i olika socialgrupper Socialgrupp Rökare Ej rökare Totalt Högre tjänstemän 236 354 590 Tjänstemän på mellannivå 144 176 320 Lägre tjänstemän 305 305 610 Utbildade arbetare 385 315 700 Outbildade arbetare 198 132 330 Totalt 1268 1282 2550 Jenny Selander, Kvant. metoder, FHV T1 december 2011 20

X ² - chi-två - exempel Vi är intresserade av att bedöma om andelen rökare skiljer sig mellan olika socialgrupper Vi jämför ett observerat antal rökare inom varje socialgrupp med det antal som vi förväntar oss X 2 = O E 2 E (fg) I likhet med t-fördelningen ser chi-två fördelningen olika ut beroende på antalet frihetsgrader, vi beräknar antalet frihetsgrader som (antalet rader -1) x (antalet kolumner-1), obs! rader och kolumner inkluderar inte totalsummor eller rubriker Jenny Selander, Kvant. metoder, FHV T1 december 2011 21

X ² - chi-två - exempel Räkna ut den förväntande antalet (E) för varje cell Soc Rökare Ej rökare Tot Högr (236),590x1268/2550=293,4 (354),590x1282/2550=296,6 590 Tjänst (144),320x1268/2550=159,1 (176),320x1282/2550=160,9 320 Lägr (305),610x1268/2550=303,3 (305),610x1282/2550=306,7 610 Utbil (385),700x1268/2550=348,1 (315),700x1282/2550=351,9 700 Outb (198),330x1268/2550=164,1 (132),330x1282/2550=165,9 330 Totalt 1268 1282 2550 Jenny Selander, Kvant. metoder, FHV T1 december 2011 22

X ² - chi-två - exempel X 2 = (fg) O E 2 E, antalet frihetsgrader = 5 1 2 1 = 4 X 2 = 236 293,4 2 (4) 293,4 305 303,3 2 303,3 198 164,1 2 164,1 + 354 296,6 2 296,6 + 305 306,7 2 306,7 + 132 165,9 2 165,9 + 144 159,1 2 159,1 + 385 348,1 2 348,1 = 46,9 + 176 160,9 2 160,9 + 315 351,9 2 351,1 + + Vi jämför det observerade chi-två värdet 46,9 med ett kritiskt värde för chi-två fördelningen med fyra frihetsgrader, vi väljer signifikansnivån 5%, se tabell 4 i appendix Vi får då värdet 9,49, eftersom 46,9>9,49 är skillnaden i rökvanor signifikant på 5% signifikansnivå Jenny Selander, Kvant. metoder, FHV T1 december 2011 23

Läs kapitel 5 i Grunderna i biostatistik Jenny Selander, Kvant. metoder, FHV T1 december 2011 24

Övningsuppgifter Lös övningsuppgifterna 20/12 kl 14.00 15.00 individuellt eller i grupp Genomgång den 21/12 kl 09.15 Jenny Selander, Kvant. metoder, FHV T1 december 2011 25