Analys av proportioner
Innehåll Proportion konfidensintervall Jämförelse av två proportioner Två oberoende stickprov Relativ risk Parvisa observationer Jämförelse av tre eller flera proportioner x² (chi-två) Jenny Selander, Kvant. metoder, FHV T1 december 2011 2
Proportion En proportion beskriver andelen av något i en population. Andelen rökare bland tjänstemän Andelen egenföretagare bland medelålder män Andelen arbetslösa ibland unga stockholmare I medicinska studier är det vanlig att mäta proportioner via Prevalens Kumulativ incidens Jenny Selander, Kvant. metoder, FHV T1 december 2011 3
Proportion -exempel I en undersökning studerades astmatisk andning hos små barn på bvc i en storstadkommun. Totalt var 245 barn med i undersökningen, 45 av barnen klassades med astmatisk andning. P = 45/245 = 0,18 = 18% Jenny Selander, Kvant. metoder, FHV T1 december 2011 4
Konfidensintervall för proportioner På ett likande sätt som för medelvärden kan vi räkna ut ett konfidensintervall för en proportion p ± 1.96 p 1 p n p = proportionen 1.96, z-värdet för ett 95% konfidensintervall n = totala studieantalet Jenny Selander, Kvant. metoder, FHV T1 december 2011 5
Konfidensintervall - exempel I det tidigare exemplet med barn med astmatisk andning blir konfidensintervallet p ± 1.96 p 1 p n = 0,18 ± 1.96 0,18 (1 0,18) 245 = 0,18 ± 0,05 P 18% (95% KI 13%-23%) Jenny Selander, Kvant. metoder, FHV T1 december 2011 6
Jämförelse av två proportioner I epidemiologiska studier jämförs ofta andelen sjuka i en exponerad grupp med motsvarande andel i en oexponerad grupp. Jämförelser av två proportioner kan göras genom Två oberoende stickprov Relativa risker Parvisa observationer Jenny Selander, Kvant. metoder, FHV T1 december 2011 7
Två oberoende stickprov När man vill jämföra två populationer med avseende på andelen med en viss egenskap. 1. ta ett stickprov från vardera population 2. beräknar andelen med egenskapen i respektive stickprov 3. räkna ut skillnaden mellan dessa andelar 4. beräkna konfidensintervall p 1 p 0 ± 1,96 p 1 1 p 1 n 1 + p 0 1 p 0 n 0 Jenny Selander, Kvant. metoder, FHV T1 december 2011 8
Två oberoende stickprov p 1 och p 0 = andelen med den studerade egenskapen i vart och ett av stickproven n 1 och n 0 är respektive stickprovsstorlekar Jenny Selander, Kvant. metoder, FHV T1 december 2011 9
Två oberoende stickprov - exempel I den tidigare nämnda undersökning där förekomsten av astmatisk andning hos små barn på bvc studerades, ställdes det även frågor om boendet. Astmatisk andning Krypgrund Ej krypgrund Totalt Ja 27 18 45 Nej 88 112 200 Totalt 115 130 245 Finns det en skillnad i förekomsten av astmatisk andning mellan barn boende i hus med krypgrund och barn boende i övriga hustyper? Jenny Selander, Kvant. metoder, FHV T1 december 2011 10
Två oberoende stickprov - exempel p 1 = 27/115=0,23 p 0 = 18/130=0,14 p 1 p 0 ± 1,96 p 1 1 p 1 n 1 + p 0 1 p 0 n 0 = 0,23 0,14 ± 1,96 9% skillnad (-1% till 10%) 0,23 1 0,23 115 + 0,14 1 0,14 130 = 0,09 ± 0,10 Jenny Selander, Kvant. metoder, FHV T1 december 2011 11
Relativ risk I epidemiologiska undersökningar jämför vi ofta sjukdomsförekomsten mellan en exponerad och en oexponerad grupp genom den relativa risken (RR), bl.a gällande den Kumulativa Incidensen: RR = A1 n1 A0 n0 = A = antalet insjuknade bland 1=exponerade respektive 0=oexponerade n = antalet individer fria från sjukdom vid periodens början Jenny Selander, Kvant. metoder, FHV T1 december 2011 12
Relativ risk - exempel I en undersökning av sambandet mellan fysisk aktivitet och risken för slaganfall följdes 1150 icke-rökande män under 20 års tid. Bland 600 personermed låg fysisk aktivitet insjuknade 48 personer i slaganfall och bland 550 personer med hög fysisk aktivitet insjuknade 22, vi beräknar den relativa risken till: RR = A1 n1 A0 n0 = 48 600 22 550 = 0,08 0,04 = 2,0 Risken att drabbas av slaganfall är dubbelt så stor för personer med låg fysisk aktivitet jämfört med personer med hög fysisk aktivitet. Jenny Selander, Kvant. metoder, FHV T1 december 2011 13
Konfidensintervall relativ risk e lnrr±1.96 n 1 A1 n A + n 0 A0 n A 1 1 0 0 Jenny Selander, Kvant. metoder, FHV T1 december 2011 14
Parvisa observationer Finns då vi studerar ett utfall genom upprepade mätningar på samma individ T.ex. före och efter behandling Observationerna är inte oberoende av varann Mättillfälle 1 Mättillfälle 2 Antal parvisa observationer Ja Ja a Ja Nej b Nej Ja c Nej Nej d Total n Jenny Selander, Kvant. metoder, FHV T1 december 2011 15
Parvisa observationer P 2 P 1 ±1.96 a+d b+c +4 b c n n P 1 = andelen med det aktuella utfallet vid det första observationstillfället P 2 = andelen med det aktuella utfallet vid det andra observationstillfället. Jenny Selander, Kvant. metoder, FHV T1 december 2011 16
Parvisa observationer - uträkning Räkna ut var och en för sig: P 1 = a+b n och P 2 = a+c n Räkna ut differansen: P 2 P 1 = a+b n a+c n att få ut differansen. = b c b c, d.v.s vi behöver endast räkna ut n n för Jenny Selander, Kvant. metoder, FHV T1 december 2011 17
Parvisa observationer - exempel På en arbetsplats ville man undersöka om bildskärmsarbete påverkade de anställdas benägenhet att få huvudvärk. Totalt 30 personer arbetade en vecka med bildskärm och en vecka utan bildskärm, huvudvärksymtom registrerades dagligen Bildskärm Ej bildskärm Antal individer Ja Ja 2 (a) Ja Nej 14 (b) Nej Ja 6 (c) Nej Nej 8 (d) Total 30 (n) P 2 P 1 = 14 6 30 = 0.27 Jenny Selander, Kvant. metoder, FHV T1 december 2011 18
X ² - chi-två Användbar om man vill jämföra tre eller flera proportioner samtidigt X 2 = (fg) O E 2 E O = observerat antal E = Förväntat antal om nollhypotesen är sann Jenny Selander, Kvant. metoder, FHV T1 december 2011 19
X ² - chi-två - exempel I en studie av sambandet mellan socialgruppstillhörighet och lungcancer undersöktes rökvanor i olika socialgrupper Socialgrupp Rökare Ej rökare Totalt Högre tjänstemän 236 354 590 Tjänstemän på mellannivå 144 176 320 Lägre tjänstemän 305 305 610 Utbildade arbetare 385 315 700 Outbildade arbetare 198 132 330 Totalt 1268 1282 2550 Jenny Selander, Kvant. metoder, FHV T1 december 2011 20
X ² - chi-två - exempel Vi är intresserade av att bedöma om andelen rökare skiljer sig mellan olika socialgrupper Vi jämför ett observerat antal rökare inom varje socialgrupp med det antal som vi förväntar oss X 2 = O E 2 E (fg) I likhet med t-fördelningen ser chi-två fördelningen olika ut beroende på antalet frihetsgrader, vi beräknar antalet frihetsgrader som (antalet rader -1) x (antalet kolumner-1), obs! rader och kolumner inkluderar inte totalsummor eller rubriker Jenny Selander, Kvant. metoder, FHV T1 december 2011 21
X ² - chi-två - exempel Räkna ut den förväntande antalet (E) för varje cell Soc Rökare Ej rökare Tot Högr (236),590x1268/2550=293,4 (354),590x1282/2550=296,6 590 Tjänst (144),320x1268/2550=159,1 (176),320x1282/2550=160,9 320 Lägr (305),610x1268/2550=303,3 (305),610x1282/2550=306,7 610 Utbil (385),700x1268/2550=348,1 (315),700x1282/2550=351,9 700 Outb (198),330x1268/2550=164,1 (132),330x1282/2550=165,9 330 Totalt 1268 1282 2550 Jenny Selander, Kvant. metoder, FHV T1 december 2011 22
X ² - chi-två - exempel X 2 = (fg) O E 2 E, antalet frihetsgrader = 5 1 2 1 = 4 X 2 = 236 293,4 2 (4) 293,4 305 303,3 2 303,3 198 164,1 2 164,1 + 354 296,6 2 296,6 + 305 306,7 2 306,7 + 132 165,9 2 165,9 + 144 159,1 2 159,1 + 385 348,1 2 348,1 = 46,9 + 176 160,9 2 160,9 + 315 351,9 2 351,1 + + Vi jämför det observerade chi-två värdet 46,9 med ett kritiskt värde för chi-två fördelningen med fyra frihetsgrader, vi väljer signifikansnivån 5%, se tabell 4 i appendix Vi får då värdet 9,49, eftersom 46,9>9,49 är skillnaden i rökvanor signifikant på 5% signifikansnivå Jenny Selander, Kvant. metoder, FHV T1 december 2011 23
Läs kapitel 5 i Grunderna i biostatistik Jenny Selander, Kvant. metoder, FHV T1 december 2011 24
Övningsuppgifter Lös övningsuppgifterna 20/12 kl 14.00 15.00 individuellt eller i grupp Genomgång den 21/12 kl 09.15 Jenny Selander, Kvant. metoder, FHV T1 december 2011 25