Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111

Innehåll Normalfördelningen Konfidensintervall Hypotesprövning P-värde Typ I och Typ II-fel Teststyrka Små stickprov Jämförelse av två medelvärden Två oberoende stickprov Wilcoxon rangsummetest Parvisa observationer Jenny Selander, Kvant. metoder, FHV T1 december 2011 2

Normalfördelning En klockformad kurva som är symmetrisk kring medelvärdet Många statistiska beräkningar bygger på att en variabel är normalfördelad x Jenny Selander, Kvant. metoder, FHV T1 december 2011 3

Positivt sned fördelning Är icke symmetrisk. Har sin koncentration på vänstersidan. x Jenny Selander, Kvant. metoder, FHV T1 december 2011 4

Negativt sned fördelning Är icke symetrisk Har sin koncentration på högersidan x Jenny Selander, Kvant. metoder, FHV T1 december 2011 5

T-fördelning En variabel från ett litet stickprov med kvantitativa mätdata är inte riktigt normalfördelad utan följer en annan fördelning, t-fördelningen, även om populationen man drog stickprovet ur är normalfördelad. T-fördelningens form beror på stickprovsstorleken Vid stort stickprov är t-fördelningen och normalfördelningen nästan identiska, men vid mindre stickprovsantal skiljer sig som sagt fördelningarna åt. x Jenny Selander, Kvant. metoder, FHV T1 december 2011 6

T-fördelningen Eftersom t-fördelningen blir samma som normalfördelningen vid ökande stickprovsstorlek behöver man inte byta till normalfördelningen om man inte vill, utan kan göra signifikansanalys av kvantitativa data genom olika varianter av t- test. Undantaget är när man har ett mycket stort stickprov som inte är normalfördelat. Då bör man göra ett z-test, som använder normalfördelningen. Jenny Selander, Kvant. metoder, FHV T1 december 2011 7

Konfidensintervall Det finns alltid en osäkerhet i datat eftersom vi undersöker stickprov och inte hela populationen och slumpen avgör vilka individer som kommer med i stickprovet. Ett bra sätt att ta hänsyn till denna osäkerhet är att beräkna ett konfidensintervall. Vanligen används ett 95% Konfidensintervall Det betyder att intervallet med 95% sannolikhet inkluderar det sanna populationsvärdet eller att intervallet i 95 fall av hundra täcker det sanna värdet. Jenny Selander, Kvant. metoder, FHV T1 december 2011 8

Konfidensintervall för medelvärden x ± 1.96 s 2 n x = Stickprovsmedelvärdet Standardiserade normalfördelningen (z-värde) 1.96 gäller för ett 95% konfidensintervall Stickprovsmedelvärdets standardavvikelse s Stickprovsmedelvärdets varians = s ² Populationens varians (σ² ) är inte känd, därför används stickprovets varans (s²) som ett skattning av variansen i populationen Denna konfidensintervallsberäkning gäller större stickprov Jenny Selander, Kvant. metoder, FHV T1 december 2011 9

Stickprovets varians s 2 = x x ² n 1 Stickprovets varians s² Summa Ʃ Variabelvärdet för varje observation x Aritmetiskt medelvärde x Totala antalet observationer (individer) n Jenny Selander, Kvant. metoder, FHV T1 december 2011 10

Repetition tidigare exempel - Olika längd på personerna Id Längd i cm (x) x-x (x-x) 2 Först räknar vi ut medelvärdet: 1 167-9,2 84,64 2 177 0,8 0,64 Medelvärdet: x = n x 3 179 2,8 7,84 4 187 10,8 116,64 x = 167+177+179+187+169+172+179+180+175+177 10 = 176,2 cm 5 169-7,2 51,84 6 172-4,2 17,64 Variansen (s 2 ) är: 7 179 2,8 7,84 8 180 3,8 14,44 s 2 = x x ² n 1 = 303,6 = 303,6 10 1 9 = 33,73 9 175-1,2 1.44 10 177 0,8 0,64 Variansen är 33,73 Totalt 0 303,6 Jenny Selander, Kvant. metoder, FHV T1 december 2011 11

Konfidensintervall för medelvärden - exempel I en tidigare nämnd undersökning gällande längd fann man att man i medtal (aritmetiskt medelvärde, x ) var 176,2 cm lång, beräkna ett 95% konfidensintervall kring detta medelvärde Variansen (s 2 ) = 33,73, antalet observationer=10 se föregående sida. x ± 1.96 s 2 n 176,2 ±1.96 33,73 10 = 176,2 ±1,96 3,37 = 176,2 ±1,96 1,84 = 176,2 ± 3.61 Övre konfidensintervallet = 176,2+3,61 = 179,81 Nedre konfidensintervallet = 176,2-3,61 = 172,59 x= 176,2 (172,59 till 179,81), intervallet inkluderar med 95% sannolikhet det sanna (okända) populationsvärdet Jenny Selander, Kvant. metoder, FHV T1 december 2011 12

Hypotesprövning Kan även kallas signifikanstest Tar också hänsyn till den statistiska osäkerheten hos en undersökning Vid en hypotesprövning relaterar vi det observerade värdet till ett visst värde som bestäms genom att vi specificerar en sk nollhypotes. Vanligtvis finns det en naturlig nollhyptes, t.ex. att det inte finns någon skillnad i sjukdomsförekomst mellan de två grupper som jämförs Jenny Selander, Kvant. metoder, FHV T1 december 2011 13

Hypotesprövning 1. Specificera en nollhypotes och en alternativ hypotes 2. Bestäm signifikansnivå (oftast 5%) 3. Bestäm teststorhet (Z) 4. Beräkna det observerade z-värdet 5. Jämför det observerade värdet på teststorheten med ett kritiskt värde, förkasta nollhypotesen eller ej. Jenny Selander, Kvant. metoder, FHV T1 december 2011 14

Hypotesprövning Man specificerar en nollhypotes (Ho) och en alternativ hypotes (H1) Testet svarar på frågan: Är slumpen en trolig förklaring till skillnaden mellan det i undersökningen observerade värdet och det som nollhypotesen anger? Jenny Selander, Kvant. metoder, FHV T1 december 2011 15

Studie I en undersökning fann man att medelvärdet för stresshormonet kortisol på morgonen (30 min efter uppvaknande) var 23.7 nmol/l för 225 boende nära en internationell flygplats. Standardavvikelsen var 2,7. Medel-kortisolvärdet (30 min efter uppvaknande) i den allmänna befolkningen är 23,3 nmol/l. Är slumpen en trolig orsak till skillnaden? Jenny Selander, Kvant. metoder, FHV T1 december 2011 16

Hypotesprövning - exempel Ho = populationsmedelvärdet bland boende kring en flygplats = 23,3 nmol/l H1 = populationsmedelvärdet bland boende kring en flygplats 23,3nmol/L Jenny Selander, Kvant. metoder, FHV T1 december 2011 17

Signifikansnivå Sannorlikheten/risken att förkasta nollhypotesen fast den är sann. Vanligtvis väljs 5% signifikansnivå Jenny Selander, Kvant. metoder, FHV T1 december 2011 18

Teststorhet Det finns flera olika teststorheter, om vi använder oss av den standardiserade normalfördelningen är teststorheten Z. z = x μ0 s 2 n = 23,7 23,3 2,7 2 225 = 0,4 7,3 225 = 0,4 0,03 = 0,4 0,17 = 2,35 x = det observerade stickprovsmedelvärdet μ0 = populationsmedelvärdet som specificerades via nollhypotesen s 2 = stickprovsmedelvärdets varians (s = standardavvikelse) n = antalet observationer Jenny Selander, Kvant. metoder, FHV T1 december 2011 19

Jämförelse med ett kritiskt värde Det kritiska värdet är ett värde på teststorheten (z) som korresponderar med den valda signifikansnivån I detta fall z-värdet som svarar mot 5% signifikansnivå. Vid ett tvåsidigt test är det kritiska z-värdet -1.96 och 1.96 eftersom dessa tal avgränsar 2.5% (0,025) på vardera sidan om den standardiserade normalfördelningen (sammanlagt 5%, vilket är den valda signifikantnivån). Se tabell 1 i appendix. detta innebär att vi förkastar nollhypotesten om z är mindre än -1.96 eller större än 1.96. 2,5 % 2,5 % Jenny Selander, Kvant. metoder, FHV T1 december 2011 20

Jämförelse med ett kritiskt värde I vårt exempel observerade vi z-värdet 2,35, eftersom detta är större än 1,96 så förkastar vi nollhypotesen Vi kan säga att det förekommer en statistiskt signifikant skillnad i kortisolvärde mellan boende nära flygplatser och den allmänna befolkningen Jenny Selander, Kvant. metoder, FHV T1 december 2011 21

P-värde Resultatet från hypotesprövningen kan beskrivas genom ett så kallat p-värde. P-värdet uttrycker sannolikheten att observera ett utfall minst så extremt som det vi faktiskt observerat under förutsättning att nollhypotesen är sann. Relaterat till vårt tidigare exempel, svarar p-värdet på frågan: Vad är sannolikheten att observera ett kortisolvärde på minst 23,7 nmol/l bland boende kring flygplatser i vårt stickprov om populationsmedelvärdet bland de boende i själva verket är 23,3 nmol/l Jenny Selander, Kvant. metoder, FHV T1 december 2011 22

P-värde Vi räknade ut z-värdet 2,35, detta z-värde avgränsar 0,009 (se tabell 1 i appendix) = 0,9% av ytan på vardera sidan av den standardiserade normalfördelningen, vilket ger en total yta på 1,8% (0,9+0,9). Detta innebär att ett tvåsidigt p-värde för denna studie är = 1,8% Ensidigt p-värde för denna studie är = 0,9% Sannorlikheten för att finna värdet 23,7 nmol/l om det sanna populationsvärdet är 23,3 nmol/l är 1,8% (för ett tvåsidigt p- värde) Jenny Selander, Kvant. metoder, FHV T1 december 2011 23

Typ-I och Typ-II fel vi kan dra felaktiga slutsatser av en hypotesprövning på två olika sätt Typ-I fel (Signifikansnivå) Nollhypotesen kan förkastas fast den är sann Typ-II fel Nollhypotesen förkastas inte fast den är falsk Sannorlikheten för detta = signifikansnivån, den bestämmer vi själva Jenny Selander, Kvant. metoder, FHV T1 december 2011 24

Teststyrka (power) Sannorlikheten att förkasta nollhypotesen när den är falsk Motsvarar komplementhändelsen till typ II-fel Beräknas via 1-P(typII-fel) Jenny Selander, Kvant. metoder, FHV T1 december 2011 25

Exempel Antag att det verkliga medelvärdet hos boende kring flygplatser är 23,7 nmol/l, vi anger att nollhypotesen är den samma som tidigare d.v.s. att boende kring flygplatser har samma kortisol värde som den allmänna befolkningen 23,3. Vad är sannorlikheten att inte förkasta nollhypotesen trots att den är falsk? typ-ii fel Vi väljer signifikansnivån 5% (0,05) och ett ensidigt test, läs av tabell 1 i Appendix, detta innebär att vi förkastar noll-hypotesen om z är större än 1,65. Jenny Selander, Kvant. metoder, FHV T1 december 2011 26

Exempel Detta betyder att om z > 1,65 så förkastar vi nollhypotesen Z = x μ0 s 2 n, 1.65> x 23,3 2,7 2 225 vi löser ut: x > 23,3 + 1,65 2,72 225 X>23,60 Nollhypotesen förkastas om x är större än 23,6 Jenny Selander, Kvant. metoder, FHV T1 december 2011 27

Exempel Var är då sannorlikheten att observera ett kortisolvärde som är mindre än 23,6 om populationsvärdet är 23,7? Vi beräknar återigen z-värdet: Z = x μ0 s 2 n = 23,6 23,7 2,7 2 225 = - 0,56 I tabell 1 i appendix kan man utläsa att z-värdet 0,56 motsvarar ett värde på 0,288 = 29% Detta innebär att risken för typ-ii-fel är 29% Jenny Selander, Kvant. metoder, FHV T1 december 2011 28

Exempel Vi kan nu svara på frågan: Vad är sannorlikheten att förkasta nollhypotesen när den är falsk? Sannorlikheten för komplementhändelsen till typ-ii-fel 1 p(typii-fel) = 1-0.29 = 0,71, 71% Om populationsvärdet i själva verket är 23,7 har vi 71% sannorlikhet att förkasta nollhypotesen när den är falsk vid signifikansnivån 5% Jenny Selander, Kvant. metoder, FHV T1 december 2011 29

Teststyrkan påverkas av tre faktorer Valet av signifikansnivå Antaganden om det sanna populationsvärdet Stickprovsstorleken Jenny Selander, Kvant. metoder, FHV T1 december 2011 30

Små stickprov Om stickprovet är litet gäller lite andra regler än vid stora stickprov Om vi i ett litet stickprov vill analysera en variabel som i grunden är normalfördelad kan vi beräkna konfidensintervall för populationsmedelvärdet genom t-fördelningen Denna metod ger oavsett stickprovets storlek exakta konfidensintervall Jenny Selander, Kvant. metoder, FHV T1 december 2011 31

T-fördelningen T-fördelningens form uttrycks i antal frihetsgrader Frihetsgrader beräknas genom att ta antalet observationer minus ett (n-1). I tabell 3 i appendix anges värden på T-fördelningen för olika antal frihetsgrader Jenny Selander, Kvant. metoder, FHV T1 december 2011 32

Beräkna konfidensintervall för medelvärdet i små stickprov x ± t n 1 s2 n I stället för ett z-värde (vanligen 1.96 för ett 95% konfidensintervall) har vi nu ett värde från t-fördelningen i formeln. n-1 anger t-fördelningens antal frihetsgrader Jenny Selander, Kvant. metoder, FHV T1 december 2011 33

Exempel längd på personer ur ett litet stickprov Id Längd i cm (x) x-x (x-x) 2 Först räknar vi ut medelvärdet: 1 167-9,2 84,64 2 177 0,8 0,64 Medelvärdet: x = n x 3 179 2,8 7,84 4 187 10,8 116,64 x = 167+177+179+187+169+172+179+180+175+177 10 = 176,2 cm 5 169-7,2 51,84 6 172-4,2 17,64 Variansen (s 2 ) är: 7 179 2,8 7,84 8 180 3,8 14,44 s 2 = x x ² n 1 = 303,6 = 303,6 10 1 9 = 33,73 9 175-1,2 1.44 10 177 0,8 0,64 Totalt 0 303,6 Eftersom vi har 10 observationer så använder vi t-fördelningen med 9 frihetsgrader vid beräkningen av konfidensintervall. Från tabell 3 i appendix kan vi utläsa att värdet på t-fördelningen med 9 frihetsgrader för ett 95% konfidensintervall är 2,26 Jenny Selander, Kvant. metoder, FHV T1 december 2011 34

Exempel - fortsättning x ± t n 1 s2 n = 176,2 ± 2,26 33,73 10 = 176,2 ± 4,15 Konfidensintervallets gränser blir då: 180,35 och 172.05 Medelvärde: 176,2 (95% Konfidensintervall 172,05 till 180,35) Jenny Selander, Kvant. metoder, FHV T1 december 2011 35

Jämförelse av två medelvärden Många gånger är vi intresserade av att jämföra medelvärden mellan två grupper t.ex. Exponerad oexponerad Behandlad - obehandlad Jenny Selander, Kvant. metoder, FHV T1 december 2011 36

Jämförelse av två medelvärden Två oberoende stickprov Wilcoxons rangsummetest Parvisa observationer Jenny Selander, Kvant. metoder, FHV T1 december 2011 37

Två oberoende stickprov Vi vill jämföra medelvärdet från två stickprov som är tagna ur två olika populationer Vi beräknar skillnaden mellan stickprovs-medelvärderna samt ett konfidensintervall för denna skillnad via följande formel: x 1 x 0 ± 1,96 s 1 2 n 1 + s 02 n 0 Man brukar anse att 30 observationer i varje stickprov är tillräckligt Jenny Selander, Kvant. metoder, FHV T1 december 2011 38

Exempel två oberoende stickprov Vi vill titta på skillnaderna i serumkolestrol hos en grupp med klassad fettma >BMI 30 och en grupp som endast klassas som överviktiga BMI 27-29. Viktklass Antal X mmol/l Standardavvikelse Överviktig 27-29 75 6.5 1.1 Fetma >30 52 6.9 1.2 x 0 = överviktiga och x 1 = fetma x 1 x 0 = 6,9 6,5 = 0,4 mmol/l Jenny Selander, Kvant. metoder, FHV T1 december 2011 39

Exempel fortsättning (z-värde 1,96) x 1 x 0 ± 1,96 s 1 2 + s 02 = 0,4 ± 1,96 1,22 + 1,12 n 1 n 0 52 75 = 0,4 ± 1,96 1,44 + 1,21 52 75 = 0,4 ± 1,96 0,03 + 0,02 = 0,4 ± 1,96 0,22 = 0,4 ± 0,43 Skillnaden i medelvärde är 0,4 (95% Konfidensintervall = -0,03, 0,83) Skillnaden är inte statistiskt signifikant eftersom konfidensintervallet inkluderar 0. Jenny Selander, Kvant. metoder, FHV T1 december 2011 40

Exempel fortsättning (t-värde) Om våra stickprover är från normalfördelade populationer kan vi beräkna ett exakt konfidensintervall för skillnaden mellan medelvärderna genom en alternativ metod där vi använder t-fördelningen. x x ± t n1 +n 0 2 s 2 pool 1 n 1 + 1 n 0 = 0,4 ± 1,96 1,31 0,03 = 0,4 ± 0,39, vilket ger ett konfidensintervall på 0,01 till 0,79, en statistiskt signifikant resultat s 2 = pool x 1 x 1 2 + x 0 x 0 2 n 1 +n 0 2 man kan skriva om formeln så att den blir lättare att räkna ut s 2 = pool n 1 1 s 2 + n 0 1 s 2 1 0 n 1 1 + n 0 1 = 52 1 1,22 + 75 1 1,1 2 52 1 + 75 1 = 73,44 +89,54 51+74 = 1,31 Jenny Selander, Kvant. metoder, FHV T1 december 2011 41

Wilcoxons rangsummetest När man vill jämföra två medelvärden från små stickprov och man inte vet något om fördelningen av variabeln i populationen Nollhypotesen i testet är att de två jämförda populationernas fördelning inte skiljer sig åt. Jenny Selander, Kvant. metoder, FHV T1 december 2011 42

Wilcoxon - exempel Patient nr Sjukhus 1 Vårdtid, dagar Sjukhus 2 Vårdtid, dagar 1 15 12 2 19 14 3 21 15 4 24 17 5 30 18 6 32 20 7 34 22 8 37 23 9 40 25 10 41 27 I tabellen har vi ordnat patienterna efter vårdtid på respektive sjukhus I sjukhus 1 hade patienten med kortast vårdtid varit på sjukhuset i 15 dagar och patienten med längs vårdtid i 41 dagar. De första steget är nu att sammanföra alla observationer från de två stickproven och göra en rangordning (se nästa sida) Jenny Selander, Kvant. metoder, FHV T1 december 2011 43

Wilcoxon - exempel Vårdtid sjukhus 1 Vårdtid sjukhus 2 Rangordning sjukhus 1 12 1 14 2 15 15 3,5 3,5 17 5 18 6 19 7 20 8 21 9 22 10 23 11 24 12 25 13 27 14 30 15 32 16 34 17 37 18 40 19 41 20 Rangsummma 136,5 73,5 Rangordning sjukhus 2 Vi tilldelar varje patient en rang (ett tal), det lägsta värdet ger vi rangordningen 1. Observationer med samma värde ger vi det genomsnittliga rangordningsvärdet tex vårdtid 15 dagar som får rangen (3+4)/2=3,5 Rangsumman för det mindre av de två stickproven med ett kritiskt värde. Det kritiska värdet beror av stickprovsstorleken och den valda signifikansnivån. Läs i tabell 5 i appendix. Med urvalsstorlek 10 i båda stickproven och 5% signifikansnivå är det kritiska värdet 78 eller 132, om rangsumman är mindre än 78 eller större än 132 så är skillnaden signifikant. Eftersom 73,5 är mindre än 78 och 136,5 är större än 132 så är skillnaden i vårdtid statistiskt signifikant på 5% signifikansnivå. Jenny Selander, Kvant. metoder, FHV T1 december 2011 44

Parvisa observationer Är vanligt förekommande i medicinska data Ex. upprepade mätningar på samma person, vanligen rör det sig om data innan eller efter en behandling eller intervention gjorts Parvisa observationer kan inte ses som oberoende observationer i de statistiska analyserna För att komma runt detta kan man skapa en ny variabel som består av skillnaden mellan de två variablerna för varje individ. Om denna nya variabel är normalfördelad kan vi beräkna ett konfidensintervall för skillnaden mellan medelvärden med hjälp av t-fördelningen via följande formel: d ± t n 1 s2 d n d = medelvärdet av alla parvisa skillnader s 2 = skillnadernas varians i stickprovet d Jenny Selander, Kvant. metoder, FHV T1 december 2011 45

Exempel parvisa observationer Individnr Diastoliskt tryck (mmhg) före Systoliskt tryck (mmhg) efter d d-d (d-d) 2 1 82 80 2-4 16 2 90 86 4-2 4 3 86 76 10 4 16 4 88 80 8 2 4 5 77 78-1 -7 49 6 94 85 9 3 9 7 85 76 9 3 9 8 87 75 12 6 36 9 88 80 8 2 4 10 80 79 1-5 25 11 79 80-1 -7 49 12 75 70 5-1 1 13 74 74 0-6 36 14 88 80 8 2 4 15 78 72 6 0 0 16 82 74 8 2 4 17 81 70 11 5 25 18 94 86 8 2 4 19 80 75 5-1 1 20 78 70 8 2 4 Summa 120 0 300 I syfte att minska risken för hjärt-kärlsjukdom genomgick 20 medelålders män ett förebyggande program. Programmet innehöll bl.a. regelbunden fysisk aktivitet, ändrade kostvanor och rökstopp. Diastoliskt blodtryck mättes såväl före som efter programmet. För varje individ beräknar vi skillnaden (d) mellan blodtrycket före och efter programmet. Summan av dessa skillnader är i exemplet 120 och beräkning av d ger: d = 120/20 = 6,0 mm Hg, blodtrycket är i genomsnitt 6,0 mmhg högre före än efter programmet. variansen, s 2 = d d ² n 1 = 300 20 1 = 300 19 = 15,8 För ett 95% konfidensintervall och med n-1=19 frihetsgrader är värdet på t-fördelningen 2.09 d ± t n 1 s2 n = 6,0 ± 2,09 15,8 20 = 6,0 ± 1,9 Jenny Selander, Kvant. metoder, FHV T1 december 2011 46

Läs kapitel 4 i Grunderna i biostatistik Jenny Selander, Kvant. metoder, FHV T1 december 2011 47

Övningsuppgifter i biostatistik Måndagen den 19:e dec 13.15 15.00, lös de utdelade övningsuppgifterna var och en för sig eller i grupp, ni bestämmer själva vad som passar er. Tisdagen den 20:e dec kl 9.15 vi går igenom övningsuppgifterna i helklass. Jenny Selander, Kvant. metoder, FHV T1 december 2011 48