Studietyper, inferens och konfidensintervall

Studietyper, inferens och konfidensintervall Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Studietyper Experimentella studier Innebär ett ingrepp i det naturliga skeendet för att studera effekter - Klinisk prövning av läkemedel Populationsstudier Saknar effekt på skeendet - Tvärsnittsstudier - Longitudinella o o Retrospektiva Prospektiva 2

Kontrollgrupper Matchade kontroller Varje individ i den studerade befolkningen har en tvilling - Kan vara svårt att genomföra Oberoende kontroller En grupp får en viss behandling, en annan t ex placebo - Kan endast jämföra genomsnittseffekter 3

Studiedesign: Parallella grupper Experimentell studie Fördelar - En behandlingsperiod - Få statistiska antaganden - Enkel Nackdelar - Mellanindividsvariabiliteten avgörande - Kräver stora material 4

Studiedesign: Crossover-studie Experimentell studie A B A B Varje individ är sin egen kontroll! Fördelar - Inomindividsvariabiliteten avgörande - Kräver färre individer Nackdelar - Enbart vid kroniska och obotbara sjukdomar - Bortfallsproblem - Fler behandlingsperioder per individ 5

Studiedesign: Faktoriell design Experimentell studie Läkemedel A Placebo Läkemedel B Placebo 25 25 25 25 - Användbart för kombinationsbehandlingar - Varje behandlingstyp kan studeras för sig - Interaktioner kan studeras - Patientekonomisk 6

Urvalsmetoder Totalundersökning Alla individer undersöks Ger en rättvis bild Nackdel: dyrt, tidskrävande; ofta omöjligt Stickprovsundersökning Ett representativt urval undersöks Studien kan anpassas efter syftet Nackdel: Risk för så kallad bias, d.v.s. systematiska fel på grund av icke representativt urval 7

Dubbel-blindförsök För att undvika subjektiva inslag vid läkemedelsstudier så bör dessa genomföras som dubbel-blindade försök: varken patient, läkare eller övrig personal vet vilken behandling som ges Först när studien är slut bryts koden Den behandling som en given patient får bestäms slumpmässigt ( randomisering ) 8

Varför randomisering? Garantera att det inte finns någon möjlighet till medveten eller omedveten styrning av tilldelningen av behandlingsalternativ Skapa balans mellan behandlingsgrupperna med avseende på kända och okända bakgrunds- och prognostiska faktorer Införa ett slumpmoment vilket är en förutsättning för att få statistisk kontroll över osäkerheten i slutsatserna 9

Population Stickprovstagning Målgrupp om vilka vi vill kunna uttala oss om Studiepopulation De i målgruppen som är möjliga att studera Stickprov De som faktiskt ingår i studien 10

Inferens Statistisk inferens är att dra slutsatser om egenskaper hos en population genom att använda data från ett stickprov. Inference = slutsats 11

Stickprovsbaserade skattningar Från ett stickprov kan man få en skattning av populationens medelvärde µ Om man gör om stickprovet många gånger får man lite olika skattningar av µ Dessa skattningar bildar en fördelning som är stickprovets sannolikhetsfördelning (kallas samplingsfördelning i boken) 12

Exempel Stickprovsbaserad skattning Kroppsvikt Vi drar 10 stickprov (n=7) från en population med medelvikten (μ) 74 kg och standardavvikelsen (σ) 15: Stickprov x s 1 80 12 2 83 16 3 72 10 4 63 12 5 70 22 Stickprov x s 6 69 16 7 82 19 8 66 14 9 68 12 10 64 13 13

Antal stickprov Exempel Stickprovsbaserad skattning µ 3 2 1 0 60 65 70 75 80 85 Vikt (kg) 14

Exempel Stickprovsbaserad skattning µ 60 65 70 75 80 Vikt (kg) 15

Centrala gränsvärdessatsen 1. Om man tar stickprov av storlek n (där n är tillräckligt stort) från en population med medelvärdet µ och standardavvikelsen σ kommer distributionen av medelvärden att bli ungefär normalfördelad 2. Normalfördelningen kommer att ha medelvärdet m och standardavvikelsen σ n. 3. Detta gäller oavsett underliggande fördelning! 16

Antal stickprov Exempel Stickprovsbaserad skattning µ 3 2 1 0 60 65 70 75 80 85 Vikt (kg) Medelvärdet av stickprovens medelvärden (x ) är dock något lägre än µ (72 kg) 17

Exempel Stickprovsbaserad skattning µ 60 65 70 75 80 Vikt (kg) och medianen av stickprovens medelvärden (x ) är betydligt lägre än µ (69.5 kg) 18

Stickprovsmedelvärdets osäkerhet Ett stickprovsmedelvärde är endast en skattning av det verkliga medelvärdet (µ) Skattningens osäkerhet beror av n (antalet prover/datapunkter) och osäkerheten behöver kvantifieras Ett bra sätt att redogöra för hur säkert vi kan beskriva medelvärdet är att beräkna konfidensintervall 19

Centrala gränsvärdessatsen Stickprovets medelvärde Om vi känner till n, µ och σ så kan vi beräkna (skatta) var stickprovets medelvärde (x ) kan förväntas ligga med en viss säkerhet Sannolikheten att observera x kan beräknas genom att utnyttja Z-värdet: 1 Z = skillnad spridning 3 Z x = x μ σ n 2 Z = X μ σ 4 p Z x = p x μ σ n 20

Centrala gränsvärdessatsen Skattning av populationsmedelvärdet Om vi istället känner till n, x och σ så kan vi utnyttja samma förhållande för att beräkna (skatta) var populationens medelvärde (µ) kan förväntas ligga med 95% säkerhet p 1.96 x μ σ n 1.96 = 0.95 p x 1.96 σ n μ x + 1.96 σ n = 0.95

Centrala gränsvärdessatsen Skattning av populationsmedelvärdet Om vi istället känner till n, x och σ så kan vi utnyttja samma förhållande för att beräkna (skatta) var populationens medelvärde (µ) kan förväntas ligga med 95% säkerhet p x 1.96 σ n μ x + 1.96 σ n = 0.95 μ = x 1.96 σ n, x + 1.96 σ n μ = x ± 1.96 σ n

Centrala gränsvärdessatsen Konfidensintervall Formeln vi fått fram kan generaliseras så att den beskriver var populationsmedelvärdet (µ) ligger med en viss säkerhet (om signifikansnivån (α) är 5% så ligger populations-medelvärdet med 95% säkerhet inom intervallet). μ = x ± Z 1 α σ n 23

Centrala gränsvärdessatsen Begränsningar med metoden 1. Metoden förutsätter att populationens standardavvikelse (σ) är känd (vilket den aldrig är!) Använd stickprovets standardavvikelse (s) istället för σ (och anta att s är en bra approximation av σ) s = 1 n 1 x i x 2 Då har vi: μ = x ± Z 1 α s n 24

Centrala gränsvärdessatsen Begränsningar med metoden 2. Gäller endast om stickprovsstorleken (n) är tillräckligt stor! Vid små n OCH då vi kan anta att den underliggande fördelning är normalfördelad så använder vi t istället för Z μ = x ± t 1 α,n 1 s n 25

t-fördelningen Lik normalfördelningen men med längre svansar Normal t -6-4 -2 0 2 4 6 26

t-fördelningen Svansandet beror på n Normal n=3 n=10 n=30-6 -4-2 0 2 4 6 27

Hur väljer vi mellan t och Z? t z n=2 n>50 28

Konfidensintervallet runt medelvärdet (Z) Det sanna medelvärdet i populationen ligger med 95% sannolikhet inom gränserna: μ = x ± Z 95% = x ± 1.96 s n s n Hittas i tabell 2 29

Konfidensintervallet runt medelvärdet (t) Det sanna medelvärdet i populationen ligger med 95% sannolikhet inom gränserna: μ = x ± t 95%,n 1 s n Hittas i tabell 3, där n 1 är antalet frihetsgrader 30

Exempel Konfidensintervallet runt medelvärdet Kroppslängd x = 171.4 cm s = 8.6 cm n = 65 Z Lägre gräns - Lower 95%CI = Övre gräns - Upper 95%CI = cm cm 31

Exempel Konfidensintervallet runt medelvärdet Kroppslängd x = 171.4 cm s = 8.6 cm n = 65 t Samma gränser för t som för Z! Detta beror på att n är tillräckligt stort. Lägre gräns - Lower 95%CI = Övre gräns - Upper 95%CI = cm cm 32

Exempel Konfidensintervallet runt medelvärdet Kroppslängd x = 171.4 cm s = 8.6 cm n = 5 Z Lägre gräns - Lower 95%CI = Övre gräns - Upper 95%CI = cm cm 33

Exempel Konfidensintervallet runt medelvärdet Kroppslängd x = 171.4 cm s = 8.6 cm n = 5 t Olika gränser för t och Z! n är för litet för att vi ska kunna använda oss av Z så om ett konfidensintervall ska anges måste vi använda t. Lägre gräns - Lower 95%CI = Övre gräns - Upper 95%CI = cm cm 34

Större stickprov - säkrare medelvärde Konfidensintervallet är ett mått på tillförlitligheten i medelvärdet Ju fler observationer (mätpunkter, individer), desto lägre standardavvikelse i stickprovens sannolikhetsfördelning ( σ ) och desto snävare konfidensintervall. Ju snävare konfidensintervall, desto mer tillförlitligt medelvärde. n 35

Exempel Stickprovsstorlek: 95%CI för Längd 180 175 U95%CI L95%CI Medel 170 165 160 n=5 n=10 n=20 n=40 n=65 36

Konfidensintervall för proportioner med 2 klasser Ofta gör vi undersökningar gällande proportioner - Andelen av Sveriges befolkning som är >60 år - Andelen av dessa som har diabetes - Andelen av de med diabetes som behandlas med ett visst läkemedel Konfidensintervallet för en observerad proportion (p obs ) kan beräknas exakt m.h.a. binomialfördelningen 37

Konfidensintervall för proportioner med 2 klasser Då n är så pass stort att vi kan anta en normalfördelning så kan vi göra inferens även med avseende på proportioner Konfidensintervallet för den skattade proportionen ges då av: π = p obs ± Z 1 α p obs 1 p obs n 38

Sammanfattning Studietyper Stickprovsurval Undersökningar berör oftast representativa urval snarare än hela populationer Dubbel-blindning När läkemedelsbehandlingar testas bör inte vare sig läkare eller patient veta exakt vilka preparat som ges Randomisering Skapar balans i och kontroll över materialet 39

Sammanfattning Konfidensintervall Centrala gränsvärdessatsen Distributionen av stickprovsmedelvärden är normalfördelad oavsett variabelns underliggande fördelning Konfidensintervall Beskriver ett intervall där medelvärdet med t ex 95% sannolikhet ligger t-fördelning Används för att räkna ut konfidensintervall vid små n 40