Studietyper, inferens och konfidensintervall

Relevanta dokument
Parade och oparade test

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hur man tolkar statistiska resultat

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Föreläsning 5. Kapitel 6, sid Inferens om en population

Lektionsanteckningar 11-12: Normalfördelningen

Föreläsning G60 Statistiska metoder

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hur skriver man statistikavsnittet i en ansökan?

Föreläsning 4. Kapitel 5, sid Stickprovsteori

, s a. , s b. personer från Alingsås och n b

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F3 Introduktion Stickprov

Föreläsning G60 Statistiska metoder

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

F9 SAMPLINGFÖRDELNINGAR (NCT

TMS136. Föreläsning 10

Samplingfördelningar 1

FÖRELÄSNING 7:

Thomas Önskog 28/

TMS136. Föreläsning 13

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

F9 Konfidensintervall

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

9. Konfidensintervall vid normalfördelning

TMS136. Föreläsning 7

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

TMS136. Föreläsning 11

FÖRELÄSNING 8:

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Föreläsning 11: Mer om jämförelser och inferens

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

F10 Problemlösning och mer om konfidensintervall

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Medicinsk statistik I

Tentamen i Statistik, STA A10 samt STA A13 9p 24 augusti 2005, kl

Hypotestestning och repetition

Introduktion till statistik för statsvetare

Föreläsning 4: Konfidensintervall (forts.)

Statistik 1 för biologer, logopeder och psykologer

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Föreläsning G60 Statistiska metoder

Föreläsningsanteckningar till kapitel 8, del 2

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

a) Facit till räkneseminarium 3

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Lärare 4. Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum

F22, Icke-parametriska metoder.

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Dataanalys kopplat till undersökningar

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

8 Inferens om väntevärdet (och variansen) av en fördelning

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

10. Konfidensintervall vid två oberoende stickprov

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Uppgift a b c d e Vet inte Poäng

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

LMA522: Statistisk kvalitetsstyrning

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Mer om konfidensintervall + repetition

Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

Forskningsmetodik 2006 lektion 2

Föreläsning 7: Punktskattningar

Formel- och tabellsamling i matematisk statistik

Föreläsning G60 Statistiska metoder

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

LMA521: Statistisk kvalitetsstyrning

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Föreläsning 12: Regression

Laboration 2 Inferens S0005M VT18

Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

Föreläsning 7. Statistikens grunder.

Föreläsning 12, FMSF45 Hypotesprövning

Statistik och epidemiologi T5

Transkript:

Studietyper, inferens och konfidensintervall Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Studietyper Experimentella studier Innebär ett ingrepp i det naturliga skeendet för att studera effekter - Klinisk prövning av läkemedel Populationsstudier Saknar effekt på skeendet - Tvärsnittsstudier - Longitudinella o o Retrospektiva Prospektiva 2

Kontrollgrupper Matchade kontroller Varje individ i den studerade befolkningen har en tvilling - Kan vara svårt att genomföra Oberoende kontroller En grupp får en viss behandling, en annan t ex placebo - Kan endast jämföra genomsnittseffekter 3

Studiedesign: Parallella grupper Experimentell studie Fördelar - En behandlingsperiod - Få statistiska antaganden - Enkel Nackdelar - Mellanindividsvariabiliteten avgörande - Kräver stora material 4

Studiedesign: Crossover-studie Experimentell studie A B A B Varje individ är sin egen kontroll! Fördelar - Inomindividsvariabiliteten avgörande - Kräver färre individer Nackdelar - Enbart vid kroniska och obotbara sjukdomar - Bortfallsproblem - Fler behandlingsperioder per individ 5

Studiedesign: Faktoriell design Experimentell studie Läkemedel A Placebo Läkemedel B Placebo 25 25 25 25 - Användbart för kombinationsbehandlingar - Varje behandlingstyp kan studeras för sig - Interaktioner kan studeras - Patientekonomisk 6

Urvalsmetoder Totalundersökning Alla individer undersöks Ger en rättvis bild Nackdel: dyrt, tidskrävande; ofta omöjligt Stickprovsundersökning Ett representativt urval undersöks Studien kan anpassas efter syftet Nackdel: Risk för så kallad bias, d.v.s. systematiska fel på grund av icke representativt urval 7

Dubbel-blindförsök För att undvika subjektiva inslag vid läkemedelsstudier så bör dessa genomföras som dubbel-blindade försök: varken patient, läkare eller övrig personal vet vilken behandling som ges Först när studien är slut bryts koden Den behandling som en given patient får bestäms slumpmässigt ( randomisering ) 8

Varför randomisering? Garantera att det inte finns någon möjlighet till medveten eller omedveten styrning av tilldelningen av behandlingsalternativ Skapa balans mellan behandlingsgrupperna med avseende på kända och okända bakgrunds- och prognostiska faktorer Införa ett slumpmoment vilket är en förutsättning för att få statistisk kontroll över osäkerheten i slutsatserna 9

Population Stickprovstagning Målgrupp om vilka vi vill kunna uttala oss om Studiepopulation De i målgruppen som är möjliga att studera Stickprov De som faktiskt ingår i studien 10

Inferens Statistisk inferens är att dra slutsatser om egenskaper hos en population genom att använda data från ett stickprov. Inference = slutsats 11

Stickprovsbaserade skattningar Från ett stickprov kan man få en skattning av populationens medelvärde µ Om man gör om stickprovet många gånger får man lite olika skattningar av µ Dessa skattningar bildar en fördelning som är stickprovets sannolikhetsfördelning (kallas samplingsfördelning i boken) 12

Exempel Stickprovsbaserad skattning Kroppsvikt Vi drar 10 stickprov (n=7) från en population med medelvikten (μ) 74 kg och standardavvikelsen (σ) 15: Stickprov x s 1 80 12 2 83 16 3 72 10 4 63 12 5 70 22 Stickprov x s 6 69 16 7 82 19 8 66 14 9 68 12 10 64 13 13

Antal stickprov Exempel Stickprovsbaserad skattning µ 3 2 1 0 60 65 70 75 80 85 Vikt (kg) 14

Exempel Stickprovsbaserad skattning µ 60 65 70 75 80 Vikt (kg) 15

Centrala gränsvärdessatsen 1. Om man tar stickprov av storlek n (där n är tillräckligt stort) från en population med medelvärdet µ och standardavvikelsen σ kommer distributionen av medelvärden att bli ungefär normalfördelad 2. Normalfördelningen kommer att ha medelvärdet m och standardavvikelsen σ n. 3. Detta gäller oavsett underliggande fördelning! 16

Antal stickprov Exempel Stickprovsbaserad skattning µ 3 2 1 0 60 65 70 75 80 85 Vikt (kg) Medelvärdet av stickprovens medelvärden (x ) är dock något lägre än µ (72 kg) 17

Exempel Stickprovsbaserad skattning µ 60 65 70 75 80 Vikt (kg) och medianen av stickprovens medelvärden (x ) är betydligt lägre än µ (69.5 kg) 18

Stickprovsmedelvärdets osäkerhet Ett stickprovsmedelvärde är endast en skattning av det verkliga medelvärdet (µ) Skattningens osäkerhet beror av n (antalet prover/datapunkter) och osäkerheten behöver kvantifieras Ett bra sätt att redogöra för hur säkert vi kan beskriva medelvärdet är att beräkna konfidensintervall 19

Centrala gränsvärdessatsen Stickprovets medelvärde Om vi känner till n, µ och σ så kan vi beräkna (skatta) var stickprovets medelvärde (x ) kan förväntas ligga med en viss säkerhet Sannolikheten att observera x kan beräknas genom att utnyttja Z-värdet: 1 Z = skillnad spridning 3 Z x = x μ σ n 2 Z = X μ σ 4 p Z x = p x μ σ n 20

Centrala gränsvärdessatsen Skattning av populationsmedelvärdet Om vi istället känner till n, x och σ så kan vi utnyttja samma förhållande för att beräkna (skatta) var populationens medelvärde (µ) kan förväntas ligga med 95% säkerhet p 1.96 x μ σ n 1.96 = 0.95 p x 1.96 σ n μ x + 1.96 σ n = 0.95

Centrala gränsvärdessatsen Skattning av populationsmedelvärdet Om vi istället känner till n, x och σ så kan vi utnyttja samma förhållande för att beräkna (skatta) var populationens medelvärde (µ) kan förväntas ligga med 95% säkerhet p x 1.96 σ n μ x + 1.96 σ n = 0.95 μ = x 1.96 σ n, x + 1.96 σ n μ = x ± 1.96 σ n

Centrala gränsvärdessatsen Konfidensintervall Formeln vi fått fram kan generaliseras så att den beskriver var populationsmedelvärdet (µ) ligger med en viss säkerhet (om signifikansnivån (α) är 5% så ligger populations-medelvärdet med 95% säkerhet inom intervallet). μ = x ± Z 1 α σ n 23

Centrala gränsvärdessatsen Begränsningar med metoden 1. Metoden förutsätter att populationens standardavvikelse (σ) är känd (vilket den aldrig är!) Använd stickprovets standardavvikelse (s) istället för σ (och anta att s är en bra approximation av σ) s = 1 n 1 x i x 2 Då har vi: μ = x ± Z 1 α s n 24

Centrala gränsvärdessatsen Begränsningar med metoden 2. Gäller endast om stickprovsstorleken (n) är tillräckligt stor! Vid små n OCH då vi kan anta att den underliggande fördelning är normalfördelad så använder vi t istället för Z μ = x ± t 1 α,n 1 s n 25

t-fördelningen Lik normalfördelningen men med längre svansar Normal t -6-4 -2 0 2 4 6 26

t-fördelningen Svansandet beror på n Normal n=3 n=10 n=30-6 -4-2 0 2 4 6 27

Hur väljer vi mellan t och Z? t z n=2 n>50 28

Konfidensintervallet runt medelvärdet (Z) Det sanna medelvärdet i populationen ligger med 95% sannolikhet inom gränserna: μ = x ± Z 95% = x ± 1.96 s n s n Hittas i tabell 2 29

Konfidensintervallet runt medelvärdet (t) Det sanna medelvärdet i populationen ligger med 95% sannolikhet inom gränserna: μ = x ± t 95%,n 1 s n Hittas i tabell 3, där n 1 är antalet frihetsgrader 30

Exempel Konfidensintervallet runt medelvärdet Kroppslängd x = 171.4 cm s = 8.6 cm n = 65 Z Lägre gräns - Lower 95%CI = Övre gräns - Upper 95%CI = cm cm 31

Exempel Konfidensintervallet runt medelvärdet Kroppslängd x = 171.4 cm s = 8.6 cm n = 65 t Samma gränser för t som för Z! Detta beror på att n är tillräckligt stort. Lägre gräns - Lower 95%CI = Övre gräns - Upper 95%CI = cm cm 32

Exempel Konfidensintervallet runt medelvärdet Kroppslängd x = 171.4 cm s = 8.6 cm n = 5 Z Lägre gräns - Lower 95%CI = Övre gräns - Upper 95%CI = cm cm 33

Exempel Konfidensintervallet runt medelvärdet Kroppslängd x = 171.4 cm s = 8.6 cm n = 5 t Olika gränser för t och Z! n är för litet för att vi ska kunna använda oss av Z så om ett konfidensintervall ska anges måste vi använda t. Lägre gräns - Lower 95%CI = Övre gräns - Upper 95%CI = cm cm 34

Större stickprov - säkrare medelvärde Konfidensintervallet är ett mått på tillförlitligheten i medelvärdet Ju fler observationer (mätpunkter, individer), desto lägre standardavvikelse i stickprovens sannolikhetsfördelning ( σ ) och desto snävare konfidensintervall. Ju snävare konfidensintervall, desto mer tillförlitligt medelvärde. n 35

Exempel Stickprovsstorlek: 95%CI för Längd 180 175 U95%CI L95%CI Medel 170 165 160 n=5 n=10 n=20 n=40 n=65 36

Konfidensintervall för proportioner med 2 klasser Ofta gör vi undersökningar gällande proportioner - Andelen av Sveriges befolkning som är >60 år - Andelen av dessa som har diabetes - Andelen av de med diabetes som behandlas med ett visst läkemedel Konfidensintervallet för en observerad proportion (p obs ) kan beräknas exakt m.h.a. binomialfördelningen 37

Konfidensintervall för proportioner med 2 klasser Då n är så pass stort att vi kan anta en normalfördelning så kan vi göra inferens även med avseende på proportioner Konfidensintervallet för den skattade proportionen ges då av: π = p obs ± Z 1 α p obs 1 p obs n 38

Sammanfattning Studietyper Stickprovsurval Undersökningar berör oftast representativa urval snarare än hela populationer Dubbel-blindning När läkemedelsbehandlingar testas bör inte vare sig läkare eller patient veta exakt vilka preparat som ges Randomisering Skapar balans i och kontroll över materialet 39

Sammanfattning Konfidensintervall Centrala gränsvärdessatsen Distributionen av stickprovsmedelvärden är normalfördelad oavsett variabelns underliggande fördelning Konfidensintervall Beskriver ett intervall där medelvärdet med t ex 95% sannolikhet ligger t-fördelning Används för att räkna ut konfidensintervall vid små n 40