Kort om statistik och epidemiologi

Relevanta dokument
Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Studietyper, inferens och konfidensintervall

Use of alcohol, tobacco and illicit drugs: a cause or an effect of mental ill health in adolescence? Elena Raffetti 31 August 2016

Propensity Scores. Bodil Svennblad UCR 16 september 2014

Tillämpad statistik Naprapathögskolan. Henrik Källberg Tel

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

7.5 Experiment with a single factor having more than two levels

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 17 August 2015, 8:00-12:00. English Version

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 31 May 2016, 8:00-12:00. English Version

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Forskningsmetodik 2006 lektion 2

Föreläsning 11: Mer om jämförelser och inferens

Parade och oparade test

APC (Age, Period, Cohort) - modellering av incidensdata

ANOVA Mellangruppsdesign

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

EPIDEMIOLOGI. Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell)

Bootstrapping i fall-/kontrollstudier av genetiska markörer

Lösningar till SPSS-övning: Analytisk statistik

Uppgift 1. Produktmomentkorrelationskoefficienten

Hur skriver man statistikavsnittet i en ansökan?

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Konfidensintervall, Hypotestest

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

ST-fredag epidemiologi och biostatistik 2017

Measuring child participation in immunization registries: two national surveys, 2001

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 15 August 2016, 8:00-12:00. English Version

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Hälsoeffekter av luftföroreningar i Stockholm Göran Pershagen

S0005M, Föreläsning 2

Metod och teori. Statistik för naturvetare Umeå universitet

TMS136. Föreläsning 11

17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

Studiedesign: Observationsstudier

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

S0005M. Stokastiska variabler. Notes. Notes. Notes. Stokastisk variabel (slumpvariabel) (eng: random variable) Mykola Shykula

Medicinsk statistik II

6 februari Soffia Gudbjörnsdottir Registerhållare NDR

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Studier av anti-citrullinerade protein antikroppars roll i reumatoid artrit

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Statistik och epidemiologi T5

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Lektionsanteckningar 11-12: Normalfördelningen

F3 Introduktion Stickprov

Tentamen i matematisk statistik

8 Inferens om väntevärdet (och variansen) av en fördelning

Epidemiologi del 2. Anders Beckman. MD, PhD Lunds Universitet. A Beckman Regional forskarutbildning

Fel och fel. slumpmässiga och systema4ska fel i epidemiologiska studier Katja Fall Vetenskapligt förhållningssä>

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Introduktion till Klinisk Epidemiologi. Klinisk Epidemiologi och Biosta6s6k, 2016

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

OLIN-studiernas barn-kohorter. Umeå september 2018

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Föreläsning G60 Statistiska metoder

Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

Hur fattar samhället beslut när forskarna är oeniga?

Statistik. Statistik. Statistik. Lars Walter Fil.lic. Statistik

The present situation on the application of ICT in precision agriculture in Sweden

Hypotestestning och repetition

Statistik Termin 10, Läkarprogrammet, HT16

Statistik för teknologer, 5 poäng Skrivtid:

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Från epidemiologi till klinik SpAScania

Epidemiologi (II) Läkarprogrammet Termin 5, VT Lars Rylander. Avdelningen för arbets- och miljömedicin, Lund

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

7.5 Experiment with a single factor having more than two levels

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Kurskod: TAMS24 / Provkod: TEN (8:00-12:00) English Version

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Normalfördelning. Modeller Vi har alla stött på modeller i olika sammanhang. Ex:

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Tentamen i matematisk statistik

Gamla tentor (forts) ( x. x ) ) 2 x1

Formel- och tabellsamling i matematisk statistik

7.3.3 Nonparametric Mann-Whitney test

FÖRELÄSNING 8:

CHANGE WITH THE BRAIN IN MIND. Frukostseminarium 11 oktober 2018

Medicinsk statistik I

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Könsfördelningen inom kataraktkirurgin. Mats Lundström

Transkript:

Kort om statistik och epidemiologi Statistik - Mått -Urval - Konfidensintervall -Hypotestest - p-värde, Typ II fel etc. - Fördelningar Epidemiologi - Studietyper - Riskmått - Bias - Confounding - Exempel (fallkontroll)

Statistik (sammanfattande mått) Median ( mittenvärdet Bra att använda om extrema värden förekommer i data materialet) Typvärde ( vanligaste värdet ) Medelvärde (används ofta) Geometriskt medelvärde (bra att använda för att beräkna doser av läkemedel etc.)

Statistik (spridningsmått) Variationsvidd (eng. Range): skillnaden mellan högsta och lägsta värdet. Percentiler, kvartiler Varians och standardavvikelse. Varför? Därför att det mesta (allt) varierar!

Statistik Varians och standardavvikelse X X - (X - ) 2 1-1 1 2 0 0 3 1 1 Summa 6 0 2 x x X X = n 6 = = 3 s ( std. avvikelse) = 2 s 2 s 2 (varians) ( ) = x x n 1 2 = 2 = 1 3 1

Statistik (urval) Varför statistik? Allt Varierar, dyrt ev. omöjligt att mäta allt eller alla urval 1 Population μ x 1 urval 2 x 2 urval 4 x 4 sample 3 x 3

Statistik (konfidensintervall) Urvalsfördelning för X X 1. 96 ca 2.5% av urvalen hamnar utanför denna sidan av gränsen (under) S n x x x x x μ x x x x x x x X +1. 96 S n ca 2.5% av urvalen hamnar utanför denna sidan av gränsen (över) ca 95% of all sample means falls within this interval

Statistik (konfidensintervall) Ett konfidensintervall ger ett mått på precisionen av skattningen. Tolkning av ett 95% confidence interval: med 95% sannolikhet finns det okända uppskattade populationsvärdet inom dessa gränser

Statistik (Hypotestestning) Hur sannolikt är det att slumpen förklarar skillnaden mellan det observerade värdet och värdet som specificerats i hypotesen? Nollhypotes (ofta ingen skillnad) H O Alternativ Hypotes

Statistik Hypotestestning (P-värde mm) P-värdet anger hur stor sannolikheten är att vi observerar ett extremare värde förutsatt att H O är sann. H O Typ II-fel Signifikansnivå P-värde

Statistik Hypotestest (p-värde vs. Konfidensintervall) Konfidensintervall anger magnitud Konfidensintervall anger signifikansnivå indirekt Konfidensintervall mer kliniskt tillämpbart. P-värde kan beräknas ur konfidensintervall och medelvärde ej tvärtom. Vad är Bäst?

Statistik (Centrala principer kort!) Litet p-värde kan förklaras av: - Många individer i studien (n) - Stora skillnader mellan grupper eller mättillfällen. - Liten variation, spridning (varians)

Statistik (fördelningar) Det finns många olika sannolikhetsfördelningar. - Normalfördelning - t-fördelningar - χ 2 (Chi-två fördelningar) - Binomialfördelningen (proportioner) - Poissonfördelningen (Incidens) Alla fördelningar kan approximeras med normalfördelningen förutsatt att man har tillräckligt många observationer (centrala gränsvärdessatsen)

Statistik Centrala principer kort! För att slippa tusen tabeller så standardiserar man: st. värde ( z, t) = Medelvärde varians På följande sätt får man konfidensintervall: Medelvärde ± t abellvärde varians

Statistik (Standardisering) Standardisering x x obs x -1,96 0 1,96 z obs z

Statistik (t- fördelningstabell) Konfidensint. Bredd 0,9 0,95 0,99 Frihetsgrad (n-1) etc. 1 6,31 12,71 63,66 2 2,92 4,30 9,92 3 2,35 3,18 5,84 4 2,13 2,78 4,60 5 2,02 2,57 4,03 6 1,94 2,45 3,71 7 1,89 2,36 3,50 8 1,86 2,31 3,36 9 1,83 2,26 3,25 10 1,81 2,23 3,17

Epidemiologi Epidemiologi ~ Läran om sjukdomars utbredning och uppkomst Epidemiologiska studier är sk. Observationsbaserade studier. Stora Randomiserade studier anses vara bättre än Observationsbaserade studier.

Epidemiologi (studier) Common observational studies Cohort - Good for single exposures. - Time consuming and expensive. - Often prospective -EsimateRR Case-control - Good for many exposures. - More efficient than Cohort studies. -Retrospective (Implictaions on causal relationship) - Estimate OR (RR) Tvärsnittsstudier Ekologiska studier (grupper)

Epidemiologi (studier och mått) Eira c Exposed (R1) A1 cases d Unexposed (R0) A0 cases Time RR=A1/A0/R1/R0 (RR>1 increased risk for disease when exposed) R1 and R0 can be proportions during a specified time interval or time counted in person years. OR=A1/A0/c/d (= RR if c/d = R1/R0). OR is only based on proprotions.

Epidemiologi (slumpmässiga och systematiska felkällor) Felkällor Slumpmässiga felkällor Systematiska felkällor

Epidemiologi Bias I (felkällor) Låg validitet Hög validitet Hög precision Låg precision

Epidemiologi -Bias II (Systematiska felkällor) Cohort Fall-kontroll Selection - Loss to follow up Felklassificering - Differential - Non differential Confounding Selection - Kontrollgrupp Felklassificering - Differential (recall) - Non differential Confounding

Epidemiologi Eira Problems with case-control studies Temporality (is the exposure preceding the outcome or not) - Time dependent questions and time of onset of disease. Bias (recall) - Incident cases. Confounding (spurious associations) - Adjusting (and matching) A B Outcome

Epidemiologi Fall-kontroll Odds Ratio Exposed Unexposed Case a b Control c d OR = a/b/c/d, often estimated by using Logistic regression (OR=e β1*exposure )

The EIRA study Eira EIRA= Epidemiological Investigation of Rheumatoid Arthritis (RA) - Population based Case-control study. - Incident cases (at present more than 2000 RA cases) - Randomly choosen Controls matched to cases on age, sex and living area. Cases and controls asked to fill in an extensive questionnaire regarding life style, exposures, diseases, education etc. Provide blood sample for genetic and serological analysis. Participating rate: 96% for cases and 82% for controls Aim: Investigate genetic and environmental risk factors for RA.

Gen-Miljö interaktion Eira Real world example (Rheumatoid Arthritis (RA)) Established Risk factors for RA (RA with certain antibodies called ACPA): - Shared epitope alleles (SE alleles). Alleles in the HLA-DRB1 region. (These alleles enhance affinity to citrullinated peptides) - Smoking (causes citrullination of peptides)

Gen-Miljö interaktion Eira SE allele and risk of RA Real world example (Rheumatoid Arthritis (RA)) - ACPA+ RA: RR= 5.8 (95% CI: 4.7 7.0) - ACPA- RA: RR= 1.2 (95% CI: 0.9 1.4) Smoking and risk of RA - ACPA+ RA: RR= 1.8 (95% CI: 1.5 2.1) - ACPA- RA: RR= 0.8 (95% CI: 0.8 1.2) SE and smoking combined?

Gen-Miljö interaktion Real world example (Rheumatoid Arthritis (RA)) Eira 25 20 SE, SMOKING & ACPA- RA 15 10 5 0 E ver Smokers No SE Single SE Double SE Never Smokers Never Smokers Ever Smokers

Gen-Miljö interaktion Eira RR 25 20 15 SE, SMOKING & ACPA+ RA Risk decrease if non smoker Icke rökare Rökare 10 5 REF 0 No SE 1 SE 2 SE

Gen-Miljö interaktion Eira RR for developing ACPA+ RA SE allele zygousity Smoking status RR (95% CI) (No SE allele, 0) RR (95% CI) (Heterozygous, A) RR (95% CI) (Homozygous, AA) Never smokers, 0 1.0 (Ref) 3.3 (1.8 5.9) 5.4 (2.7 10.8) Ever smokers, B 1.5 (0.8 2.6) 6.5 (3.8 11.4) 21.0 (11.0 40.2)

Gen-Miljö interaktion Definition Statistical level Eira Multiplicative interaction logistic scale - logit( P( Y = y, SMK, SE, SMK * SE)) = α + β SMK + β SE + β SMK SE + ε SMK SE SMK, SE OR - SE, SMK > OR SE OR SMK OR SE, SMK > e β * SMK A e β * SE B Additative model OR - SMK, SE > OR SMK + OR SE OR SMK, SE > e β SMK * SMK + e β SE * SE

Gen-Miljö interaktion Eira Interaction between SE alleles, smoking ACPA+ RA (RERI and AP calculation) RERI (Relative Excess Risk due to Interaction) regarding ACPA+ RA, Smoking (B) and hetero-(a) or Homo-(AA),zygous SE allele. RERI AB =RR AB -RR A -RR B + 1 = 6.5 3.3 1.5 + 1= 2.7 RERI AAB =RR AAB -RR AA -RR B + 1 = 21 5.4 1.5 + 1 = 15.1 AP (Attributable proportion due to interaction) AP AB =RERI/RR AB = 2.7/6.5 0.42 AP AAB =RERI/RR AAB = 15.1/21 0.72

Gen-Miljö interaktion Eira Genes + Smoking MHC II (SE GENES) Citrullinated protein APC Activation of immunological cells

Gene-Gene interaction in Rheumatoid Arthritis Eira Gene-gene and gene-environment interactions involving HLA-DRB1, PTPN22 and smoking in two subsets of rheumatoid arthritis* Possible to use the same methods for investigating gene-gene interaction between unlinked loci. * Källberg H, Padyukov L, Plenge R P, Rönnelid J, Gregersen P K, van der Helm-van Mil A H M, Toes R E M, Huizinga T, Klareskog L, Alfredsson L, EIRA-study group. Am. J. Hum. Gen. 2007

Gene-Gene interaction in Rheumatoid Arthritis Eira Relative risks for presence of SE alleles, R620W PTPN22 regarding anti-ccp+ RA (Women and Men) 30 EIRA + NARAC+ LEIDEN EAC 25 20 15 10 5 0 Any PTPN22 No SE Single SE Double SE No PTPN22

Gene-Gene interaction in Rheumatoid Arthritis Eira Interaction between HLA-DRB1 SE and R620W PTPN22, in terms of developing anti-ccp+ RA. EIRA NARAC Leiden EAC All Deviation from additivity p < 0.001 p < 0.001 p = 0.0016 p < 0.001 AP together with 95 % CI 0.5 (0.3 0.7) 0.7 (0.5 0.9) 0.4 (0.1 0.7 ) 0.5 (0.4 0.6) Deviation from multiplicity Deviation from independency of penetrance p = 0.06 p = 0.05 p = 0.29 p = 0.025 p = 0.022 p = 0.035 p = 0.76 p = 0.027

Gene*Environmental and Gene- Gene interactions Conclusions Eira Smoking and SE alleles are associated with strong interaction regarding risk of developing anti-ccp + RA Gene-gene interaction between SE and PTPN22 alleles regarding risk of developing anti-ccp + RA

A short story of Rheumatoid Arthritis Epidemiology Eira Thank you for your attention!