ST-fredag epidemiologi och biostatistik 2017

Relevanta dokument
Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Statistik och epidemiologi T5

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Hur skriver man statistikavsnittet i en ansökan?

ST-fredag epidemiologi och biostatistik Emma Larsson. MD, PhD Specialistläkare, PMI, Karolinska Max Bell. MD, PhD Överläkare, PMI, Karolinska

Medicinsk statistik II

Medicinsk statistik I

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Epidemiologi T5. Kursmål epidemiologi. Kursmål epidemiologi. Kunna förklara och använda grundläggande epidemiologiska begrepp

Statistik och epidemiologi T5

Hypotestestning och repetition

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

EPIDEMIOLOGI. Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell)

Lektionsanteckningar 11-12: Normalfördelningen

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

2. Test av hypotes rörande medianen i en population.

Gamla tentor (forts) ( x. x ) ) 2 x1

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Statistik. Statistik. Statistik. Lars Walter Fil.lic. Statistik

F22, Icke-parametriska metoder.

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

OBS! Vi har nya rutiner.

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Föreläsning 5. Kapitel 6, sid Inferens om en population

Hur man tolkar statistiska resultat

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

F3 Introduktion Stickprov

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Statistik Termin 10, Läkarprogrammet, HT16

Medicinsk statistik II

Medicinsk statistik I

Studietyper, inferens och konfidensintervall

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Parade och oparade test

F9 SAMPLINGFÖRDELNINGAR (NCT

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

BIOSTATISTIK OCH EPIDEMIOLOGI

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), STATISTIK

Föreläsning G60 Statistiska metoder

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

8 Inferens om väntevärdet (och variansen) av en fördelning

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

Statistik 1 för biologer, logopeder och psykologer

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Statistik. Statistik. Statistik. Statistics, Lars Walter. Forsknings- och utvecklingsenheten för närsjukvård. Folkhälsocentrum

Studiedesign: Observationsstudier

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Statistik 1 för biologer, logopeder och psykologer

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Att välja statistisk metod

FÖRELÄSNING 8:

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

TAMS65 - Föreläsning 6 Hypotesprövning

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

FACIT (korrekta svar i röd fetstil)

Vetenskaplig metod och statistik

SOPA62 - Kunskapsproduktion i socialt arbete

Repetitionsföreläsning

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Föreläsning 12: Regression

Samplingfördelningar 1

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

TAMS65 - Föreläsning 6 Hypotesprövning

, s a. , s b. personer från Alingsås och n b

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Höftledsdysplasi hos dansk-svensk gårdshund

Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10

Föreläsning G60 Statistiska metoder

Medicinsk statistik III Läkarprogrammet, Termin 5 VT 2016

Föreläsning 5: Hypotesprövningar

Transkript:

ST-fredag epidemiologi och biostatistik 2017 Emma Larsson. ST-läkare, PhD. PMI, KS Solna Gabriella Jäderling. Överläkare, PhD. PMI KS Solna Mikael Eriksson. Specialistläkare, doktorand. PMI KS Solna. Max Bell. Överläkare, Docent. PMI KS Solna

BIOSTATISTIK

Att genomföra en studie Frågeställning = hypotes Studiedesign Styrkeberäkning (power-beräkning) Variabler: utfall resp. prediktorer Datainsamling Deskriptiv statistik Analytisk statistik Interferens

Population den samling vi vill dra slutsatser om Slumpmässigt urval garanterar att det enda sätt på vilket stickprovet skiljer sig från populationen är genom slumpen Slutsats Statistisk interferens Stickprov = sample Ett urval ur populationen Grupp A Grupp B Utvärdera effekt Vi använder informationen i stickprovet för att dra slutsatser om populationen

Datanivåer (typer av variabler) Nominala variabler Kvalitativa variabler = kategorivariabler Ordinala variabler Kvantitativa variabler = numeriska variabler Utfallen är kategorier som inte kan rangordnas Blodgruppering Kön Yrke Utfallen är ordnade kategorier VAS Betyg Rökning (nej, lite, mkt)

Datanivåer (typer av variabler) Nominala variabler Kvalitativa variabler = kategorivariabler Utfallen är kategorier som inte kan rangordnas Blodgruppering Kön Yrke Ordinala variabler Utfallen är ordnade kategorier VAS Betyg Rökning (nej, lite, mkt) Kvantitativa variabler = numeriska variabler Intervallvariabler Kan beräkna differenser men inte kvoter Temperatur mätt i C och F Kvotvariabler Kan beräkna differenser och kvoter Längd Vikt Ålder Rökning (antal cig/ dag)

Ytterligare indelning numeriska (kvantitativa) variabler Diskret = kan endast anta vissa värden inom ett intervall, oftast heltal Kontinuerlig = kan i princip anta alla värden inom ett intervall

Deskriptiv statistik - centralmått Medelvärdet x n i= = 1 n x i Median (Medianvärde används som centralmått för snedfördelade kontinuerliga / diskreta variabler samt för variabler som mäts med ordinalskalan. Medianvärdet är det värde som ligger exakt i mitten med lika många mätvärden ovan som under sig. Mode = typvärde

Deskriptiv statistik - spridningsmått Varians Standardavvikelse ( x n 1 x) 2 Hur mycket de olika värdena i en population avviker från medelvärdet. Om de olika värdena ligger samlade nära medelvärdet à standardavvikelsen låg. OBS!!!! Skilj från SEM (standard error of the mean) SEM är ett mått på osäkerheten i skattningen av medelvärdet. SD är ett mått på spridningen av observationerna. (Standardavvikelsen i stickprovet/roten ur stickprovsstorleken) Range X max X min Inter Quartile Range = 75:e percentilen 25:e percentilen q3 q 1

Varians och Standardavvikelse Exempel: 5 observationer 24, 27, 28, 31, 34 Summan: 144. Medelvärde 28,8. Om vi tar medelvärdet och räknar hur varje värde skiljer sig från medelvärdet (-4,8; -1,8; -0,8; 2,2; 5,2) och summeras deviationerna à summan = 0 Kvadrera deviationerna, summera à 58,8 58,8/(5-1) = variansen = 14,7 Standardavvikelsen = roten ur variansen = 3,8

Lågt medelvärde. Hög varians Högt medelvärde. Låg varians

Sammanfattning centralmått och spridningsmått Normalfördelad variabel à medelvärdet och standardavvikelse Ordinala data, kvantitativa data som ej är symmetriska (skevt fördelad variabel, extremvärden) à median och IQR

Analytisk statistik Statistisk interferens à de metoder som används för att utifrån ett stickprov dra slutsatser om en hel population Anledningen till att man studerar ett mindre stickprov i stället för hela studiepopulationen kan vara att studiepopulationen är svår att begränsa eller de<iniera, eller att den är för stor för att studeras.

Population den samling vi vill dra slutsatser om Med analytisk statistik kan man använda information från stickprovet för att göra uttalanden (gissningar) om studiepopulationen. Eftersom man inte har data från hela studiepopulationen utan bara en delmängd av den kan man naturligtvis aldrig uttala sig helt säkert om den, utan varje gissning man gör är behäftad med en viss osäkerhet. Slutsats Statistisk interferens Stickprov = sample Ett urval ur populationen Grupp A Grupp B Utvärdera effekt Vi använder informationen i stickprovet för att dra slutsatser om populationen

Vi hittar en skillnad! Bra! Eller? Vi gör en studie Skillnad Ingen skillnad Verklig skillnad Slumpfel Systematiskt fel Slumpfel Systematiskt fel Power Bias P-värde Confounding Kon[idensintervall

Statistisk interferens (slutledning) Skatta samband mellan exponering och utfall genom att beräkna ett eller hlera riskmått Skatta inverkan av slumpmässiga fel (konhidensintervall och p- värden) Tolka resultatet (riskmåttet) med hänsyn till inverkan av slumpmässiga fel Tolka resultaten med hänsyn till inverkan av systematiska fel

Associationsmått Samband mellan exponering (t.ex. en behandling) och förekomst av ett visst utfall Absoluta och relativa mått Riskdifferens Relativ risk Ex om risken för utfall är 40% hos exponerade och 20% hos oexponerade är den absoluta riskskillnaden 20 procentenheter och den relativa risken är 2 Odds Ratio Odds = sannolikheten för en händelse/sannolikheten för ej händelse Hazard Ratio

Punktskattningar och kon[idensintervall Punktskattning (eng: point estimate) information från stickprovet används för att skatta en parameter i studiepopulationen. En punktskattning kan vara ett enskilt värde eller andel, men det kan också vara en skillnad i värden eller andelar mellan olika grupper. Exempel: Vi väljer slumpmässigt ut 100 studenter på KI (=vårt stickprov). Vi registrerar ålder för de 100 studenterna och använder deras medelålder för att gissa skatta medelåldern för alla studenter vid KI. Detta är en punktskattning av medelåldern vid KI

Punktskattningar och kon[idensintervall För att ange osäkerheten i en punktskattning kan man använda ett kon[idensintervall Om man väljer 100 stickprov ur en studiepopulation och genomför samma mätning på alla stickprov och beräknar ett 95 konhidensintervall för varje stickprov kan man förvänta sig att 95 av konhidensintervallen täcker det sanna värdet i studiepopulationen. à ett 95 kon[idensintervall täcker med 95% sannolikhet det sanna värdet i studiepopulationen KI = punktskattningen ± konstant standardfelet Konstanten beror på kon<idensintervallets kon<idensgrad. Ett 90 kon<idensintervall har kon<idensgraden 90% och till detta använder man konstanten 1,64. Ett 95 kon<idensintervall har kon<idensgraden 95% och till detta använder man konstanten 1,96. Standardfelet = Standardavvikelsen i stickprovet/roten ur stickprovsstorleken

100 studenter Exempel kon[idensintervall Medelålder 31.3 Standardavvikelsen 9.7 år ( x n 1 x) 2 95 % konhidensintervall för denna punktskattning 31.3 ± 1.96 x (9.7/ 100) = 31.3 ± 1.9 à 29.4 33.2 à Medelåldern i studiepopulationen (= alla KI studenter) med 95% sannolikhet ligger mellan 29.4 år och 33.2 år

Hypotesprövning Antag att man har beräknat ett konhidensintervall och därmed kunnat konstatera att det sanna värdet i studiepopulationen med 95% sannolikhet ligger mellan två specihika gränsvärden à vad kan man använda denna information till??? Med analytisk statistik kan man aldrig bevisa något. Däremot kan man avfärda en teori hypotes som mindre trolig. För att göra detta använder man sig av något som kallas hypotesprövning.

Nollhypotes och alternativ hypotes Nollhypotes (eng: null hypothesis) = det hinns ingen effekt, ingen skillnad mellan grupperna, Alternativhypotes = det [inns en verklig skillnad, det som hinns kvar om man förkastar nollhypotesen (kan vara enkelsidig eller dubbelsidig) Exempel: Vi vill veta om det <inns lika många män som kvinnor på KI. Vår nollhypotes, d.v.s. hypotesen om ingen skillnad, blir då andelen kvinnor är lika stor som andelen män, skillnaden mellan andelen män och andelen kvinnor=0 eller 50% av alla studenter är kvinnor. à Vi vill kunna förkasta nollhypotesen!

Hypotesprövning med kon[idensintervall När man gör hypotesprövning med konhidensintervall beräknar man konhidensintervallet för den punktskattning man vill testa. Enligt de[initionen av kon[idensintervall skall det sanna värdet i studiepopulationen med 95% sannolikhet ligga inom kon[idensintervallets gränser. à Om nollhypotesen ligger inom konhidensintervallets gränser kan alltså nollhypotesen mycket väl vara det sanna värdet, och nollhypotesen kan med stor sannolikhet stämma. à Om nollhypotesen däremot inte ligger inom intervallets gränser kan man förkasta nollhypotesen, d.v.s. göra uttalandet är nollhypotesen är mindre trolig, till förmån för alternativhypotesen. När man har förkastat nollhypotesen säger man att resultatet är statistiskt signi[ikant, eller statistiskt säkerställt.

Hypotesprövning med kon[idensintervall Exempel: Nollhypotesen - andelen kvinnor vid KI är 50%. Vi beräknar ett 95% kon<idensintervall för andelen kvinnor = 49%- 59%. Nollhypotesen ligger innanför kon<idensintervallets gränser, vi kan därför inte förkasta nollhypotesen, d.v.s. andelen kvinnor kan vara 50%. Vidden på kon[idensintervallet speglar studiens precision, snävare intervall = högre precision 7

Statistisk signi[ikans En gräns (signihikansnivå) där man anser att inverkan av slumpmässiga fel är så liten att resultaten inte kan förklarats av slumpen Inom medicin traditionellt till 5 procent Godtycklig gräns! Vad är skillnad på p = 0.07 och p = 0.47? Vad är skillnad på p = 0.000001 och p 0.01?

P-värde Förutom att testa nollhypoteser med kon<idensintervall kan man även använda p-värde P-värde = sannolikheten (måste ligga mellan 0 och 1) för att få det observerade utfallet (om studien upprepades under samma förhållanden) givet att nollhypotesen är sann (dvs ingen skillnad) Sannolikheten att resultatet beror på slumpen Om p-värdet är tillräckligt litet anser man att det är orimligt att nollhypotesen är sann, och alltså förkastar man den. De<initionen av tillräckligt liten kan förstås variera, men den gräns man sätter upp kallas för testets signi<ikansnivå, eller risknivå. Vanliga nivåer är 1% (0,01), 5% (0,05) och 10% (0,10). Det är viktigt att man redan innan man börjat med de statistiska analyserna har bestämt sig för vilken signi<ikansnivå man skall använda! Statistisk signi[ikans är ej lika med klinisk relevans!!!

P-värde vs kon[idensintervall P-värde Används vid hypotesprövning Olika metoder beroende på om data är normalfördelade eller ej Kon[idensintervall Används vid hypotesprövning Uttrycker osäkerhet i en skattning Normalfördelade data

Vi hittar en skillnad! Bra! Eller? Vi gör en studie Skillnad Ingen skillnad Verklig skillnad Slumpfel Systematiskt fel Slumpfel Systematiskt fel Power Bias P-värde Confounding Kon[idensintervall

Fel i hypotesprövningar Naturligtvis kan man, som sagts tidigare, aldrig bevisa något med analytisk statistik, utan man löper hela tiden risk att göra fel av något slag antingen förkastar man en nollhypotes som inte borde ha förkastats, eller så förkastar man inte en nollhypotes som borde ha förkastats. Dessa två felen betecknas α och β. à Typ I fel: man hittar en effekt som egentligen inte Cinns. à Typ II fel (β): man inte hittar en effekt som faktiskt Cinns (sample size) Statistisk styrka (eng: power) betecknar sannolikheten att hitta en effekt som Cinns, och beräknas genom 1-β. STUDIEN VISAR Behandling har effekt Behandling har ingen effekt Behandling har effekt Bra! β VERKLIGHET Behandling har ingen effekt α Bra!

Power beräkning (styrkeberäkning) Sannolikheten att en studie ska kunna påvisa ett förväntat resultat àhur stor studien måste vara för att upptäcka ett förväntat resultat (ex skillnad i sjukdomsrisk) hos exponerade individer och oexponerade individer 80 % anses vara rimlig statistisk styrka bestäms av: Studiens storlek Sambandets styrka (effektstorlek) Signihikansnivå

Vi hittar en skillnad! Bra! Eller? Vi gör en studie Skillnad Ingen skillnad Verklig skillnad Slumpfel Systematiskt fel Slumpfel Systematiskt fel Power Bias P-värde Confounding Kon[idensintervall

Bias och confounding Systematiska fel (eng: bias) uppstår när mätresultaten har en tendens att avvika från det sanna värdet på ett systematiskt sätt (dvs alla mätvärden avviker från det sanna värdet på samma sätt). Selection bias fel vid identihiering av studiepopulationen Ex man undersöker enbart de som frivilligt anmäler sig till undersökning Observation or information bias fel vid mätning av exponering eller utfall Ex s.k. recall bias i falkontrollstudier, lättare att kontroller erinrar sig att de varit utsatta för misstänka exponeringsfaktorer

Bias och confounding Confounding (störfaktor): exponerade och oexponerade kan skilja sig med avseende på förekomsten av någon annan faktor som i sig påverkar risken att insjukna. 1 - associerad med exponeringen 2 - självständig riskfaktor för sjukdomen 3 - inte ett mellansteg i kausalkedjan från exponering till effekt (ej E à C à O) Exposure Confounder Outcome

Hur hantera confounding? Stratihiering Matchning Regressionsmodell (hlera förväxlingsfaktorer) Skilj från effektmodiciering = sambandet mellan en exponering och ett utfall varierar beroende på värdet av en annan faktor (effektmodi<ieraren) Exempel olika risker i olika åldersgrupper. Olika risker för och kvinnor. Effektmodi<iering är ett fynd att redovisa män ST-fredag dec 2014

Felkällor Fullständig precision frånvaro av slumpmässiga fel. Åtgärd à exempelvis öka antalet individer, bättre mätinstrument Fullständig validitet frånvaro av systematiska fel

Normalfördelning En teoretisk fördelning ( dehinierad av en matematisk formel). Många fenomen i naturen följer normalfördelningen, exempelvis födelsevikter. Går från minus till plus oändligheten. Symmetrisk. Ytan under kurvan n är 1 Dehinieras utifrån två faktorer: medelvärdet standardavvikelsen (= roten ur variansen)

Normalfördelning forts. Inom intervallet som går från 1,96 standardavvikelser under medelvärdet till 1,96 standardavvikelser över medelvärdet ligger 95% av observationerna

Sjukdomsförekomst Incidence Hur många blir sjuka? à mått på hur många som insjuknar under en given tidsperiod Kumulativ incidence (=risk): andelen av en population som insjuknar under en given tidsperiod. Antalet insjuknade/antal friska vid start Ex årligen insjuknar 5 % av Sveriges befolkning i in<luensa Incidence rate: antal nya sjukdomsfall under en given tidsperiod/ total risktid. Ex incidensen av Mb Chron är 5 per 100.000 personår Prevalens Hur många är sjuka? Disease status Disease burden in a population àproportionen av populationen som har en sjukdom (eller egenskap) vid ett givet tillfäll3

Sensitivitet/speci[icitet Sensitivitet = sannolikheten att en sjuk individ blir klassihicerad som sjuk Speci[icitet = sannolikheten att en frisk individ blir klassihicerad som frisk Positivt och negativt prediktivt värde Sannolikheten för sjukdom, givet ett testresultat, kallas för testets prediktiva värde. Positivt prediktivt värde = sannolikheten att en individ med ett "sjukt" provsvar verkligen är sjuk Negativt prediktivt värde = sannolikheten att en individ med ett "friskt" provsvar verkligen är frisk

Verklighet Sjuk Frisk Test Sjuk A B Frisk C D Pos pred värde A/(A+B) Neg pred värde D/(C+D) Sensitivitet A/(A+C) Speci[icitet D/(B+D)

ST-fredag dec 2014

ROC-kurva ROC-diagram. Kurvan visar hur sensitivitet och speci<icitet ändras då det diskriminativa värdet successivt ändras från det mest patologiska värdet till det minst patologiska. Ju närmare det övre vänstra hörnet kurvan går desto bättre diagnostisk förmåga. ST-fredag dec 2014

ST-fredag dec 2014

Exempel statistiska tester/modeller Parametriska tester/modeller (bygger på antaganden om hur data fördelar sig (oftast normalfördelningen), skattar en effekt (ex skillnad i medelvärde) för vilken man kan beräkna kon<idensintervall och p-värde) Two sample t-test Paired t-test Regressionsanalys Variansanalys (ANOVA) Icke-parametriska: (kan anv oberoende av hur data fördelar sig, baseras på observationernas ranger, beräknar endast p-värde) Mann-Whitney two sample test Chi-2 test Fischers exakta test Wilcoxons matched pairs test ST-fredag dec 2014

ST-fredag dec 2014

Korrelationskoef[icient Korrelation är ett begrepp inom statistiken som anger styrkan eller riktningen av ett samband mellan 2 variabler. Det kallas även korrelationskoefhicient. Uttrycks som ett samband mellan 1 och -1 där 0 anger inget samband, 1 anger maximalt pos samband och -1 maximalt neg samband ST-fredag dec 2014

Regressionsanalys Studera sambandet mellan olika variabler Centrala inom epidemiologisk forskning, multipel regressionsanalys kan användas för att kontrollera för förväxling (confounder) och för att skapa prediktionsmodeller Data anv för att bestämma en ekvation eller matematisk modell som beskriver hur en utfallsvariabel varierar som en funktion av en eller hlera förklarande variabler. Utifrån modellen kan sedan sambandet mellan variablerna kvantihieras. ST-fredag dec 2014