19/10/14. Kvantitativ metod och grundläggande statistik. Olika typer av studier. Experiment. Klinsika prövningar. Representativt (randomiserat) urval

Relevanta dokument
17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

Kvantitativ metod och grundläggande statistik. Introduktion

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Medicinsk statistik II

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

Parade och oparade test

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

Statistik och epidemiologi T5

Statistik Termin 10, Läkarprogrammet, HT16

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Gamla tentor (forts) ( x. x ) ) 2 x1

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Hur skriver man statistikavsnittet i en ansökan?

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

EXAMINATION KVANTITATIV METOD vt-11 (110204)

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Statistik och epidemiologi T5

F22, Icke-parametriska metoder.

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Medicinsk statistik II

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

2. Test av hypotes rörande medianen i en population.

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Mata in data i Excel och bearbeta i SPSS

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Uppgift 1. Produktmomentkorrelationskoefficienten

Hypotestestning och repetition

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

7.3.3 Nonparametric Mann-Whitney test

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Kent W. Nilsson. Falun

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

a) Facit till räkneseminarium 3

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

Föreläsning 2 Deskription (forts). Index Deskription: diagram som stapeldiagram, histogram mm (tex spridningsdiagram, Mera om mätnivåer

2.1 Minitab-introduktion

F3 Introduktion Stickprov

Introduktion till Biostatistik. Hans Stenlund, 2011

Repetitionsföreläsning

OBS! Vi har nya rutiner.

Studietyper, inferens och konfidensintervall

Medicinsk statistik I

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Statistik. Statistik. Statistik. Lars Walter Fil.lic. Statistik

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Föreläsning G60 Statistiska metoder

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Statistik. Statistik. Statistik. Statistics, Lars Walter. Forsknings- och utvecklingsenheten för närsjukvård. Folkhälsocentrum

Medicinsk statistik I

Statistik Lars Valter

Att välja statistisk metod

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Tillämpad statistik Naprapathögskolan. Henrik Källberg Tel

Föreläsning G60 Statistiska metoder

SOPA62 - Kunskapsproduktion i socialt arbete

7.5 Experiment with a single factor having more than two levels

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

DELMOMENT INOM GRUNDUTBILDNINGEN I BIOLOGI/MOLEKYLÄRBIOLOGI HT Kod:... Nr Fråga Svarsalternativ (ringa in rätt svar)

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

OBS! Vi har nya rutiner.

Statistik 1 för biologer, logopeder och psykologer

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Föreläsning 11 (ej på tentan): Tillämpningar och vidareutvecklingar

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Statistik 1 för biologer, logopeder och psykologer

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Lycka till! Nämnden för omvårdnadsutbildningar Sjuksköterskeprogrammet 180hp. SJSD10, Sjuksköterskans profession och vetenskap I, 15 hp, Delkurs II

Statistik 1 för biologer, logopeder och psykologer

Kvantitativ strategi Univariat analys 2. Wieland Wermke

EXAMINATION KVANTITATIV METOD

Metod och teori. Statistik för naturvetare Umeå universitet

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Sänkningen av parasitnivåerna i blodet

Uppgift a b c d e Vet inte Poäng

OBS! Vi har nya rutiner.

LYCKA TILL! Omtentamen i Statistik A1, Institutionen för Farmaceutisk Biovetenskap Institutionen för Farmaci

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Transkript:

Kvantitativ metod och grundläggande statistik Olika typer av studier Experiment 1. Manipulation 2. Kontroll 3. Randomisering Klinsika prövningar Observationsstudier Retrospektivstudie Tvärsnittsstudie Prospektivstudie Representativt (randomiserat) urval Population Stickprov Slutsatser Generalisering 1

Variabler = De egenskaper vi studerar/ mäter Beroende variabel (dependent variable) Utfallsvariablen Det vi studerar Det sompåverkas Beroende av de oberoende variablen Oberoende variabel (independent variable) Variabler som påverkar utfallet Förklaringsvariabler Oberoende av den beroende variablen Exempel 1. Hur påverkar interventionen X patientens upplevad hälsa? Interventionen X = oberoende Upplevdhälsa = beroende 2. Vilka av faktorerna sjukdomsgrad, ålder, kön, och BMI förklarar bäst graden av upplevd hälsa? Sjukdomsgrad, ålder, kön och BMI = oberoende Upplevd hälsa = beroende Mätnivåer Nominal (kvalitativ variabel; t ex kön, boendeform) Kategorier utan kvantitativ mening Klassificering 0=kvinna 1=man Ordinal (kvalitativ variabel; t ex symtom svårighetsgrad) Ojämna (okända) intervall Ordning 01 23 4 Intervall (kvantitativ variabel; t ex temperatur enlig Celcius & Fahrenheit) Jämna intervaller med absulota magnituder okända och noll-punkt arbiträr Ordning + differens -1 0 1 2 3 Kvot (kvantitativ variabel; t ex blodtryck, lab-prover) Jämna intervall med absoluta magnituder och noll-punk Ordnign + differens + kvot 0 1 2 3 4 5. 2

Grafisk presentation av kvalitativa data Histogram Normalfördelning (symetrisk) Medelvärde Median Positiv snedfördelning Negativ snedfördelning Median Medelvärde Medelvärde Median Kvantitativa data Centralmått (Central tendencies) Medelvärde (mean, m, x) Summan av alla mätvärden dividerat med antalet observationer Median (md) Det värde som delar fördelningen I två likastoradelar efter sortering från lägsta till högsta värde Typvärde (mode) Det vanligast förekommande värdet Obs nr Ålder 7 21 10 29 8 30 2 31 5 32 6 36 3 45 4 50 1 58 9 58 n=10 Σ=390 m=390/10=39,0 md = 34 mode = 58 Spridningsmått vid normalfördelning Standardavvikelse (standarddeviations, SD,s) den genomsnittliga avvikelsen från medelvärdet Medelvärdet ± 2 SD 0 ca 95% av alla observationer Obs nr Värde (xi) xi- m (xi- m)2 1 5-4 16 2 15 6 36 3 10 1 1 4 8-1 1 5 15 6 36 6 10 1 1 7 3-6 36 8 6-3 9 Σ 72 0 136 M=72/8=9,0 SD= Σ(xi- m)2/(n- 1)= 136/7=4,41 3

Normalfördelning Spridningsmått för ej normalfördelade variabler Kvartilavstånd (interquartiale range, IQR, q1,q3) Omfattar 50% av alla observationer(varav 25% ligger över och 25% ligger under medianen) oavsett fördelning Obs nr värde 7 3 1 5 8 6 4 8 3 10 q1=5,5 q2=md=9 IQR Variationsvidd (range) Skillnaden mellan lägsta och högsta värdet 6 10 2 15 5 15 q3=12,5 Min-max Lägsta och högsta värdet Boxplott IQR Max q1 q2=md q3 Min Variationsvidd (range) 4

Användning av deskriptiv statistik CentralmåF SpridningsmåF Mätnivå Medel Median Typvärde SD IQR Min- Max/ VariaQonsvidd Totalt antal Kvot O X X O X X (X) Intervall O X X O X X (X) Snedfördelad intervall/kvot O X O X (X) Ordinal O X O X (X) Nominal O O O: Används normalt i första hand X: kan användas (X): kan användas men tveksamt som spridningsmått Precision, konfidensintervall Populationsvärden okända Stickprovsvärden = bästa uppskattningen Precisionen ökar med stickprovets storlek Konfidensintervall (confidence intervall, CI) Kan beräknas utifrån stickprovets storlek, medelvärde och spridning Med detta intervall har vi en given sannolikhet, ofta 95% (95% CI), för att inkludera det sanna medelvärdet m n SD 95% CI 50 30 20 42.8-57.2 50 90 20 45.8-54.2 50 60 20 44.8-55.2 50 60 10 47.4-52.6 50 60 30 42.2-57.8 Beräkning: SE (standard error) = SD / n 95% CI = m±1.96 SE Ett exempel 5

Jämförande statistik: Hypotesprövning Representativt (randomiserat) urval Population Stickprov Slutsatser Generalisering Population Skillnader mellan värden i grupper/stickprov Verklig eller slumpmässig Hypotesprövning Med hypotesprövning vill vi bestämma vilken av dessa två hypotesr vi vill lita på Nollhypotesen (H 0 ) Det föreligger ingen skillnad mellan grupperna i populationen Mothypotesen (H 1 ) Det föreligger en reell skillnad mellan grupperna i populationen Hypoteserna testas med en testmetod (analysmetod) där man gör antagandet att nollhypotesen är sann Baseras på medelvärde och spridningsmått eller fördelning av stickprovens variabelvärden, proportioner. Statistisk signifikans Sannolikheten att det inte finns en mätbar skillnad mellan grupperna om nollhypotesen (H 0 ) är sann. P-värde Vad är sannolikheten för vår observerade resultat om H 0 är sann => om p-värdet är litet (p< 0.05) så förkastas H 0 P-värdet kan anta värden mellan 0 och 1 Ju lägre p-värde, desto» Mindre risk att felaktigt dra slutsatsen att en skillnad föreligger (förkasta H 0 ) 6

Statistisk signifikans P-värdet säger INTE något om skillnadens storlek eller kliniska betydelse P-värdet bestäms av Effektens storlek (t ex skillnaden mellan grupperna) Gruppstorlek Spridning inom gruppen Val av analysmetod Styrs av: Vad man vill jämföra» Upprepade observationer, samma individer (skillnad inom en grupp över tid)» Observationer från olika individer (skillnad mellan grupper)» Typ eller fler tidpunkter/grupper Data» Mätnivå (nominal vs. ordinal vs. intervall/kvot)» Fördelning (ungefärlig normalfördelning?)» Spridning I respektive grupp (ungefär lika?) Huvudindelning av analysmetoder Parametriska metoder Utgår från medelvärden och normalfördelning Förutsatser Kvantitativa variabler Normalfördelning Lika spridning Icke-parametriska metoder Utgår från rangordning och proportion Okänsliga för variabeltyp, snedfördelning och olikheter i spridning Medelvärde Median Median Medelvärde 7

Parametrisk hypotesprövning: Kvantitativ, normalfördelad variabel Jämförelse av medelvärden i två olika grupper (oberoende observationer) Är skillnaden mellan grupperna så pass stor att det kan ses som sannolikt att det finns en verklig skillnad? T-test (oparat, unpaired) t= Skillnaden i medelvärden / SE av medelvärdesskillnaden Liknande funktion vid parvis jämförelse (sammagrupp över tid) Sannolikheten att erhålla det observerade värdet jämfört med t om det inte föreligger reell skillnad = p-värde Ju högre t, desto lägre p-värde Assessment of exercise capacity in women with type 2 diabetes. Segerström Å, Glans F, Eriksson K, Groop L, Thorsson O, Wollmer P. Clinical Physiology & Functional Imaging [serial online]. September 2008;28(5):294-298. Table 2. Results of exercise tests and tests of muscle strength and endurance before and a=er the training period.*+ 8

Assessment of exercise capacity in women with type 2 diabetes. Segerström Å, Glans F, Eriksson K, Groop L, Thorsson O, Wollmer P. Clinical Physiology & Functional Imaging [serial online]. September 2008;28(5):294-298. Icke-parametrisk hypotesprövning: Icke normalfördelade/ordinalskalevariabel Observationerna rangordnas Fördelningen av rangtalen jämförs mellan grupperna (oberoende observationer: Mann-Whitney U-test) Fördelningen av rangtalen jämförs mellan positiva och negativa förändringar (parvis jämförelse: Wilcoxon signedrank test) Sannolikheten att erhålla den observerade fördelningen av rangsummor då ingen skillnad föreligger = p-värde Mann-Whitney U-test: Test mellan grupper Grupp A: 54 62 64 66 71 74 Grupp B: 38 42 48 53 59 60 70 74 Rang: 1 2 3 4 5 6 7 8 9 10 11 12 13.5 Rangsumma (W A ), Grupp A: 5 + 8 + 9 +10 + 12 + 13.5= 57.5 Rangsumma (W B ), Grupp B: 1 + 2+ 3 + 5 + 6 + 7 + 11 + 13.5 = 47.5 Förkasta H 0 om medelrangerna W A /n A och W B /n B skiljer sig mycket från varandra W A /n A = 57.5 / 6 = 9.6 W B /n B = 47.5 / 8 = 6.0 9

Wilcoxon signed-rank test: Mellan mättillfällen Skillnad t1- t2 Rangtal 29 5.5 41 7 0 12 2-5 1 19 4-13 3 29 5.5 Positivt rangsumma (W + ): 5.5 + 7 + 2 +14 + 5.5 = 24 Negativ rangsumma (W - ): 1 + 3 = 4 Förkasta H 0 om W + och W - skiljer sig mycket från varandra Grafisk presentation (boxplot) Jämförelse mellan mer än två grupper Parametriska metoder Oberoende observationer Analys of variance (ANOVA) Testfunktion F (tolkas som t) Beroende observationer Repeated-measures ANOVA Icke-parametriska metoder Oberoende observationer Kruska-Wallis ANOVA Beroende observationer Friedmans test Parametriska metoder Tolkas som t-test/mann-whitney U-test/Wilcoxon signed-rank test men över samtliga grupper Post-hoc test: Visar mellan vilka av grupperna som skillnaderna föreligger 10

ANOVA - fortsättning Fler än två grupper Slumpmässigt urval från varje grupp VI antar att grupperna: Är normalfördelade Kan ha olika medelvärden Har samma spridning, varians σ 2, (standardavvikelsen 2 ) Icke-parametrisk hypotesprövning: Proportioner/kvalitativa variabler Skiljer sig fördelningen av individer mellan de olika katagorierna från vad man kan förvänta sig om det inte är någon skillnad? Kvinnor Män Frisk a b Sjuk c d Test funktion: Chi-2-test (Chi-square) Skillnaden mellan den observerade (O) och förväntade (e, expected) fördelningen Sannorlikheten att erhålla det observerade Chi-2-värdet = p-värde Ju högre Chi-2-värde, desto lägra p- värde Föreligger det en könsskillnad i förekomsten av hypertoni bland personer med diabetes? OBSERVERAT Kvinnor Män Totalt Ej hypertoni 133 154 287 Hypertoni 137 128 265 Totalt 270 282 552 Förväntat värde = e e = radsumman x (kolumnsumman/totalsumman) 287 x (270/552) = 287 x 0.49 = 140 287 x (282/552) = 287 x 0.51 = 146 265 x (270/552) = 265 x 0.49 = 130 265 x (282/552) = 265 x 0.51 = 135 FÖRVÄNTAT Kvinnor Män Ej hypertoni 140 146 Hypertoni 130 135 Utav kvinnorna (n=270) var det 137 (50.7%) som hade hypertoni, bland männen (n=282) var det 128 (45.5%). Skillnaden var inte statiskt signifikant (p=0.208) 11

Inte bara skillnader Hypotesprövning och p-värde kan beräknas för flertalet typer av anaylser Tolkningen av p-värde utgår dock alltid (om inget annat anges) från nollhypotesen: Korrelation/sambandsanalys:» H 0 : Det föreligger inget samband Förklaringsmodeller:» H 0 : Observerade variablen X förklarar inte värdet på beroendevariabeln Y Riskbedömningar:» H 0 : X ökar inte risken för sjukdom Korrelationer Samvarierar variable X linjärt med variabel Y? Grafiskt: Spridningsdiagram (scatterplot) Korrelation Parametrisk metod Pearson s korrelation (r) Kvantitativa variabler Normalfördelning Icke-parametrisk metod Spearman s korrelation (r s, r ho ) Vid data på ordinalskalenivå och/eller kvantitativa icke normalfördelade variabler Utgår från rangordning Okäsnlig för variabeltyp, sendfördelning och olikheter I spridning 12

Korrelationskoefficienten Korrelationskoefficienten (r) uttrycker graden av linjär samvariation Varierar mellan -1 och 1 Tecken framför anger riktning Positivt r Värdet (oavsett riktning) anger styrkan (lutningen) Några exempel på korrelationer Tolkning av korrelationskoefficienten Statistisk signifikans H 0 : r = 0 i populationen, H 1 : r = större än 0 i populationen Styrkan Situationberoende Riktlinjer» <0.20: Dålig» 0.20-0.35: Svag» 0.35-0.65: Måttlig» 0.65-0.85: Stark» >0.85: Mycket stark 13

Assessment of exercise capacity in women with type 2 diabetes. Segerström Å, Glans F, Eriksson K, Groop L, Thorsson O, Wollmer P. Clinical Physiology & Functional Imaging [serial online]. September 2008;28(5):294-298. Upper Body Muscle Strength and Endurance in RelaMon to Peak Exercise Capacity during Cycling in Healthy Sedentary Male Subjects. Segerstrom, Asa; Holmback, Anna; Elzyri, Targ; Eriksson, Karl- Fredrik; Ringsberg, Karin; Groop, Leif; Thorsson, Ola; Wollmer, Per Journal of Strength & CondiMoning Research. 25(5):1413-1417, May 2011. Table 3. Pearson's correlaqon coefficient between measurements of muscle strength and endurance of the upper body and [laqn capital V with dot above]o2peak and WRpeak.* 2 Statistiska tester Sammanfattning Statistiska test Kvantitativa data Kvalitativa data Ett stp T-test Två eller fler stp Ett stp Chi-två Två eller fler stp Oberoende t-test Beroende Parat t-test Oberoende Mann-Whiteny Beroende Wilcoxon 14

15