Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

Relevanta dokument
Statistik Termin 10, Läkarprogrammet, HT16

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Medicinsk statistik II

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

Hur skriver man statistikavsnittet i en ansökan?

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Statistik och epidemiologi T5

19/10/14. Kvantitativ metod och grundläggande statistik. Olika typer av studier. Experiment. Klinsika prövningar. Representativt (randomiserat) urval

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Statistik. Statistik. Statistik. Lars Walter Fil.lic. Statistik

Medicinsk statistik I

Gamla tentor (forts) ( x. x ) ) 2 x1

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Att välja statistisk metod

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Repetitionsföreläsning

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Introduktion till Biostatistik. Hans Stenlund, 2011

Föreläsning G60 Statistiska metoder

Statistik en introduktion

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Statistik och epidemiologi T5

Forskarutbildningskurs DATAHANTERING OCH DATABEARBETNING

Kvantitativ metod och grundläggande statistik. Introduktion

Mall och manual för granskning av interventionsstudier

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Hypotestestning och repetition

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Lycka till! Nämnden för omvårdnadsutbildningar Sjuksköterskeprogrammet 180hp. SJSD10, Sjuksköterskans profession och vetenskap I, 15 hp, Delkurs II

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

Mata in data i Excel och bearbeta i SPSS

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

OBS! Vi har nya rutiner.

Introduktion till PAST

Tillämpad statistik Naprapathögskolan. Henrik Källberg Tel

Medicinsk statistik II

Konfidensintervall, Hypotestest

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Statistiska analyser C2 Bivariat analys. Wieland Wermke

Kent W. Nilsson. Falun

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Medicinsk statistik I

1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c)

Statistik. Statistik. Statistik. Statistics, Lars Walter. Forsknings- och utvecklingsenheten för närsjukvård. Folkhälsocentrum

BIOSTATISTIK OCH EPIDEMIOLOGI

36 poäng. Lägsta poäng för Godkänd 70 % av totalpoängen vilket motsvarar 25 poäng. Varje fråga är värd 2 poäng inga halva poäng delas ut.

Föreläsning 5. Kapitel 6, sid Inferens om en population

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

HÖGSKOLAN I BORÅS. FORSKNINGSMETODER I OFFENTLIG FÖRVALTNING 15 Högskolepoäng

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 1

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Parade och oparade test

Tentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), STATISTIK

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Medicinsk statistik III Läkarprogrammet, Termin 5 VT 2016

Statistik en introduktion

Föreläsning 2 Deskription (forts). Index Deskription: diagram som stapeldiagram, histogram mm (tex spridningsdiagram, Mera om mätnivåer

Hur man tolkar statistiska resultat

ST-fredag epidemiologi och biostatistik 2017

January 3, Statistiska metoder vid kvantitativa. undersökningar. Jan-Olof Johansson

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Statistik 1 för biologer, logopeder och psykologer

LYCKA TILL! Omtentamen i Statistik A1, Institutionen för Farmaceutisk Biovetenskap Institutionen för Farmaci

Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Föreläsning G70 Statistik A

Transkript:

Agenda Statistik Termin 10, Läkarprogrammet, VT15 I: Grundläggande begrepp och beskrivande statistik II: Exempel på typisk forskning III. Frågestund Martin Cernvall martin.cernvall@pubcare.uu.se Grundläggande begrepp och beskrivande statistik Forskningsprocessen Skalnivåer Centralmått och spridningsmått Figurer; histogram och boxplot Normalfördelning Statistisk inferens och standardfel Konfidensintervall Hypotesprövning P-värde Olika typer av statistiska test Agenda (forts.) Forskningsprocessen Exempel på typisk forskning Case-control studie Randomiserad interventionsstudie Frågestund Data Identifiera variabler Initial observation (Forskningsfråga) Generera teori Generera hypoteser Mäta variabler Samla data för att testa teori Presentera data grafiskt Anpassa modell Analysera data Den heliga treenigheten Data - skalnivåer Intern validitet: Strukturell design Hypoteser Kontroll över påverkande variabler Design Extern validitet: Urvalsplan Nominal Ordinal Intervall Kvot Konstruktvaliditet Definition av konstrukt Operationalisering Reliabilitet Mätning Analys Slutsatsvaliditet Estimat av kovarians Estimat av urvalsfel Utvärdera hypoteser 1

Nominalskala Kategorier Kryssa för det alternativ som stämmer in på dig. Är du? Kvinna Man Ja Nej Data - skalnivåer Uppfyller patienten kriterierna för diagnosen? Data - skalnivåer Ordinalskala Kategorier som är rangordnade Hur uppfattar du din egen hälsa? Ringa in siffran framför det påstående som stämmer bäst med hur du uppfattar din hälsa. 1. Min hälsa är mycket dålig 2. Min hälsa är ganska dålig 3. Min hälsa är ganska bra 4. Min hälsa är mycket bra Data - skalnivåer Data - skalnivåer Intervallskala Kontinuerlig, lika långa intervall, godtycklig nollpunkt Kvotskala Kontinuerlig, lika långa intervall, absolut nollpunkt Vilken temperatur har patienten? Hur mycket väger du? kg Hur lång är du? cm Skalnivåer Skala Kvantitet Lika intervall Nominal Nej Ordinal Ja Nej Nej Intervall Ja Ja Nej Kvot Ja Ja Ja Absolut nollpunkt Diskutera med grannen bredvid: Vilka variabler är relevanta i det forskningsområde som jag är intresserad av? Vilka skalnivåer befinner de sig på? Typ av data och skalnivå har betydelse för hur vi sedan analyserar och presenterar våra data 2

Data Data Variabel Gender Weight Height Health Kodning 0=kvinna, 1=man vikt i kilogram längd i centimeter Hur upplever du din egen hälsa? 1 = Mycket dålig, 2 = Ganska dålig, 3 = Ganska bra, 4 = Mycket bra ; Vilken skalnivå? Data Variabel Kodning Variabeltyp Gender 0=kvinna, 1=man Nominalskala Weight vikt i kilogram Kvotskala Height längd i centimeter Kvotskala Health Hur upplever du din egen hälsa? 1 = Mycket dålig, 2 = Ganska dålig, 3 = Ganska bra, 4 = Mycket bra Ordinalskala Parametrisk statistik vs. Icke-parametrisk statistik - ett sätt att klassificera olika statistiska test - distinktionen baseras på vissa antaganden om populationen samt typ av data Parametrisk statistik Kräver att data är normalfördelad (storlek på urval) Data ska vara i intervall- eller kvotskala (ev. ordinal) Ytterligare antaganden för olika test Medelvärde och standardavikelse Icke-parametrisk statistik Okänd eller skev bakomliggande fördelning (storlek på urval) Alla typer av skalor Median, variationsvidd, kvartilavstånd 3

Pie chart Histogram Histogram Pie chart Histogram Centralmått och spridningsmått Centralmått Spridningsmått Egenskaper Typvärde (T) Variationsvidd Icke-param. Median (Md) Kvartilavstånd Icke-param. Medelvärde (M) Standardavvikelse (Sd) Parametrisk 4

Hur många standardglas har du druckit den senaste veckan? 0 0 2 4 4 4 5 6 6 6 8 9 10 11 12 12 14 15 16 17 Hur många standardglas har du druckit de senaste 7 dagarna? n = 20 Q1 = 4 Median (Md) = 7 ((6+8)/2) Q3 = 12 Kv. avst. = Q3 Q1 = 12 4 = 8 Sd = M = X n S 2 = Sd 2 (x M) 2 n 1 M = 8,05 Sd = 5,18 S 2 = 26,79 Boxplot eller lådagram N = 100 Scatterplot 25 25 Högsta värde (max) 75% = 3:e kvartil Median 25% = 1:a kvartil Illustrera samband mellan två variabler: styrka och riktning Minsta värde (min) Statistisk inferens Normalfördelningskurvan (Gauss kurva) Att dra slutsatser om egenskaperna hos en population på basis av egenskaperna hos ett urval. Population 0.5 % 2.5% 2.5% 0.5 % -2.58 SD -1.96 SD -1SD M Md T +1SD +1.96 SD 68.3% 95 % 99 % +2.58 SD Urval 5

Standardfel Konfidensintervall Standardfelet (SE) = Standardavvikelsen hos populationen SE är ofta okänd men kan estimeras baserat på avvikelserna från medelvärdet i urvalet SE kan användas för att estimera ett kofindensintervall (CI) runt vårt urvals parameter Punktskattning av en variabels medelvärde i populationen är alltid osäker eftersom den gjorts utifrån enbart en del av populationen urval Därför bildas ofta ett intervall inom vilket det sanna medelvärdet med viss sannolikhet ligger Ett sådant intervall kallas konfidensintervall (CI) CI anges med sannolikheterna 95%, 99% eller 99.9% 95 % betyder att populationens medelvärde kommer hamnar inom detta intervall i 95 % av urvalen Bygger alltså på ett antagande om normalfördelning CI kan även estimeras för andra parametrar; regressionskoefficienter, oddskvoter mm. Exempel på tavlan. Hypotesprövning Normalfördelningskurvan (Gauss kurva) Att förkasta eller att inte förkasta H 0, det är frågan. 0.5 % 2.5% 2.5% 0.5 % -2.58 SD -1.96 SD -1SD M Md T +1SD +1.96 SD 68.3% 95 % 99 % +2.58 SD Nollhypotes H 0 Det finns inget samband mellan rökning och alkoholkonsumtion Mothypotes Hypotesprövning Riktad och oriktad hypotes Riktad hypotes Det finns ett positivt samband mellan rökning och alkoholkonsumtion Oriktad hypotes Det finns ett samband mellan rökning och alkoholkonsumtion Det finns ett positivt samband mellan rökning och alkoholkonsumtion 6

Hypotesprövning Logiken vid hypotesprövning 1. Ange nollhypotes (H 0 ) och mothypotes 2. Beräkna vad vi kan förvänta oss om H 0 är sann. 3. Jämför det faktiska resultatet med vad vi kunde förvänta oss enligt 2. Statistisk beräkning. 4. Om utfall och förväntan ej stämmer överens förkasta H 0. Annars behåll H 0. Hypotesprövning Signifikansnivå (alfa-värde) (p < 0.05) Vad betyder det? Givet att H 0 är sann och studien upprepas många gånger med hjälp av slumpvis dragna urval från samma population så kommer färre än 5 % av dessa resultat vara mer inkonsistenta med H 0 än vad föreliggande resultat är Probability = p Andra vanliga nivåer: p < 0.01 p < 0.001 Hypotesprövning Typ-I fel: att förkasta nollhypotesen trots att den är sann i populationen Typ-II fel: att behålla nollhypotesen trots att den inte gäller i populationen Effektstorlek och power Begränsningar med signifikanstestning Säger inget om storleken av samband/skillnad Påverkas av sample-storlek Svårt att jämföra studier som är olika stora Två studier som egentligen har samma resultat kan ge motsatta slutsatser Effektstorlek - Ger ett mått på omfattningen av ett resultat oberoende av sample-storlek Power - Genom beräkning av power för ett test kan man uppskatta risken för ett typ-ii fel. Cohens d hur många SD ligger två medelvärden ifrån varann r Utrycker graden av samvarians mellan två variabler r 2 Effektstorlek utrycker hur mycket varians i en variabel som kan förklaras av en annan Odds-kvot proportion ökad risk för ett visst utfall vid en slutpunkt Hazard-kvot Proportion ökad risk för ett visst utfall över flera tidpunkter Power Power beror på en rad faktorer -Typ av test - effektstorlek - Design; mellan- eller inomgruppsjämförelser - signifikansnivå - riktad eller oriktad hypotes - relativa gruppstorlekar Powerberäkning kan utföras - I designfasen för att ex. bestämma hur många deltagare som krävs för att upptäcka en skillnad eller ett samband med en viss storlek - Efter att data samlats in för att bestämma vilken power ett test har 7

Effektstorlek och power Desto större effektstorlek desto färre deltagare krävs för att upptäcka en skillnad eller ett samband, dvs att få ett signifikant testvärde Desto mindre effektstorlek desto fler deltagare krävs Parametrisk statistik vs. Icke-parametrisk statistik - ett sätt att klassificera olika statistiska test - distinktionen baseras på vissa antaganden om populationen samt typ av data Parametrisk statistik Kräver att data är normalfördelad (storlek på urval) Data ska vara i intervall- eller kvotskala (ev. ordinal) Ytterligare antaganden för olika test Medelvärde och standardavikelse Icke-parametrisk statistik Okänd eller skev bakomliggande fördelning (storlek på urval) Alla typer av skalor Median, variationsvidd, kvartilavstånd Transformering av data om ej normalfördelad Kontinuerligt utfall (exv. livskvalitet, smärta) Skillnad mellan grupper 2 relaterade grupper Beroende t-test (parametriskt) Wilcoxon signed rank test (icke-parametriskt) 2 oberoende grupper Obereonde t-test (parametriskt) Mann-Whitney U-test (icke-parametriskt) 3 el flera grupper ANOVA (parametriskt) Kruskal Wallis (icke-parametriskt) Kontinuerliga variabler (exv. livskvalitet, smärta) Samband mellan variabler Korrelation Pearsons r (parametriskt) Spearmans rho (icke-parametriskt) Regression Enkel (en prediktor) Multipel (flera prediktorer) 8

Kategoriskt utfall (exv. död-levande, sjuk-frisk) Chi2-test (oberoende grupper) McNemars test (beroende grupper) Logistisk regression (prediktorer kategoriska el. kontinuerlig) Kaplan Meier kurvor (överlevnad) Cox regression (överlevnad) Studiedesign Fråga: vilka är riskfaktorerna för stroke? Design: case-control design Jämföra personer som haft stroke med kontroller som inte haft stroke (samma ålder och kön) Analysmetod: Logistisk regression Hur mycket bidrar olika riskfaktorer till utfallet stroke? Odds ratio Relativ förändring i odds (chansen för en viss händelse) när riskfaktor x ökar med ett steg. Resultat från logistisk regression där man kan inkludera flera prediktorer och titta på deras unika bidrag Population attributable risk Proportionen fall som inte skulle förekomma om riskfaktor(er) x inte förelåg 9

Studie Fråga: ger kroppstemperatur 33 C respektive 36 C någon skillnad i överlevnad hos personer som haft hjärtstillestånd? Design: randomiserad klinisk studie Jämföra utfall över tid (död resp. levande) mellan två grupper. Analysmetod: Kaplan-Meier kurva med Cox regression (hazard ratio). Hazard ratio Chansen att en händelse förekommer i en betingelse/chansen att en händelse förekommer i den andra betingelsen Baseras på flera tidpunkter - studera överlevnad över tid 10

Statistikprogram SPSS Standard men dyrt; finns som pröva på http://www14.software.ibm.com/download/data/web/en_us/trialprogram s/w110742e06714b29.html PSPP Gratis, men begränsat https://www.gnu.org/software/pspp/get.html R Gratis, mycket flexibelt, dock inlärningströskel http://www.r-project.org/ Litteratur Litteratur Johan Bring & Adam Taube Jonas Björk 11

Litteratur David Machin, Micheal J. Campell, Stephen J. Walters Tack för mig! 12