Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Relevanta dokument
Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

Statistik Termin 10, Läkarprogrammet, HT16

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

Medicinsk statistik II

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Statistik. Statistik. Statistik. Lars Walter Fil.lic. Statistik

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hur skriver man statistikavsnittet i en ansökan?

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Statistik och epidemiologi T5

Statistik en introduktion

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Gamla tentor (forts) ( x. x ) ) 2 x1

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Medicinsk statistik I

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

OBS! Vi har nya rutiner.

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Introduktion till Biostatistik. Hans Stenlund, 2011

19/10/14. Kvantitativ metod och grundläggande statistik. Olika typer av studier. Experiment. Klinsika prövningar. Representativt (randomiserat) urval

Medicinsk statistik II

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Hypotestestning och repetition

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Statistik 1 för biologer, logopeder och psykologer

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Analytisk statistik. Tony Pansell, optiker Universitetslektor

17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

Föreläsning G60 Statistiska metoder

Att välja statistisk metod

Repetitionsföreläsning

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Statistik en introduktion

SOPA62 - Kunskapsproduktion i socialt arbete

Medicinsk statistik III Läkarprogrammet, Termin 5 VT 2016

Introduktion till PAST

Statistik och epidemiologi T5

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Kvantitativ metod och grundläggande statistik. Introduktion

Mall och manual för granskning av interventionsstudier

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Medicinsk statistik I

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

Statistik. Statistik. Statistik. Statistics, Lars Walter. Forsknings- och utvecklingsenheten för närsjukvård. Folkhälsocentrum

Tentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), STATISTIK

Lycka till! Nämnden för omvårdnadsutbildningar Sjuksköterskeprogrammet 180hp. SJSD10, Sjuksköterskans profession och vetenskap I, 15 hp, Delkurs II

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Konfidensintervall, Hypotestest

Kent W. Nilsson. Falun

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

36 poäng. Lägsta poäng för Godkänd 70 % av totalpoängen vilket motsvarar 25 poäng. Varje fråga är värd 2 poäng inga halva poäng delas ut.

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

F3 Introduktion Stickprov

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 1

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Tillämpad statistik Naprapathögskolan. Henrik Källberg Tel

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

ST-fredag epidemiologi och biostatistik 2017

Mata in data i Excel och bearbeta i SPSS

1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c)

Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Föreläsning 5. Kapitel 6, sid Inferens om en population

Forskarutbildningskurs DATAHANTERING OCH DATABEARBETNING

2.1 Minitab-introduktion

Uppgift 1. Produktmomentkorrelationskoefficienten

Statistiska analyser C2 Bivariat analys. Wieland Wermke

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

BIOSTATISTIK OCH EPIDEMIOLOGI

Föreläsning 2 Deskription (forts). Index Deskription: diagram som stapeldiagram, histogram mm (tex spridningsdiagram, Mera om mätnivåer

HÖGSKOLAN I BORÅS. FORSKNINGSMETODER I OFFENTLIG FÖRVALTNING 15 Högskolepoäng

Lösningar till SPSS-övning: Analytisk statistik

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Parade och oparade test

Fråga nr a b c d 2 D

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Transkript:

Agenda Statistik Termin 11, Läkarprogrammet, VT14 I: Grundläggande begrepp och beskrivande statistik II: Exempel på typisk forskning III. Frågestund Martin Cernvall martin.cernvall@pubcare.uu.se Grundläggande begrepp och beskrivande statistik Forskningsprocessen Skalnivåer Centralmått och spridningsmått Figurer; histogram och boxplot Normalfördelning Statistisk inferens och standardfel Konfidensintervall P-värde Olika typer av statistiska test Agenda (forts.) Forskningsprocessen Exempel på typisk forskning Case-control studie Randomiserad interventionsstudie Frågestund Data Identifiera variabler Initial observation (Forskningsfråga) Generera teori Generera hypoteser Mäta variabler Samla data för att testa teori Presentera data grafiskt Anpassa modell Analysera data Den heliga treenigheten Konstruktvaliditet Definition av konstrukt Operationalisering Reliabilitet Intern validitet: Strukturell design Hypoteser Kontroll över påverkande variabler Mätning Design Extern validitet: Urvalsplan Analys Slutsatsvaliditet Estimat av kovarians Estimat av urvalsfel Utvärdera hypoteser Nominal Kategorier, exv kön. Ordinal Kategorier som är rangordnade, exv stor mellan - liten. Intervall Kontinuerlig, lika långa intervall, godtycklig nollpunkt; exv temperatur. Kvot Kontinuerlig, lika långa intervall absolut nollpunkt; exv längd, vikt. 1

Nominalskala Kryssa för det alternativ som stämmer in på dig. Är du? Kvinna Man Uppfyller patienten kriterierna för diagnosen? Ja Nej Ordinalskala Hur uppfattar du din egen hälsa? Ringa in siffran framför det påstående som stämmer bäst med hur du uppfattar din hälsa. 1. Min hälsa är mycket dålig 2. Min hälsa är ganska dålig 3. Min hälsa är ganska bra 4. Min hälsa är mycket bra Intervallskala Kvotskala Vilken temperatur har patienten? Hur mycket väger du? kg Hur lång är du? cm Skalnivåer Centralmått och spridningsmått Skala Kvantitet Lika intervall Nominal Nej Ordinal Ja Nej Nej Intervall Ja Ja Nej Kvot Ja Ja Ja Absolut nollpunkt Centralmått Typvärde (T) Median (Md) Medelvärde (M) Spridningsmått Variationsvidd Kvartilavstånd Standardavvikelse (Sd) Typ av data och skalnivå har betydelse för hur vi sedan analyserar och presenterar våra data 2

Skalnivåer 0 0 2 4 4 4 5 6 6 6 8 9 10 11 12 12 14 15 16 17 Hur många standardglas har du druckit de senaste 7 dagarna? n = 20 Q1 = 4 Median (Md) = 7 ((6+8)/2) Q3 = 12 Kv. avst. = Q3 Q1 = 12 4 = 8 Sd = M = X n S 2 = Sd 2 (x M) 2 n 1 M = 8,05 Sd = 5,18 S 2 = 26,79 Skala Kvantitet Lika intervall Nominal Nej Absolut nollpunkt Centralmått Spridningsmått Ordinal Ja Nej Nej Md Kv. avst. Intervall Ja Ja Nej M Sd Kvot Ja Ja Ja M Sd Histogram Boxplot eller lådagram N = 100 Centralmått och spridningsmått 25 Högsta värde (max) 75% = 3:e kvartil 25 Median 25% = 1:a kvartil Minsta värde (min) Scatterplot Normalfördelningskurvan (Gauss kurva) Illustrera samband mellan två variabler: styrka och riktning 0.5 % 2.5% 2.5% 0.5 % -2.58 SD -1.96 SD -1SD M Md T +1SD +1.96 SD 68.3% 95 % 99 % +2.58 SD 3

Statistisk inferens Smoking Statistics N Valid 100 Att dra slutsatser om egenskaperna hos en population på basis av egenskaperna hos ett urval. Missing 0 Mean 4,23 Median 4,00 Std. Deviation 2,601 Skewness -,131 Std. Error of Skewness,241 Population Minimum 0 Maximum 8 Percentiles 25 2,00 50 4,00 75 7,00 Urval Standardfel Konfidensintervall Standardfelet (SE) = Standardavvikelsen hos populationen SE är ofta okänd men kan estimeras baserat på avvikelserna från medelvärdet i urvalet SE kan användas för att estimera ett kofindensintervall (CI) runt vårt urvals parameter Punktskattning av en variabels medelvärde i populationen är alltid osäker eftersom den gjorts utifrån enbart en del av populationen urval Därför bildas ofta ett intervall inom vilket det sanna medelvärdet med viss sannolikhet ligger Ett sådant intervall kallas konfidensintervall (CI) CI anges med sannolikheterna 95%, 99% eller 99.9% 95 % betyder att populationens medelvärde kommer hamnar inom detta intervall i 95 % av urvalen Bygger alltså på ett antagande om normalfördelning CI kan även estimeras för andra parametrar; regressionskoefficienter, oddskvoter mm. Exempel på tavlan. Normalfördelningskurvan (Gauss kurva) Att förkasta eller att inte förkasta H 0, det är frågan. 0.5 % 2.5% 2.5% 0.5 % -2.58 SD -1.96 SD -1SD M Md T +1SD +1.96 SD 68.3% 95 % 99 % +2.58 SD 4

Nollhypotes H 0 Det finns inget samband mellan rökning och alkoholkonsumtion Mothypotes Det finns ett positivt samband mellan rökning och alkoholkonsumtion Riktad och oriktad hypotes Riktad hypotes Det finns ett positivt samband mellan rökning och alkoholkonsumtion Oriktad hypotes Det finns ett samband mellan rökning och alkoholkonsumtion Logiken vid hypotesprövning 1. Ange nollhypotes (H 0 ) och mothypotes 2. Beräkna vad vi kan förvänta oss om H 0 är sann. 3. Jämför det faktiska resultatet med vad vi kunde förvänta oss enligt 2. Statistisk beräkning. 4. Om utfall och förväntan ej stämmer överens förkasta H 0. Annars behåll H 0. Signifikansnivå (alfa-värde) (p < 0.05) Vad betyder det? Givet att H 0 är sann och studien upprepas många gånger med hjälp av slumpvis dragna urval från samma population så kommer färre än 5 % av dessa resultat vara mer inkonsistenta med H 0 än vad föreliggande resultat är Probability = p Andra vanliga nivåer: p < 0.01 p < 0.001 Typ-I fel: att förkasta nollhypotesen trots att den är sann i populationen Typ-II fel: att behålla nollhypotesen trots att den inte gäller i populationen Effektstorlek och power Begränsningar med signifikanstestning Säger inget om storleken av samband/skillnad Påverkas av sample-storlek Svårt att jämföra studier som är olika stora Två studier som egentligen har samma resultat kan ge motsatta slutsatser Effektstorlek - Ger ett mått på omfattningen av ett resultat oberoende av sample-storlek Power - Genom beräkning av power för ett test kan man uppskatta risken för ett typ-ii fel. 5

Cohens d hur många SD ligger två medelvärden ifrån varann r Utrycker graden av samvarians mellan två variabler r 2 Effektstorlek utrycker hur mycket varians i en variabel som kan förklaras av en annan Odds-kvot proportion ökad risk för ett visst utfall vid en slutpunkt Hazard-kvot Proportion ökad risk för ett visst utfall över flera tidpunkter Power Power beror på en rad faktorer -Typ av test - effektstorlek - Design; mellan- eller inomgruppsjämförelser - signifikansnivå - riktad eller oriktad hypotes - relativa gruppstorlekar Powerberäkning kan utföras - I designfasen för att ex. bestämma hur många deltagare som krävs för att upptäcka en skillnad eller ett samband med en viss storlek - Efter att data samlats in för att bestämma vilken power ett test har Effektstorlek och power Desto större effektstorlek desto färre deltagare krävs för att upptäcka en skillnad eller ett samband, dvs att få ett signifikant testvärde Desto mindre effektstorlek desto fler deltagare krävs Parametrisk statistik vs. Icke-parametrisk statistik - ett sätt att klassificera olika statistiska test - distinktionen baseras på vissa antaganden om populationen samt typ av data Parametrisk statistik Kräver att data är normalfördelad (storlek på urval) Data ska vara i intervall- eller kvotskala (ev. ordinal) Ytterligare antaganden för olika test Medelvärde och standardavikelse Icke-parametrisk statistik Okänd eller skev bakomliggande fördelning (storlek på urval) Alla typer av skalor Median, variationsvidd, kvartilavstånd Transformering av data om ej normalfördelad 6

Utfall kontinuerligt (exv. livskvalitet, smärta) Skillnad mellan grupper 2 relaterade grupper Beroende t-test (parametriskt) Wilcoxon signed rank test (icke-parametriskt) 2 oberoende grupper Obereonde t-test (parametriskt) Mann-Whitney U-test (icke-parametriskt) 3 el flera grupper ANOVA (parametriskt) Kruskal Wallis (icke-parametriskt) Utfall kontinuerligt (exv. livskvalitet, smärta) Samband mellan grupper Korrelation Pearsons r (parametriskt) Spearmans rho (icke-parametriskt) Regression Enkel (en prediktor) Mulitipell (flera prediktorer) Utfall kategoriskt (exv. död-levande, sjuk-frisk) Chi2-test (oberoende grupper) McNemars test (beroende grupper) Logistisk regression (prediktorer kategoriska el. kontinuerlig) Kaplan Meier kurvor (överlevnad) Cox regression (överlevnad) Studiedesign Fråga: vilka är riskfaktorerna för stroke? Design: case-control design Jämföra personer som haft stroke med kontroller som inte haft stroke (samma ålder och kön) Analysmetod: Logistisk regression Hur mycket bidrar olika riskfaktorer till utfallet stroke? Odds ratio Relativ förändring i odds (chansen för en viss händelse) när riskfaktor x ökar med ett steg. Resultat från logistisk regression där man kan inkludera flera prediktorer och titta på deras unika bidrag Population attributable risk Proportionen fall som inte skulle förekomma om riskfaktor(er) x inte förelåg 7

8

Studie Fråga: ger kroppstemperatur 33 C respektive 36 C någon skillnad i överlevnad hos personer som haft hjärtstillestånd? Design: randomiserad klinisk studie Jämföra utfall över tid (död resp. levande) mellan två grupper. Analysmetod: Kaplan-Meier kurva med Cox regression (hazard ratio). Hazard ratio Chansen att en händelse förekommer i en betingelse/chansen att en händelse förekommer i den andra betingelsen Baseras på flera tidpunkter - studera överlevnad över tid Tack för mig! 9