Disraeli, England, 1860 talet: Det finns tre grader av osanning. Går ej att mäta hela populationen. Deskriptiv statistik

Relevanta dokument
ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

7.3.3 Nonparametric Mann-Whitney test

7.5 Experiment with a single factor having more than two levels

Följande resultat erhålls (enhet: 1000psi):

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

OBS! Vi har nya rutiner.

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Tentamen i matematisk statistik

Statistik för teknologer, 5 poäng Skrivtid:

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Tentamen består av 9 frågor, totalt 34 poäng. Det krävs minst 17 poäng för att få godkänt och minst 26 poäng för att få väl godkänt.

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Hypotestestning och repetition

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Lösningar till SPSS-övning: Analytisk statistik

Tentamen i matematisk statistik

Metod och teori. Statistik för naturvetare Umeå universitet

OBS! Vi har nya rutiner.

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Lösningar med kommentarer till övningsuppgifterna i min bok Grundläggande statistiska metoder för analys av kvantitativa data

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

ANOVA Mellangruppsdesign

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

Tentamen i matematisk statistik

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Gamla tentor (forts) ( x. x ) ) 2 x1

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

OBS! Vi har nya rutiner.

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Variansanalys med SPSS Kimmo Sorjonen ( )

Uppgift 1. Produktmomentkorrelationskoefficienten

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet. Laboration 3. Variansanalys

7.5 Experiment with a single factor having more than two levels

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

Repetitionsföreläsning

Tentamen i matematisk statistik

8.1 General factorial experiments

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

SOPA62 - Kunskapsproduktion i socialt arbete

Skrivning i ekonometri lördagen den 29 mars 2008

Regressions- och Tidsserieanalys - F4

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Att välja statistisk metod

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

OBS! Vi har nya rutiner.

Repetitionsföreläsning

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

OBS! Vi har nya rutiner.

Statistiska analyser C2 Bivariat analys. Wieland Wermke

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Musselmatematik eller Stormusselstatistik

Samhällsvetenskaplig metod, 7,5 hp

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

Tentamen i matematisk statistik

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

OBS! Vi har nya rutiner.

Forsknings- och undersökningsmetodik Skrivtid: 4h

Parade och oparade test

Kort manual till SPSS 10.0 för Mac/PC

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Tentan består av 10 frågor, totalt 30 poäng. Det krävs 20 poäng för att få godkänt på tentan, varav 50 % inom respektive moment.

Introduktion till PAST

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

2. Test av hypotes rörande medianen i en population.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Problem med analyser av EQ-5D data. Philippe Wagner Tomasz Czuba Jonas Ranstam

Räkneövning 3 Variansanalys

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

SOPA62 - Kunskapsproduktion i socialt arbete

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Medicinsk statistik II

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Tentan består av 15 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 33 poäng för att få välgodkänt.

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Transkript:

Torbjörn Ledin Öronklin, Linköping Enkel medicinsk datorstödd statistik Föreläsning för ST utbildningsläkare i Landstinget Östergötland Åtvidaberg ht000 Historiskt grundantagande Disraeli, England, 1860 talet: Det finns tre grader av osanning Lögn Förbannad dikt Statistik 1 Statistiska varianter Varför medicinsk deduktiv statistik? Deskriptiv statistik räkna antalet enheter av olika slag befolkningsstatistik valresultat ingen värdering görs Deduktiv statistik dra slutsatser om det okända grundläggande antaganden om egenskaper samplade observationer av delmängder 3 Går ej att mäta hela populationen dyrt, tidskrävande skapa kunskap för framtiden så snart möjligt förstörande provning Annars enbart retrospektroskopi. Risker? Risker! Faktisk skillnad Ingen skillnad Testet "positivt" Testet "negativt" OK! Typ fel Typ 1 fel OK! Varje statistiskt baserat beslut innebär att man tar en liten (?) risk att påstå något felaktigt Typ 1 felet (alfa error) man tar en risk (stor?) att missa väsentligheter Typ felet (beta error) So what? Statistikern bryr sig inte om eventuella följder, ditt problem! 5 6

Typ 1 fel (alfa) normalfördelning (t, df=10) Probability Density Function Vilka är längst? Grupp 6 män medel 176 cm SD 6.5 cm Grupp 6 kvinnor medel 167 cm SD 5.5 cm t-test antag normalfördelat och rätt lika SD p<0.08 (two tail), accepteras som signifikant Alfafels risken är.8% för påståendet män och kvinnor är inte lika långa 7 y=student(x;10) 0.500 0.375 0.50 0.15 0.000-3.50-1.75 0.00 1.75 3.50 8 Typ fel (beta) t-fördelning df= Probability Density Function y=student(x;) Risken att missa en faktisk skillnad pga för litet antal undersökta individer tillräckligt dålig studie hittar ingenting Mät kvinnor (16 cm, 17 cm) och män (170 cm, 18 cm) t-test (OK!!) p<0.37 NS betauppskattning: >0% 9 0.500 0.375 0.50 0.15 0.000-3.50-1.75 0.00 1.75 3.50 10 Datakvalitet Nominal data Analys av data beror på typ av dem: Nominal (grupptillhörighet) Ordinal (kan ordnas i storleksföljd) Intervall (lika långt mellan stegen i skalan) Kvot (absolut och meningsfull nollpunkt) Klasstillhörighet, utan inbördes ordning Politiska partier, kön, bilsort, vilken klinik Man kan bara räkna antalet individer Begränsade statistik möjligheter Chi, Fisher, binomial, Poisson mfl 11 1

Nominaldata: en grupp Nominaldata: Två grupper Otogen facialispares är mycket ovanligt Sista 10 åren.1 fall /år Förra året 3 fall Dags ändra antibiotikapolicy? Nej! Poisson analys: p<0.16. Slumpen! Well, då? p<0.06 5? p<0.00!! 13 Jämför antalet sjuka i två grupper. Olika? Öron: 7 kv dr, 15 män KK: 1 kv, 11 män Segregerat? Nej, slumpen kan ej uteslutas. Chi: p<0.17 med Yates korrektion (ja!) p<0.8 Oron KK Kvinnor 7 1 Män 15 11 1 Nominal: grp, få pers Nominaldata: Flera grupper Antal super schackspelare i grp? USA Chess mates (16st): Deep Blue, Bobby F Moskva Krasnaja Ploshadj Tovarish (100 st): Gary Kasparov Chi ej OK om antalet pers mkt litet ( 5 ) Fishers exakta! p<0.09 Amris Russkij Super 1 Member 1 99 15 Chi Problem: visar bara OM skillnad finns Var skillnad? Repetera parvis, anpassa p Grp A Grp B Grp C V 11 66 S 5 110 15 C 17 0 5 Fp 6 1 6 M 1 99 0 16 Ordinal data Normalfördelning Kan rangordnas oantastligt T staging av tumörer Betyg G, VG, MVG Icke-parametrisk statistik (bas: ranger) Två grupper: Mann Whitney s U test Före-efter hos en grupp: Wilcoxon s Viktigt att veta om data är normalfördelade Ja => eleganta enkla statistiska metoder! Nej => ofta betydligt krångligare Transformera data? Om så, lucky you! Logaritmering? Roten ur?? Annat??? 17 18

Gaussiska klockkurvan Normalfördelning?? Probability Density Function y=normal(x;100;15) VIKT 0.09 10 9 8 0.0 7 0.015 No of obs 6 5 3 0.007 1 0 0 5 50 55 60 65 70 75 80 85 90 95 100 105 Expected Normal 0.000 50 60 70 80 90 100 110 10 130 10 150 19 Upper Boundaries (x <= boundary) 0 Kolmogorov Smirnovs vodkatest Histogram (MARK-OP.STA 87v*5c) y = 5 * inormal (x; 7.0889; 1.6195) Logaritmisk fördelning?? Variable AGE ; distribution: Lognormal Kolmogorov-Smirnov d =.1111939, p = n.s. Chi-Square: ------, df = 0, p = --- 100% 90% Percent of obs 80% 70% 60% 50% 0% 30% No of obs 3 1 0% 10% 0% <= 5 (50;55] (60;65] (70;75] (80;85] (90;95] (100;105] > 110 (5;50] (55;60] (65;70] (75;80] (85;90] (95;100] (105;110] VIKT 1 0 0 6 8 30 3 3 36 38 0 6 8 50 5 5 56 58 60 Category (upper limits) Expected Kolmogorov Smirnov Testval vid mätvärden No of obs 0 18 16 1 1 10 8 6 Variable AGE ; distribution: Lognormal Kolmogorov-Smirnov d =.1111939, p = n.s. Chi-Square: ------, df = 0, p = --- 0 0 6 8 30 3 3 36 38 0 6 8 50 5 5 56 58 60 Expected 3 Category (upper limits) Normalfördelning enligt K-S vodkatest: parametrisk statistik t-test (parad inom grupp, jämföra två grupper) ANOVA för flera grupper eller komplexa designer Ej normalfördelning: icke-parametrisk statistik Wilcoxon, Mann-Whitney ANOVAs bröder, liten skara

t-test ANalysis Of VAriance Världens mest missbrukade test? Krav: normalfördelning hyggligt lika SD (tumregel < ca 70% högre) Fördel: lättförståeligt enkelt räkna (m, SD, N för grupperna) 5 Enklaste form: envägs ANOVA (oneway) Svarar på: Finns skillnad mellan < 3 gruppers medel? Problem: Jaså, en skillnad nånstans, var då då? Krav: normalfördelning, hyggligt lika SD 6 Sport problemet Statisticas resultat text pentathlon marathon football canowing 1 5.3.3.5.6 5.9.5. 5 3.8 5 3.9 5.3.5 3.8 5. 5.8 5 6.1 5..1 5.5 6 5.5.7 5 6 7 5.3 5. 5.1 8 5.6 5..7.8 9.6.8. 5.6 10 5.3.1.9 5.3 7 DESIGN: 1 - way ANOVA, fixed effects DEPENDENT: 1 variable: VALUE BETWEEN: 1-GRUPPNR ( ): 1 3 WITHIN: none STAT. Summary of all Effects; design: (-anovor.sta) GENERAL 1-GRUPPNR MANOVA df MS df MS Effect Effect Effect Error Error F p-level 1 3* 1.55333* 36*.833* 5.9180*.0011* 8 Variable: VALUE 5. 5.3 5. 5.1 5.0.9.8.7.6 Medelvärden Plot of Means GRUPPNR Main Effect F(3,36)=5.9; p<.001 Och var låg skillnaderna? Post-hoc test (tex Tukey) STAT. Tukey HSD test; variable VALUE (-anovor.sta) GENERAL Probabilities for Post Hoc Tests MANOVA MAIN EFFECT: GRUPPNR {1} {} {3} {} 5.60000.610000.630000 5.300000 GRUPPNR 1.08161*.03998*.997916 {1} {}.999761.018015*.08161* 3 {3}.03998*.999761.0561* {}.997916.018015*.0561*.5 G_1:1 G_: G_3:3 G_: GRUPPNR 9 30

Komplex design ANOVA Solklart! Två grupper om tre personer Samma test vid tre tillfällen Tre upprepningar varje gång Repeated measures över två nivåer i två grupper Fyrvägs ANOVA 0 GRUPP T1D1 T1D T1D3 TD1 TD TD3 T3D1 T3D T3D3 35 1 1 5 53 60 0 5 57 8 37 6 30 1 35 1 50 30 37 7 5 3 1 5 3 1 60 65 75 58 5 70 0 7 50 0 GRUPP: G_1:1 50 8 61 5 3 51 16 3 35 15 REPEAT level_ REPEAT level_ REPEAT level_ GRUPP: 5 5 55 30 37 3 7 37 level_1 level_3 level_1 level_3 level_1 level_3 G_: 6 56 60 77 0 39 57 31 9 6 31 TIME: level_1 TIME: level_ TIME: level_3 3 65 Variable: Var.1 70 60 55 50 5 Plot of Means 3-way interaction F(,16)=.36; p<.8357 Fido Statistik? DESIGN CATEGORY PROCEDURES PARAMETRICS NONPARAMETRICS One group Binomial test Student's t-test Wilcoxon rank sum test Sign test Poisson test McNemar test Two groups Fisher's exact test Student's t-test Mann-Whitney U test Chi- test (Yates correction) Many groups Chi test ANOVA + nd stage e.g. Kruskall Wallis test Bonferroni methods Correlation - Pearson's r Spearman rank correlation Available descriptors Frequency counts mean, SD median, percentiles Datakvalitet Förutsättningar Metodval Beräkning Tolkning Riskuppskattning 33 3 Statistik tutorials Web länk Med statistik kompendium och nedladdningsbara tutorials: http://hem.fyristorg.com/medve OBS!! inget www i början. 35 36

Tack för uppmärksamheten! 37