Lars Valter LARC (Linköping Academic Research Centre) Enheten för hälsoanalys, Centrum för hälso- och vårdutveckling
Statistics, the most important science in the whole world: for upon it depends the applications of every other science and of every art: the one science essential for all political and social administration, all education, all organization based on experience for it only gives results of our experiences Florence Nightingale 1820-1919
Statistik vetenskapen om hur data med inslag av slumpvariation eller osäkerhet skall insamlas, utvärderas och presenteras. (Nationalencyklopedin)
Statistik kan delas in i två huvudspår Deskriptiv (beskrivande) statistik statistiska mått (medelvärde, median) tabeller diagram Statistisk inferens (analys) hypotesprövning p-värde konfidensintervall signifikant
Deskriptiv statistik Beskriva och rapportera kvantitativa data
Först: Vilka variabler har vi? Vilken typ av skala mäts de med (nominal-, ordinal- eller intervall-skala)?
Exempel: Blodtryckssänkande intervention Systoliskt blodtryck före interventionen, mmhg Systoliskt blodtryck efter interventionen, mmhg Differens för blodtryck (X2-X1), mmhg Födelseland: Sverige, Norden, Europa eller resten av världen Kön, kvinna eller man Ålder, antal år Fysisk aktivitet, låg, medel eller hög Vikt, kg Längd, cm Högsta utbildningsnivå, grundskola, gymnasium eller högskola
Nominal skala Egenskaper: Varje observation (tex person) kategoriseras till en (1) av flera kategorier. Kategorierna har ingen inbördes ordning.
Exempel: Blodtryckssänkande intervention Systoliskt blodtryck före interventionen, mmhg Systoliskt blodtryck efter interventionen, mmhg Differens för blodtryck (X2-X1), mmhg Födelseland: Sverige, Norden, Europa eller resten av världen Kön, kvinna eller man Ålder, antal år Fysisk aktivitet, låg, medel eller hög Vikt, kg Längd, cm Högsta utbildningsnivå, grundskola, gymnasium eller högskola
Ordinal skala Egenskaper: Kan vara indelad i kategorier eller vara kontinuerlig. Har en naturlig inbördes ordning.
SF-36 fråga 1 en variabel som mäts på en skala som är indelad i kategorier med inbördes ordning.
Exempel: Blodtryckssänkande intervention Systoliskt blodtryck före interventionen, mmhg Systoliskt blodtryck efter interventionen, mmhg Differens för blodtryck (X2-X1), mmhg Födelseland: Sverige, Norden, Europa eller resten av världen Kön, kvinna eller man Ålder, antal år Fysisk aktivitet, låg, medel eller hög Vikt, kg Längd, cm Högsta utbildningsnivå, grundskola, gymnasium eller högskola
VAS, Visuell Analog Skala en kontinuerlig ordinal skala eller med kategorier
Intervall-/kvot-skala Egenskaper: Ekvidistant (jmf. SF36 fråga 1) Absolut nollpunkt (%-beräkningar fungerar)
Exempel: Blodtryckssänkande intervention X1: Systoliskt blodtryck före interventionen, mmhg X2: Systoliskt blodtryck efter interventionen, mmhg X3: Differens för blodtryck (X2-X1), mmhg X4: Födelseland Sverige, Norden, Europa eller resten av världen X5: Kön, kvinna eller man X6: Ålder, antal år X7: Fysisk aktivitet, låg, medel eller hög X8: Vikt, kg X9: Längd, cm X10: Högsta utbildningsnivå, grundskola, gymnasium eller högskola
Tre olika sammanfattande lägesmått Typvärde (Nominal skala) Median (Ordinal skala) Medelvärde (Intervall-/kvotskala) Tre olika spridningsmått Range (vidd), största-minsta Kvartilavstånd (Ordinal skala) Standardavvikelse (Intervall-/kvotskala)
Typvärde=72 Median=73 Medelvärde=74
Exempel: Blodtryckssänkande intervention Ofta kan det vara lämpligt att dikotomisera variabler och ange proportioner X1: Systoliskt blodtryck före interventionen, mmhg X2: Systoliskt blodtryck efter interventionen, mmhg X3: Differensen, minskning, ökning X4: Födelseland, Sverige och övriga norden, utanför norden X5: Kön, kvinna, man X6: Ålder, över 65 år, under 65 år X7: Fysisk aktivitet, inaktiv eller aktiv X8: Vikt, kg X9: Längd, cm X10: Högsta utbildningsnivå, högskola, högst gymnasium
Alla skalor kan dikotomiseras. Koda en dikotomiserad variabel med 0 och 1 i datafilen Exempel: man=0, kvinna=1 Medelvärdet blir i så fall andelen 1:or i datamaterialet Exempel: man, man, kvinna, man, kvinna, man, kvinna, man 0, 0, 1, 0, 1, 0, 1, 0 medelvärde=3/8=0,375 dvs. 37,5% kvinnor
Resultatpresentation: Tabeller Tabell 1. Andelen (%) män och kvinnor fördelade efter utbildning Män Kvinnor Totalt Grundskola 23 (n=25) 9 (n=10) 16 (n=35) Gymnasium 50 (n=45) 52 (n=60) 48 (n=105) Högskola 32 (n=35) 39 (n=45) 36 (n=80) Totalt 100 (n=105) 100 (n=115) 100 (n=220)
Resultatpresentation: Tabeller Tabell 2. Genomsnittligt systoliskt blodtryck, mmhg, efter intervention Män Kvinnor Totalt Grundskola 138 (n=25) 135 (n=10) 137 (n=35) Gymnasium 137 (n=45) 135 (n=60) 136 (n=105) Högskola 130 (n=35) 136 (n=45) 133 (n=80) Totalt 135 (n=105) 135 (n=115) 135 (n=220)
Antal Statistik Diagram Diagram 1. Antal män och kvinnor uppdelade efter utbildning 60 50 40 30 20 Män Kvinnor 10 0 Grundskola Gymnasium Högskola Utbildning
Andel (%) Statistik 60 Diagram 1. Andel män och kvinnor uppdelade utbildning 50 40 30 20 Män Kvinnor 10 0 Grundskola Gymnasium Högskola Utbildning
Diagram 3. Andel personer fördelade efter utbildningsnivå
Diagram 4. Systoliskt blodtryck (mmhg)
Statistisk inferens
Population Stickprov Medelvärde: μ Standardavvikelse: σ _ Medelvärde: x Standardavvikelse: s
Behandling A Behandling B Medelvärde: μ A Medelvärde=μ B Stickpr ov Medelvärde=xA Standardavvikelse: s A Stickprov Medelvärde=x B Standardavvikelse: s B
Generaliserbarhet och statistisk hypotesprövning
Statistiska hypoteser Hypoteser uttryckta i med ord H 0 : Ingen skillnad mellan behandling A och B H 1 : Skillnad mellan behandlingarna H 1 : Behandling A bättre än behandling B H 1 : Behandling B bättre än behandling A Hypoteser uttryckta i statistiska parametrar H 0 : μ A = μ B H 1 : μ A μ B H 1 : μ A > μ B H 1 : μ A < μ B
Avgör om en noll-hypotes kan förkastas eller inte med hjälp av p-värdet. Ett statistiskt test, tex t-test, chi 2 -test, z-test, etc, resulterar bland annat i ett p- värde. Ett litet p-värde indikerar att H 0 inte är särskilt trolig och kan förkastas, ett högt p-värde indikerar att H 0 inte kan förkastas. Gränsen är oftast 0,05. H 0 : Ingen skillnad mellan behandling A och B H 1 : Skillnad mellan behandlingarna
H 0 : Ingen skillnad mellan behandling A och B H 1 : Skillnad mellan behandlingarna Slutsats: H 0 kan inte förkastas
Ett konfidensintervall innehåller mer information Med 95% säkerhet täcker intervallet -0.06 till 3.83 den sanna skillnaden (μ A μ B ) mellan behandlingarna.
Simpsons paradox Med kompl. Utan kompl. Det stora sjukhuset Det lilla sjukhuset 20 20 16 24
Akut Ej akut Simpsons paradox Med kompl. Utan kompl. Det stora sjukhuset 2 8 Det lilla sjukhuset 9 21 Det stora sjukhuset 18 12 Det lilla sjukhuset 7 3
Simpsons paradox Akut/ej akut Sjukhus Resultat