Hur man tolkar statistiska resultat

Relevanta dokument
Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Parade och oparade test

Studietyper, inferens och konfidensintervall

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Föreläsning G60 Statistiska metoder

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 5. Kapitel 6, sid Inferens om en population

F3 Introduktion Stickprov

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

F22, Icke-parametriska metoder.

Hypotestestning och repetition

Föreläsning 5: Hypotesprövningar

Föreläsning G60 Statistiska metoder

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Hur skriver man statistikavsnittet i en ansökan?

Statistik 1 för biologer, logopeder och psykologer

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

TMS136. Föreläsning 11

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

2. Test av hypotes rörande medianen i en population.

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

, s a. , s b. personer från Alingsås och n b

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

8 Inferens om väntevärdet (och variansen) av en fördelning

Föreläsningsanteckningar till kapitel 9, del 2

Föreläsning 12, FMSF45 Hypotesprövning

Konfidensintervall, Hypotestest

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

TMS136. Föreläsning 13

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

a) Facit till räkneseminarium 3

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Föreläsning G60 Statistiska metoder

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

TMS136. Föreläsning 10

Gamla tentor (forts) ( x. x ) ) 2 x1

Kapitel 10 Hypotesprövning

Om statistisk hypotesprövning

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Laboration 4 Statistiska test

FÖRELÄSNING 8:

Laboration 4 Statistiska test Del I: Standardtest Del II: Styrkefubktion

Laboration 4: Hypotesprövning och styrkefunktion

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Medicinsk statistik II

7.3.3 Nonparametric Mann-Whitney test

Hypotestest och fortsättning av skattningar och konfidensintervall

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

FACIT (korrekta svar i röd fetstil)

Uppgift a b c d e Vet inte Poäng

TAMS65 - Föreläsning 6 Hypotesprövning

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

TAMS65 - Föreläsning 6 Hypotesprövning

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )

Statistik och epidemiologi T5

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Statistik och epidemiologi T5

Laboration 3 Inferens fo r andelar och korstabeller

Introduktion till statistik för statsvetare

TENTAMEN I STATISTIKENS GRUNDER 2

Matematisk statistik för B, K, N, BME och Kemister

Omtentamen i Metod C-kurs

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

Lektionsanteckningar 11-12: Normalfördelningen

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Medicinsk statistik II

Föreläsning G60 Statistiska metoder

Övningstentamen 2 Uppgift 1: Uppgift 2: Uppgift 3: Uppgift 4: Uppgift 5: Uppgift 6: i ord

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Fråga nr a b c d 2 D

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

F9 Konfidensintervall

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Stockholms Universitet Statistiska institutionen Termeh Shafie

Statistik. Statistik. Statistik. Lars Walter Fil.lic. Statistik

Transkript:

Hur man tolkar statistiska resultat Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Varför använder vi oss av statistiska tester? För att kunna göra några uttalanden om observerade förändringar och/eller skillnader i insamlade data så måste någon typ av statistiskt test tillämpas! 2

Vikten av att välja rätt test Det finns många statistiska test att välja mellan då man vill genomföra en hypotesprövning. I den här kursen har ni lärt er 15 olika tester! Olika typer av studier och olika studieupplägg kräver olika typer av hypotesprövningar. För att kunna dra rätt slutsatser är det väldigt viktigt att välja rätt test! 3

När ska testet användas? Analys av medelvärden Jämförelser mot ett specifikt värde 4

När ska testet användas? Analys av proportioner (2 klasser) Jämförelse mellan 2 grupper eller mot ett specifikt värde 5

När ska testet användas? Analys av frekvenser (2 eller flera klasser) Jämförelse mellan 2 eller flera grupper/klasser 6

När ska testet användas? Oparade gruppvisa jämförelser Jämförelse mellan 2 grupper 7

När ska testet användas? Oparade gruppvisa jämförelser Jämförelse mellan 2 grupper 8

När ska testet användas? Parade gruppvisa jämförelser Jämförelse före och efter för samma individer eller mellan tvillingar 9

När ska testet användas? Parade gruppvisa jämförelser Jämförelse före och efter för samma individer eller mellan tvillingar 10

När ska testet användas? Variansanalys Jämförelse mellan 2 eller flera grupper 11

Testvariabel mot kritiskt värde Det uträknade värdet på testvariabeln jämförs mot kritiskt/kritiska värde(n) i en tabell. Parametriska test Om värdet på testvariabeln är större än eller lika med det positiva kritiska värdet och/eller om värdet på testvariabeln är mindre än eller lika med det negativa kritiska värdet så Icke-parametriska test Oparade: Om rangsumman för det minsta stickprovet faller utanför intervallet (eller på intervallgränserna) som bildas av de kritiska värdena så Parade: Om den lägsta teckenrangsumman underskrider eller är lika med det kritiska värdet så förkastas nollhypotesen! 12

Vad säger testet oss? Vad innebär det att vi förkastar nollhypotesen? Kan vi säga att en behandling är bättre än en annan om vi har jämfört 2 eller flera grupper och vi efter analysen förkastar nollhypotesen? Nej Riktigt så enkelt är det faktiskt inte! Med hjälp av hypotestestet avgör vi om det finns någon statistisk skillnad mellan grupperna på en viss signifikansnivå! 13

Normalfördelade testvärden (Z) 1-sidigt test: Vid 5% signifikansnivå är det 5% sannolikhet att den beräknade testvariabeln hamnar i de blå fälten trots att nollhypotesen är sann! 2-sidigt test: 5% 2.5% 2.5% -6-4 -2 0 2 4 6-6 -4-2 0 2 4 6 5% signifikansnivå 14

Typ I fel Om vi förkastar nollhypotesen trots att den är sann så begår vi ett typ I fel Risken att begå ett typ I fel är lika med vår signifikansnivå! 15

Vad säger testet oss? Vad innebär det om vi inte kan förkasta nollhypotesen? Kan vi säga att behandlingarna är lika bra om vi har jämfört 2 eller flera grupper och vi efter analysen behåller nollhypotesen? Nej Så enkelt är det inte heller! Att vi inte har hittat en signifikant skillnad är inte samma sak som att det inte finns någon skillnad! 16

Typ II fel Om vi behåller vår nollhypotes trots att den är falsk så begår vi ett typ II fel Risken att begå ett typ II fel kan vi inte styra över på samma sätt som när det gäller typ I felen 17

Normalfördelade testvärden Typ I fel och typ II fel μ a μ b Variabelvärde Risken för typ II fel Sannolikhet: β Risken för typ I fel Sannolikhet: α 18

Typ I fel och typ II fel Verkligheten Resultat av hypotesprövning H 0 accepteras H 0 förkastas H 0 sann OK! Typ I-fel H 0 falsk Typ II-fel OK! Om vi förkastar nollhypotesen kan vi bara begå typ I fel Om vi behåller nollhypotesen kan vi bara begå typ II fel 19

Vad säger testet oss? Då vi förkastar nollhypotesen så är vår slutsats att vi har en signifikant skillnad på signifikansnivån α. Då vi behåller nollhypotesen så är vår slutsats att vi inte har tillräckligt med bevis för att förkasta vår nollhypotes på signifikansnivån α. Testet säger ingenting om hur stor skillnaden är mellan grupperna (hur nära eller långt ifrån vi är) och det säger ingenting om risken för typ II fel. 20

p-värde Genom att beräkna p-värdet får vi lite mer information om våra analysresultat. p-värdet talar om hur sannolikt det är att observera en skillnad som är minst så stor som den som observerats, förutsatt att nollhypotesen är sann! Hur stor är sannolikheten att skillnaden vi ser har uppkommit av en slump? 21

p-värde Om p-värdet är mindre än signifikansnivån så förkastar vi nollhypotesen! p-värdet säger lite mer om hur nära eller långt ifrån vi är men det säger inte så mycket om hur stor skillnaden är mellan grupperna och det säger ingenting om risken för typ II fel. 22

Konfidensintervall Genom att beräkna konfidensintervallet så får vi ett mått på osäkerheten. I grund fallet beräknar vi konfidensintervall för medelvärdet Vi får ett mått på hur pass osäker skattningen av populationsmedelvärdet är utifrån stickprovsmedelvärdet. Populationsmedelvärdet (det sanna medelvärdet) ligger inom konfidensintervallet med en viss säkerhet (1-α). 23

Konfidensintervall Vad beskriver konfidensintervallet då vi jämför skillnaden mellan 2 grupper? Konfidensintervallet beskriver skillnadens osäkerhet! Om intervallet inkluderar noll Ingen skillnad kunde påvisas Konfidensintervallet säger lite mer om hur stor skillnaden är mellan grupperna men det säger ingenting om risken för typ II fel. 24

Statistisk styrka (power) Statistisk styrka (power) är sannolikheten att förkasta nollhypotesen när den är falsk! Sannolikhet: 1-β Om vi minskar risken för typ I fel (sänker signifikansnivån) så ökar risken för typ II fel och därmed minskar den statistiska styrkan! Hur ökar vi den statistiska styrkan? μ a μ b 25

Statistisk styrka (power) Givet en viss definierad skillnad mellan två behandlingar så är en studies statistiska styrka lika med sannolikheten att studien kommer att kunna upptäcka (d.v.s. resultaten blir statistsikt signifikanta) en skillnad av den storleksordningen. Om vi från början vet hur stor skillnad vi vill kunna upptäcka så kan vi planera studien utifrån det! 26

Design av studier utifrån statistisk styrka Vi börjar med att besluta vilken skillnad (i behandlingseffekt) som vi vill kunna upptäcka Antalet individer i våra stickprov påverkar variansen av stickprovssannolikhetsfördelningen och därmed vår risk för typ II fel! Genom att öka antalet individer i våra stickprov så minskar risken för typ II fel Oftast designar vi studier med 80-90% statistisk styrka för att kunna upptäcka en viss skillnad 27

Design av studier utifrån statistisk styrka Powerkurva Ett sätt att illustrera den statistiska styrkan Idén är att inte bara beräkna den statistiska styrkan för ett givet alternativ utan se hur styrkan ändras då vi exempelvis ändrar antalet individer i stickproven Viktigt verktyg då vi planerar vår studie Vilka skillnader vill vi inte missa? Hur många individer måste vi i så fall inkludera? 28

Design av studier utifrån Statistisk styrka (power) statistisk styrka - Powerkurva 0.0 0.2 0.4 0.6 0.8 1.0 Skillnaden vi vill upptäcka mellan individerna är fast medan antalet individer per grupp kan varieras 25 individer behövs för att upptäcka den här specifika skillnaden med 80% power! 0 10 20 30 40 50 60 70 80 90 100 Antal individer per grupp 29

Statistisk styrka (power) Om vi inte får vara med och påverka studiedesignen så kan vi utifrån en powerkurva avgöra: Hur stora skillnader vi har chans att upptäcka med 80% statistisk styrka Vad vi har för statistisk styrka för att upptäcka en viss skillnad 30

Statistisk styrka (power) Design av studier utifrån statistisk styrka - Powerkurva Antal individer per grupp är fast medan skillnaderna mellan grupperna kan varieras Betydelsefull skillnad Obetydlig skillnad Betydelsefull skillnad Meningsfull skillnad Meningsfull skillnad μ 1 μ 2 31

Statistisk styrka (power) Design av studier utifrån statistisk styrka - Powerkurva n a = n b = 10 n a = n b = 30 Bredden (osäkerheten) minskar med ökande antal individer! μ 1 μ 2 32

Sammanfattning Det är väldigt viktigt att välja rätt test vid hypotesprövning Ett hypotestest avgör om vi kan förkasta nollhypotesen eller inte på en viss signifikansnivå - Vi kan förkasta nollhypotesen trots att den är sann Typ I fel, α - Vi kan behålla nollhypotesen trots att den är falsk Typ II fel, β - Vi kan förkasta nollhypotesen då den är falsk Statistisk styrka (power), 1-β 33

Sammanfattning Vi vill ha 80-90% statistisk styrka Powerkurvor kan hjälpa oss att designa vår studie och avgöra hur många individer vi behöver och/eller avgöra vad vi har för statistisk styrka med ett visst antal individer 34

Sammanfattning Ett statistiskt test säger ingenting om hur stor skillnaden är mellan grupperna p-värdet berättar hur stor sannolikhet det är att observera minst en så pass stor skillnad som har observerats, förutsatt att H 0 är sann Konfidensintervallet berättar om osäkerheten och dessa ger lite mer information om skillnaden mellan grupperna 35