Vad är p-värde? P-värde belysande exempel. Bayesians ansats MSG Staffan Nilsson, Chalmers 1

Relevanta dokument
Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Hur man tolkar statistiska resultat

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Hur skriver man statistikavsnittet i en ansökan?

7.5 Experiment with a single factor having more than two levels

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Analytisk statistik. Tony Pansell, optiker Universitetslektor

TAMS65 - Föreläsning 6 Hypotesprövning

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Metod och teori. Statistik för naturvetare Umeå universitet

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Hypotestestning och repetition

TAMS65 - Föreläsning 6 Hypotesprövning

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Följande resultat erhålls (enhet: 1000psi):

Föreläsningsanteckningar till kapitel 9, del 2

Parade och oparade test

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Multipel Regressionsmodellen

Medicinsk statistik III Läkarprogrammet, Termin 5 VT 2016

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

Föreläsning 12, FMSF45 Hypotesprövning

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning G60 Statistiska metoder

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

OBS! Vi har nya rutiner.

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Konfidensintervall, Hypotestest

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

8.1 General factorial experiments

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 15 August 2016, 8:00-12:00. English Version

TMS136. Föreläsning 11

Medicinsk statistik II

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

TMS136. Föreläsning 13

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Samhällsvetenskaplig metod, 7,5 hp

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Statistik 1 för biologer, logopeder och psykologer

Frågor som påverkar utvärderingens design

Test av tidstrender. Anders Grimvall SLU-workshop,

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Matematisk statistik för B, K, N, BME och Kemister

Fråga nr a b c d 2 D

Medicinsk statistik II

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Matematisk statistik för B, K, N, BME och Kemister

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1

MSG830 Statistisk analys och experimentplanering

Elementa om Variansanalys

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Tentamen i matematisk statistik

Temperatur (grader Celcius) 4 tim. och 32 min tim. och 12 min tim. och 52 min tim. och 1 min tim. och 4 min.

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 17 August 2015, 8:00-12:00. English Version

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Föreläsning 5: Hypotesprövningar

EXAMINATION KVANTITATIV METOD vt-11 (110204)

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Icke-parametriska/fördelningsfria test. Finansiell statistik, vt-05. Teckentest. Teckentest. Vi gör observationer för =1,, på variablerna.

Gamla tentor (forts) ( x. x ) ) 2 x1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

F19, (Multipel linjär regression forts) och F20, Chi-två test.

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER OM χ 2 -TEST OCH LIKNANDE. Jan Grandell & Timo Koski

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

Statistik för teknologer, 5 poäng Skrivtid:

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Kapitel 10 Hypotesprövning

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Sekventiellt t-test av skillnaden i väntevärden mellan två normalfördelade stickprov

HYPOTESPRÖVNING sysselsättning

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

import totalt, mkr index 85,23 100,00 107,36 103,76

Föreläsning 5. Kapitel 6, sid Inferens om en population

Statistisk styrka Dimensioneringsberäkningar

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 31 May 2016, 8:00-12:00. English Version

Transkript:

Vad är p-värde? Det betyder: P(så extrema data H 0 är sann) Men det betyder inte P(H 0 är sann) Och därmed är inte P(H a är sann)=1-p så t ex om p=0.01 så är P (H a är sann) 0.99 Väldigt många forskare lyckas konstigt nog forska trots denna vanliga missuppfattning! P-värde belysande exempel Du vet att mördaren är vänsterhänt och att 13% av alla människor är vänterhänta. Du ser en man på gatan H 0 :Mannen är oskyldig H 1 :Mannen är skyldig Test: Kolla om han är vänsterhänt Resultat: Han är vänsterhänt P=0.13 Men det betyder inte P(skyldig)=0.87 Bayesians ansats A priori p=p(skyldig), Evidens E, A posteriori p E Staffan Nilsson, Chalmers 1

Bayesiansk uppdatering A posteriori 0.0 0.1 0.2 0.3 0.4 0.00 0.02 0.04 0.06 0.08 0.10 A priori Är H 0 sann? När vi inte förkastar H 0, säger vi att vi accepterar H 0. Vi har däremot inte visat att H 0 är sann. Vi hade kanske bara för litet stickprov. Titta på konfidensintervallet. Om viktiga skillnader finns där, så ska du kanske öka studien, om inte kan H 0 ur en praktisk aspekt anses vara sann. Multipelinferens Av 20 obeoende test kommer man i genomsnitt att hitta en signifikans även om nollhypoteserna är sanna i alla 20 testen. Med signifikansnivå α=0.05, blir multipla signifikansnivån P(minst ett falskt förkastande)= 1-P(inget falskt förkastande)=1-(1-0.05) 20 =0.64! Staffan Nilsson, Chalmers 2

Bonferroni Om α är den valda signifikansnivån kan man visa att oavsett om testen är oberoende eller ej så är P(minst en falskt förkastad) n α Med individuell nivå α/n kan vi alltså får multipel signifikansnivå α. Detta brukas tillämpas med det ekvivalenta förfarandet Bonferronikorrektion av nominella p-värden för varje test p c =np. Wanted Dead or Alive Bonferroni För 20 test betyder det att nominella p-värdet behöver vara lägre än 0.05/20=0.0025. Ofta är testerna positivt beroende och då är are Bonferronikorektion alldeles för konservativt. Det finns särskilda metoder för t ex ANOVA. För generella fall kan permutationsmetoder tillämpas. Sekventiella test Låt p = P(En rökares barn är pojke) Testa H 0 : p=½ mot H a :p ½ Om vi testar efter varje nytt barn kommer vi med 100% slh att kunna förkasta H 0 trots att den är sann. Why? Staffan Nilsson, Chalmers 3

Multipel testning simultan nivå Ursprungstanken med en multipel signifikansnivån är att man vill skydda en logiskt sammanhängande grupp av hypoteser så att risken att ngn av dem blir falskt signifikant är låg. Man ska inte korrigera hela livets tester! Stort antal test När man testar många hypoteser, där de flesta nollhypoteserna är sanna måste man ovillkorligen korrigera för multipelinferens. Typiska exempel finns inom storskaliga genetiska analyser, masspektrometri mm Ett vanligt dilemma Om du har 15 rimliga test, men inte direkt ser att de hänger samman logiskt får du kanske 3 signifikanta (p=0.02, 0.04, 0.05), men 12 som inte är det. Om du tvingas korrigera blir det (p c =0.3,0.6,0.75). Vad gör den fiffige? Jo, gömmer de 12 icke signifikanta. Gör inte så, du skadar dig själv i längden! Staffan Nilsson, Chalmers 4

Prespecificerade test p c =3*p p c =5*p Experiment Ett experiment en metod som syftar till att bestämma kausalitet till skillnad från en observationsstudie, som bara detekterar samband. I ett experiment strävar man efter studera påverkan på en resultatvariabel och en eller flera kontrollerade faktorer (kategoriska variabler). Försöksobjekten skall vara så identiska som möjligt i alla andra avseenden. Kontrollgrupp Ett experiment innebär ofta ngn slags behandling vars resultat man vill jämföra med icke behandling och eller andra behandlingar. Man skall randomisera till kontroll eller behandling. För människor vill man om möjligt att deltagarna inte ska känna till vilken grupp de tillhör (blinded) och ännu hellre att försöksledaren inte heller gör det (double blinded) Staffan Nilsson, Chalmers 5

Randomiserade block Randomiseringen kan vara fullständing, men man kan också använda sig av randomiserade block. Om två körningar behövs, se till att inte lägga alla kontroller på ena körningen och alla behandingar på den andra för att undvika batcheffekter. 50/50 50/50 Replikation Man ändrar inte paradigm pga ett ynka experiment. Förvissa dig om att det går att replikera av dig själv, av andra och i andra omgivningar. De olika replikationerna kan eventuellt slås samman för att få högre styrka. Antingen med varje experiment som egen faktor i en ANOVA eller genom metaanalys Styrkeberäkningar Styrka (power) = 1-β = P(förkasta H 0 ) beror av Stickprovsstorlek(n) Effektstorlek (medelskillnad, lutning, OR etc) Signifikansnivå(α) Styrkeberäkningar skall utföras före studiestart! Staffan Nilsson, Chalmers 6

Power vs n, given effekt d=0.55 Power vs effekt, givet n Hur väljer man effekt Kvalificerad gissning Preliminära resultat, andra studier Lägsta relevanta effekt Staffan Nilsson, Chalmers 7

Post hoc power Dear Professor Mean, The results of my study were negative, and the journal reviewer insists that I perform a post hoc power calculation. How do I do this? -Jittery Jerry Dear Jittery, Post hoc power calculations are very bad. If it's the only way you can get the paper published, we can do this calculation, but a confidence interval calculation is far better. http://www.childrens-mercy.org/stats/size/posthoc.asp Programvara för power Det finns som tillägg till SPSS, SAS m fl, men också mycket web-baserade program och en bra nedladdningsbar gratisversion: G*Power. Går lätt att simulera också. Staffan Nilsson, Chalmers 8

Staffan Nilsson, Chalmers 9