Hur skriver man statistikavsnittet i en ansökan?

Relevanta dokument
STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Medicinsk statistik II

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Hur man tolkar statistiska resultat

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Statistik och epidemiologi T5

Studietyper, inferens och konfidensintervall

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 5. Kapitel 6, sid Inferens om en population

Gamla tentor (forts) ( x. x ) ) 2 x1

Föreläsning G60 Statistiska metoder

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Medicinsk statistik I

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Föreläsning G60 Statistiska metoder

Hypotestestning och repetition

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

8 Inferens om väntevärdet (och variansen) av en fördelning

Parade och oparade test

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), STATISTIK

, s a. , s b. personer från Alingsås och n b

F22, Icke-parametriska metoder.

EXAMINATION KVANTITATIV METOD vt-11 (110319)

2. Test av hypotes rörande medianen i en population.

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

F3 Introduktion Stickprov

Statistik 1 för biologer, logopeder och psykologer

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Föreläsningsanteckningar till kapitel 9, del 2

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Om statistisk hypotesprövning

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Medicinsk statistik II

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Laboration 4: Hypotesprövning och styrkefunktion

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Lektionsanteckningar 11-12: Normalfördelningen

TMS136. Föreläsning 11

Föreläsning 5: Hypotesprövningar

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Bilaga 6 till rapport 1 (5)

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

FACIT (korrekta svar i röd fetstil)

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

F9 Konfidensintervall

Statistisk styrka Dimensioneringsberäkningar

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

FÖRELÄSNING 8:

Föreläsning G60 Statistiska metoder

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Stockholms Universitet Statistiska institutionen Termeh Shafie

Statistik och epidemiologi T5

Föreläsning 12, FMSF45 Hypotesprövning

Medicinsk statistik I

TMS136. Föreläsning 13

Föreläsning 12: Regression

Konfidensintervall, Hypotestest

Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig (ej fackspråklig) ordbok utan kommentarer. Formelsamling lånas i tentamenslokalen.

Föreläsning 7: Punktskattningar

7.5 Experiment with a single factor having more than two levels

TAMS65 - Föreläsning 6 Hypotesprövning

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Föreläsning 7: Punktskattningar

Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

TAMS65 - Föreläsning 6 Hypotesprövning

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Föreläsning 7: Punktskattningar

Statistik Termin 10, Läkarprogrammet, HT16

Vetenskaplig metod och statistik

Transkript:

Hur skriver man statistikavsnittet i en ansökan? Val av metod och stickprovsdimensionering Registercentrum Norr http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 11 Oktober, 2018 1 / 52

Det här är vi Gabriel Henrik Per Simon 2 / 52

Upplägg 1 Teori 2 Gemensam diskussion 3 Individuella frågor Efter detta pass hoppas jag att: att ni ska veta vad man ska tänka på vilka verktyg som finns vilket stöd som finns 3 / 52

Varför är statistik viktigt? Datainsamling Analys Publicering Planering Statistik Frågeställning 4 / 52

Varför bry sig om statistik i planeringen? Riskerar att dra felaktiga slutsatser Riskerar att inte kunna dra några slutsatser Ej publicerbart Missade anslag 5 / 52

Enligt vetenskapsrådet "Valet av statistisk analys (hypotesprövning) och/eller modellering, kvalitetssäkring eller dylikt ska redovisas tydligt. Kriterier för eventuella interimsanalyser skall anges. Det är inte tillräckligt att ange allmänna begrepp såsom parametrisk, ickeparametrisk metod, deskriptiv statistik eller standardmetoder för analys. Observera, att normalfördelningen kan vara en möjlig sannolikhetsfördelning för symmetriska kvantitativa data men aldrig för data från bedömningar i frågeformulär. Hur hanteras beroende data från upprepade mätningar, till exempel inom grupp eller mellan grupper? Vilka statistiska metoder planeras för komplexa data från frågeformulär och andra subjektiva bedömningar, som genererar ordnade kategoridata? Hur hanteras longitudinella data och bortfall?" 6 / 52

Val av statistisk metod Vilken studiedesign? Vilket är mitt utfall? Hur kommer mitt data se ut? Val av statistisk metod 7 / 52

Design Studieupplägg Experiment Observationsstudie Randomiserad klinisk studie Longitudinell studie Tvärsnittsstudie Kohortstudie Fall-kontroll-studie 8 / 52

Utfall Skillnader Risker Antalet händelser Tid till händelse 9 / 52

Datakvalitet Vilket bortfall bör vi räkna med? Mätfel Slumpmässiga Systematiska Hur många patienter kan vi få in? 10 / 52

Primary Outcome Särskilt viktigt i kliniska prövningar Det vi är mest intresserade av att undersöka Studien dimensioneras för dessa utfall Ska hållas nere i antal Kan behöva överväga justering för multipla jämförelser Gärna kontinuerlig (om möjligt) 11 / 52

Analysplanen Strukturera syftet i frågeställningar. Vad ska studeras och på vilka? Studiedesign Variabler och mätning Dimensionering Statistisk analysplan Replikerbar 12 / 52

Statistiska metoder Det är lätta köra fast i gamla hjulspår när det gäller val av statistisk metod. Metod utifrån frågeställning och data. 13 / 52

Repetition och terminologi I de flesta situationer vi ställs inför har vi inte tillgång till hela populationen vi vill undersöka. Vi tar då ett stickprov från den population vi önskar undersöka. Det sanna värdet Skattning av det sanna värdet Genomsnitt Proportion Standardavvikelse Medelvärde Proportion Standardavvikelse Populationen Stickprov 14 / 52

Lägesmått Vi skattar exempelvis det medelvärdet värdet för populationen med medelvärdet i stickprovet. Har vi en skev fördelning av mätvärden exempelvis operationstid så är det bättre att använda medianen som lägesmått. 15 / 52

Spridningsmått Standardavvikelsen är ett mått på hur stor spridningen mellan observationerna i stickprovet är. Standard error är ett mått på osäkerheten i en punktskattning. Anger precisionen i vår skattning. Med hjälp av standard error kan vi beräkna bland annat konfidensintervall. Om vi upprepar ett försök tillräckligt många gånger kommer ett 95% konfidensintervall att täcka det sanna medelvärdet 95% av gångerna. 16 / 52

Konfidensintervall 170 180 190 170 180 190 17 / 52

Precision 120 80 40 20 10 162 165 168 171 174 18 / 52

Varför är power viktigt? För lite data Missar intressanta resultat Kostnad För mycket data Kostnad Ej etiskt OBS! Endast relevant före en studie är genomförd! 19 / 52

Vägen dit Vilken typ studiedesign? Vilket är mitt utfall? Hur kommer mitt data se ut? Val av statistisk metod Stickprovsdimensionering 20 / 52

Vad är power? Bakgrund Konceptet med power bygger på hypotesprövning. En nollhypotes som ska vara falsifierbar och ha en mothypotes. Nollhypotesen: Det finns ingen skillnad mellan grupperna H 0 : µ 1 µ 2 = 0 Mothypotesen: Det finns en skillnad mellan grupperna H 1 : µ 1 µ 2 0 Vad är power? Sannolikheten att korrekt förkasta en falsk nollhypotes (när den alternativa hypotesen är sann) 21 / 52

Hypotesprövning 2.5% 2.5% 22 / 52

Slutsats utifrån test Verkligheten Nollhypotesen sann Nollhypotesen falsk Ej förkasta nollhypotesen Korrekt Typ ll-fel Förkasta nollhypotesen Typ l-fel Korrekt Power = 1- sannolikheten för typ ll-fel 23 / 52

Typ-l Typ-ll 24 / 52

Typ-l fel Typ-l felets storlek är lätt att kontrollera genom signifikansnivån. En signifikansnivå på 5% innebär att vid tillräckligt många upprepningar av ett försök kommer att upptäcka en signifikant skillnad som i verkligheten inte exsisterar i 5% av fallen. Dvs vi förkastar nollhypotesen. 25 / 52

Exempel Antag att vi utför ett experiment där vi undersöker om tuggummituggande är associerat med matstrupscancer. Från vårat experiment drar vi slutsatsen att tuggummituggande ger en högre risk för matstrupscancer. Om det inte stämmer med verkligheten har vi gjort oss skyldiga till ett typ-l fel. Slutsats utifrån test Verkligheten Nollhypotesen sann Nollhypotesen falsk Ej förkasta nollhypotesen Korrekt Typ ll-fel Förkasta nollhypotesen Typ l-fel Korrekt 26 / 52

Exempel Antag att vi istället drar slusatsen att tuggummituggande inte ger en högre risk för matstrupscancer. Om det stämmer med verkligheten har vi inte gjort oss skyldiga till något fel. Slutsats utifrån test Verkligheten Nollhypotesen sann Nollhypotesen falsk Ej förkasta nollhypotesen Korrekt Typ ll-fel Förkasta nollhypotesen Typ l-fel Korrekt 27 / 52

Tyvärr är det betydligt svårare att kontrollera typ II-felet. Typ II-felet beror på flera variabler: Storlek på den skillnad vi önskar mäta Spridningen i materialet (standardavvikelsen) Signifikansnivån Antalet patienter Oftast är det mer intressant att beräkna hur många patienter som behövs för att uppnå en viss power. 28 / 52

Exempel Antag att vi utför ett experiment där vi undersöker om rökning är associerat med matstrupscancer. Från vårat experiment drar vi slutsatsen att rökning inte ger en högre risk för matstrupscancer. Om det inte stämmer med verkligheten har vi gjort oss skyldiga till ett typ-ll fel. Slutsats utifrån test Verkligheten Nollhypotesen sann Nollhypotesen falsk Ej förkasta nollhypotesen Korrekt Typ ll-fel Förkasta nollhypotesen Typ l-fel Korrekt 29 / 52

Exempel Antag att vi istället drar slusatsen att rökning ger en högre risk för matstrupscancer. Om det stämmer med verkligheten har vi inte gjort oss skyldiga till något fel. Slutsats utifrån test Verkligheten Nollhypotesen sann Nollhypotesen falsk Ej förkasta nollhypotesen Korrekt Typ ll-fel Förkasta nollhypotesen Typ l-fel Korrekt 30 / 52

Storlek på skillnaden Effektstorlek Spridning Stickprovsstorlek (n) Power Signifikansnivå 31 / 52

Storlek på skillnaden Definiera gränsen för intressanta skillnader! Ofta har vi en tidigare studie att luta oss mot då vi uppskattar den förväntade skillnaden. En fråga vi måste ställa oss är - Hur stor måste skillnaden vara för att den ska vara kliniskt relevant? Det kan vara så att vi är intresserade av att hitta mindre skillnader än vad som uppmäts i pilotstudien. 32 / 52

Spridningen Om det finns en tidigare studie kan vi hämta standardavvikelsen från denna studie. Finns ingen sådan får vi uppskatta standardavvikelsen. Ett alternativ är att arbeta med olika scenarion och undersöka hur stickprovsstorleken förändras med standardavvikelsen. 33 / 52

Effektstorlek Beroende på vilken statistisk metod man valt så beräknas effektstorleken på olika sätt olika. Ett exempel är Cohen s d men det finns väldigt många olika mått. Gemensamt är att de är beroende av storleken på skillnaden och på spridningen. Överskattas spridningen så underskattar vi inte antalet som behövs. 34 / 52

Exempel Antag att vi vill testa hur effektiv en behandling är på att sänka det diastoliskt blodtryck i en grupp patienter. Är skillnaden mindre än 5mmHG mellan före och efter behandling bedöms skillnaden som irrelevant. Vi har dock ingen aning om hur stor spridningen är. Vi beräknar hur många patienter som krävs för att nå upp till 80% power på 5% signifikansnivå. 35 / 52

Exempel Antal 50 100 150 Givet en skillnad på 5mmHg 5 10 15 20 Standardavvikelse 36 / 52

En varning! Effect size d Small 0.20 Medium 0.50 Large 0.80 37 / 52

Övriga komponenter Mothypotesen Kan vara enkelsidig eller dubbelsidig. Vad vi väljer här beror på om vi testar olikhet eller om vi redan på förhand vet vilken grupp som kommer ha högre mätvärden. Är vi osäkra ska vi alltid välja dubbelsidigt. För samma power kräver ett dubbelsidigt test fler patienter. Signifikansnivå Sannolikheten för typ-i fel. Vanligtvis 0.05. Lägre signifikansnivå kräver fler patienter för att uppnå samma power. Power Vanligtvis dimensioneras stickprovet för att uppnå en power på 80% men 90% förekommer också. 38 / 52

Sammanfattning Hur stor stickprovstorlek som behövs beror på flera saker 1 Power 2 Signifikansnivån 3 Effect size 4 Metod Power sätts oftast till 80% och stickprovet dimensioneras utifrån det. Stickprovet dimensioneras för ett fixt värde på signifikansnivå, en lägre signifikansnivå kräver en större stickprovsstorleken. Desto mindre skillnader vi vill kunna upptäcka, desto större behöver stickprovet vara. Vissa metoder ger högre power än andra. 39 / 52

Exempel Antag att vi vill testa hur effektiv en ny behandling är på att sänka det diastoliskt blodtryck. Vi planerar ge en grupp placebobehandling och en grupp aktiv behandling. Innan behandlingen är blodtrycket är 100mmHg i båda grupperna. Vi vet från en tidigare studie att vi kan förvänta oss en standardavvikelse på 25mmHG. Nu vill vi veta hur många patienter vi behöver inkludera för att upptäcka en skillnad på 5mmHg. Med andra ord om blodtrycket i gruppen som får behandling är 95mmHg eller mindre vill vi upptäcka det med en power på 80 %. Vi vill testa Nollhypotesen: Ingen skillnad Mothypotesen: Blodtrycket är lägre efter behandling 40 / 52

Vi är bara intresserad av fallet mindre än 95mmHg. Således är det ett ensidigt test. Om vi använder signifikansnivån 5% behövs 310 patienter i vardera grupp för uppnå en power på 80 %. 41 / 52

Fortsättning Om blodtrycket efter behandling är 90mmHG? I detta fall behöver vi endast 78 patienter i vardera grupp för uppnå en power på 80 %. 42 / 52

Ett annat sätt att beräkna stickprovsstorleken Ett annat alternativ för att beräkna stickprovsstorleken är utifrån vilken precision vi behöver ha. Önskad precision 120 80 40 20 10 162 165 168 171 174 43 / 52

Hur går det till rent praktiskt? För enklare fall: G*Power http://powerandsamplesize.com/ https://www.sealedenvelope.com För svårare fall... 44 / 52

Exempel G*Power 45 / 52

powerandsamplesize 46 / 52

sealedenvelope 47 / 52

Hur beskriver man det i text? 1 Beskriv vilken metod ni valt och varför den passar. 2 Baserat på vilken metod ni valt beskriv vilken information som ligger till grund för era beräkningar och vad ni kommit fram till. 48 / 52

Exempel metod Resultatet från behandlingen av det diastoliska blodtrycket kommer analyseras med ett parat t-test. Detta är lämpligt då vi mäter samma individer före och efter behandling (matchade par) och variabeln vi mäter är kontinuerlig. 49 / 52

Exempel power Stickprovsstorleken beräknades med ett dubbelsidigt parat t-test på en 5% signifikansnivå. I en tidigare studie har vi hittat en genomsnittlig skillnad på 10mmHG mellan för och efter mätningar och en standardavvikelse på 15mmHG. Eftersom att vi är intresserade av att hitta mindre skillnader än 10mmHG så kommer vi räkna med en skillnad på 5mmHG (vilket vi bedömer vara den minsta skillnaden av kliniskt intresse). Denna skillnad tillsammans med den observerade standardavvikelsen på 15mmHG användes för att beräkna stickprovsstorlek. En stickprovsstorlek på 144 patienter behövs för att uppnå en power på 80%. 50 / 52

Sammanfattning Detta måste ingå i en ansökan: Frågeställning Primary outcome Studiedesign Statistisk analysplan Stickprovsdimensionering Datainsamling Analys Publicering Planering Statistik Frågeställning 51 / 52

Om ni vill ha hjälp med en ansökan? Genom ALF-finansiering har vi möjlighet att hjälpa er. Alla kliniska forskare som planerar en klinisk studie, och avser att söka forskningsanslag från forskningsråd och andra större nationella finansiärer omfattas. http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 52 / 52