Hypotestestning och repetition

Relevanta dokument
Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Hur man tolkar statistiska resultat

F3 Introduktion Stickprov

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Medicinsk statistik II

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Parade och oparade test

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

F22, Icke-parametriska metoder.

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Föreläsning 5. Kapitel 6, sid Inferens om en population

Hur skriver man statistikavsnittet i en ansökan?

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

2. Test av hypotes rörande medianen i en population.

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Föreläsning G60 Statistiska metoder

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

, s a. , s b. personer från Alingsås och n b

Gamla tentor (forts) ( x. x ) ) 2 x1

Föreläsning G60 Statistiska metoder

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Fråga nr a b c d 2 D

Lektionsanteckningar 11-12: Normalfördelningen

Föreläsning G60 Statistiska metoder

Uppgift 1. Produktmomentkorrelationskoefficienten

8 Inferens om väntevärdet (och variansen) av en fördelning

SOPA62 - Kunskapsproduktion i socialt arbete

TMS136. Föreläsning 13

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

7.5 Experiment with a single factor having more than two levels

ANOVA Mellangruppsdesign

Föreläsning 12: Regression

Studietyper, inferens och konfidensintervall

Medicinsk statistik II

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Statistik och epidemiologi T5

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

Laboration 4 Statistiska test

Laboration 4 Statistiska test Del I: Standardtest Del II: Styrkefubktion

Medicinsk statistik I

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Statistik. Statistik. Statistik. Lars Walter Fil.lic. Statistik

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

a) Facit till räkneseminarium 3

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

7.3.3 Nonparametric Mann-Whitney test

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

import totalt, mkr index 85,23 100,00 107,36 103,76

EXAMINATION KVANTITATIV METOD vt-11 (110204)

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Repetitionsföreläsning

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

Tentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), STATISTIK

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Föreläsning 11: Mer om jämförelser och inferens

Statistisk försöksplanering

Föreläsning 5 och 6.

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Tentan består av 15 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 33 poäng för att få välgodkänt.

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Tentamen i Statistik, STA A10 samt STA A13 9p 24 augusti 2005, kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

FÖRELÄSNING 8:

Icke-parametriska/fördelningsfria test. Finansiell statistik, vt-05. Teckentest. Teckentest. Vi gör observationer för =1,, på variablerna.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

F9 SAMPLINGFÖRDELNINGAR (NCT

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Transkript:

Hypotestestning och repetition Statistisk inferens Vid inferens använder man urvalet för att uttala sig om populationen

Centralmått Medelvärde: x= Σx i / n Median Typvärde Spridningsmått Används för att beskriva hur bra centralmåttet är på att sammanfatta den information som data ger Dels för att beskriva det insamlade materialet Dels för att generalisera till populationen (inferens)

Spridningsmått, medelvärde Standardavvikelse: ( x x) = n s i i Beskrivning av det insamlade materialet Variansen = s Spridningsmått, medelvärde Medelvärdets medelfel: SEM= s/ n För att dra slutsatser SEM: standard error of the mean, kallas också SE (standard error) 3

z och t Vid stora urval (>50) används z-fördelningen, alltid f.g x µ z = σ n vid mindre urval används t-fördelningen med n- f.g x µ t = s n Konfidensintervall På samma sätt för z och t x ± t( s ) n t fås ur tabell (n-) f.g 4

Standardiserad normalfördelning Hypotestestning H 0 : Anger att det inte finns någon skillnad H : Anger att det finns en skillnad Testet anger sannolikheten för att H 0 är sann Egentligen: sannolikheten att få ett utfall minst så extremt som det uppmätta värdet om H 0 är sann 5

Klassisk hypotestestning Om z-värdet, eller motsvarande, blir mindre än det gränsvärde man använder förkastas H 0 P-värdesbaserad testning När p-värdet har räknats fram bedöms om sannolikheten är tillräckligt låg för att förkasta H 0 Exempel Glödlampor av ett visst märke har i genomsnitt en brinntid på 600 timmar med en standardavvikelse på 00 timmar. En förbättring av produktionen gör att man tror att brinntiden har förlängts. H 0 : µ=600, σ=00 H : µ>600, stickprov n=5, x=660, s=5 z=(660-600)/(00/5)= 3,0 6

7

Exempel, forts Klassiskt test Z kritiskt värde =.64 3.0>.64 H 0 förkastas P-värdesbaserat z=3.0 p=0.003 Mycket liten sannolikhet att H 0 är korrekt 8

Sammanfattning Frågeställningen Frågeställningen översätts till hypoteser Slumpmäsigt urval och beräkningar Nollhypotesen accepteras eller förkastas När man inte vet pop.medelvärde eller om variablerna inte är normalfördelade? Populationsmedelvärdet uppskattas med hjälp av ett urval. Andra metoder än de som bygger på normalfördelningen används, oftast ickeparametriska metoder 9

När pop.medelvärdet är okänt Uppskattas med hjälp av ett urval vars medelvärde används istället för pop.medelvärdet Medför att osäkerheten ökar något varför formlerna måste modifieras Jämförelse mellan två medelvärden, Z-test Parvis test: z = d SE d Gruppvis: ( x z = x ) SE x + SE x 0

Parvis test: Jämförelse mellan två medelvärden, t-test t = d SE d Frihetsgrader, fg: fg = n- Gruppvis: t ( = x x) SE x x Frihetsgrader: fg = n +n - Jämförelse mellan två medelvärden, t-test Gruppvis uträkning av SE x+x ( x x ) t = = ( x x) / SE x + s + n n x s = (( n f.g= n +n - ) s + ( n ) s ( n + n )

Exempel Man är intresserad av att undersöka om det går att förhindra allergi hos barn genom att ge ett kosttillskott dels till mamman före födseln och dels till barnet efter födseln. Hur ska studien genomföras? Det enklaste är att räkna hur många barn som blir allergiker och sedan jämföra det med populationen. Det tar dock flera år innan man kan få något svar, och vilken population ska man jämföra med? För att kunna göra en så begränsad studie som möjligt får bara gravida med känd allergi delta i studien. Vilken är populationen? Dessa delas i två grupper, en som får preparatet och en som inte får det. Varför? För att få preliminära resultat beslutar man sig för att mäta antikroppar, t.ex IgE, på så vis kan man se om preparatet har någon påverkan alls på immunförsvaret.

H 0 : Mängden IgE är lika i bägge grupperna H : Mängden IgE skiljer sig åt (egentligen bör mängden IgE vara mindre i den behandlade gruppen) Utfall: Beh.grupp: x=46, s=505, n=5 Obeh.grupp: x=350, s=73, n=54 z = 46 350 505 ( ) 5 73 + ( ) 54 = 74 7 = 4.67 t = 46 6 5 350 + 54 = 74 = 0.5 s t = (5 )*505 + (54 )*73 5+ 54 = 6 3

z: p<0.000, vid p=0.00 är z=3.9 t: p<0.000, vid p=0.00 och 03 f.g är t=3.39 Slutsats: Mängden IgE skiljer sig åt i de bägge grupperna Icke-parametriska tester Kräver inte någon kunskap om den fördelning som ligger bakom variabeln. Ordinalskala, det måste gå att ordna värdena på något sätt. Fullgoda alternativ till t-test och envägs ANOVA. 4

Gruppvisa data Det vanligaste testet är Mann-Whitney s U- test Det finns ett exakt likadant test som heter Wilcoxon s T-test. (W räknas fram lite anorlunda än U, men tolkningen blir densamma). Datorprogram använder benämningen Mann- Whitney Exempel Två grupper, A: 4, 7, 9, 7 B: 6,, 4, H 0 : Ingen tendens för någon av pop. Att komma före den andra. H : Det finns en sådan tendens. 5

Rankning 4, 6, 7, 9,, 4, 7, A, B, A, A, B, B, A, B För den ena gruppen, t.ex A, räkna hur många B som kommer före varje A. U=0+++3=5 U min =0, U max =n A *n B =6 Ranks VAR0000 N Mean Rank Sum of Ranks VAR0000,00 4 3,75 5,00,00 4 5,5,00 Total 8 Test Statistics b Mann-Whitney U Wilcoxon W Z Asymp. Sig. (-tailed) Exact Sig. [*(-tailed Sig.)] a. Not corrected for ties. VAR0000 5,000 5,000 -,866,386,486 a b. Grouping Variable: VAR0000 6

Parvisa data Vid parvisa data används en variant av Wilcoxon s T-test Man rankar differenserna, därefter summerar man de positiva för sig och de negativa för sig. Den siffra som blir minst används därefter som mått. Datorprogram använder Wilcoxon som benämning på parvisa tester Hypotestestning Statistisk signifikans- vetenskaplig signifikans Ett lågt (signifikant) p-värde uttrycker bara sannolikheten för att man kan ha kommit fram till fel slutsats. Den säger ingenting om betydelsen av storleken på resultatet Vetenskaplig signifikans innebär att skillnaden har någon praktisk betydelse 7

Feltyper: Feltyper Typ I fel (α): Att förkasta H 0 när man får ett signifikant resultat, trots att H 0 är sann (falskt positiv). Samma sak som p-värde Typ II fel (β): Att anta att H 0 är sann när man får ett icke-signifikant resultat, trots att H 0 är falsk (falskt negativ). 8

Beslut H 0 accepteras H 0 förkastas H 0 sann Korrekt beslut Typ I fel Verklig- Pr=α heten H 0 falsk Typ II fel Korrekt beslut Pr=β 9