Standardfel (Standard error, SE) Anta vi har ett stickprov X 1,,X n där varje X i has medel = µ och std.dev = σ. Då är Det sista kalls standardfel (eng:standard error of mean (SEM) eller (SE) och skattas med s/ n SD eller SE Standardavvikelsen (SD) är alltså ett mått variabiliteten i stickprovet och därmed en skattning på variabiliteten i populationen. Som sådan är den alltid intressant. Standardfelet (SE) beskriver precisionen av skattningen av populationsmedelvärdet. Intervallskattning Orimligt att tänka sig att stickprovmedel sammanfaller med µ, men troligt att det ligger nära. Anta ett stickprov från en normalfördelning. Vi konstruerar ett konfidensintervall (CI) som säger att i 100(1-α)% (oftast 95%) av alla stickprov från en normalfördelning så finns populationsmedelvärdet µ i det stokastiska intervallet Staffan Nilsson, Chalmers 1
Intervallskattning Man säger att konfidensgraden är 95%, vilket motsvarar α=0.05. Konstanten ska då vara z 0.025 = 1.96. Oftast känner man förstås inte till σ utan skattar det med s. Om n är stort så gör det inte så stor skillnad. Om n är stort spelar också fördelningen mindre roll eftersom stickprovsmedelvärdet ändå är ungefär normalfördelad. Intervallskattning exempel Av 717 kvinnor skattades medellängden till 164.60 cm med s=6.05cm Ett 95% CI för populationsmedel (µ) är 164.6±1.96 x 6.05/ 717 (164.16,165.04) Z 0.05/2 T fördelning Z är standard normalfördelad om X är normalfördelad, men det kan ju inte gärna T vara eftersom σ är en konstant, medan s är en stokastisk variabel. T har istället en t-fördelning med n-1 frihetsgrader (på eng degrees of freedom, df) Staffan Nilsson, Chalmers 2
Students t-fördelning (familj) N(0,1) t with df t (5) t (1) Intervallskattning med t-förd T-fraktilen beror precis som z-fraktilen av α, men även av n. Ju större n desto lägre värde. Värdena kan avläsas i Table A5 för några värden på α. Hypotesprövning Formulera två hypoteser: H a (el H 1 ): Alternativhypotesen el Mothypotesen el Forskningshypotesen. Typiskt det vi vill påvisa. (t ex en behandling har effekt) H 0 : Nollhyposen (t ex en behandling har ingen effekt) Med parametrar t ex H 0 :µ=0 vs H a :µ 0 Staffan Nilsson, Chalmers 3
Beslut Baserat på insamlade data ska vi fatta ett av två beslut - Förkasta H 0 om starka bevis emot - Acceptera H 0 om inga starka bevis emot Test statistika En test statistika är en funktion av observationerna som används för att fatta beslut om att förkasta eller acceptera H 0. För de värden som mest tyder på H a kan vi förkasta H 0 Ex: Vi förkastar H 0 att en tärning är OK om det blir för många sexor Beslutskonsekvenser Beslut Acceptera Förkasta H 0 H 0 H 0 sann OK Typ I fel Tillstånd H 1 sann Typ II fel OK Staffan Nilsson, Chalmers 4
Fel Beteckna de två felsannolikheterna α=p(typ I fel), β=p(typ II fel) Den vetenskapliga traditionen är att första fokusera på att α ska vara litet och därefter bekymra sig om β. jmf P(döma en oskyldig) mot P(fria en skyldig) Signifikansnivå När beslutsregeln är fastställd kallas α= P(Typ I fel)=p(förkasta H 0 H 0 sann) Traditionellt väljer man ett litet önskat α, oftast 0.05, sen anpassar man regeln så P(Typ I fel)=α eller P(Typ I fel) α Enstickprovs t-test Teststatistika: Förkasta om Staffan Nilsson, Chalmers 5
Enstickprovs t-test -exempel Önskad Glycerol conc 4 mg/ml. Välj α=0.05 H 0 : µ=4, H a µ 4 X: 2.67, 4.62, 4.14, 3.81, 3.83 Kritiskt värde: Vi kan ej förkasta H 0 på nivå 0.05, ty 0.58<2.776 P-värde Definition: p-värdet är sannolikheten, under antagandet att H 0 är sann, att få ett värde på teststatistikan som talar minst lika mycket emot H 0 som det vi observerat. P-värde exempel Låt b vara sannolikheten att en färgblind person är en pojke H 0 :b = ½ (dvs inga könsskillnader) H 1 :b ½ I ett stickprov på 10 färgblinda personer räknar vi antalet pojkar B. Vi har att B~bin(10,b) och om H 0 är sann B~bin(10,½). Vi får resultatet B=9 och p-värde = p(9)+p(10)+p(1)+p(0)=0.0215 Staffan Nilsson, Chalmers 6
Test av proportioner (stora n) H 0 : p=p 0 testas med Som är approximativt standard normalfördelad om n min(p 0,1-p 0 )>=10 Dualitet mellan test och CI Vi kan förkasta H 0 :µ=µ 0 vs H 1 :µ µ 0 på α=0.05 Om och endast om 95% CI för µ inte täcker µ 0. medel µ 0 CI Styrka Det är viktigt att undvika typ I fel, men vi måste bry oss om typ II felen också. β är en funktion av parametern β(µ). Man pratar oftast om testets styrka (1- β), som man vill ska vara hög. Vetenskap handlar om att skaffa ny kunskap! Staffan Nilsson, Chalmers 7
Tvåsidigt vs enkelsidigt test Alternativhypotesen måste bestämmas innan man tittat på data. Använd enkelsidiga test om den andra riktningen är - omöjlig - otrolig - ointressant I annat fall använd ett tvåsidigt test Språklig anmärkning Bara läroböcker i statistik skriver Vi kunde förkasta nollhypotesen att Demidekk och Nordsjö har samma torktid på signifikansnivå 5%. I en vetenskaplig artikel skriver man nåt i stil med Det var signifikant snabbare torktid med Demidekk (20h) jämfört med Nordsjö (36h) (p=0.004). Staffan Nilsson, Chalmers 8