Fiasiell Statistik (GN, 7,5 hp,, HT 8) Föreläsig 5 HYPOTESPRÖVNING (LLL Kap 11) Departmet of Statistics (Gebreegus Ghilagaber, PhD, Associate Professor) Fiacial Statistics (Basic-level course, 7,5 ECTS, Autum 8) 1 Vad är hypotes? E hypotes är ett påståede (atagade) om ett populatiosparameter: populatiosmedelvärde Exempel: Geomsittlig måadsutgift för mobiltelefo i Stockholm är = 3 kroor populatiosproportio Exempel: Adel vuxa i Stockholm med mobiltelefo är p =.68
Nollhypotese, H är de (umerisk) påståedet som skall testas: H : = 3 Hadlar om populatiosparameter (ite om stickprovsstatistik) H : = 3 H :X = 3 Nollhypotese, H Hävisar till status quo Vi börjar med att ata att ollhypotese är sa iocet util prove guilty Ka förkastas eller ej
Mothypotese, H 1 Motsats till ollhypotese Ifrågasätter status quo Ka stödjas av data eller ej Allmät är de hypotes som forskare (utredare) försöker stödja. Nollhypotese, H & Mothypotese, H 1 Det fis e asymmetri i behadlige av H och H 1 i statistisk hypotesprövig. Som H väljer vi de hypotes som vi i det lägsta håller fast vid. Vi kräver extra starkt stöd frå observerade data för att H skall förkastas. Bevisbörda ligger hos de som förespråkar H 1. Ofta iebär H ågot i stil med ige förädrig, ige effekt, ige skillad, meda H 1 kaske är de ur tillämpigssypukt djärvare och mer itressata hypotese.
Hypotesprövigsprocess Är Påståede: Populatiosmedelålder är 5. (Nollhypotes: H : = 5 ) X = Trolig/rimlig om = 5? Om ite trolig, FÖRKASTA Nollhypotese Ata att Stickprovsmedelålder är : X = Populatio Dra ett OSU stickprov Stickprov När (varför) förkastas H? Sampligsfördelige för X Om det är orimlig att få ett stickprovsmedelvärde på... = 5 om H är sa... är egetlige populatiosmedelvärde var 5 X... då förkastar vi ollhypotese som påstår att = 5.
Sigifikasivå, α Defiieras de föga trolig värdea av ett stickprovstatistik om ollhypotese är sa Defiierar sampligfördeliges rejectio regio Beteckas med α, Typiska värde är.1,.5, eller.1 Väljs av kosumete eller forskare i förväg Bestämmer de kritiska värdea av ett test variabel Sigifikasivå, α Sigifikasivå = α H : = 3 H 1 : 3 H : 3 H 1 : > 3 H : 3 H 1 : < 3 tvåsidig test Esidig test Esidig test α α/ α / α Kritiska värde Rejectio regio
Fel vid Hypotesprovig Typ I-fel görs är ma förkastar e sa hypotes asedd (allmät) som mer alvarligt Saolikhete av typ I-fel beteckas med α kallas också för testets sigifikasivå (1-α) kallas för kofidesivå Väljs av kosumete eller forskare i förväg Fel vid Hypotesprovig Typ II-fel görs är ite förkastar e falsk hypotes Saolikhete av typ II-fel beteckas med Saolikhete att förkasta e falsk hypotes är (1- ) och kallas för styrka av testet. Alltså mäter testets styrka förmåga att upptäcka ett falsk hypotes.
Utfall och Saolikheter Möjliga utfall vid hypotesprövig Beslut Ej Förkasta H Verklighete H sa Ige fel (1 - ) α H ite sa Typ II-fel ( ) Utfall (Saolikhet) Förkasta H Typ I-fel ( ) α Ige fel ( 1 - ) Hypotesprövig för medelvärde ( Käd) Kovertera stickprovsresultat ( x ) till ett z-värde Hypotesprövig för µ Käd Om vi vill testa H : = H : > 1 (Ata att populatioe är ormal) Okäd Beslutsregel: x Förkasta H om z = > z
x Förkasta H om z = > Beslutsregel z H : = H 1 : > Alterativregel: Förkasta H om X > + Z / α Z x Förkasta ite H + z z Förkasta H Kritiskvärde Exempel: VD vid ett telefoföretag aser att de geomsittliga måadsutgifte för telefo har ökat, och är u på över $5 per måad. Företaget vill testa VD:s påståede. (ata att σ = 1 är käd) Hypotesera: H : 5 H 1 : > 5 är ite över $5 per måad är större ä $5 per måad (d.v.s., det fis tillräckligt bevis för att stödja VD:s påståede
Exempel: Hitta Rejectio Regio Ata att α =.1 har valts för testet Hitta rejectio regio: Förkasta H α =.1 Ite Förkasta H 1.8 Förkasta H x Förkasta H om z = > 1.8 / Exempel: Resultat frå stickprov Ata att ett stickprov med 64 observatioer gav följäde resultat: = 64, x = 53.1 (σ=1 är reda käd) Då får vi, x 53.1 5 z = = =.88 1 64
Exempel: Beslut & tolkig Förkasta H α =.1 Ej Förkasta H z =.88 1.8 Förkasta H Förkasta ej H eftersom z =.88 < 1.8 (och ligger i No-rejectio regio) d.v.s: det fis ite tillräckligt bevis som stödjer påståedet att medelvärdet är över $5. Esidig mothypoteser H : 3 H 1 : > 3 E kritiskvärde (i övre svase ) H : 3 H 1 : < 3 E kritiskvärde (i udre svase )
Övre-svas Tester H : 3 H 1 : > 3 α Z x Ej Förkasta H z Förkasta H Kritiskvärde Udre-Svas Tester H : 3 H 1 : < 3 α Förkasta H Förkasta ej H -z α Z x Kritiskvärde
Tvåsidig tester H : = 3 H 1 : 3 α/ α/ 3 x Förkasta H Förkasta ej H Förkasta H -z α/ +z α/ z Lägre kritiskvärde Övre kritiskvärde Tvåsidig test: Exempel Testa påståedet att geomsittlig # TV per hushåll i Stockholm är 3. (ata =.8) Formulera hypotesera H : = 3, H 1 : 3 (tvåsidig alterativ) Specificera öskad sigifikasivå ata att vi väljer α =.5 Bestäm om stickprovsstorlek vi öjer oss med = 1
Tvåsidig test: Exempel Bestäm om lämplig testvariable eftersom är käd aväder vi z test Irätta kritiska värdea För α =.5 är kritiska värdea ±1.96 Samla data och beräka värdet på testvariabel ata att vi fick följäde resultat: = 1, x =.84 ( =.8 är reda käd) Då blir värdet på testvariabel: X.84 3.16 z = = = =..8.8 1 Tvåsidig test: Exempel Ligger värdet på testvariabel i rejectio regio? Förkasta H om z < -1.96 eller z > 1.96; aars förkasta ej H α =.5/ Förkasta H Förkasta ej H -z = -1.96 +z = +1.96 α =.5/ Förkasta H Här, z = -. < -1.96, så värdet på testvariabel är iom rejectio regio.
Tvåsidig test: Exempel Beslut och tolkig α =.5/ α =.5/ Förkasta H Förkasta ej H Förkasta H -z = -1.96 -. +z = +1.96 Eftersom z = -. < -1.96, vi förkastar ollhypotese och dra slutsatse att det fis tillräckligt bevis som stödjer påståedet att geomsittlig # TV per hushåll är ite 3. Hypotesprövig för medelvärde ( Okäd) Hypotesprövig för µ Käd Okäd H : = H : > 1 (ata populatioe är ormal) Beslutregel: x om t = t-1, Förkasta H s >
Hypotesprövig för medelvärde ( Okäd) Tvåsidig test: H : = H : 1 (Ata populatioe är ormal) Beslutregel: x x Förkasta H > s s om t = < t -1, / eller om t = t -1, / Exempel: Tvåsidig (σ Okäd) Medelpris på ett hotellrum i NY påstås vara $168 per att. Ett stickprov på 5 hotellrum gav x = $17.5 och s = $15.4. Testa påståedet på α =.5 sigifikasivå (ata att populatiosfördelige är ormal) H : = 168 H 1 : 168
Exempel: Tvåsidig (σ Okäd) H : = 168 H 1 : 168 α/=.5 α/=.5 α =.5 = 5 σ är okäd, därför aväder vi t-statistik Kritiskvärde: t 4,.5 = ±.639 Förkasta H Förkasta ej H : ite tillräckligt bevis att medelpriset per hotellrum ite är $168. Förkasta H t -1, / Förkasta ej H -t -1, / -.639.639 x s 17.5 168 15.4 5 1.46 t 1 = = = 1.46 Hypotesprövig för proportio Sampligfördelige för pˆ approximativt ormal, därför aväder vi z-statistik som testvariabel z = pˆ P P (1 P )
Test för Proportio: Exempel Ett udersökigsföretag påstår att edast 8% av de tillfrågade svarar. För att testa detta, ett stickprov på 5 post skickades och 5 svarade. Testa hypotese på α =.5 sigifikasivå. P skattas med pˆ = 5/5 =.5 P(1 - P) = (5)(.5)(.95) = 3.75 > 9 Test för Proportio: Exempel H : P =.8 H 1 : P.8 α =.5 = 5, pˆ =.5 Kritiskvärde: ± 1.96 Reject.5 -.47-1.96 Reject 1.96 z =.5 z Testvariabel: pˆ P.5.8 = = P (1 P ).8(1.8) 5 Beslut: Förkasta H på α =.5 Slutsats: Det fis tillräckligt bevis för att förkasta företagets påståede på 8% svar..47
Hypothesis Tests of oe Populatio Variace Populatio Variace Goal: Test hypotheses about the populatio variace, If the populatio is ormally distributed, χ 1 ( 1)s = follows a chi-square distributio with ( 1) degrees of freedom Cofidece Itervals for the Populatio Variace Populatio Variace The test statistic for hypothesis tests about oe populatio variace is 1 = ( 1)s
Decisio Rules: Variace Populatio variace Lower-tail test: H : H 1 : < Upper-tail test: H : H 1 : > Two-tail test: H : = H 1 : α α α/ α/ 1,1 α 1, α 1,1 α / 1, α / Reject H if Reject H if Reject H if < > > 1 1,1 α 1 1, α 1 or < 1 1, α / 1,1 α / Hypothesis Tests for Two Variaces Tests for Two Populatio Variaces F test statistic Goal: Test hypotheses about two populatio variaces H : x y H 1 : x < y H : x y H 1 : x > y Lower-tail test Upper-tail test H : x = y H 1 : x y Two-tail test The two populatios are assumed to be idepedet ad ormally distributed
Hypothesis Tests for Two Variaces Tests for Two Populatio Variaces F test statistic The radom variable s F = s x y / / x y Has a F distributio with ( x 1) umerator degrees of freedom ad ( y 1) deomiator degrees of freedom Deote a F value with ν 1 umerator ad ν deomiator degrees of freedom by Test Statistic Tests for Two Populatio Variaces The critical value for a hypothesis test about two populatio variaces is x F = F test statistic sy s where F has ( x 1) umerator degrees of freedom ad ( y 1) deomiator degrees of freedom
Decisio Rules: Two Variaces Use s x to deote the larger variace. H : x y H 1 : x > y α H : x = y H 1 : x y α/ Do ot reject H F x 1, y 1, Reject H F Do ot reject H F x 1, y 1, / Reject H F Reject H if F > F x 1, y 1, rejectio regio for a twotail test is: Reject H if F > F x 1, y 1, / where s x is the larger of the two sample variaces Example: F Test You are a fiacial aalyst for a brokerage firm. You wat to compare divided yields betwee stocks listed o the NYSE & NASDAQ. You collect the followig data: NYSE NASDAQ Number 1 5 Mea 3.7.53 Std dev 1.3 1.16 Is there a differece i the variaces betwee the NYSE & NASDAQ at the α =.1 level?
F Test: Example Solutio Form the hypothesis test: H : x = y (there is o differece betwee variaces) H 1 : x Degrees of freedom: Numerator (NYSE has the larger stadard deviatio): x 1 = 1 1 = d.f. Deomiator: y 1 = 5 1 = 4 d.f. y (there is a differece betwee variaces) Fid the F critical values for α =.1/: F 1, 1, / x = F, y 4,.1/ =.3 The test statistic is: s = s F Test: Example Solutio 1.3 = 1.16 F x = y 1.56 H : x = y H 1 : x y α/ =.5 F = 1.56 is ot i the rejectio regio, so we do ot reject H Do ot reject H F, 4,.1/ = Reject H.3 F Coclusio: There is ot sufficiet evidece of a differece i variaces at α =.1