Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 5

Relevanta dokument
Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

1. Test av anpassning.

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

S0005M V18, Föreläsning 10

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

F10 ESTIMATION (NCT )

Föreläsning G04: Surveymetodik

Föreläsning G70 Statistik A

English Version P (A) = P (B) = 0.5.

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

TMS136: Dataanalys och statistik Tentamen med lösningar

95%-igt konfidensintervall för andel kalsongbärare i populationen: Slutsats: Med 95% säkerhet finns andelen kalsongbärare i intervallet 38-48%

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

4.2.3 Normalfördelningen

ANOVA I: Kap 14. Åldersgrupper -30 år år 51- år. Totalt n k N = 9 X k X = s k s = 8.

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Föreläsning G70 Statistik A

a) Beräkna E (W ). (2 p)

2. Konfidensintervall för skillnaden mellan två proportioner.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Föreläsning G60 Statistiska metoder

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Föreläsning 5. Kapitel 6, sid Inferens om en population

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Statistik 1 för biologer, logopeder och psykologer

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Borel-Cantellis sats och stora talens lag

Föreläsningsanteckningar till kapitel 9, del 2

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Statistik för bioteknik SF1911 // KTH Matematisk statistik // Formler och tabeller. 1 Numeriska sammanfattningar (statistikor)

FÖRELÄSNING 8:

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

θx θ 1 om 0 x 1 f(x) = 0 annars

Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

Introduktion till statistik för statsvetare

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Datorövning 2 Fördelningar inom säkerhetsanalys

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Multipel Regressionsmodellen

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Lycka till! I(X i t) 1 om A 0 annars I(A) =

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Grundläggande matematisk statistik

TMS136. Föreläsning 13

2. Test av hypotes rörande medianen i en population.

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

TAMS65 - Föreläsning 6 Hypotesprövning

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Jag läser kursen på. Halvfart Helfart

Hur man tolkar statistiska resultat

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

TAMS65 - Föreläsning 6 Hypotesprövning

Statistik en introduktion

Jag läser kursen på. Halvfart Helfart

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Avd. Matematisk statistik

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

TMS136. Föreläsning 11

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Tentamen MVE301 Sannolikhet, statistik och risk

Inledande matematisk analys. 1. Utred med bevis vilket eller vilka av följande påståenden är sana:

Kapitel 10 Hypotesprövning

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

z Teori z Hypotesgenerering z Observation (empirisk test) z Bara sanningen : Inga falska teser z Hela sanningen : Täcker alla sanna teser

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Transkript:

Fiasiell Statistik (GN, 7,5 hp,, HT 8) Föreläsig 5 HYPOTESPRÖVNING (LLL Kap 11) Departmet of Statistics (Gebreegus Ghilagaber, PhD, Associate Professor) Fiacial Statistics (Basic-level course, 7,5 ECTS, Autum 8) 1 Vad är hypotes? E hypotes är ett påståede (atagade) om ett populatiosparameter: populatiosmedelvärde Exempel: Geomsittlig måadsutgift för mobiltelefo i Stockholm är = 3 kroor populatiosproportio Exempel: Adel vuxa i Stockholm med mobiltelefo är p =.68

Nollhypotese, H är de (umerisk) påståedet som skall testas: H : = 3 Hadlar om populatiosparameter (ite om stickprovsstatistik) H : = 3 H :X = 3 Nollhypotese, H Hävisar till status quo Vi börjar med att ata att ollhypotese är sa iocet util prove guilty Ka förkastas eller ej

Mothypotese, H 1 Motsats till ollhypotese Ifrågasätter status quo Ka stödjas av data eller ej Allmät är de hypotes som forskare (utredare) försöker stödja. Nollhypotese, H & Mothypotese, H 1 Det fis e asymmetri i behadlige av H och H 1 i statistisk hypotesprövig. Som H väljer vi de hypotes som vi i det lägsta håller fast vid. Vi kräver extra starkt stöd frå observerade data för att H skall förkastas. Bevisbörda ligger hos de som förespråkar H 1. Ofta iebär H ågot i stil med ige förädrig, ige effekt, ige skillad, meda H 1 kaske är de ur tillämpigssypukt djärvare och mer itressata hypotese.

Hypotesprövigsprocess Är Påståede: Populatiosmedelålder är 5. (Nollhypotes: H : = 5 ) X = Trolig/rimlig om = 5? Om ite trolig, FÖRKASTA Nollhypotese Ata att Stickprovsmedelålder är : X = Populatio Dra ett OSU stickprov Stickprov När (varför) förkastas H? Sampligsfördelige för X Om det är orimlig att få ett stickprovsmedelvärde på... = 5 om H är sa... är egetlige populatiosmedelvärde var 5 X... då förkastar vi ollhypotese som påstår att = 5.

Sigifikasivå, α Defiieras de föga trolig värdea av ett stickprovstatistik om ollhypotese är sa Defiierar sampligfördeliges rejectio regio Beteckas med α, Typiska värde är.1,.5, eller.1 Väljs av kosumete eller forskare i förväg Bestämmer de kritiska värdea av ett test variabel Sigifikasivå, α Sigifikasivå = α H : = 3 H 1 : 3 H : 3 H 1 : > 3 H : 3 H 1 : < 3 tvåsidig test Esidig test Esidig test α α/ α / α Kritiska värde Rejectio regio

Fel vid Hypotesprovig Typ I-fel görs är ma förkastar e sa hypotes asedd (allmät) som mer alvarligt Saolikhete av typ I-fel beteckas med α kallas också för testets sigifikasivå (1-α) kallas för kofidesivå Väljs av kosumete eller forskare i förväg Fel vid Hypotesprovig Typ II-fel görs är ite förkastar e falsk hypotes Saolikhete av typ II-fel beteckas med Saolikhete att förkasta e falsk hypotes är (1- ) och kallas för styrka av testet. Alltså mäter testets styrka förmåga att upptäcka ett falsk hypotes.

Utfall och Saolikheter Möjliga utfall vid hypotesprövig Beslut Ej Förkasta H Verklighete H sa Ige fel (1 - ) α H ite sa Typ II-fel ( ) Utfall (Saolikhet) Förkasta H Typ I-fel ( ) α Ige fel ( 1 - ) Hypotesprövig för medelvärde ( Käd) Kovertera stickprovsresultat ( x ) till ett z-värde Hypotesprövig för µ Käd Om vi vill testa H : = H : > 1 (Ata att populatioe är ormal) Okäd Beslutsregel: x Förkasta H om z = > z

x Förkasta H om z = > Beslutsregel z H : = H 1 : > Alterativregel: Förkasta H om X > + Z / α Z x Förkasta ite H + z z Förkasta H Kritiskvärde Exempel: VD vid ett telefoföretag aser att de geomsittliga måadsutgifte för telefo har ökat, och är u på över $5 per måad. Företaget vill testa VD:s påståede. (ata att σ = 1 är käd) Hypotesera: H : 5 H 1 : > 5 är ite över $5 per måad är större ä $5 per måad (d.v.s., det fis tillräckligt bevis för att stödja VD:s påståede

Exempel: Hitta Rejectio Regio Ata att α =.1 har valts för testet Hitta rejectio regio: Förkasta H α =.1 Ite Förkasta H 1.8 Förkasta H x Förkasta H om z = > 1.8 / Exempel: Resultat frå stickprov Ata att ett stickprov med 64 observatioer gav följäde resultat: = 64, x = 53.1 (σ=1 är reda käd) Då får vi, x 53.1 5 z = = =.88 1 64

Exempel: Beslut & tolkig Förkasta H α =.1 Ej Förkasta H z =.88 1.8 Förkasta H Förkasta ej H eftersom z =.88 < 1.8 (och ligger i No-rejectio regio) d.v.s: det fis ite tillräckligt bevis som stödjer påståedet att medelvärdet är över $5. Esidig mothypoteser H : 3 H 1 : > 3 E kritiskvärde (i övre svase ) H : 3 H 1 : < 3 E kritiskvärde (i udre svase )

Övre-svas Tester H : 3 H 1 : > 3 α Z x Ej Förkasta H z Förkasta H Kritiskvärde Udre-Svas Tester H : 3 H 1 : < 3 α Förkasta H Förkasta ej H -z α Z x Kritiskvärde

Tvåsidig tester H : = 3 H 1 : 3 α/ α/ 3 x Förkasta H Förkasta ej H Förkasta H -z α/ +z α/ z Lägre kritiskvärde Övre kritiskvärde Tvåsidig test: Exempel Testa påståedet att geomsittlig # TV per hushåll i Stockholm är 3. (ata =.8) Formulera hypotesera H : = 3, H 1 : 3 (tvåsidig alterativ) Specificera öskad sigifikasivå ata att vi väljer α =.5 Bestäm om stickprovsstorlek vi öjer oss med = 1

Tvåsidig test: Exempel Bestäm om lämplig testvariable eftersom är käd aväder vi z test Irätta kritiska värdea För α =.5 är kritiska värdea ±1.96 Samla data och beräka värdet på testvariabel ata att vi fick följäde resultat: = 1, x =.84 ( =.8 är reda käd) Då blir värdet på testvariabel: X.84 3.16 z = = = =..8.8 1 Tvåsidig test: Exempel Ligger värdet på testvariabel i rejectio regio? Förkasta H om z < -1.96 eller z > 1.96; aars förkasta ej H α =.5/ Förkasta H Förkasta ej H -z = -1.96 +z = +1.96 α =.5/ Förkasta H Här, z = -. < -1.96, så värdet på testvariabel är iom rejectio regio.

Tvåsidig test: Exempel Beslut och tolkig α =.5/ α =.5/ Förkasta H Förkasta ej H Förkasta H -z = -1.96 -. +z = +1.96 Eftersom z = -. < -1.96, vi förkastar ollhypotese och dra slutsatse att det fis tillräckligt bevis som stödjer påståedet att geomsittlig # TV per hushåll är ite 3. Hypotesprövig för medelvärde ( Okäd) Hypotesprövig för µ Käd Okäd H : = H : > 1 (ata populatioe är ormal) Beslutregel: x om t = t-1, Förkasta H s >

Hypotesprövig för medelvärde ( Okäd) Tvåsidig test: H : = H : 1 (Ata populatioe är ormal) Beslutregel: x x Förkasta H > s s om t = < t -1, / eller om t = t -1, / Exempel: Tvåsidig (σ Okäd) Medelpris på ett hotellrum i NY påstås vara $168 per att. Ett stickprov på 5 hotellrum gav x = $17.5 och s = $15.4. Testa påståedet på α =.5 sigifikasivå (ata att populatiosfördelige är ormal) H : = 168 H 1 : 168

Exempel: Tvåsidig (σ Okäd) H : = 168 H 1 : 168 α/=.5 α/=.5 α =.5 = 5 σ är okäd, därför aväder vi t-statistik Kritiskvärde: t 4,.5 = ±.639 Förkasta H Förkasta ej H : ite tillräckligt bevis att medelpriset per hotellrum ite är $168. Förkasta H t -1, / Förkasta ej H -t -1, / -.639.639 x s 17.5 168 15.4 5 1.46 t 1 = = = 1.46 Hypotesprövig för proportio Sampligfördelige för pˆ approximativt ormal, därför aväder vi z-statistik som testvariabel z = pˆ P P (1 P )

Test för Proportio: Exempel Ett udersökigsföretag påstår att edast 8% av de tillfrågade svarar. För att testa detta, ett stickprov på 5 post skickades och 5 svarade. Testa hypotese på α =.5 sigifikasivå. P skattas med pˆ = 5/5 =.5 P(1 - P) = (5)(.5)(.95) = 3.75 > 9 Test för Proportio: Exempel H : P =.8 H 1 : P.8 α =.5 = 5, pˆ =.5 Kritiskvärde: ± 1.96 Reject.5 -.47-1.96 Reject 1.96 z =.5 z Testvariabel: pˆ P.5.8 = = P (1 P ).8(1.8) 5 Beslut: Förkasta H på α =.5 Slutsats: Det fis tillräckligt bevis för att förkasta företagets påståede på 8% svar..47

Hypothesis Tests of oe Populatio Variace Populatio Variace Goal: Test hypotheses about the populatio variace, If the populatio is ormally distributed, χ 1 ( 1)s = follows a chi-square distributio with ( 1) degrees of freedom Cofidece Itervals for the Populatio Variace Populatio Variace The test statistic for hypothesis tests about oe populatio variace is 1 = ( 1)s

Decisio Rules: Variace Populatio variace Lower-tail test: H : H 1 : < Upper-tail test: H : H 1 : > Two-tail test: H : = H 1 : α α α/ α/ 1,1 α 1, α 1,1 α / 1, α / Reject H if Reject H if Reject H if < > > 1 1,1 α 1 1, α 1 or < 1 1, α / 1,1 α / Hypothesis Tests for Two Variaces Tests for Two Populatio Variaces F test statistic Goal: Test hypotheses about two populatio variaces H : x y H 1 : x < y H : x y H 1 : x > y Lower-tail test Upper-tail test H : x = y H 1 : x y Two-tail test The two populatios are assumed to be idepedet ad ormally distributed

Hypothesis Tests for Two Variaces Tests for Two Populatio Variaces F test statistic The radom variable s F = s x y / / x y Has a F distributio with ( x 1) umerator degrees of freedom ad ( y 1) deomiator degrees of freedom Deote a F value with ν 1 umerator ad ν deomiator degrees of freedom by Test Statistic Tests for Two Populatio Variaces The critical value for a hypothesis test about two populatio variaces is x F = F test statistic sy s where F has ( x 1) umerator degrees of freedom ad ( y 1) deomiator degrees of freedom

Decisio Rules: Two Variaces Use s x to deote the larger variace. H : x y H 1 : x > y α H : x = y H 1 : x y α/ Do ot reject H F x 1, y 1, Reject H F Do ot reject H F x 1, y 1, / Reject H F Reject H if F > F x 1, y 1, rejectio regio for a twotail test is: Reject H if F > F x 1, y 1, / where s x is the larger of the two sample variaces Example: F Test You are a fiacial aalyst for a brokerage firm. You wat to compare divided yields betwee stocks listed o the NYSE & NASDAQ. You collect the followig data: NYSE NASDAQ Number 1 5 Mea 3.7.53 Std dev 1.3 1.16 Is there a differece i the variaces betwee the NYSE & NASDAQ at the α =.1 level?

F Test: Example Solutio Form the hypothesis test: H : x = y (there is o differece betwee variaces) H 1 : x Degrees of freedom: Numerator (NYSE has the larger stadard deviatio): x 1 = 1 1 = d.f. Deomiator: y 1 = 5 1 = 4 d.f. y (there is a differece betwee variaces) Fid the F critical values for α =.1/: F 1, 1, / x = F, y 4,.1/ =.3 The test statistic is: s = s F Test: Example Solutio 1.3 = 1.16 F x = y 1.56 H : x = y H 1 : x y α/ =.5 F = 1.56 is ot i the rejectio regio, so we do ot reject H Do ot reject H F, 4,.1/ = Reject H.3 F Coclusio: There is ot sufficiet evidece of a differece i variaces at α =.1