Att testa normalitet och heteroskedasticitet i en linjär regressionsmodell

Relevanta dokument
Sensorer, effektorer och fysik. Analys av mätdata

Sensorer och elektronik. Analys av mätdata

Föreläsningsanteckningar till Linjär Regression

4.2.3 Normalfördelningen

Väntevärde, standardavvikelse och varians Ett statistiskt material kan sammanfattas med medelvärde och standardavvikelse (varians), och s.

Något om beskrivande statistik

En utvärdering av två olika sätt att skatta fördelningen till stickprovsmedelvärden från olikfördelade data - normalapproximation kontra resampling

Korrelationens betydelse vid GUM-analyser

F9 Hypotesprövning. Statistikens grunder 2 dagtid. p-värden. Övning 1 från F8

D 45. Orderkvantiteter i kanbansystem. 1 Kanbansystem med två kort. Handbok i materialstyrning - Del D Bestämning av orderkvantiteter

Parametriska metoder. Icke-parametriska metoder. parametriska test. Icke-parametriska test. Location Shift. Vilket test ersätts med vilket?

REGRESSIONSANALYS S0001M

Väntevärde för stokastiska variabler (Blom Kapitel 6 och 7)

SOS HT Punktskattningar. Skattning från stickprovet. 2. Intuitiva skattningar. 3. Skattning som slumpvariabel. slump.

Orderkvantiteter vid begränsningar av antal order per år

Formler och tabeller i statistik

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Lycka till och trevlig sommar!

Orderkvantiteter i kanbansystem

SAMMANFATTNING AV KURS 602 STATISTIK (Newbold kapitel [7], 8, 9, 10, 13, 14)

Normalfördelningar (Blom Kapitel 8)

F15 ENKEL LINJÄR REGRESSION (NCT )

Prisuppdateringar på elementär indexnivå - jämförelser mot ett superlativt index

Tentamen STA A15 delkurs 1 (10 poäng): Sannolikhetslära och statistisk slutledning 3 november, 2005 kl

Fördelningen för populationen som stickprovet togs ifrån är känd så nära som på ett antal parametrar, t.ex: N med okända

Lösningsförslag till tentamen i 732G71 Statistik B,

Flexibel konkursriskestimering med logistisk spline-regression

Variansberäkningar KPI

TENTAMEN I MATEMATISK STATISTIK. Statistik för lärare, 5 poäng

b) Om du nu hade oturen att du köpt en trasig dator, vad är sannolikheten att den skulle ha tillverkats i Litauen?

Repetition DMI, m.m. Några begrepp. egenskap d. egenskap1

Armin Halilovic: EXTRA ÖVNINGAR. ) De Moivres formel ==================================================== 2 = 1

Introduktion till statistik för statsvetare

FÖRSÖKSPLANERING. och utvärdering av försöksresultat med den matematiska statistikens metoder. av Jarl Ahlbeck

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Kontingenstabell (Korstabell) 2. Oberoende-test. Stickprov beror av slumpen. Vad vi förvf. är r oberoende: kriterier är r oberoende: kriterier

Hastighetsförändringar och trafiksäkerhetseffekter

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Fyra typer av förstärkare

Strukturell utveckling av arbetskostnad och priser i den svenska ekonomin

Genomsnittligt sökdjup i binära sökträd

Kap. 1. Gaser Ideala gaser. Ideal gas: För en ideal gas gäller: Allmänna gaslagen. kraft yta

Beräkna standardavvikelser för efterfrågevariationer

Tentamen i Matematisk statistik för V2 den 28 maj 2010

c n x n, där c 0, c 1, c 2,... är givna (reella eller n=0 c n x n n=0 absolutkonvergent om x < R divergent om x > R n n lim = 1 R.

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

Grundläggande matematisk statistik

Induktion LCB Rekursion och induktion; enkla fall. Ersätter Grimaldi 4.1

Linjär Algebra. Linjära ekvationssystem. Ax = b. Viktiga begrepp. Linjära ekvationssystem. Kolumnerna i A. Exempel. R (A) spänns upp av t.ex.

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

F10 ESTIMATION (NCT )

1. Test av anpassning.

Föreläsning 10: Kombinatorik

a) Beräkna E (W ). (2 p)

S0005M V18, Föreläsning 10

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

DEL I. Matematiska Institutionen KTH

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

Datorövning 2 Fördelningar inom säkerhetsanalys

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Tillämpad biomekanik, 5 poäng Plan rörelse, kinematik och kinetik

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Centrala gränsvärdessatsen

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

= α. β = α = ( ) D (β )= = 0 + β. = α 0 + β. E (β )=β. V (β )= σ2. β N β, = σ2

STOCKHOLMS UNIVERSITET

Föreläsning G04: Surveymetodik

En kvalitetskontroll - Snustillverkaren Fiedler & Lundgren kvalitetstestas Av: Andreas Timglas

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

- Syns den globala uppvärmningen i den svenska snöstatistiken?

Kontrollskrivning 3 i SF1676, Differentialekvationer med tillämpningar. Tisdag kl 8:15-10

MS-A0409 Grundkurs i diskret matematik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Slumpvariabler (Stokastiska variabler)

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

F7 PP kap 4.1, linjära överbestämda ekvationssystem

Medelvärde. Repetition. Median. Standardavvikelse. Frekvens. Normerat värde. z = x x

TENTAMEN I MATEMATISK STATISTIK

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

2. Konfidensintervall för skillnaden mellan två proportioner.

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Handbok i materialstyrning - Del F Prognostisering

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

Lycka till! I(X i t) 1 om A 0 annars I(A) =

101. och sista termen 1

Begreppet rörelsemängd (eng. momentum) (YF kap. 8.1)

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Tentamen Metod C vid Uppsala universitet, , kl

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Formelblad Sannolikhetsteori 1

Lösningar och kommentarer till uppgifter i 1.1

Transkript:

UPPSALA UNIVERSITET -9- Isttutoe för formatosveteskap ehete för statstk Statstk D D-uppsats, poäg Arkvverso Poltces Magster-programmet HT 999 Att testa ormaltet och heteroskedastctet e ljär regressosmodell E emprsk jämförelse mella ormaltets-, heteroskedastctets- och kombatostest Författare: Adreas Karlsso Hadledare: Aders Ågre E-post: adreas973@hotmal.com E-post: aders.agre@ds.uu.se

SAMMANFATTNING Dea uppsats behadlar fråga om ormaltets-, heteroskedastctets- och kombatostests avädbarhet att testa ollhypotese om samtdg ormaltet och lkhet varas. Kombatosteste utgörs här av summa av ett χ -fördelat ormaltetstest och ett χ -fördelat heteroskedastctetstest. Udersökge hadlar dels om testes styrkevåer uder olka former av avvkelser frå ollhypotese, varvd tresset särsklt är rktat på hur kombatosteste klarar sg. Me äve fråga om ormaltets- och heteroskedastctetstestes förmåga att hålla sa sgfkasvåer uder ollhypotesera om ormaltet respektve lka varas är störgstermera har olka varas respektve ej är ormalfördelade tas upp. Udersökge geomförs med hjälp av omfattade Mote Carlo-smulergar. Resultate pekar på att kombatosteste klarar sg väl förhållade tll ormaltetsrespektve heteroskedastctetsteste är det gäller styrkevåer, förutom då störgstermera är symmetrska, platykurtska och med lka varas. De vsar också att ge av ormaltetseller heteroskedastctetsteste lyckas hålla sg acceptabelt ära sa omella sgfkasvåer.

Iehåll Iledg.... Syfte...3. Avgräsgar, metod och materal...4 Teoretsk bakgrud...4. Normalfördelge och avvkelser frå dea...5. Heteroskedastctet...7.3 Normalfördelgstest...8.3. Test baserade på skevhet och kurtoss eller baserade på momet...9 Jarque-Beras LM N -test... Urzúas ALM N -test... D Agosto-Pearsos Z -test... Fshers kumulattest (K-testet)... 3.3. Test baserade på de emprska fördelgsfuktoe (EDF-test)...5 Aderso-Darlgs, Cramér-vo Mses och Kolmogorov-Smrovs EDF-test... 5.3.3 Regressos- eller korrelatosbaserade test...6 Shapro-Wlks W-test... 6 Wesberg-Bghams W ~ -test... 7 Rahma-Govdarajulus W ~ -test... 8 de Wet-Veters r-test... 9 Fllbetestet (r F -testet)... 9.4 Heteroskedastctetstest....4. t-fördelade heteroskedastctetstest... Parks P-test samt Glejsers G - och G -test... Spearmas ragkorrelatostest (r S -testet)....4. F-fördelade heteroskedastctetstest... Goldfeld-Quadts GQ-test....4.3 χ -fördelade heteroskedastctetstest...3 Breusch-Paga-Godfreys LM H -test... 3 Verbylas ALM H -test... 4 Whtes W H -test... 5.5 Kombatostest för både ormaltet och homoskedastctet...6 3 Desg av Mote Carlo-stude...7 4 Smulergsresultat I: Hypotestestes styrka...9 4. Formler och otato för aggregerg av datamateralet...3 4.. Aggregerg över estaka -värde...3 4.. Aggregerg över flera -värde...33 4..3 Mätg av sambadet mella kombatostestes två delar...35 4..4 Allmät om aalyse av smulergsresultate...35 4. Resultat för homoskedastska ej ormalfördelade störgstermer...37 4.. Symmetrska fördelgar med β <3...37 4.. Symmetrska fördelgar med β >3...4

4..3 Ickesymmetrska fördelgar...44 4..4 Resultat aggregerat över samtlga ckeormala fördelgar...46 Sambadet mella kombatostestes två delar... 5 4.3 Resultat för ormalfördelade heteroskedastska störgstermer...5 4.3. Heteroskedastctet som e fukto av X-värdea...5 4.3. Heteroskedastctet på grud av ärvaro av ett extremvärde...55 4.3.4 Resultat aggregerat över samtlga heteroskedastctetsvarater...58 Sambadet mella kombatostestes två delar... 6 4.4 Resultat för heteroskedastska ej ormalfördelade störgstermer...6 4.4. Symmetrska ckeormala fördelgar med β <3 och heteroskedastctet som e fukto av X-värdea...6 4.4. Symmetrska ckeormala fördelgar med β >3 och heteroskedastctet som e fukto av X-värdea...66 4.4.3 Symmetrska ckeormala fördelgar med β <3 och heteroskedastctet på grud av ärvaro av ett extremvärde...68 4.4.4 Symmetrska ckeormala fördelgar med β >3 och heteroskedastctet på grud av ärvaro av ett extremvärde...7 4.4.5 Resultat aggregerat över samtlga varater av samtdg ckeormaltet och heteroskedastctet...74 Sambadet mella kombatostestes två delar... 75 4.5 Övergrpade aalys av samtlga smulergsresultat...78 4.5. Resultat aggregerat över samtlga smulergar...78 4.5. Jämförelse av resultate frå avstt 4.-4.4...8 Jämförelse av sambadet mella kombatostestes två delar... 8 5 Smulergsresultat II: Hypotestestes robusthet...83 5. Faktska sgfkasvåer för ormaltetsteste...84 5. Faktska sgfkasvåer för heteroskedastctetsteste...85 Jämförelse med resultate frå tdgare udersökgar... 86 6 Avslutade dskusso...87 Blagor...89 Blaga : Fördelgsfuktoer...89 Beta(p,q)... 89 Gamma(α,β)... 9 Gumbel(ξ,θ)... 9 HalvNormal(θ,λ)... 9 Laplace(θ,λ)... 9 Logstsk(α,β)... 9 LogLogstsk(a,b,c)... 9 Normal(µ,σ)... 93 Pareto(k,a)... 93 Studet s t (ν)... 94 Tragular(a,b,c)... 94 Tukey(λ)... 95 Uform(θ,θ )... 95 Webull (c,α)... 95

Blaga : Rådata...96 Blaga 3: Mtabmakro...38 B3. Huvudmakro...38 B3. Makro för ckeormala fördelgar...4 B3.3 Makro för framtagade av C α...44 B3.4 Makro för aalys av smulergar med urspruglga X-värde...44 B3.5 Makro för aalys av X-värde med ett extremvärde...47 B3.6 Makro för beräkg av sambadet mella θ NH och θ N samt θ H...5 Refereser...5

TECKENFÖRKLARING α = ett tests sgfkasvå, d.v.s. saolkhete att e sa ollhypotes förkastas -β = ett tests styrka ( power ), d.v.s. saolkhete att förkasta e falsk ollhypotes α& = ett tests faktska sgfkasvå θ = e teststatstka θ obs = det observerade värdet för e teststatstka τ = e vss X- och u -kombato Ω τ = e mägd av τ-kombatoer T = det totala atalet elemet mägde Ω τ δ τ = de observerade styrkevå -β på e teststatstka för e vss τ-kombato δ = de observerade styrkevå för ett vsst -värde för e teststatstka δ = geomsttlg observerad styrkevå för ett vsst -värde och e vss τ-kombato σ = de stadardserade stadardavvkelse för ett vsst -värde och e vss τ-kombato λ = de lägsta relatva styrkevå för ett vsst -värde och e vss τ-kombato δ = geomsttet av alla δ -värde upp tll och med σ = geomsttet av alla σ -värde upp tll och med λ = geomsttet av alla λ -värde upp tll och med Λ5 = det lägsta relatva styrkevå för 5 Λ5 = det lägsta relatva styrkevå för 5 Ω θ = mägde av de 3 olka δ τ -värdea för ett vsst τ Ω = mägde av de 3 δ -värde som har beräkats över ett vsst Ω δ τ RR = e teststatstkas förkastelserego ( Rejecto Rego ) = atalet observatoer N = atalet replkatoer e smulerg C α = det krtska värdet (sgfkaspukte) för e vss sgfkasvå α Ĉ α = skattg av C α -värdet, beräkat frå smulergar uder alteratvet NH θ N = ett ormalfördelgstest θ H = ett test för lka varas (homoskedastctet) θ HN = ett kombatostest för både ormalfördelg och lka varas NH = störgstermera är ormalfördelade med lka varas

N H = störgstermera är ej ormalfördelade, me har lka varas N H = störgstermera är ormalfördelade me heteroskedastska N H = störgstermera är heteroskedastska samt ej ormalfördelade m () = värdet på de :te ordgsstatstka mˆ () = värdet på de :te ordgsstatstka för de smulerade värdea för e vss teststatstka µ k = det k:te cetrala mometet m k = stckprovsestmator för det k:te cetrala mometet κ r = de r:e kumulate k r = stckprovsestmator för de r:e kumulate φ( ) = täthetsfuktoe ( probablty desty fucto ) för de stadardserade ormalfördelge Φ( ) = de kumulatva fördelgsfuktoe för de stadardserade ormalfördelge Φ - ( ) = de versa kumulatva fördelgsfuktoe för de stadardserade ormalfördelge = least teger fucto = greatest teger fucto κ r µ k

INLEDNING P arametrska statstska metoder bygger på att det datamateral som bearbetas uppfyller vssa fördelgsatagade. Det är därför av stor vkt att vd avädade av parametrska metoder testa om fördelgsatagadea verklge är uppfyllda. Exempelvs baseras de klassska ljära regressosmodelle, som ges av Y = β + β X + β X + L + β X + u, (.) bl.a. på atagadet att störgstermera k k u är ormalfördelade, serellt oberoede och har lka varas. Om dessa förutsättgar te är uppfyllda påverkas såväl parameterskattgar som feresresultat, vlket ka medföra allvarlga kosekveser. Vd regressosaalys är olka varas (heteroskedastctet) huvudsaklge ett problem som uppstår vd avädade av tvärsttsdata, meda serellt beroede (autokorrelato) främst uppträder tdsseredata. V ka därför ursklja främst två olka täkbara scearer för är fördelgsatagadea för e regressosaalys te är uppfyllda:. Störgstermera är serellt oberoede, me heteroskedastska och/eller ej. ormalfördelade Störgstermera är homoskedastska, me autokorrelerade och/eller ej ormalfördelade. Låt oss u ata att v har ett dataset med tvärsttsdata, och vll geomföra e regressosaalys av dessa. I detta läge är v tresserade av scearo (), och vll u testa om störgstermera u frå vårt datamateral verklge är homoskedastska och ormalfördelade. Vår ollhypotes är såluda H : u ~ N( µ, σ ), (.) vlket v kallar för e dubbelrktad ollhypotes, eftersom de samtdgt gäller både e ormalfördelgshypotes och e homoskedastctetshypotes. Det fs fyra möjlga alteratv för hur störgstermera u stämmer överes med ollhypotese (.). Om v låter N och H betecka att ormalfördelgs- respektve homoskedastctetsatagadet är uppfyllt, och N respektve H betecka att motsvarade atagade te är uppfyllt, så ges dessa fyra alteratv av: Gujarat, D. N., Basc Ecoometrcs, 3 rd ed., ss. 45 och 436 Dessa beteckgar har v låat frå Bera, A. K. Jarque, C. M., Model Specfcato Tests A Smultaeous Approach, Joural of Ecoometrcs (98), ss. 59-8.

. NH ollhypotese är sa, d.v.s. störgstermera är både ormalfördelade och.. v. homoskedastska N H ollhypotese är falsk p.g.a. att störgstermera ej är ormalfördelade N H ollhypotese är falsk p.g.a. att störgstermera är heteroskedastska N H ollhypotese är falsk, eftersom störgstermera varke är ormalfördelade eller homoskedastska. När v u vll testa ollhypotese (.) fs det ågra olka tllvägagågssätt som ka avädas. Ett alteratv skulle vara att aväda sg av ekelrktade test, d.v.s. test som är utvecklade för att ebart testa de ea av ollhypoteses två delar atge ormalfördelgshypotese eller homoskedastctetshypotese och såluda testa ollhypoteses två delar var för sg. Eftersom ollhypotese (.) är dubbelrktad, och därmed kräver att ormalfördelgs- och homoskedastctetshypotesera är uppfyllda samtdgt, räcker det ju med att e av ollhypoteses två delar skall förkastas för att v skall kua förkasta hela ollhypotese (.). Det ka dock uppstå vssa problem vd avädadet av ekelrktade test, eftersom flertalet ormaltetstest är härledda uder atagadet att störgstermera meda måga heteroskedastctetstest bygger på atagadet att störgstermera är u har lka varas, ormalfördelade. 3 Fråga är då hur avädbara teste ädå är vd de olka alteratva avvkelsera frå NH ova N H, N H och N H. För ormaltetsteste är här de ekelrktade ollhypotese om ormalfördelade störgstermer sa uder alteratvet och falsk uder alteratve N H och N H, meda heteroskedastctetstestes ekelrktade ollhypotes om homoskedastska störgstermer på motsvarade sätt är sa uder alteratvet N H och falsk uder alteratve N H och N H N H. Fråga om testes avädbarhet hadlar såluda först och främst om hur effektva de är att förkasta de falska ekelrktade ollhypotesera om ormalfördelg respektve lka varas, och om hur robusta de är, d.v.s. hur väl de klarar av att hålla s sgfkasvå α, saolkhete att förkasta e sa ekelrktad ollhypotes om ormalfördelg respektve lka varas, uder de olka alteratve N H, N H och N H. E alteratv metod för att testa ollhypotese (.) är att aväda sg av dubbelrktade test, d.v.s. test som är avsedda att reagera på alla de olka alteratva avvkelsera frå

ollhypotese (.), vare sg dessa beror på cke-ormaltet, heteroskedastctet eller både och. Detta är e på flera sätt attraktvare metod ä att aväda två olka ekelrktade test. Eftersom ma aväder e eda teststatstka stället för två blr testet eklare att aväda, och ma slpper täka hur robust det är. Me fråga är då hur pass effektva dessa kombatostest är är det gäller att förkasta ollhypotese (.) är dea är falsk, jämfört med de ekelrktade ormaltets- och heteroskedastctetsteste. Hur stora är sklladera uder de olka alteratve N H, N H och N H, och vad medför dessa skllader för kosekveser? Tllgåge på tdgare resultat är det gäller fråga om avädadet av ekelrktade och dubbelrktade test uder olka avvkelser frå NH är tämlge begräsad. 4 Det är främst e artkel av A. K. Bera och C. M. Jarque 5 som behadlar detta. Dea tar dock huvudsaklge upp teoretska aspekter på de dubbelrktade testes uppbyggad. V kommer att akyta tll detta sambad med e teoretsk geomgåg av de dubbelrktade teste seare uppsatse. I artkel redovsas också vssa smulergsresultat för både ekelrktade och dubbelrktade test uder olka avvkelser frå NH, me dessa är så kapphädga att det är svårt att dra ågra slutsatser frå dem. När det seda gäller de ekelrktade testes robusthet har v te fut ågra resultat för ormaltetstestes robusthet. Däremot fs det ågra udersökgar som behadlar robusthete hos heteroskedastctetsteste. Resultate frå ett par av dessa udersökgar kommer att tas upp tll dskusso uppsatse.. Syfte Syftet med dea uppsats är att jämföra kombatostest för både ormaltet och heteroskedastctet med reodlade ormaltets- respektve heteroskedastctetstest. Huvudsyftet är därvd att jämföra teste med avseede på deras styrkevå -β (saolkhete att förkasta e falsk ollhypotes) vd test av ollhypotese (.) att störgstermera samtdgt är såväl ormalfördelade som homoskedastska. Ett delsyfte är seda att udersöka hur robusta de reodlade ormaltets- respektve heteroskedastctetsteste är. Här är syftet att u 3 Se t.ex. Bera, A. K. Jarque, C. M., op. ct., s. 59f och McGurk, A. M. Drscoll, P. Alwag, J., Msspecfcato Testg: A Comprehesve Approach, Amerca Joural of Agrcultural Ecoomcs 75 (November 993), s. 44. 4 Däremot fs det e del materal om avädadet av ekelrktade ormaltets- respektve heteroskedastctetstest uder de ekelrktade ollhypotesera om ormalfördelg respektve homoskedastctet. För ormaltetsteste häför sg dock huvuddela av detta materal tll studer som gäller observatosdata. V kommer vd ågra tllfälle att kommetera kort om hur slutsatsera frå dessa udersökgar stämmer överes eller te stämmer överes med resultate frå dea uppsats. 5 Bera, A. K. Jarque, C. M., op. ct., ss. 59-8. 3

jämföra teste med avseede på sgfkasvå α (saolkhete att förkasta e sa ollhypotes) är atagadet om homoskedastska respektve ormalfördelade störgstermer ej är uppfyllda.. Avgräsgar, metod och materal V skall dea udersökg djupgåede udersöka och jämföra ett flertal olka test. Då atalet tllgäglga test är stort måste v dock avgräsa oss tll att edast ttta på e del av dessa. Urvalet av test som skall avädas måste med ödvädghet bl subjektvt. Me som krterer för urvalet har v att teste skall vara välkäda, vsat sg ha bra styrka eller vara lätta att aväda och beräka. E ärmare beskrvg av de test som har valts ut sammalagt 3 stycke görs kaptel. När det seda gäller vad för slags regressosmodell som skall avädas har v för att uderlätta projektets geomförbarhet valt att ebart aväda oss av de ekla ljära regressosmodelle med e beroede och e oberoede varabel, vlke ges av formel Y = β + β X + u, (..) där u är störgstermera, vlka v atar är serellt oberoede. Vdare måste v också begräsa oss är det gäller atalet observatoer för modell (..), vlka v beteckar med. För att ädå kua täcka både små och stora -värde har v valt att aväda oss av =,, 3, 4, 5, och 5. Att aalytskt beräka ett hypotestests styrka eller robusthet är atalet observatoer är ädlgt är geerellt sett e omöjlghet. Detta medför att v stället måste lta tll Mote Carlosmulergar för att kua geomföra udersökgara dea uppsats. E beskrvg av hur dessa geomförs ges kaptel 3. Som sgfkasvå för testes styrka och robusthet kommer v edast att aväda oss av α=,5. Vad gäller heteroskedastctetstests robusthet mot ckeormaltet fs det äve e del skrvet seda tdgare, varför v vad gäller detta äve kommer att gör e kortfattad presetato av resultate frå dessa tdgare udersökgar. TEORETISK BAKGRUND A vskte med detta kaptel är att beskrva de olka test som v kommer att aväda vår udersökg. V vsar hur teste är uppbyggda, vad som motverar deras avädade samt hur de olka teste häger samma. För att v skall kua förstå detta är det dock 4

ödvädgt att först kortfattat beskrva ormalfördelge och täkbara avvkelser frå dea, samt heteroskedastctetes egeskaper. V behadlar därför detta de två första avstte, (.) och (.). Först skall v dock äma ågra ord om de otato som kommer att avädas. Låt θ betecka e godtycklg teststatstka och θ obs det observerade värdet för dea. Tll varje sgfkasvå α för ett test hör ett vsst krtskt värde (e sgfkaspukt). V skall dea uppsats betecka detta värde med C α. Låt seda e teststatstkas förkastelserego beteckas med RR. Förkastelseregoera för de test som aväds dea uppsats ka då skrvas som RR={θ obs <C α } respektve RR={θ obs >C α }. Vdare kommer v att låta θ N, θ H och θ NH betecka godtycklga ormaltetstest, heteroskedastctetstest respektve kombatostest.. Normalfördelge och avvkelser frå dea Normalfördelge, också kallad de gaussaska fördelge, har vart käd åtmstoe seda börja av 7-talet. 6 E populato, eller dess slumpvarabel X, sägs vara ormalfördelad om dess täthetsfukto ges av x µ f (x) = exp, - <x< ; - <µ< ; σ>. (..) σ π σ där µ och σ är dess medelvärde respektve stadardavvkelse. E grudläggade metod för att beskrva forme på e fördelg har hstorskt sett vart att ttta på dess skevhet och kurtoss. Skevhete är ett mått på e populatos symmetr, varvd populatoe ka vara symmetrsk, skev åt väster eller skev åt höger. 7 Meda deftoe av skevhete således är klar och etydg ka motsvarade te alls sägas om kurtosse. Vad kurtoss egetlge är för ågot råder det ge eghet om. Särsklt vad gäller fördelgar som te är umodala och symmetrska är det svårt att ge e tolkg av kurtossmåttet. E vag defto av kurtoss är dock att det är ett mått på e fördelgs form som ager de läges- och skaloberoede förflyttge av saolkhetsmassa frå e fördelgs flaker (det område som lgger 6 Mudholkar, G. S. Hutso, A. D., The epslo-skew-ormal dstrbuto for aalyzg ear-ormal data, Joural of Statstcal Plag ad Iferece 83 (), s. 9. 7 D Agosto, R. B. Belager, A. D Agosto Jr., R. B., A Suggesto for Usg Powerful ad Iformatve Tests of Normalty, The Amerca Statstca, November 99, Vol. 44, No. 4, s. 36f och Marda, K.V., Tests of Uvarate ad Multvarate Normalty Krshaah, P. R., (ed.), Hadbook of Statstcs, Volume Aalyss of Varace, s. 8. 5

mella fördelges ceter och dess svasar) tll dess ceter och svasar, vlket seda ka formalseras på olka sätt. 8 Det fs ett flertal olka formler för att beräka e fördelgs skevhet eller kurtoss, vlka alla har sa olka för- och ackdelar. 9 Tradtoellt sett har ma utgått frå e saolkhetsfördelgs cetrala momet µ k, där det k:te cetrala mometet ges av k µ = E[(X ) ], (..) k µ och seda avät de tredje och fjärde stadardserade cetrala momete för att beräka skevhete respektve kurtosse. För e godtycklg populato beteckas dessa med β respektve β, och ges för e slumpvarabel X av 3 E[(X µ ) ] µ 3 β = =, (..3) 3 / 3 (E[(X µ ) ]) σ 4 E[(X µ ) ] µ 4 β = =. (..4) 4 (E[(X µ ) ]) σ Påpekas bör också att trots rottecket ka β ta egatva värde. V vet att för e ormalfördelad populato är β = och β 3. Ickeormaltete hos e populato ka därför beskrvas geom att ttta på hur dess skevhet och kurtoss avvker frå ormalfördelges. För symmetrska fördelgar, såsom exempelvs ormalfördelge, är β =. Om e fördelg har β > är de skev åt höger, meda de är skev åt väster om β <. Fördelgar som har β 3 tederar att ha tjockare > = svasar och högre toppar ä vad ormalfördelge har, och har tradtoellt kallats 8 Balada, K. P. MacGllvray, H. L., Kurtoss: A Crtcal Revew, The Amerca Statstca, May 988, Vol. 4, No., ss. och 6, Ruppert, D., What Is Kurtoss? A Ifluece Fucto Approach, The Amerca Statstca, February 987, Vol. 4, No., s., samt Roysto, P., Whch Measures of Skewess ad Kurtoss Are Best?, Statstcs Medce, Vol., (99), s. 335. 9 Se referesera fotot 9 samt Arold, B. C. Groeeveld, R. A., Measurg Skewess Wth Respect to the Mode, The Amerca Statstca, February 995, Vol. 49, No., ss. 34-38, Groeeveld, R. A., A Class of Quatle Measures for Kurtoss, The Amerca Statstca, November 998, Vol. 5, No. 4, ss. 35-39, Hoskg, J. R. M., Momets or L Momets? A Example Comparg Two Measures of Dstrbutoal Shape, The Amerca Statstca, August 99, Vol. 46, No. 3, ss. 86-89 samt Tajudd, I. H., A comparso betwee two smple measures of skewess, Joural of Appled Statstcs, Vol. 6, No. 6, 999, ss. 767-774. Obsevera att beteckgara γ och γ blad aväds stället för β respektve β, varvd dessa deferas geom γ = β och γ = β 3 (Marda, K. V., op. ct., s. 8). D Agosto, R. B. Belager, A. D Agosto Jr., R. B., op. ct., s. 37 och Marda, K.V., op. ct., s. 8. När beteckgara γ och γ (se fotot 8) aväds får såväl skevhete som kurtosse hos ormalfördelge värdet. Observera att vssa datorprogram, såsom t.ex. Mtab, aväder sg av γ och γ som mått på skevhet respektve kurtoss. 6

leptokurtska. De fördelgar för vlka β 3 brukar ha tuare svasar och bredare < ceterparter ä ormalfördelge, och kallas tradtoellt för platykurtska. Mesokurtska fördelgar, slutlge, har β = 3 och e form som lkar ormalfördelges.3 Dessa beskrvgar av sambadet mella fördelgaras form och värdea på β och β är dock lågt frå så klara och etydga som det ka tyckas här. Således fs det exempel på fördelgar som är skeva åt väster för vlka β > samt fördelgar med β = och β = 3 som är bmodala eller har betydlgt tjockare svasar och högre toppar ä ormalfördelge. 4 V väljer dock trots probleme med dessa mått att aväda dem dea uppsats, dels eftersom de spelar e betydade roll för e del av de ormaltetstest och kombatostest som v aväder, dels eftersom v behöver ett umerskt mått för att särsklja olka fördelgar.. Heteroskedastctet V talar om heteroskedastctet är v har ett atal slumpvarabler σ sådaa att j X med varasera σ σ för ågot j. Översatt tll vår ljära regressosmodell (.) med de ckestokastska förklarade varabel X ebär detta att störgstermera heteroskedastska om u är Var(u X ) Var(u j X j), j, (..) är uppfyllt ågot fall. 5 Heteroskedastctet ka se ut på olka sätt. För vår ljära regressosmodell (.) torde de valgast förekommade formera vara att varase för störgstermera u är atge kotuerlgt ökade eller kotuerlgt mskade med stgade värde på de förklarade varabel X. E aa valg form är att heteroskedastctete beror på ärvaro av ett extremvärde ("outler"). Sådaa stuatoer ka uppstå av flera olka orsaker, t.ex. vd mätfel av data. I detta läge har alltså samtlga störgstermer samma varas, förutom de eda störgsterm som härrör frå detta extremvärde. 6 V aväder oss dea uppsats av alla 3 D Agosto, R. B. Belager, A. D Agosto Jr., R. B., op. ct., s. 37 och Balada, M. P. MacGllvray, H. L., op.ct., s.. 4 Arold, B. C. Groeeveld, R. A., op. ct., s. 37, Tajudd, I. H., op. ct., s. 77f och Balada, M. P. MacGllvray, H. L., op.ct., s. 3f. 5 Gujarat, D. N., op. ct., s. 6. 6 Gujarat, D. N., op. ct., s. 357f. 7

dessa olka former av heteroskedastctet är v modellerar H för Mote Carlosmulergara av modell (..). (För e vdare beskrvg av hur smulergara desgas hävsas tll kaptel 3.).3 Normalfördelgstest Det fs ett otal test tllgäglga för att testa atagadet om att ett stckprov kommer frå e ormalfördelad populato. Dessa test ka delas fem olka kategorer: 7... v. χ -test Test baserade på skevhet och kurtoss eller baserade på momet Test baserade på de emprska fördelgsfuktoe ( emprcal dstrbuto fucto ) EDF-test Regressos- eller korrelatosbaserade test v. Övrga test. V kommer här dock edast att behadla test som tllhör kategorera ()-(v), då dessa är de mest aväda teste, och också de test som har uppvsat störst styrka emprska udersökgar. Dessutom kommer v edast att aväda oss av s.k. ombustest, d.v.s. test som är kostruerade för att kua upptäcka alla slags avvkelser frå ormalfördelge. Test som är specalutvecklade för att upptäcka ebart vssa slags avvkelser, såsom exempelvs avvkelser som gäller ebart kurtoss eller skevhet, behadlas således te dea udersökg. Det fs dock ett problem som uppstår är v vll aväda dessa ormaltetstest för att testa ormalfördelgsatagadet för störgstermera frå e regressosmodell. Eftersom de saa störgstermera u te är observerbara har v te har ågo möjlghet att aväda oss av dessa vd beräkgara av de olka teststatstkora. Istället får v aväda oss av de skattade resdualera û, och hoppas att dessa är tllräcklgt ära substtut för de saa störgstermera u. Ett problem med detta är dock att är störgstermera är ormalfördelade så lgger alltd saolkhetsfördelge för resdualera û ärmare ormalfördelge ä vad saolkhetsfördelge för störgstermera u, vlket u te 7 Ggerch, P. D., Statstcal Power of EDF Tests of Normalty ad the Sample sze Requred to Dstgush Geometrc-Normal (Logormal) from Arthmetc-Normal Dstrbutos of Low Varablty, Joural of theoretcal Bology (995) 73, s. 7 och Dufour, J-M, et. al., Smulato-based fte sample ormalty tests lear regressos, Ecoometrcs Joural (998), volume, ss. C57-C59. 8

aturlgtvs påverkar testes styrka egatvt. Detta feome, som kallas superormaltet, är särsklt påtaglgt för små stckprov. 8 Me att det för övrgt fugerar väl att aväda regressosresdualer vd beräkade av ormaltetstest har vsats såväl teoretskt som med smulergsstuder. 9 När det gäller teststatstkora för de ormaltetstest som aväds dea uppsats så redovsar flertalet av källora dessa teststatstkor för fallet är de beräkas frå ett stckprov av observatoer. Här kommer de dock att redovsas med observatoera ersatta med OLSresdualera û, vlket kommer göra att formlera ser ågot aorluda ut, beroede på att summa (och därmed medelvärdet) för dessa är oll. I övrgt görs ga förädrgar teststatstkora. Dock ka ma ställa sg fråga om te -termera teststatstkora borde ersättas med -k, som e frhetsgradskorrekto. Dea fråga udersöktes av Whte- MacDoald geom e smulergsstude med jämförelser mella korrgerade och okorrgerade teststatstkor, och deras slutsatser blev att de avrådde frå dea korrgerg. Av dea aledg aväder te v heller dea uppsats e såda frhetsgradskorrekto..3. Test baserade på skevhet och kurtoss eller baserade på momet De test baserade på skevhet och kurtoss som v tar upp här utgår frå de mått på skevhet och kurtoss som ges av β och β. Eftersom dessa är populatosmått, och således te är observerbara praktke, behöver v stckprovsestmatorer för dem. Stckprovsestmator för e saolkhetsfördelgs cetrala momet µ k ges av m k m k k (x x) = =, (.3.) 8 Whte, H. MacDoald, G. M., Some Large-Sample Tests for Normalty the Lear Regresso model, Joural of the Amerca Statstcal Assocato, March 98, Volume 75, Number 369, s. 6, Huag, C. J. Bolch, B. W., O the Testg of Regresso Dsturbaces for Normalty, Joural of the Amerca Statstcal Assocato, Jue 974, Volume 69, Number 346, s. 33f och Wesberg, S., Commet, Joural of the Amerca Statstcal Assocato, March 98, Volume 75, Number 369, s. 8. 9 Se Perce, D. A. Kopecky, K. J., Testg goodess of ft for the dstrbuto of errors regresso models, Bometrka (979), 66,, ss. -5, Perce, D. A. Gray, R. J., Testg ormalty of errors regresso models, Bometrka (98), 69,, ss. 33-36 samt Whte, H. MacDoald, G. M., op. ct., ss. 6-8. De huvudkälla som aväds, Dufour, J-M, et. al., op. ct., ss. C54-C73, redovsar dock ormaltetsteste regressosfallet, med avädade av OLS-resdualer. Whte, H. MacDoald, G. M., op. ct., s.. 9

och utfrå dea ka v seda kostruera stckprovsestmatorera för β och β, vlka tradtoellt beteckas med b respektve b och ges av formlera 3 (x x) = b = = 3 (x x) = m m 3 3 / (.3.) 4 (x x) = b = = (x x) = m m 4. (.3.3) Motsvarade mått med avädade av OLS-resdualer beteckar v med bˆ respektve bˆ. Eftersom u summa, och därmed medelvärdet, för OLS-resdualera alltd är lka med oll, får v att bˆ och bˆ ges av bˆ = = = û û 3 3 / (.3.4) bˆ = = = û û 4. (.3.5) Det är vdare kät att b och b är asymptotskt ormalfördelade, och att deras vätevärde och varaser, för e ormalfördelad populato, ges av E( b ) = (.3.6) 3( ) E(b ) = (.3.7) + 6( ) Var( b ) = (.3.8) ( + )( + 3) 4( )( 3) Var(b ) =. (.3.9) ( + ) ( + 3)( + 5) Dessa beteckgar låar v frå Whte, H. MacDoald, G. M., op. ct., s. 8.

Notera också formlera (.3.6)-(.3.9) ka approxmeras med, 3, 6/ respektve 4/. Dea approxmato blr aturlgtvs bättre ju större är. 3 Jarque-Beras LM N -test De formato som har preseterats ova ka utyttjas tll att kostruera ett atal olka ormaltetstest. 4 Av dessa test torde Jarque-Beras Lagrage Multpler-test för ormaltet (LM N -testet) 5 vara det eklaste. Detta utgörs helt ekelt av summa av de kvadrerade stadardserade stckprovsstatstkora för skevhet (.3.4) och kurtoss (.3.5) för regressosresdualer, där stadardserge sker med hjälp av de approxmatva värdea för (.3.6)-(.3.9). Jarque och Bera vsar att dea summa är asymptotskt ges teststatstka för LM N -testet av formel χ -fördelad. Såluda LM N bˆ 6 bˆ 3 4 = + ~ asy. χ. (.3.) Urzúas ALM N -test Urzúas Adjusted Lagrage Multpler -test för ormaltet (ALM N -testet) 6 är e vdareutvecklg av Jarque-Beras LM N -test. Här ersätts helt ekelt de asymptotska värdea LM N -statstka (.3.) med motsvarade exakta värde. Teststatstka för ALM N -testet ges då av formel 3 D Agosto, R. B. Belager, A. D Agosto Jr., R. B., op. ct., s. 37, Whte, H. MacDoald, G. M., op. ct., s. 8, Urzúa, C. M., O the correct use of ombus tests for ormalty, Ecoomcs Letters 53 (996), s. 48, Marda, K. V., op. ct., s. 8f samt Ascombe, F. J. Gly, W. J., Dstrbuto of the kurtoss statstc b for ormal samples, Bometrka (983), 7,, s. 7. 4 Ett teoretskt stöd för ormaltetstest baserade på dessa skevhets- och kurtossmått ges Nguye, T. T. Dh, K. T., Characterzatos of ormal dstrbutos supportg goodess-of-ft tests based o sample skewess ad sample kurtoss, Metrka (998) 48, ss. -3. 5 Jarque, C. M. Bera, A. K., A Test for Normalty of Observatos ad Regresso Resduals, Iteratoal Statstcal Revew (987), 55,, ss. 64-67. 6 Urzúa, C. M., O the correct use of ombus tests for ormalty, Ecoomcs Letters 53 (996), ss. 47-49 och Urzúa, C. M., Erratum to O the correct use of ombus tests for ormalty [Ecoomcs Letters 53 (996) 47], Ecoomcs Letters 54 (997), s. 3.

ALM N = bˆ Var( b ) bˆ E(b ) + Var(b ) 3( ) bˆ bˆ + = + 6( ) 4( )( 3) ( + )( + 3) ( + ) ( + 3)( + 5) = ~ asy. χ. (.3.) D Agosto-Pearsos Z -test D Agosto-Pearsos Z -test 7 baseras på e trasformerg av skevhets- och kurtossestmatorera bˆ och bˆ som gör att dessa blr approxmatvt ormalfördelade reda vd små stckprov. För dea trasformato behöver v det stadardserade fjärde mometet för b, som v beteckar med β b ), och det stadardserade tredje mometet ( för b, vlket v beteckar med β ( b ). Dessa ges av 4 ( b E[ b ]) ) 3( + 7 7)( + )( + = ( Var( b )) ( )( + 5)( + 7)( + 9) 3 ( E[b ]) ) 6( 5 + ) 6( + 3)( + 5) E ( 3) β ( b ) = (.3.) E (b β (b ) = =. (.3.3) ( Var(b )) 3 / ( + 7)( + 9) ( )( 3) Skevhetsestmator bˆ trasformeras u på följade sätt: Låt ( + )( + 3) = bˆ (.3.4) 6( ) A A A 3 = + ( β ( b ) ) (.3.5) =. (.3.6) A För 8 komberas seda formlera (.3.4)- (.3.6) så att 7 D Agosto, R. B. Belager, A. D Agosto Jr., R. B., op. ct., s. 37f, D Agosto, R. B., Trasformato to ormalty of the ull dstrbuto of g, Bometrka (97), 57, s. 68, Ascombe, F. J. Gly, W. J., op. ct., s. 8f samt Ladry, L. Lepage, Y., Emprcal behavor of some tests for ormalty, Commucatos Statstcs Smulato ad Computato :(4) 99, s. 98f. Observera att Ladry-Lepages formel C 4 på s. 98 delvs är felaktg. Det ssta C 3 -värdet de formel skall vara kvadrerat. Notera också att de flesta källor kallas Z -testet för K -testet. V tycker dock att det förefaller aturlgare att kalla det för Z -testet, med take på hur formel (.3.) är formulerad.

Z A A l + + A 3 A 3 = ~ approx.n(,). (.3.7) l(a ) Kurtossestmator bˆ trasformeras s tur på följade sätt: Låt 8 4 B = 6 + + +. (.3.8) β (b ) β (b ) β(b ) V får då för att Z B 3 9B bˆ E(b ) + Var(b ) B 4 = ~ approx.n(,), (.3.9) 9B där E(b ) och Var(b ) ges av formlera (.3.7) respektve (.3.9). Teststatstka för testet ges seda av Z = Z + Z ~ approx. χ. (.3.) Z - Fshers kumulattest (K-testet) Fshers kumulattest (K-testet) 8 baserar sg, som amet säger, på kumulater. De r:e kumulate deferas som koeffcete κ för t r r! sereexpasoe av l(m(t)), där M(t) är de mometgeererade fuktoe. För alla fördelgar gäller u att κ = µ (.3.) κ (.3.) = σ κ 3 = µ 3 (.3.3) κ, (.3.4) 4 = µ 4 3µ r 8 Kaj, G. K., statstcal tests, s. 4f, Datth, J. Nelso, R. D., (eds.), The Pegu Dctoary of Mathematcs, s. 8, Kotz, S. Johso, N. L., (eds.), Ecyclopeda of Statstcal Sceces, Vol., s. 9 och Vol. 3, s. 5. 3

där µ k är det k:te cetrala mometet, deferat som (..). Stckprovsestmatorera för κ r ges av Fshers k-statstkor geom r r = û = k r, för vlka det gäller att E(k ) r M = κ. Om v deferar r r M, (.3.5) så ges de fyra första k-statstkora för av k k k M = (.3.6) = 3 M M M M = = = (.3.7) ( ) ( ) 3 M 3 3M M + M M 3 M 3 = = = (.3.8) ( )( ) ( )( ) ( )( ) k 4 ( = ( = 3 3 )M 4 4( )M 4 3( )M ( )( )( 3) + )M 3M 3( )M ( )( )( 3) + M M 6M 4 (.3.9) eftersom M = för resdualera frå e OLS-regresso. Fshers kumulatstatstka blr då K 3 / K 3 K K 4 K = + ~ approx. χ, (.3.3) 6 4 där de första terme tll höger om lkhetstecket mäter skevhete och de adra terme mäter kurtosse. Samtlga ormaltetstest baserade på skevhet och kurtoss eller baserade på momet som v behadlar dea uppsats är alltså asymptotskt eller approxmatvt χ -fördelade. Såluda är gäller för dessa test att ollhypotese förkastas om det observerade värdet för θ N är större ä ett krtskt värde C α, d.v.s. RR={θ obs >C α }. Påpekas ka också att fortsättgsvs kommer v blad att med ett gemesamt am kalla alla ormaltetstest baserade på skevhet och kurtoss eller på momet för χ -fördelade ormaltetstest. 4

.3. Test baserade på de emprska fördelgsfuktoe (EDF-test) 9 EDF-teste är baserade på e jämförelse mella de teoretska fördelgsfukto som ollhypotese säger att stckprovet kommer frå, och de faktska emprska fördelgsfukto som ma ka observera för stckprovet. Låt û () betecka de ordade resdualera frå e OLS-regresso, d.v.s. û ( ) û ()... û (), och låt û () û () y = = (.3.3) σˆ û = ( ) y x exp π z = Φ(y ) = dx, (.3.3) d.v.s. Φ( ) är de stadardserade kumulatva ormalfördelgsfuktoe. Aderso-Darlgs, Cramér-vo Mses och Kolmogorov-Smrovs EDF-test Med ovaståede bakgrudsformato ka ma kostruera ett atal olka EDF-test. Här tar v dock edast upp tre av dessa, ämlge Aderso-Darlgs A -test, Cramér-vo Mses W -test samt Kolmogorov-Smrovs D-test, vlka är de mest käda EDF-teste. Dessa ges av A = ( )[l(z ) + l( z + )] (.3.33) = W = z +. (.3.34) = D = max max z, max z. (.3.35) Eftersom teststatstkora (.3.33)-(.3.35) aväder skattade värde för µ och det föreslagts att de ska korrgeras för att ta häsy tll detta faktum. Dessa modferade W - och D-test, vlka v beteckar med, respektve Dˆ, ges av σ har A -, 9 Dufour, J-M, et. al., op. ct., s. C57f, Stephes, M. A., EDF Statstcs for Goodess of Ft ad Some Comparsos, Joural of the Amerca Statstcal Assocato, September 974, Volume 69, Number 347, ss. 73-73, Petttt, A. N., Testg the Normalty of Several Idepedet Samples usg the Aderso-Darlg Statstc, Appled Statstcs (977), 6, No., s. 56f, Ggerch, P. D., op. ct., s. 8f, Ladry, L. Lepage, Y., op. ct., ss. 97-974, Marda K. V., op. ct., s. 94f samt Ga, F. F. Koehler, K. J., Goodess-of-Ft Tests Based o P-P Probablty Plots, Techometrcs, August 99, Vol. 3, No. 3, s. 94. 5

4 5 = A + (.3.36) = W + (.3.37),85 Dˆ = D, +. (.3.38) Det är dessa modferade teststatstkor som v kommer att aväda dea uppsats. För alla dessa gäller det att ollhypotese förkastas för höga värde, d.v.s. RR={θ obs >C α }..3.3 Regressos- eller korrelatosbaserade test De regressos- eller korrelatosbaserade ormaltetsteste utgör grude metoder för att kvatfera de formato som fås frå de s.k. ormalsaolkhetsplottara ( ormal probablty plots ). Avskte med ormalsaolkhetsplottara är att plotta det datamateral ma vll udersöka på ett sådat sätt att om de uderlggade populatoe är ormalfördelad så kommer grafe att bl e rät lje. Avvkelser frå detta utseede dkerar seda grade och type av ckeormaltet. 3 Shapro-Wlks W-test Det mest käda av de regressos- eller korrelatosbaserade ormaltetsteste är Shapro- Wlks W-test. De övrga ormaltetstest tllhörade dea kategor som v beskrver detta avstt är egetlge get aat ä modfergar av detta test. 3 W-testet är uppbyggt krg ordgsstatstkor på följade sätt: 3 Låt m T =,m,...,m ) betecka vektor av (m () () () förvätade värde för de ordgsstatstkora m () frå e stadardserad ormalfördelg 3 Kotz, S. Johso, N. L. (eds), op. ct., Vol., ss. 38-3. 3 Hur de olka teste häger samma beskrvs Verrll, S. Johso, R. A., The asymptotc equvalece of some modfed Shapro-Wlk statstcs Complete ad cesored sample cases, The Aals of Statstcs, 987, Vol. 5, No., ss. 43-49, där det som framgår av ttel också vsas att de olka teste är asymptotskt ekvvaleta. 3 Shapro, S. S. Wlk, M. B., A aalyss of varace test for ormalty (complete samples), Bometrka (965), 5, 3 ad 4, s. 59f, 63, Marda, K. V., op. ct., s. 86f, Rahma, M. M. Govdarajulu, Z., A modfcato of the test of Shapro ad Wlk for ormalty, Joural of Appled Statstcs, Vol. 4, No., 997, s. f, Whte, H. MacDoald, G. M., op. ct., s. 8 och Roysto, J. P., A Exteso of Shapro ad Wlk s W Test for Normalty to Large Samples, Appled Statstcs (98), 3, No., s. 6f. 6

och V = ( v j ) motsvarade kovarasmatrs. Detta ebär alltså att för ett ordat stckprov X ( ) X ()... X () frå e stadardserad ormalfördelg är E (X =, =,,, (.3.39) ( ) ) m () Cov (X =,,j =,,,. (.3.4) ( ), X ( j) ) v j Låter v seda u ˆ T = (û ( ), û ( ),..., û ( )) betecka e vektor av ordade OLS-resdualer û () så ges Shapro-Wlks W-test av W där T ( a uˆ ) ( ) ( ) = = = û ( ) û ( ) = = a û, (.3.4) a T T m V = (a (), a (),...,a () ) =. (.3.4) T m V V m W-testet har uppvsat mycket goda resultat jämförade studer över olka ormaltetstests styrka. 33 Det fs dock ett par problem med detta test, vlka båda härrör frå a () -värdea. Dels fs dessa värde edast tllgäglga frå tabeller 34, vlket gör testet ågot otymplgt att aväda, dels fs de edast beräkade upp t.o.m. =5, vlket medför att testet te ka avädas för -värde som är större ä 5. Detta har gjort att dverse författare har föreslagt olka modfergar av W-testet som försöker komma tll rätta med dessa problem. Wesberg-Bghams W ~ -test I Wesberg-Bghams modferade W-test, W ~ -testet 35, ersätts kovarasmatrse V (.3.4) med ehetsmatrse E, med hävsg tll att v för stora stckprov ka sätta v j = för j. Låt u Φ ( ) betecka de versa kumulatva fördelgsfuktoe för de stadardserade ormalfördelge. Ordgsstatstkora m () frå vektor m formel (.3.4) ka då approxmeras med 33 Se t.ex. Ga, F. F. Koehler, K. J., ss. 96-98 och Barghaus, L. Daschke, R. Heze, N., Recet ad classcal tests for ormalty a comparatve study, Commucatos Statstcs Smulato ad Computato, 8(), (989), ss. 37-375. 34 Tabeller med dessa värde fs Shapro, S. S. Wlk, M. B., op. ct., ss. 63-65. 35 Marda, K. V., op. ct., s. 88f. 7

3 m ~ m = Φ 8 ( ) (). (.3.43) + 4 Ersätter v u m T =,m,...,m ) (.3.4) med m ~ T = (m ~,m ~,...,m ~ ) så ka v blda (m() () () Wesberg-Bghams W ~ -test, vlket ges av () () () W ~ = ( m ~ ( m ~ T T uˆ) m ~ ) = û = = = m ~ m ~ () û ( ) ( ) ( ) = û. (.3.44) Rahma-Govdarajulus W ~ -test Ytterlgare e modferg av Shapro-Wlks W-test förslås av Rahma-Govdarajulu 36 geom teststatstka W ~. De föreslår att ordgsstatstkora m () frå vektor m formel (.3.4) skall approxmeras med m( ) h () = Φ. (.3.45) + Låt u φ( ) betecka täthetsfuktoe ( probablty desty fucto ) för de stadardserade ormalfördelge, och blda vektor ~ c T = ( ~ c, ~ c,..., ~ c ) där ~ c ( + )( + ) φ(h )[h φ(h ) h φ(h ) + h + φ(h )],,,..., (.3.46) = + = h φ + = (h ) = h + φ(h ). (.3.47) Rahma-Govdarajulu vsar att vektor a T T a frå formel (.3.4) u ka approxmeras med ~ T ~ T c a = ( ~ a ~ ~ ( ), a( ),..., a ( ) ) =. (.3.48) ~ T c ~ c Om v u ersätter T a teststatstka (.3.4) med teststatstka för Rahma-Govdarajulus W ~ -test, d.v.s. ~ a T frå formel (.3.48) så erhåller v W ~ ~ a ( ) û ( ) ( ~ a u ˆ). (.3.49) T = = = û = = û 36 Rahma, M. M. Govdarajulu, Z., op. ct., ss. -4, 35. 8

de Wet-Veters r-test Ett reodlat korrelatostest är de Wet-Veters r-test 37. Lksom för Rahma-Govdarajulus W ~ -test approxmeras ordgsstatstkora m () med värdea h () frå formel (.3.45). Teststatstka för r-teste ges seda helt ekelt av stckprovskorrelatoe mella h () -värdea och OLS-resdualera û () geom formel (û û)(h h) û (h h) () () () () = = r = =. (.3.5) (û () û) (h () h) û () (h () h) = = = = Fllbetestet (r F -testet) Fllbetestet (r F -testet) 38, slutlge, är e varat av de Wet-Veters r-test. Här ersätts h () - värdet formel (.3.5) med medae för de :e ordgsstatstka frå e stadardserad ormalfördelg, som v beteckar M (). Detta ger oss teststatstka (û û)(m M) û M) () () () () = = r F = =. (.3.5) (û () û) (M () M) û () (M () M) = = = = För att beräka M () -värdea (.3.5) föreslår Fllbe att e trasformerg av de :e medavärdea Mˆ () för ordgsstatstkora frå e rektagulärfördelg om tervallet (,) aväds, eftersom M () = Φ (Mˆ () ). Mˆ () -värdea, s tur, föreslår Fllbe skall approxmeras geom Mˆ, = Mˆ ( ) = (,375) ( +,365 ), =,3,...,( -). (.3.5),5, = (M 37 Verrll, S. Johso, R. A., op. ct., s. 44. 38 Fllbe, J. J., The Probablty Plot Correlato Coeffcet Test for Normalty, Techometrcs, Vol. 7, No., February 975, s. f, 6 och Pfaffeberger, R. C. Delma, T. E., Testg ormalty of regresso dsturbaces A Mote Carlo study of the Fllbe test, Computatoal Statstcs & Data Aalyss (99), s. 65ff. 9

Detta är dessa approxmatva värde v aväder dea uppsats, tllsammas med trasformerge M () = Φ (Mˆ () ), är v beräkar r F -värdea våra Mote Carlosmulergar. Gemesamt för samtlga de regressos- och korrelatosbaserade ormaltetstest som v har behadlat detta avstt är att om störgstermera kommer frå e ormalfördelad populato så skall det observerade värdet på teststatstkora lgga ära, vlket är det maxmala värdet för teststatstkora. Såluda förkastas ollhypotese om ormalfördelg om det observerade värdet för θ N är mdre ä ett vsst krtskt värde C α, d.v.s. RR={θ obs <C α }..4 Heteroskedastctetstest Flertalet av de formella metoder för att upptäcka heteroskedastctet som v studerar dea uppsats baseras på att försöka fa ett sambad mella värdea för störgstermera de förklarade X-varablera, då de seare atas vara ära relaterade tll störgstermera σ. Då de saa u och u dock te är möjlga att observera aväds stället OLS-resdualera û, som atas vara goda skattgar av störgstermera u. Vd multpel regresso ka för vssa test också fråga uppstå om vlka X-varabler som skall avädas för att mäta sambadet med störgstermera eftersom v edast har e förklarade X-varabel. u. Detta problem uppkommer dock ej dea uppsats, Alla de åtta olka heteroskedastctetstest v aväder dea uppsats följer asymptotskt ågo välkäd fördelg. V delar därför heteroskedastctetsteste följade tre grupper:. t-fördelade test.. F-fördelade test χ -fördelade test. I beskrvgara av de olka teste kommer v att kocetrera oss på fallet där v edast har e X-varabel, eftersom det är dea modell som v aväder de smulergar som v kör.

.4. t-fördelade heteroskedastctetstest 39 Parks P-test samt Glejsers G - och G -test Parks och Glejsers heteroskedastctetstest utgår frå atagadet att varase störgstermera u beror av värdea på σ för X. De föreslår seda att detta sambad skall mätas geom e regresso av ågo fukto av OLS-resdualera û på ågo fukto av de förklarade varabel X. Park föreslår sambadet l( û ) l( σ ) + β l(x ) + v = β + β l(x ) + = v, (.4.) meda Glejser har flera olka förslag på hur sambadet ka se ut, av vlka v väljer följade två sambad û = β + β X + v (.4.) û = β + β X + v. (.4.3) I dessa tre formler beteckar v de stokastska störgsterme. Om u β är sgfkat sklt frå oll tyder detta på att störgstermera u är heteroskedastska. Ett test av detta ges av formel t obs. där βˆ =, (.4.4) se(ˆ β ) = û ( ) σˆ = se (ˆ β) = =. (.4.5) (X X) (X X) = Formel (.4.4) är såluda teststatstka för Parks och Glejsers heteroskedastctetstest. V låter dea uppsats P betecka Parks heteroskedastctetstest, utgåede frå formel (.4.), meda G och G beteckar Glejsers heteroskedastctetstest baserade på formlera (.4.) respektve (.4.3). 39 Gujarat, D. N., op. ct., ss. 7, 88 och 369-374.

Spearmas ragkorrelatostest (r S -testet) Ytterlgare ett t-fördelat test är Spearmas ragkorrelatostest ( Spearma s rak correlato test r S -testet). Som framgår av amet är detta ett test som beräkar korrelatoe mella två ragordade varabler. I de verso av testet som v aväder dea uppsats är det värdea för û och X som ragordas. Därefter beräkas skllade rag ( d ) mella dessa, vlke v aväder tll att beräka Spearmas ragkorrelatoskoeffcet ( r s ) med hjälp av formel = = d s 6. (.4.6) ( ) r För >8 ges seda Spearmas ragkorrelatostest r S av r S r s = t obs =. (.4.7) rs För samtlga heteroskedastctetstest som v har behadlat detta avstt gäller att ollhypotese om homoskedastctet förkastas för höga värde. Förkastelseregoe är således RR={θ obs >C α }..4. F-fördelade heteroskedastctetstest 4 Goldfeld-Quadts GQ-test Det eda F-fördelade heteroskedastctetstest v behadlar här är Goldfeld-Quadts heteroskedastctetstest, GQ-testet. Idé bakom detta test är att dela upp de observatoera två lka stora grupper, och seda testa om σ, där σ, j,, är σ j = varase för observatoera frå grupp respektve grupp. Om skllade är sgfkat tyder detta på att störgstermera följade sätt: Sortera värdea för u är heteroskedastska. Ret praktskt går detta tll på X och Y stgade ordg, efter storleke på X - värdea, och ta därefter bort de c mttersta observatoera. Storleke på kostate c ka väljas olka sätt. Här väljer v att sätta c tll 4 Gujarat, D. N., op. ct., s. 37ff.

c = 5. (.4.8) V erhåller då två separata grupper, med (-c)/ observatoer varje grupp. Apassa seda separata OLS-regressoer tll de båda modellera Y = + (.4.9), β, + β,x, u, Y = +, (.4.), β, + β,x, u, där (.4.9) består av observatoer tllhörade grupp och (.4.) utgörs av observatoer tllhörade grupp. Beräka därefter respektve regressos resdualkvadratsumma ( resdual sum of squares ) RSS och RSS, där RSS = û j j, = j, j,, (.4.) vlka här har (-c- )/ frhetsgrader ( degrees of freedom ). GQ-statstka ges seda av RSS / df GQ = ~ F. (.4.) RSS / df Nollhypotese om homoskedastctet förkastas seda om det observerade värdet på θ H är större ä ett vsst krtskt värde C α, d.v.s. RR={θ obs >C α }..4.3 χ -fördelade heteroskedastctetstest Breusch-Paga-Godfreys LM H -test Take bakom Breusch-Paga-Godfreys Lagrage Multpler-test för heteroskedastctet (LM H -testet) 4 är att varase σ för störgsterme u är e ljär fukto av e eller flera av de förklarade X-varablera. Testet är uppbyggt krg Maxmum Lkelhoodestmator av σ, vlke v beteckar med uppsats, är testet kostruerat på följade sätt: Defera p som p ~σ. För modell (.), som v aväder dea û û = ~ =, (.4.3) σ û = och apassa seda e OLS-regresso tll modelle p = α + α X + v, (.4.4) 4 Gujarat, D. N., op. ct., s. 76 och 377f. 3

där v är e stokastskt störgsterm. Det går seda att vsa att om störgstermera ormalfördelade med lka varas så är LM H = ESS = (pˆ = p) där pˆ är OLS-estmatet av p. u är ~ asy. χ, (.4.5) Verbylas ALM H -test Verbylas Adjusted Lagrage Multpler -test för heteroskedastctet (ALM H -testet) 4 e utvecklg av Breusch-Paga-Godfreys LM H -test som har vsat bra resultat. För att kostruera detta test behöver v aväda oss av matrser. Låt Y betecka e -vektor med de beroede varablera Y, X e p-matrs med de första kolume beståede av ettor och de övrga p- kolumera av förklarade varabler, β e p -vektor med β-koeffceter, samt u e -vektor med störgstermera skrvas som u. De klassska ljära regressosmodelle ka då Y = Xβ + u. (.4.6) Frå dea modell ka v få fram e -vektor av regressosresdualer ( û ) samt e p -vektor med de skattade β-koeffcetera (βˆ ) vlka ges av uˆ = Y Xβˆ, (.4.7) ˆ T T β = ( X X) X Y. (.4.8) Låt u betecka e -vektor av ettor, d e -vektor vars :e elemet är q-matrs med de första kolume beståede av ettor och de övrga q- kolumera är û, Z e beståede av de eller de förklarade varabler som heteroskedastctete är beroede av samt H e -matrs som bldas geom H ( ) X T T = X X X. (.4.9) Låt vdare h = (h vara de vektor som bldas av dagoalelemete H, och V T, h,..., h ) vara e -matrs beståede av dagoalelemete ( h ) och elemete j h på övrga platser. Verbylas ALM H -test ka då skrvas som 4 Verbyla, A. P., Modellg Varace Heterogeety: Resdual Maxmum Lkelhood ad Dagostcs, Joural of the Royal Statstcal Socety, Seres B (993), 55, No., ss. 494-5, Lyo, J. D. Chh-Lg, T., A 4

ALM T T T uˆ uˆ T T uˆ uˆ H = ( h) Z(Z VZ) Z d ( h) ~ asy. q d χ p p. (.4.) Breuch-Paga-Godfreys LM H -test ka, med samma termolog, skrvas som LM T T T uˆ uˆ T T uˆ uˆ H = Z(Z Z) Z d ~ asy. q d χ. (.4.) V ser att de båda teste har e lkartad struktur. Whtes W H -test Whtes allmäa heteroskedastctetstest (W H -testet) 43, slutlge, bygger på att heteroskedastctete hos störgstermera u ka mätas geom de kvadrerade OLSresdualera û :s beroede av X-varablera, kvadrate på dessa, krossprodukte mella dem, samt evetuellt högre poteser av dem. För modell (.) formulerar v detta på följade sätt: û = α + α X + α X + v, (.4.) där v är stokastska störgstermer. W H -testet beräkas seda geom att apassa e OLSregresso tll modell (.4.), beräka ( û û ) = R frå dea regresso, det vll säga vˆ = R =, (.4.3) och därefter beräka teststatstka W H = R ~ asy. χ. (.4.4) För χ -fördelade test gäller det att ollhypotese om homoskedastctet förkastas om det observerade värdet på teststatstka är större ä det krtska värdet på e vss sgfkasvå α. För teste detta avstt får v alltså att ollhypotese förkastas om θ H hamar om förkastelseregoe RR={θ obs >C α }. comparso of tests for heteroscedastcty, The Statstca (996), 45, No. 3, s. 343 och Gujarat, D. N., op. ct., ss. 8-9. 43 Gujarat, D. N., op. ct., ss. 77 och 379f. 5

.5 Kombatostest för både ormaltet och homoskedastctet Meda det fs ett stort atal test att tllgå för att testa atge ormaltetsatagadet eller homoskedastctetsatagadet för störgstermera u så fs det bara ytterst få test tllgäglga som är utformade för att samtdgt testa både ormaltetsatagadet och homoskedastctetsatagadet. V skall därför dea uppsats ebart behadla Bera-Jarques LM NH -test 44, och ett atal varater av detta. Detta test är trolge det mest käda kombatostestet, och utmärker sg också geom att vara mycket ekelt att tllämpa praktke. Det utgörs helt ekelt av summa av teststatstkora för LM N - och LM H -teste, vlka ges av formlera (.3.) respektve (.4.5), d.v.s. LM = LM + LM. (.5.) NH N H Bera-Jarque vsade att dea summa asymptotskt följer χ -fördelge. De föreslog också att exempelvs W H -statstka (.4.4) skulle kua ersätta LM H -statstka (.5.). Dea ya teststatstka kallar v för LM N W H, det vll säga LM W = LM + W. (.5.) N H N H V ser att de båda kombatosteste (.5.) och (.5.) helt ekelt bldas geom att summera ett χ -fördelat ormaltetstest och ett χ -fördelat heteroskedastctetstest. Mot dea bakgrud föreslår v här ett atal ya teststatstkor, som v skapar geom att olka kombatoer summera de olka χ -fördelade ormaltets- och heteroskedastctetsteste som v har tagt upp avstte (.3) och (.4). V har fyra olka och tre olka χ -fördelade ormaltetstest χ -fördelade heteroskedastctetsteste. Således får v, klusve LM NH - och LM N W H -teste, totalt tolv olka kombatostest som v kommer att aväda dea uppsats. Förutom LM NH - och LM N W H -teste blr det följade test: LM A = LM + ALM (.5.3) N N H H N N H A LM = ALM + LM (.5.4) NH N H ALM = ALM + ALM (.5.5) N H N H H A W = ALM + W (.5.6) Z NLM N Z + Z NA H Z + = LM (.5.7) H = ALM (.5.8) H 44 Bera, A. K. Jarque, C. M., op. ct., ss. 59-8. 6