Paneldata och instrumentvariabler/2sls

Relevanta dokument
Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Data på individ/hushålls/företags/organisationsnivå. Idag större datamänger än tidigare

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

Modeller för fler än två valmöjligheter. Förekommer både som logit- och som probitmodeller.

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)

Skrivning i ekonometri torsdagen den 8 februari 2007

Korrelation och autokorrelation

STATISTISK ANALYS AV KOMPLEXA DATA

Tentamen i matematisk statistik

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

En empirisk studie om sambandet mellan inspektionsbesök och kemtvättars miljöbeteende i Stockholm

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar

Skrivning i ekonometri lördagen den 29 mars 2008

Repetitionsföreläsning

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Föreläsning 7: Punktskattningar

Finansiell statistik

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Höftledsdysplasi hos dansk-svensk gårdshund

Lektionsanteckningar 11-12: Normalfördelningen

Regressions- och Tidsserieanalys - F7

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Medicinsk statistik II

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

STATISTISK ANALYS AV KOMPLEXA DATA

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Skrivning i ekonometri lördagen den 15 januari 2005

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I

FÖRELÄSNING 8:

Några extra övningsuppgifter i Statistisk teori

Långa räntor, skuldkvot och budgetbalans

7.5 Experiment with a single factor having more than two levels

TENTAMEN I STATISTIK B,

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Grundläggande matematisk statistik

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Föreläsning 12: Regression

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller

Don efter representation

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Elementa om Variansanalys

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Statistik 1 för biologer, logopeder och psykologer

STATISTISK ANALYS AV KOMPLEXA DATA

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Hur skriver man statistikavsnittet i en ansökan?

Matematisk statistik för B, K, N, BME och Kemister

7.5 Experiment with a single factor having more than two levels

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Föreläsning 12: Repetition

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Föreläsning G60 Statistiska metoder

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Kvinnlig politisk representation och dess påverkan på förlossningsvården

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

F8 Avvikelser från modellantagandena I

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

STATISTISK ANALYS AV KOMPLEXA DATA

Tentamen Tillämpad statistik A5 (15hp)

Matematisk statistik, Föreläsning 5

Stokastiska processer med diskret tid

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Kursbeskrivning för Ekonometri, 15 högskolepoäng

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

Propensity Scores. Bodil Svennblad UCR 16 september 2014

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

Parade och oparade test

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Föreläsning 11: Mer om jämförelser och inferens

Skrivning i ekonometri lördagen den 25 augusti 2007

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Transkript:

Extra anteckningar om paneldata; Paneldata och instrumentvariabler/2sls Oavsett REM, FEM eller poolad OLS så görs antagandet att Corr(x,u) = 0, dvs att vi har svagt exogena regressorer. Om detta inte gäller ger ingen av dessa metoder konsistenta skattningar (jmfr med modellen baserad enbart tvärsnittsdata eller enbart på tidsseriedata där varken OLS eller GLS ger konsistenta skattningar om vi har endogena regressorer) Även vid paneldata kan alltså komma att krävas att vi formulerar instrumentvariabler. För att skatta ekvationen väljer vi antingen att skatta en panel-2sls eller skapar våra instrument genom att skatta dessa och spara (x f ) och sätt in i den aktuella ekvationen. (Skatta ekvationen, x1 = f( ), proc forecast x1 f spara och använd som instrument för x1) OBS även här viktigt med identifikation, dvs att instrumentet innehåller tillräckligt mycket unik information. 1

Robust Inference Såväl REM som FEM baseras på antagandet att närvaron av i gör att u it kan antas vara okorrelerad mellan individer och över tiden. Om detta inte håller: Givet att x it -variablerna är strikt exogena leder förekomsten av autokorrelation hos u it till att standardavvikelserna för koefficienterna blir felaktiga (och därmed till dessa kopplade hypotesprövningar). Dessutom leder autokorrelation hos u it till ineffektiva skattningar. Dock inte till inkonsistens. Ett sätt att hantera problem med autokorrelation (liksom även med heteroskedasticitet) är att beräkna robusta standardavvikelser. Att beräkna en panel robust eller cluster-robust varians/covarians matris för poolad OLS alternativt för FEM. 2

Ett annat alternative är att utnyttja Feasible GLS vilket dock kräver specifika antaganden om typ av autokorrelationen och/eller heteroskedasticiteten. Om N är tillräckligt stort relativt T, kan feasible GLS vara ett attraktivt alternative till REM. 3

Test för heteroskedasticitet och autokorrelation Beräkningsmässigt tungt om REM däremot relativt okomplicerat om poolad OLS eller FEM Dock eftersom FEM kan användas även om antagandena för en REM är uppfyllda kan vi förlita oss på test baserade på FEM även för fallet med REM. Ett mycket enkelt test för autokorrelaton baserat på residualerna från FEM baseras på Durbin-Watson testet. Dock med andra kritiska värden än de som ges i den vanliga tabellen. Även när gäller test för förekomst av heteroskedasticitet baseras testet på residualerna från FEM vanligast här en variant av Breusch-Pagan testet 4

Notera också att: - En paneldataansats, lämpligen difference-indifference, är mycket lämplig vid experiment: Vi kan beakta före-och-efter för såväl kontrollgrupp som den grupp som utsatts för treatment. - Goodness-of-fit måtten ska inte användas för att välja mellan olika estimationsformer. Däremot ger dessa mått möjliga kriterier för att välja mellan olika specifikationer av modellen (eg val mellan olika ingående variabler). 5

Paneldata och Limited Dependent Variables Ofta mer komplicerat att estimera relevanta modeller om vid användande av paneldata istället för tvärsnittsdata. Anledningen till detta är framför allt att det oftast inte kan antas ett oberoende mellan observationer. Modeller för (binära) diskreta val Under antagande om FEM gäller att corr( 1, N, x) 0 vilket innebär att antalet parametrar ökar med antalet observationer Detta gäller även för den linjära modellen, men för denna modell är det möjligt att beakta den individspecifika effekten på ett sådant sätt att kan skattas på ett konsistent sätt. För den ickelinjära modellen gäller detta vanligtvis inte. Dvs under FEM svårt att skatta en del av dessa modeller på ett konsistent sätt. 6

Det är visserligen möjligt att tranformera om variablerna på högra sidan på ett sådant sätt att a i elimineras men det är däremot inte möjligt att översätta differensen mellan två latenta variabler exempelvis y * it y * i,t-1 till observerbara variabler av typen y it y i,t-1 eftersom y it kan anta samma värde under båda perioderna för en del av individerna 7

En Fixed Effects Logitmodell kan dock estimeras givet vissa restriktioner av datamängden: Antag T = 2 Corr( i,x) 0 (=FEM) kan hanteras genom att endast de observationer där en individ ändrat sitt val mellan period 1 och period 2 beaktas två möjliga utfall (0,1) eller (1,0) Vi kan här skatta en logitmodell baserad på antagandet om förekomst av fixed effect genom att sätta y it = 1 om individen ändrat sitt val från alt.0 till alt.1 = 0 om individen ändrat sitt val från alt.1 till alt.0 och genom att formulera x-variablerna som differensen mellan period 2 och period 1 x i2 x i1 För fallet med T > 2 krävs lite mer invecklade beräkningar, men principen densamma. 8

Om det å andra sidan är möjligt att anta att i är okorrelerade med x it (=REM) fungerar probitmodellen bättre The Random Effect Probit Model För att skatta med MLE måste modellen kompletteras med ett antagande om den samtidiga fördelningen för i1,...., it. Men, precis som med Poolad OLS om REM, gäller att även om förekomst av korrelationen över period T för individ i så ger probit skattade på den poolade datamängden konsistenta (men ej effektiva) skattningar. Dock med felaktigt beräknade standardavvikelser. Betr Tobitmodellen så kan liknelser betr egenskaper etc ses med en random effect probit. Under antagande om FEM däremot mer komplicerat. 9

10