TILLÄMPAD EKONOMETRI ÖVNINGSKOMPENDIUM HÖSTEN 2018

Relevanta dokument
Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

ÖVNINGSUPPGIFTER KAPITEL 4

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

ÖVNINGSUPPGIFTER KAPITEL 6

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

ÖVNINGSUPPGIFTER KAPITEL 6

Statistik B Regressions- och tidsserieanalys Föreläsning 1

ÖVNINGSUPPGIFTER KAPITEL 10

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

Grundkurs i nationalekonomi, hösten 2014, Jonas Lagerström

LABORATION 3 - Regressionsanalys

Kapitel 19: NATURLIGA EXPERIMENT OCH INSTRUMENT

ÖVNINGSUPPGIFTER KAPITEL 7

Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT

LABORATION 3 - Regressionsanalys

OBS! Vi har nya rutiner.

Föreläsning 10, del 1: Icke-linjära samband och outliers

Introduktion till kausala effekter

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

AVDELNINGEN FÖR HANDELSHÖGSKOLANS EKONOMPROGRAM

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

I grafen ser du sambandet mellan BNP per capita och ekonomisk tillväxt. Just nu har fattiga länder alltså i snitt högre tillväxt än rika länder.

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

HYPOTESPRÖVNING sysselsättning

Statistiska samband: regression och korrelation

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Kursnamn: Vetenskapsteori och grundläggande forskningsmetod

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

TVM-Matematik Adam Jonsson

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

a) Anpassa en trinomial responsmodell med övriga relevanta variabler som (icketransformerade)

Tentamen Metod C vid Uppsala universitet, , kl

ÖVNINGSUPPGIFTER KAPITEL 13

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

Försök att skriva svaren inom det utrymme på sidan som finns. Skriv tydligt! Svara sammanhängande och med enkla, tydliga meningar.

Hanken Svenska handelshögskolan / Hanken School of Economics,

Skolkvalitet, lönsamhet och betygsinflation

NEKP34, Nationalekonomi: Ekonometrisk teori, 7,5 högskolepoäng Economics: Econometric Theory, 7.5 credits Avancerad nivå / Second Cycle

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 HP. Ten1 9 HP. 19 e augusti 2015

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Målet för D1 är att studenterna ska kunna följande: Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

ÖVNINGSUPPGIFTER KAPITEL 12

TENTAMEN I STATISTIK B,

Föreläsning 12: Regression

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

ÖVNINGSUPPGIFTER KAPITEL 9

Data på individ/hushålls/företags/organisationsnivå. Idag större datamänger än tidigare

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU

ÖVNINGSUPPGIFTER KAPITEL 2

Försök att rymma svaren i den platsen som finns. Skriv tydligt! Svara sammanhängande och med enkla, tydliga meningar.

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

OBS! Vi har nya rutiner.

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Logistik (723G48), 7,5 hp Kursinformation VT -2016

BUSR31 är en kurs i företagsekonomi som ges på avancerad nivå. A1N, Avancerad nivå, har endast kurs/er på grundnivå som förkunskapskrav

HF LEQ. Antal svar: 23

Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper

Vad beror benägenheten att återvinna på? Annett Persson

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 16 e januari 2015

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

732G01/732G40 Grundläggande statistik (7.5hp)

Datorövning 5 Exponentiella modeller och elasticitetssamband

Att välja statistisk metod

Working Paper Series

Studiehandbok 1FE196 Introduktion till ekonomistyrning, 7,5

Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009

Examinationsuppgift 2014

Tentamen Tillämpad statistik A5 (15hp)

Finansiell statistik

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

SCB:s statistik om inkomstskillnader

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Föreläsning G60 Statistiska metoder

Matematisk statistik, Föreläsning 5

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Tentamen Tillämpad statistik A5 (15hp)

Regressions- och Tidsserieanalys - F1

ÖVNINGSUPPGIFTER KAPITEL 8

Kursbeskrivning för Ekonometri, 15 högskolepoäng

Justeringar och tillägg till Svar till numeriska uppgifter i Andersson, Jorner, Ågren: Regressions- och tidsserieanalys, 3:uppl.

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

VÄLKOMMEN till fakulteten för samhällsvetenskaper och ekonomi vid Åbo Akademi och

OBS! Vi har nya rutiner.

FÅ FRAM INDATA. När inga data finns!? Beslutsfattarens dilemma är att det är svårt att spå! Särskilt om framtiden!

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

InStat Exempel 4 Korrelation och Regression

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Studieguide och schema Makroekonomi och Arbetsmarknad

Kursens syfte. En introduktion till uppsatsskrivande och forskningsmetodik. Metodkurs. Egen uppsats. Seminariebehandling

Kritisk granskning av forskning

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Statistik 1 för biologer, logopeder och psykologer

Transkript:

TILLÄMPAD EKONOMETRI ÖVNINGSKOMPENDIUM HÖSTEN 2018

Så här gör du för att klara kursen bra: Varför ta kursen? Tillämpad ekonometri gör dig till expert på avancerad ekonometrisk analys. Det här är färdigheter som du har nytta av när du skriver din avhandling, men också i kommande kurser och i arbetslivet. Att kunna lösa komplexa problem med hjälp av stora mängder information blir nämligen en allt mer överlägsen etta på arbetsgivarnas önskelista när det gäller anställdas färdigheter. Världen digitaliseras, automatiseras, svämmar över av data det är en revolution som pågår just nu. Ta därför chansen! Hur funkar kursen? Det enklaste sättet att bli en skicklig empiriker är att använda metoderna till att själv lösa spännande gåtor med hjälp av riktiga datamaterial. I det här kompendiet hittar du 40 sådana gåtor. Ditt uppdrag är att lösa dem. Till din hjälp har du en lektion i veckan, dina kurskamrater, videoklippen i kursens spellista på YouTube och kursboken Methods matter. Observera att boken också finns som e-bok via Åbo Akademi. Hur examineras kursen? Sex hemuppgifter och ett Mästarprov. Varje söndag lämnar du via kurshemsidan in veckans hemuppgifter, varav en lottas fram och bedöms enligt följande: 0 poäng Undermåligt. Innehåller stora fel. Känns slarvigt, otydligt, svag förståelse. Missade deadline. 1 poäng Mindre bra. I stort sett korrekta svar men ibland slarvigt och ytligt. Känns som om skribenten inte fullt ut förstått metoden och utmaningarna eller läst kurslitteraturen ordentligt. 2 poäng Bra. Korrekta resultat med bra tolkningar på ett djupare plan. Endast mindre oklarheter. Tillräckligt kompetent och snyggt för att lämna in som rapport till en arbetsgivare. Högklassiskt och professionellt. Allting korrekt och relevant. Figurer och tabeller felfria. Klart 3 poäng och genomarbetat språk, tydlig röd tråd i svaret. Utmärkt intuitiv och teknisk förståelse för temat. Hänvisar till kurslitteratur och lyckas elegant förklara ämnet för läsaren med egna ord. Hemuppgifterna ger sammanlagt maximalt 20 poäng och Mästarprovet 30 poäng. Tänk på Mästarprovet som en förstudie till din kandidat- eller magisteravhandling; metoderna som du lär dig under kursen kan du använda oavsett huvudämne. För godkänt på kursen krävs att du har minst 25 poäng totalt under kursen: <25=underkänd; 25-30=1; 30-35=2; 35-40=3; 40-45=4; 45-50=5. Varmt välkommen till kursen! Jonas Lagerström (Jonas.Lagerstrom@abo.fi; ASA B236) 2

TEMA 1 (3.9 9.9): Randomiserade experiment Att göra denna vecka: 1) Titta på klipp 1-11, läs sidorna 40-81 i kursboken och gå på måndagslektionen; 2) Gör hemuppgifterna och lämna in via Moodle senast på söndag kväll. 1. Dricker finländarna mer eller mindre när arbetslösheten ökar? På kurshemsidan finns mappen DATA. Öppna kommun1, som innehåller fakta om Finlands kommuner år 2017. a) Hur många kommuner finns i data? b) Vilken är Finlands befolkningsmässigt minsta kommun? c) Vilka kommuner har mellan 500 och 800 invånare? d) I vilka kommuner säljs det mer än fyra gånger så mycket alkohol per person som medelvärdet för alla kommuner? e) Visa ett spridningsdiagram (eng. scatter) med alkoholförsäljningen på den vertikala axeln och arbetslösheten på den horisontella. Kom ihåg att alla tabeller och grafer alltid ska vara självgående, det vill säga läsaren ska inte behöva läsa i brödtexten för att förstå tabellen eller grafen. f) Vad är skillnaden mellan korrelation och kausalitet? Förklara utifrån bilden nedan. 2. Varje gång du klarar 55 studiepoäng på ett läsår får universitet cirka 5 000 euro från staten. 1 Att få upp genomströmningen har därför varit viktigt för ÅA. I studenter ser du alla som skrevs in vid ekonomutbildningen hösten 2011 och deras studiepoäng under det första läsåret. a) Hur många poäng tog studenterna i genomsnitt? b) Visa en lämplig graf med det genomsnittliga antalet studiepoäng hos studenterna, uppdelat per huvudämne. 1 När du tar ut din kandidatexamen får du en länk till enkäten Kandidatrespons. Om du svarar på enkäten får ÅA upp till 8 000 euro. 3

c) Estimera följande modell, där natek är nationalekonomi, red är redovisning och imf är Internationell marknadsföring. Hur tolkar du dina estimat av β 0 och β 1 respektive R2-värdet? sp i = β 0 + β 1 natek i + β 2 red i + β 3 imf i + ε i 3. I högskola finns fakta om 1000 sysselsatta finländare år 2010. Video här. a) Använd outreg2 (tips här) för att replikera resultaten i Tabell 1. b) Varför minskar den estimerade effekten av att ha en högskoleexamen när du går från modell 1 till modell 2? c) Tolka estimatet av högskola i modell 3 (tips här). Speglar den uppmätta effekten utbildningen i sig eller kan det finnas andra förklaringar? 4. Ett bra sätt att träna upp din ekonometriska intuition är att leka med konstgjorda data. Öppna simulera1. Video här. a) Förklara varför den estimerade effekten av skolans betydelse för lönen blir snedvriden (eng. biased) om du inte inkluderar IQ i regressionsmodellen. b) Hur påverkas osäkerheten i den estimerade skoleffekten om du har färre observationer, lägre feltermsvarians respektive lägre varians i variabeln skolår? 5. Nu på söndag är det val i Sverige. Enligt prognoserna kommer Sverigedemokraterna (SD) gå starkt framåt. Men varför röstar folk på SD? I SD ser du hur det gick för partiet i respektive kommun i valet 2014. (3p) SD i = β 0 + β 1 utrikes i + β 2 arbetslöshet i + β 3 högutbildade i + ε i (1) 4

a) Visa ett spridningsdiagram över sambandet mellan andelen röster på Sverigedemokraterna och arbetslösheten i kommunen. b) Estimera (1), presentera resultaten i en tabell och tolka ditt estimat av β 1. c) Förklara tydligt varför ditt estimat av β 1 knappast kan tolkas kausalt. d) År 2018 har Bengtsfors 25,6 procent utrikesfödda, arbetslösheten är 16,5 procent och andelen högutbildade är 24,3 procent. Använd din modell för att göra en prognos för hur stor andel av rösterna som SD kommer att få i Bengtsfors. 6. Randomiserade experiment ger möjligheter att mäta kausala effekter. (3p) a) Studenter som går på föreläsningarna presterar i snitt bättre än de som inte går på föreläsningarna. Många lärare vill därför införa obligatorisk närvaro. Men betyder mönstret verkligen att föreläsningar leder till förbättrade prestationer? b) Finland genomför just nu ett randomiserat experiment med medborgarlön. Även vid randomiserade experiment finns dock fallgropar, vilka beskrivs utförligt i kursboken. Vilka två fallgropar tror du är störst i försöket med medborgarlön och hur kommer de troligen att påverka resultaten? c) Vad innebär begreppet väntevärdesriktighet? 7. Alexandra Granlund undersökte i sin kandidatuppsats vad som påverkar hur du lyckas på tentamen. Vilken betydelse spelar till exempel dina klasskamrater? På vissa kurser vid Åbo Akademi har det ingått ett grupparbete, där läraren lottade grupperna. Om du hade tur fick du alltså arbeta med duktiga studenter, annars med svaga (i termer av resultat på tidigare kurser). Data finns i kamrateffekter. (3p) tentpoäng i = β 0 + β 1 kamratnivå i + β 2 kvinna i + β 3 ekonom i + ε i (2) a) Estimera (2), presentera resultaten i en tabell och tolka dina estimat av β 0 och β 2. b) Måste du inkludera variabeln kvinna i modellen för att den estimerade kamrateffekten ska vara väntevärdesriktig (eng. unbiased)? c) Anta att läraren inte lottar grupperna. Hur tror du att det skulle påverka ditt estimerade värde av β 1? Instruktioner: Lämna in dina svar på uppgifterna 5 7 senast 9.9 via kurshemsidan. Lottdragning avgör vilken av uppgifterna som rättas och bedöms. Skriv ditt namn på en framsida. 5

TEMA 2 (10.9 16.9): Naturliga experiment Att göra denna vecka: 1) Titta på klipp 12-14, läs sidorna 135-164 i kursboken och gå på måndagslektionen; 2) Gör hemuppgifterna och lämna in via Moodle senast på söndag kväll. 8. I din kandidatavhandling i sociologi vill du mäta sambandet mellan arbetslöshet och rattfylla. I rattfylla ser du antalet fall av rattfylleri som kommit till polisens kännedom (per 1000 invånare) år 2017. Du vill nu inkludera information om respektive kommun för att se om rattfyllorna är fler där arbetslösheten är hög. a) Slå ihop datamaterialet rattfylla med kommun1. b) Visa en tabell med deskriptiv statistik. I kolumn 1 visas läget i samtliga kommuner; i kolumnerna 2 och 3 läget i kommuner med låg respektive hög arbetslöshet. c) Estimera två modeller för sambandet mellan arbetslöshet och rattfylla. Låt den andra modellen vara en utökad version av den första. Visa resultaten i en tabell. d) Vilket antagande krävs för att den estimerade effekten av arbetslöshet ska ha en kausal tolkning? 9. Enligt många ekonomiska teorier leder minimilöner till arbetslöshet, men stämmer det med verkligheten? Card och Krueger undersökte vad som hände med antalet anställda på snabbmatsrestauranger i New Jersey när delstaten höjde minimilönen kraftigt. För att ta hänsyn till eventuella generella förändringar på den amerikanska arbetsmarknaden (till exempel konjunkturen eller minskat intresse för snabbmat) tittade forskarna också på vad som hände i grannstaten Pennsylvania, där man inte ändrade minimilönen. Data hittar du i minimilön. a) Hur många arbetade i genomsnitt på varje restaurang i New Jersey före respektive efter New Jersey höjde minimilönen? b) Vilka var motsvarande siffror i Pennsylvania? c) Estimera (4), visa resultaten i en tabell och tolka dina estimat av β 1, β 2 och β 3. sysselsättning i = β 0 + β 1 NJ i + β 2 AFTER i + β 3 (NJ AFTER) i + ε i (4) där NJ har värdet 1 för New Jersey och värdet 0 för Pennsylvania; AFTER har värdet 1 efter höjningen av minimilönen och värdet 0 innan höjningen. d) Ge ett konkret exempel på vad som kan göra att β 3 inte är den kausala effekten. 6

e) Använd Google Scholar och funktionen CITERA för att ta fram en referens till studien om minimilönernas effekter. Använd APA-formatet. 10. Hösten 2012 införde HHÅA en bonus på 500 euro till alla som tar sin kandidatexamen på max sex terminer. Reformen gäller enbart EK-studenter. Data hittar du i bonus. Video här. a) Visa ett histogram på studiepoäng per termin bland EK-studenterna före reformen. b) Utvärdera försöket med hjälp av metoden difference-in-differences. Presentera och tolka dina resultat. c) Varför bör du även inkludera andra exogena förklarande variabler i modellen? d) Är det troligt att det centrala antagandet i modellen är uppfyllt? 11. Hur vår ekonomi påverkas av invandring är just nu en glödhet fråga. Du ska här göra och presentera resultaten från en egen empirisk undersökning. Använd finska kommundata från ett givet år via Institutet för hälsa och välfärd här. Slumpa fram och använd endast 100 kommuner. (3p) a) Visa ett spridningsdiagram över sambandet mellan arbetslöshet och andelen utrikesfödda i kommunen. Se till att kommunernas namn syns i figuren. b) Visa deskriptiv statistik i en snygg tabell: Hur hög är arbetslösheten i genomsnitt i alla kommuner, i kommuner med hög andel utrikesfödda respektive i kommuner med låg andel utrikesfödda? Inkludera i tabellen även medelvärden för två andra variabler som du tror kan påverka arbetslösheten i kommunen. c) Skriv upp och motivera din ekonometriska modell. d) Estimera din modell, visa resultaten i en tabell och tolka dina resultat. e) Redogör för slutsatserna från Mariel Boatlift här. Varför har resultaten från detta naturliga experiment högre trovärdighet när det gäller invandringens arbetsmarknadseffekter än den studie som du själv just har gjort? 12. Barn som tittar mycket på teve är i snitt mer våldsamma, mer överviktiga och lyckas sämre i skolan än barn som inte tittar mycket på teve. Det behöver dock inte betyda att tv-tittande leder till våld, övervikt och usla skolresultat. Kanske finns det något speciellt i 7

miljön hos de barn som tillbringar dagarna framför teven och som i sig är orsaken till att barnen klarar sig sämre på sikt än barn som inte tittar mycket på teve? (3p) a) Ge minst tre exempel på dessa alternativa förklaringar! b) För att komma runt selektionsproblemet utnyttjar Gentzkow och Shapiro här ett naturligt experiment. Hur bär de sig åt och vilka resultat finner de? c) Blir man lyckligare av pengar? Många studier har jämfört rika och fattiga människor och funnit att de rika i snitt är lyckligare än de fattiga. Vad är nackdelen med denna metod jämfört med till exempel studien här? Instruktioner: Lämna in dina svar på uppgifterna 11 12 senast 16.9 via kurshemsidan. Lottdragning avgör vilken av uppgifterna som rättas och bedöms. Skriv ditt namn på en framsida. 8

TEMA 3 (17.9 23.9): Regression Discontinuity Att göra denna vecka: 1) Titta på klipp 15-16, läs sidorna 165-185 i kursboken och gå på måndagslektionen; 2) Gör hemuppgifterna och lämna in via Moodle senast på söndag kväll. 13. Deltagarna på Tillämpad ekonometri vill utvärdera om föreläsningar gör att studenterna lär sig mer, eller om Åbo Akademi helt bör gå över till läskurser. Ni begär 25.000 euro av rektorn för att utreda frågan. a) Rektorn säger: Vi vet redan att föreläsningar gör nytta eftersom studenter som går på föreläsningarna lyckas bättre på tentorna än studenter som skippar föreläsningarna. Vad är fel i rektorns resonemang? b) Kan ni få fram den kausala effekten av föreläsningar på provresultat genom att estimera regressioner med många kontrollvariabler? c) Anta att ni får igenom följande reform på grundkursen i nationalekonomi: Halvvägs in i kursen måste studenterna skriva ett prov. För dem som får mindre än hälften rätt blir resterande föreläsningar obligatoriska. För övriga är föreläsningarna även fortsättningsvis frivilliga. Hur kan ni utnyttja detta upplägg för att mäta om föreläsningar faktiskt spelar någon roll för lärande? 2 14. På YouTube undrade jag om man blir en bättre idrottare av att gå på idrottsgymnasium. Exemplet byggde på det fejkade datasetet tennis. a) Replikera resultaten i regressionsutskriften och grafen på slide 15.7. b) Hur många fler matcher (i procent) vinner man i snitt tack vare idrottsgymnasiet? c) I materialet ingår både du och Björn Borg. Är det bra eller dåligt? d) För vilka slags tennisspelare kan du generalisera resultaten? 15. Våren 2019 presenterar du din kandidatuppsats, där du använt observationsdata för att mäta hur ett extra skolår påverkar lönen. Din opponent ställer tuffa frågor. a) Anta att korrelationen mellan skolår och IQ är noll. Måste du i så fall ha med IQ i modellen för att den estimerade skolårseffekten ska bli väntevärdesriktig? Förklara med hjälp av simulera2. b) Tidigare forskning tyder på att korrelationen mellan skolår och IQ är kraftigt positiv. Överskattas eller underskattas effekten av skolår på lön om du inte inkluderar IQ i modellen? Förklara med hjälp av simulera2. 16. Är det sant att vänstern satsar mer på välfärden än högern? I skolbudget ser du hur stor andel av skatteintäkterna som olika amerikanska städer satsar på skolan. Du ser också hur stor del av rösterna som gick till demokraterna i senaste valet. Använd RD för att mäta om demokraterna satsar mer på skolan än republikanerna. Presentera resultaten i en tabell där första kolumnen antar en linjär trend och andra kolumnen en icke-linjär trend. Tolka och förklara! 2 Rapporten Skipping class in college and exam performance hittar du här. 9

17. Du jobbar som analytiker inom Försvarsmakten. Ditt uppdrag är att mäta hur militärtjänstgöringen påverkar framtida lön. Använd det fejkade datasetet lumpen. (3p) a) Anta att selektionen in i militärtjänstgöring avgörs av ett index (0-10) som visar individens resultat på ett antal tester. Försvaret tar in alla som har ett index på eller över 7.75, men ingen som ligger under gränsen. Du vill använda RDmetoden. Skriv upp och förklara din ekonometriska modell. b) Gör en RD-analys och presentera dina resultat dels i en graf, dels i en tabell där den ena kolumnen antar en linjär trend och i den andra kolumnen en icke-linjär trend. Förklara dina resultat för en läsare som inte vet någonting om ekonometri. Hur många procent högre lön förväntas man få av militärtjänstgöringen? Är effekten statistiskt signifikant? Gäller den här effekten för alla slags människor? Varför ändras estimatet när du tillåter för en icke-linjär trend? 18. Niklas Lahtinen undersökte i sin kandidatuppsats om tillgången till en bra skola påverkar bostadspriserna i Vasa. Alla som bor inom samma upptagningsområde måste gå i en viss skola. Barn som bor på en viss sida av gränsen går alltså i en annan skola än barn som bor i lägenheter tvärs över gatan. Ett utdrag på 347 sålda lägenheter hittar du i vasa. (3p) a) Gränsen mellan bra och dålig skola går vid avståndet 1000 meter (tänk dig att lägenheterna ligger längs en linje). Använd RD-metoden för att estimera hur 10

bostadspriset påverkas av en bra skola. Se till att du tagit hänsyn till åtminstone skillnader i bostadsyta. Hur mycket stiger bostadspriset tack vare att det finns en bra skola i området? Är effekten signifikant? b) Niklas uteslöt bostäder som låg långt från gränsen. Vad är fördelen respektive nackdelen med att utesluta bostäder som ligger långt från gränsen? c) Har studien intern respektive extern validitet? 19. Utbildning är avgörande för ett lands ekonomiska tillväxt. Exakt hur man ska få studenter att lära sig mer är dock omstritt. Ett populärt förslag är att minska klassernas storlek. (3p) a) Förklara hur och varför forskare har använt Maimonides regel för att mäta klasstorlekens betydelse för lärandet. b) Varför centrerar man i RD-metoden om den tvingande prediktorn (eng. forcing predictor) så att den får värdet 0 vid tröskelvärdet? c) Kursboken tar upp flera andra hot mot RD-metodens tillförlitlighet. Redogör för två tänkbara problem. Instruktioner: Lämna in dina svar på uppgifterna 17 19 senast 23.9 via kurshemsidan. Lottdragning avgör vilken av uppgifterna som rättas och bedöms. Skriv ditt namn på en framsida. 11

TEMA 4 (24.9 30.9): Instrument Att göra denna vecka: 1) Titta på klipp 17-21, läs sidorna 203-232 i kursboken och gå på måndagslektionen; 2) Gör hemuppgifterna och lämna in via Moodle senast på söndag kväll. 20. Med ett instrument kan du mäta den kausala effekten fastän du saknar data på viktiga förklarande variabler. Använd simulera3. a) Visa med hjälp av simulering att IV-metoden ger väntevärdesriktiga 3 estimat. b) Visa att en korrelation mellan instrumentet avstånd och feltermen leder till bias. c) Visa att osäkerheten vid IV-skattningen blir mindre ju starkare instrumentet avstånd korrelerar med variabeln skolår. 21. Röker folk mindre om vi höjer cigarettpriserna? Cigarett visar försäljningen på delstatsnivå i USA år 1995. Ett tänkbart instrument är den lokala skattesatsen på cigaretter. a) Estimera sambandet mellan den lokala skatten på cigaretter och det faktiska cigarettpriset. Hur tolkar du det uppmätta R 2 -värdet? b) Estimera hur konsumtionen av cigaretter beror på cigarettpriset, där du har instrumenterat cigarettpriset med hjälp av den lokala skattesatsen på cigaretter. Redovisa ditt resultat. 22. Acemoglu mäter äganderättens betydelse för ekonomisk utveckling. Han använder data om före detta kolonier och mäter om dagens BNP per capita är högre där äganderätten är starkt skyddad. Använd äganderätt och skatta (5): log(bnp/capita) i = β 0 + β 1 skydd i + β 2 euro i + β 3 latitud i + β 4 afrika i + ε i (5) a) Hur tolkar du ditt estimat av β 1? b) Länder med svag äganderätt kan dock ha andra icke-observerbara egenskaper som i sig gör landet fattigt. Acemoglu använder därför dödligheten hos kolonisatörerna på 1800-talet som ett instrument för dagens äganderätt: I kolonier där dödligheten var hög på 1800-talet brydde sig européerna kanske aldrig om att stärka äganderätten. Finns det verkligen ett samband mellan dödligheten bland kolonisatörerna på 1800-talet och äganderätten i landet i dag? skydd i = β 0 + β 1 logmort i + ε i c) Estimera nu (5) igen men använd de predikterade värdena på skydd. Hur skiljer sig IV-estimaten från de ursprungliga OLS-estimaten och varför? 23. Du vill mäta om en högre utbildning påverkar sannolikheten att rösta i politiska val. a) Du använder först observationsdata. Härled uttrycket för den så kallade omitted variable bias. Förklara för läsaren vad det här betyder i praktiken. 3 För att vara helt korrekt: IV-metoden är en konsistent estimator, det vill säga bara vi har ett tillräckligt stort sampel så kan vi komma hur nära sanningen som helst. 12

b) Två saker måste vara uppfyllda för att ett instrument ska fungera. Vilka är dessa två antaganden och går det att testa om de är uppfyllda? 24. Lär du dig mer om du går på föreläsningarna? Deskriptiv statistik från grundkursen i nationalekonomi ser du nedan. a) Man kan också se att studenter som går på föreläsningarna presterar betydligt bättre på tentamen än andra studenter, men detta kan spegla problemet med utelämnade variabler (eng. omitted variable bias). Förklara! b) Just nu består grundkursen av fyra grupper. Alla träffas varje tisdag, men under olika tider (8-10; 10-12; 13-15 och 15-17). Anta att jag lottar in studenterna till dessa grupper. Är det här ett giltigt instrument om jag vill mäta hur närvaro påverkar provresultat? 25. I college1 ser du löner och utbildning hos tusen amerikaner. Estimera (6): log(lön) i = β 0 + β 1 skolår i + β 2 age i + β 3 svart i + ε i (6) där skolår är antalet skolår, age är ålder och svart är en dummy med värdet 1 för svarta (0 annars). (3p) a) Presentera dina resultat i en tabell, där den första kolumnen enbart inkluderar skolår och den andra kolumnen även inkluderar age och svart. Varför ändras den estimerade skolårseffekten när du inkluderar de förklarande variablerna? b) Vilka två antaganden måste vara uppfyllda för att närheten till college ska vara ett giltigt instrument för skolår? c) I college2 syns hur långt de tusen individerna har till närmsta college. Använd materialet för att estimera (6) men instrumentera nu skolår med variabeln nära. Redovisa och tolka ditt resultat. d) Du har estimerat LATE. Vad innebär det i praktiken i det aktuella fallet? 26. Att utvärdera effekterna av politiska satsningar är svårt men roligt. Läs här ur boken Nationalekonomins frågor. (3p) 13

a) Förskolan är en viktig pelare i den nordiska välfärdsmodellen. Den motiveras ofta med att den ökar kvinnornas arbetsutbud och är bra för barnen. Men är detta verkligen sant? Sammanfatta med egna ord de metodologiska utmaningarna och de centrala slutsatserna. Använd maximalt 200 ord! b) Leder mindre skolklasser till förbättrade studieresultat? Sammanfatta med egna ord de metodologiska utmaningarna och de centrala slutsatserna. Använd maximalt 200 ord! 27. Flera länder använder Maimonides regel när de delar upp skolbarn i klasser. I den här uppgiften ska du använda israeliska data och IV-metoden för att mäta om större klasser leder till sämre provresultat. Datafilen heter maimonides. (3p) a) Visa deskriptiv statistik på hur det går för de israeliska eleverna i snitt. Finns det en skillnad i provresultat mellan de som gått i små respektive stora klasser? b) Du ska nu estimera följande samband: matte i = β 0 + β 1 klasstorlek i + β 2 andel flickor i + ε i där matte är klassens genomsnittliga resultat (% rätt) i matematik i årskurs 7, klasstorlek är antalet elever i klassen och andel flickor visar andelen av femteklassarna på skolan som är flickor. Estimera sambandet dels med hjälp av OLS (kolumn 1), dels med hjälp av IV-metoden (kolumn 2) enligt Maimonides regel. Varför skiljer sig den estimerade effekten av klasstorlek åt mellan skattningarna? Instruktioner: Lämna in dina svar på uppgifterna 25 27 senast 30.9 via kurshemsidan. Lottdragning avgör vilken av uppgifterna som rättas och bedöms. Skriv ditt namn på en framsida. 14

TEMA 5 (1.10 7.10): Fixa effekter Att göra denna vecka: 1) Titta på klipp 22-24, läs sidorna 107-134 i kursboken och gå på måndagslektionen; 2) Gör veckans hemuppgift och lämna in via Moodle senast på söndag kväll. 28. År 1990 drabbades Finland av en djup kris, där vissa kommuner drabbades hårdare än andra. Du kan använda paneldata på kommunnivå för att mäta om arbetslöshet ökar supandet. Materialet krisen har jag plockat från Institutet för hälsa och välfärd. a) Visa deskriptiv statistik om läget år 1996. Tabellen ska visa situationen i samtliga kommuner, men också separat för de med hög respektive låg arbetslöshet. b) Skriv upp din ekonometriska modell som också innehåller kommunfixa effekter. Kom ihåg att tiden alltid ska ingå i dessa typer av modeller. c) Estimera modellen med respektive utan kommunfixa effekter. Förklara i enkla ord varför den estimerade effekten av arbetslöshetens betydelse för supandet ändras när du inkluderar kommunfixa effekter. 29. De senaste decennierna har inkomstklyftorna i rika länder ökat. Vanliga förklaringar är globaliseringen och digitaliseringen, men vissa menar också att det kan bero på att allt fler lever ensamma och att andelen invandrare har ökat. a) Visa en egen graf över hur inkomstklyftorna i Finland har utvecklats under perioden 1995-2014. Du hittar data exempelvis här (tryck på mynthögen). b) Data för finska kommuner ser du i gini9512 och kommun9113. Slå ihop dataseten, använd endast data från åren 1998-2010, estimera (7) och presentera resultaten i en tabell. Tolka ditt estimat av β 3. gini it = β 0 + β 1 utlänn it + β 2 arblöshet it + β 3 ensamhushåll it + β 4 year t + u i + ε it (7) c) När du förklarar (7) på kandidatseminariet undrar opponenten varför du egentligen har med kommunfixa effekter. Vad svarar du? 15

30. Anton Brotkin skrev sin gradu om hur vi påverkas av ekonomiska incitament. Får du fler poäng på tentan om du får betalt utifrån vitsord? Kan en fabrik få de anställda att tillverka mer genom att ge lön utifrån prestation? a) Professorer tjänar mycket mer än övriga lärare, och presterar i regel också mer. Betyder detta att högre lön leder till förbättrade prestationer? b) Anton använder i stället data från VM i dart. För varje individ varierar de ekonomiska incitamenten kraftigt över tid. Använd individfixa effekter och mät hur spelarna påverkas av ekonomiska drivkrafter. Vilka slutsatser drar nu? 31. Materialet bolag13 innehåller fakta om finska börsbolag år 2013. Allt fler vill lagstifta om en jämn könsfördelning i bolagsstyrelserna, men andra varnar för att lagstiftningen kan leda till lägre vinster. a) Visa ett spridningsdiagram över sambandet mellan företagets vinst och andelen kvinnor i företagsledningen. Inkludera linjen över det predikterade sambandet. b) Datasetet bolag12 innehåller motsvarande information för år 2012. Använd båda materialet för att estimera (8), där u är företagsfixa effekter, och tolka ditt estimerade värde av β 1 : vinst it = β 0 + β 1 kvinnor it + β 2 anställda it + β 3 2013 t + u i + ε it (8) 16

32. I tvillingdata finns uppgifter om 41-åriga finska tvillingpar år 2004. Använd materialet för att undersöka om giftermål leder till högre inkomst. a) Visa en tabell där du redovisar den genomsnittliga lönen för gifta respektive ogifta samt medelvärdet för minst en annan variabel som du tror påverkar inkomsten. b) Estimera (9) och redovisa dina resultat. Tolka ditt estimat av β 1 och uppge tydligt vad som måste gälla för att effekten ska kunna tolkas kausalt. log(inkomst) is = β 0 + β 1 gift is + β 2 kvinna is + β 3 svenskspråkig i + ε is (9) c) Estimera (9) men inkludera nu också tvillingfixa effekter. Förklara med enkla ord varför ditt estimat av β 1 nu har ändrats. d) Hur ändrades ditt estimat av β 3 och varför? 33. Med hjälp av din ekonometriska verktygslåda kan du nu lösa mängder av ekonomiska och samhällsvetenskapliga gåtor. Tänk på att alltid vara glasklar med vad du gör och varför. I veckans hemuppgift ska du välja och analysera en av frågorna nedan med hjälp av valfria paneldata. Din analys får inte vara längre än 3 A4. Lycka till! (3p) Minskar barnafödandet när arbetslösheten stiger? En ekonometrisk analys av paneldata. Beror problemen i den svenska skolan på att andelen elever med utländsk bakgrund har stigit? Leder EMU till ökad internationell handel? Är det den höjda utbildningsnivån som gjort att brottsligheten minskat? Instruktioner: Lämna in ditt svar på uppgift 33 senast 7.10 via kurshemsidan. Skriv ditt namn på en framsida. 17

TEMA 6 (8.10 14.10): Matchningsanalys Att göra denna vecka: 1) Titta på klipp 25-28, läs sidorna 286-324 i kursboken och gå på måndagslektionen; 2) Gör veckans hemuppgifter och lämna in via Moodle senast på söndag kväll. 34. Får du högre lön av att vara med i facket? I facket ser du information om ett antal heltidsarbetande finländare. a) Visa en tabell med relevant beskrivande statistik. Finns det en skillnad i lön respektive i övriga faktorer mellan fackmedlemmar och icke fackmedlemmar? b) Estimera valfri LPM för sannolikheten att vara med i facket. Hur tolkar du den estimerade kvinnoeffekten? c) Logitmodellen har två fördelar jämfört med LPM. Vilka? d) Använd matchningsmetoden (nearest neighbour) och estimera löneeffekten av att vara med i facket. Vilket antagande krävs för en kausal tolkning? 35. En av de hetaste företeelserna inom utvecklingsekonomi kallas för mikrolån. Tanken med mikrolån är att fattiga ska få låna pengar utan säkerhet. Men leder mikrolån verkligen till att fattiga i Bangladesh får högre inkomst på sikt? Använd mikrolån och matchningsmetoden för att lösa gåtan. a) Estimera en valfri modell LPM eller logit för sannolikheten att hushållet får ett mikrolån. Vilka slags hushåll är mest benägna att få ett mikrolån? b) Dela upp ditt material i valfritt antal block och beräkna manuellt ATE och ATT av mikrolån på inkomsten tre år senare. c) Matcha med hjälp av nearest neighbour och redovisa ditt resultat tydligt: Hur påverkas inkomsten tre år senare av att hushållet fått ett mikrolån? 18

d) Matchningsanalys bygger på antagandet om selection on observables. Vad innebär antagandet? 36. Leder de höga kostnaderna för att få sjukvård i USA till att amerikaner utan sjukförsäkring avstår från att söka vård? I sjukförsäkring ser du fakta om 1000 amerikaner från år 2001 med information om huruvida de har en sjukvårdsförsäkring. a) Estimera sannolikheten att ha en sjukvårdsförsäkring med hjälp av LPM. Hur många individer i data har en predikterad sannolikhet på mellan 46 och 58 procent att ha en sjukvårdsförsäkring? b) Undersök med hjälp av nearest neighbour om en sjukvårdsförsäkring påverkar sättet som amerikaner söker vård. Tolka ditt resultat. c) Ge ett exempel på varför estimatet inte nödvändigtvis speglar den kausala effekten av att ha en sjukvårdsförsäkring på benägenheten att avstå från vård. 37. Drabbas ditt barn om du röker under graviditeten? I rökning ser du medicinska data för 1000 födslar i USA. Estimera sambandet mellan rökning och barnets födelsevikt och presentera dina resultat i en tabell där de första två kolumnerna visar resultaten från en regressionsmodell och den sista kolumnen visar resultaten från en matchningsanalys utifrån nearest neighbour. 38. Materialet skilsmässa innehåller data om inkomster och civilstatus år 1997 för ett antal finländare. Vissa av individerna skiljer sig år 1997. Du ska nu använda matchningstekniken för att mäta hur en skilsmässa påverkar inkomsten några år senare. (5p) a) Liksom regressionsanalys antar matchning att begreppet unconfoundness gäller. Vad betyder detta antagande i praktiken? b) Estimera sannolikheten för skilsmässa. Skapa därefter ett lämpligt antal block utifrån den estimerade sannolikheten och beräkna skilsmässoeffekten. Redovisa ATT och ATE skilt och förklara varför dessa skiljer sig från varandra. c) Med hjälp av materialet är det även möjligt att estimera modeller med tvillingfixa effekter. Varför anses studier på tvillingdata ofta vara mer tillförlitliga än andra observationella studier på tvärsnittsdata? 39. Lär sig elever mer på katolska gymnasier än i kommunala? Att elever på katolska skolor presterar bättre ledde på 1980-talet till att president Reagan subventionerade katolska skolor, men det är tänkbart att de fina resultaten i katolska skolor också drivs av en selektionseffekt. Lös nu gåtan med hjälp av katolik. (5p) a) Presentera resultaten från en regressionsanalys där den första kolumnen endast visar skillnaden i matematikresultaten mellan katolska och kommunala skolor och där nästa kolumn också tar hänsyn till andra observerbara skillnader mellan elever i katolska och kommunala skolor. b) Hur stor är den estimerade effekten då du matchar på propensity score (nearest neighbour)? 19

c) Läs här ur boken Nationalekonomins frågor. Leder praktikplatser till att arbetslösa ungdomar får jobb snabbare? Sammanfatta med egna ord de metodologiska utmaningarna och de centrala slutsatserna. Använd maximalt 200 ord! Instruktioner: Lämna in dina svar på uppgifterna 38 39 senast 14.10 via kurshemsidan. Lottdragning avgör vilken av uppgifterna som rättas och bedöms. Observera att denna veckas hemuppgifter ger maximalt 5 poäng. Skriv ditt namn på en framsida. 20

MÄSTARPROVET Du har nu lärt dig många ekonometriska tekniker som du kan använda för att estimera kausala samband. I ditt mästarprov är det dags att visa att du har svart bälte i ekonometri! Du får helt fritt välja din frågeställning och ditt datamaterial, och använda metoder som du har lärt dig under kursen. Var tydlig: Vad gör du? Hur gör du? Varför är det intressant? Originalitet och djup i analysen väger tungt! Forskningstips här. Väck läsarens intresse direkt och håll intresset uppe genom hela uppsatsen. Ställ alltid upp och motivera din ekonometriska modell. Varje tabell och graf ska vara självförklarande, det vill säga läsaren ska inte behöva läsa i brödtexten för att förstå tabellen eller grafen. Läs texten högt för en kompis. Om texten är stendöd eller obegriplig så skriv om! Kom ihåg: Empiri utan teori är suspekt och teori utan empiri är meningslöst. Problematisera, reflektera, kritisera, motivera dina beslut, diskutera validitet och känslighet, jämför med relaterade studier. Visa att du har ett ekonometriskt djup. Om du är osäker på akademiskt skrivande så repetera till exempel här. Ditt mästarprov ska bestå av 1 framsida, 1 sidas innehållsförteckning, 7 sidor text och 1 sidas källförteckning. 4 Instruktioner: Titta på klipp 28 och läs sidorna 332-368 i kursboken. Skicka in ditt mästarprov senast 28.10 via kurshemsidan. Lycka till! 4 Det finns en berömd anekdot om Churchill då han ombads säga några ord vid en fest. Han skulle bara tala i tio minuter, så det borde väl inte vara några problem ansåg festkommittén.»ja, men jag måste veta om det minst fjorton dagar i förväg«, sa Churchill.»Fjorton dagar!«, utbrast förespråkaren.»hur lång tid skulle ni då behöva för att förbereda ett tal på en timme?tre dagar«, löd det överraskande svaret.»och om ni skulle tala i tre timmar, Sir Winston?Ja, då skulle jag kunna börja tala med detsamma.«21