ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER 1. Regressionen nedan visar hur kvinnors arbetsmarknadsdeltagande varierar beroende på om de har småbarn eller inte. Datamaterialet gäller 753 amerikanska kvinnor år 1975. Variabeln timmar mäter antalet timmar som kvinnan jobbade under året; småbarn är en dummy som antar värdet 1 om hon hade barn i åldrarna 0-5 år och annars värdet 0: timmar = 836 488småbarn a. Hur många timmar jobbade i genomsnitt en kvinna utan småbarn? En kvinna med småbarn? Vi kontrollerar nu också för kvinnans ålder och får följande resultat: timmar = 1629 651småbarn 18ålder b. Tolka koefficienten för småbarn. c. Prediktera antalet arbetstimmar för en 30-årig kvinna utan småbarn. d. Tolka koefficienten för ålder. 2. Vi mäter skillnaden i lön mellan män och kvinnor år 2010. Regressionen nedan visar att männen i samplet i genomsnitt tjänade 3000 euro, och att kvinnorna i snitt tjänade 500 euro mindre: lön 2010 = 3000 500kvinna Vi kontrollerar nu för personernas löner år 2009: lön 2010 = a + b 1 kvinna + b 2 lön 2009 Vilket av följande alternativ beskriver bäst vad som händer med koefficienten för kvinna: a. b 1 kommer fortsättningsvis att ha värdet -500. b. b 1 mäter nu löneskillnaden mellan kvinnor och män år 2009. c. b 1 kommer antagligen att få ett värde närmare noll. d. b 1 kommer antagligen att få ett mer negativt värde. 3. Studenter som går på många föreläsningar har i snitt bättre tentresultat. Men hjälper verkligen föreläsningarna eller är det istället de duktigaste studenterna som går på flest föreläsningar? Du vill nu undersöka detta. Du har tillgång till ett datamaterial som innehåller följande variabler: Studentens poäng på kurstenten (variabeln poäng), antalet föreläsningar som studenten deltog i (variabeln
deltagande) och studentens poäng på inträdesförhöret till universitetet (variabeln inträde). Data samlas in för 100 studenter på deras första grundkurs vid ÅA. a. Hur skulle du mäta om föreläsningarna hjälper? Ställ upp en regressionsekvation som visar vilken variabel som är beroende, och vilken eller vilka variabler som är oberoende. b. Se fråga a: Vilket resultat kan du förvänta dig att se om det är så att föreläsningarna hjälper? Använd här din regressionsekvation från uppgift a: Vilket tecken (positivt/negativt/noll) skulle den relevanta koefficienten anta? 4. Det finns ett klart samband mellan hur länge föräldrar har gått i skolan och hur länge deras barn går i skolan. Spridningsdiagrammet nedan visar sambandet för 30-åriga amerikaner år 1976. På y-axeln har vi individens utbildning mätt i antal år (utb); på x-axeln har vi föräldrarnas genomsnittliga utbildningsmängd (forutb). Vi har också ritat in regressionslinjen i diagrammet, där utb = 10,11 + 0,40forutb a. Anta att hela sambandet kan förklaras av att barn till högutbildade i genomsnitt är smartare än barn till lågutbildade, och att högintelligenta personer i sin tur utbildar sig längre. Vi kontrollerar nu för iq och kör regressionen: utb = a + b 1 forutb + b 2 iq Ungefär vilket värde antar koefficienten b 1? b. Här är det egentliga resultatet: utb = 3,58 + 0,28forutb + 0,08iq
Prediktera antalet utbildningsår för en person vars föräldrar har 10 års utbildning och där personen själv har en iq på 100. c. Se uppgift b: Tolka koefficienten för forutb. d. Vi kontrollerar nu också för om personen bodde nära ett universitet i tonåren (variabeln nära som antar värdet 1 för dem som bodde nära ett universitet och 0 för övriga): utb = 3,55 + 0,27forutb + 0,07iq + 0,22nära En av personerna i data har 12 års utbildning. Personen har en iq på 103 poäng, föräldrarnas utbildning är 13 år och personen bodde inte nära ett universitet i tonåren. Hur stor är residualen för den här personen? 5. Vi kör en regression som beskriver hur utfallsvariabeln varierar beroende på kön och en annan oberoende variabel: y = a + b 1 kvinna + b 2 x, där kvinna är en dummy som antar värdet 1 för kvinnor och 0 för män. Spridningsdiagrammet nedan illustrerar data grafiskt. Vilket av följande fyra påståenden är sanna: a. b 1 har ett negativt värde och b 2 har ett negativt värde b. b 1 har ett negativt värde och b 2 har ett positivt värde c. b 1 har positivt värde och b 2 har ett negativt värde d. b 1 har ett positivt värde och b 2 har ett positivt värde 6. Hur stiger VD:ns lön med antalet år på posten? För att besvara denna fråga använder vi ett sampel för 177 amerikanska företag år 1990. I regressionen nedan mäter variabeln lön VD:ns lön i tusentals dollar; erfarenhet mäter antalet år på posten och vinst mäter företagets vinst i miljoner dollar: lön = 646,43 + 12,45erfarenhet + 0,588vinst R 2 = 0,178
a. Hur mycket ökar lönen i snitt då vinsten ökar med 5 miljoner dollar och då vi kontrollerar för VD:ns erfarenhet? b. Förklaringsgraden är 0,178. Tolka! 7. Tabellen på nästa sida är klippt ur artikeln Stature and Status: Health, Ability and Labor Market Outcomes. Utfallsvariabeln är loggad lön (den naturliga logaritmen). a. Se samplet British Cohort Study (1970) och MEN age 30. Tolka koefficienten för height at age 30, där längden mäts i tum. Använd då resultatet från regressionen där man inte kontrollerat för testresultat i ung ålder eller övriga kontrollvariabler (extended controls). b. Abstraktet nedan är klippt ur samma artikel. Läs och ta fasta på det som är understruket i rött. Förklara hur resultaten i tabellen stödjer detta uttalande. (Använd då samplet British Cohort Study (1970).)