LTH, 23 september Ekonometrisk analys av fastighetsmarknader - en introduktion (tillämpad regressionsanalys)

Relevanta dokument
4) Dra statistiska slutsatser (statistisk inferens) med hjälp av hypotestester av modellens regressionsparametrar.

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Multipel Regressionsmodellen

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Linjär regressionsanalys. Wieland Wermke

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Metod och teori. Statistik för naturvetare Umeå universitet

Grundläggande matematisk statistik

10.1 Enkel linjär regression

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F7

F11. Kvantitativa prognostekniker

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Föreläsning 12: Regression

SAMBANDS- MODELLER, 15HP. Lärare: Ann-Charlotte Hallberg Tommy Schyman

MVE051/MSG Föreläsning 7

Föreläsning G60 Statistiska metoder

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Höftledsdysplasi hos dansk-svensk gårdshund

Föreläsning 7: Punktskattningar

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Datorövning 1 Enkel linjär regressionsanalys

Skrivning i ekonometri lördagen den 25 augusti 2007

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

MVE051/MSG Föreläsning 14

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Matematisk statistik för D, I, Π och Fysiker

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Föreläsning 7: Punktskattningar

Sänkningen av parasitnivåerna i blodet

Examinationsuppgifter del 2

Skrivning i ekonometri lördagen den 29 mars 2008

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

InStat Exempel 4 Korrelation och Regression

Skrivning i ekonometri torsdagen den 8 februari 2007

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Gamla tentor (forts) ( x. x ) ) 2 x1

Repetitionsföreläsning

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Statistik 1 för biologer, logopeder och psykologer

Föreläsning G60 Statistiska metoder

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Föreläsning 12: Linjär regression

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

F3 Introduktion Stickprov

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

TENTAMEN I STATISTIK B,

Regressionsanalys. Mats Wilhelmsson. Priserna inom en region

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

2.1 Minitab-introduktion

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Statistik och epidemiologi T5

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

7.5 Experiment with a single factor having more than two levels

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Sannolikheter och kombinatorik

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar

OBS! Vi har nya rutiner.

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Hur skriver man statistikavsnittet i en ansökan?

Medicinsk statistik II

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Följande resultat erhålls (enhet: 1000psi):

Transkript:

LTH, 23 september 2008 Ekonometrisk analys av fastighetsmarknader - en introduktion (tillämpad regressionsanalys) 1

Mål Efter dagens och morgondagens föreläsning/övningar ska du kunna Bygga, skatta och tolka hedoniska prismodeller för småhus i Excel. Hedoniska modeller: studerar hur olika egenskaper hos en vara, t ex hus, har för inverkan på priset (hedonisk efterfrågeteori). Egenskaper kan vara boyta, närhet till strand, standard etc etc. 2

Matematik Statistik Ekonomi Ekonometri Enekonometriker ska i allmänhet vara en kompetent matematiker och statistiker med en i grund och botten ekonomisk skolning. De tre ingredienserna i ekonometri är - ekonomisk teori - ekonomiska data och - statistiska metoder (främst multipel regressionsanalys). 3

Vad är statistik The science of collecting, organizing, presenting, analyzing, and interpreting data to assist in making more effective decisions. [2] Två huvudkategorier: 1. Beskrivande (Deskriptiv) statistik (Descriptive statistics) 2. Statistisk inferens (Statistical inference) Referenser till engelskspråkig litteratur, se sista sliden. (Jmf slide nr 48) 4

Descriptive statistics Methods of organizing, summarizing, and presenting data in an informative way. [1] Descriptive statistics include graphical and numerical procedures that summarize and process data and are used to transform data to information. [2] Statistical inference The methods used to estimate a property of a population on the basis of a sample. [2] Inferential statistics provide the basis for predictions, forecasts, and estimates that are used to transform information to knowledge. 5 [3]

Population (Population) The entire set of individuals or objects of interest or the measurements obtained from all individuals or objects of interest. [2]. - N usually represents the population size. Urval, stickprov (Sample) An observed subset, portion, or part, of the population of interest [2]. - n usually represents the sample size. Vad utgör ett bra urval? 6

Vad är då ekonometri (econometrics)? Ekonometri handlar om samband mellan olika ekonomiska variabler. Några citat: Econometrics is concerned with the systematic study of economic phenomena using observed data. 7

Vad är ekonometri (econometrics)? Ekonometri handlar om samband mellan olika ekonomiska variabler. Några citat: Econometrics is concerned with the systematic study of economic phenomena using observed data. Econometrics is concerned with the empirical determination of economic laws. 8

Vad är ekonometri (econometrics)? Ekonometri handlar om samband mellan olika ekonomiska variabler. Några citat: Econometrics is concerned with the systematic study of economic phenomena using observed data. Econometrics is concerned with the empirical determination of economic laws. Econometrics is based upon the development of statistical methods for estimating economic relationships, testing economic theories, and evaluating and implementing government and business policy. 9

Kategorier Ekonometri Teoretisk Tillämpad Klassisk Bayesiansk Klassisk Bayesiansk 10

Linjär regressionsanalys Beskrivning och analys av linjära samband mellan en beroende variabel (y) och en eller flera förklarande (oberoende) variabler (x 1, x 2,,x k ): y = f (x 1, x 2,,x k ) Enkel linjär regressionsanalys: en förklarande variabel, t ex Pris = β 0 + β 1 Boyta + u Multipel linjär regressionsanalys: flera förklarande variabler, t ex Pris = β 0 + β 1 Boyta + β 2 Standardpoäng + u 11

Linjär regressionsanalys Vi vill bygga och skatta en modell som kan förklara verkligheten what s going on out there? Vilka variabler ska ingå i modellen? Hur ska det matematiska sambandet mellan den oberoende variabeln och de förklarande variablerna se ut? Vi är intresserade av Kasualitet: Beror BNP-ökningen på ökat byggande, eller ökat byggande på ökad BNP? Jämför korrelation: skilj på statistiska samband och kasuala samband. Vad påverkar vad? Har vi tillgång till bra data (observationer)? 12

Varför ekonometri i fastighetsekonomi? 13

Fastighetsvärdering/taxering Price 800 Scatterplott, price and size of house in square feet. 700 600 y = 0,1402x + 11,204 R 2 = 0,6208 500 400 300 200 100 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 Square feet Source: HPRICE1, Wooldrige. 14

40 30 20 10 0-10 -20 Makroanalyser 1978 1980 1982 1984 1986 1988 1990 1992 15 1976 1974 1972 1970 dbnp dprice 1968 Procent y =-1,8+0,8x+u Y=förändring Pris År X=förändring BNP 1966

Marknadsanalyser log(bostadsyta) = β 0 + β 1 log(pris) +β 1 log(inkomst) + β 1 log(familjestorlek) + u Exempel: - Priselasticitet: -0,10 - Inkomstelasticitet: 0,05. - Ökar familjestorleken med 1 person så ökar efterfrågad kvantitet med drygt 5 procent. 16

17 Finansiella analyser -3-2 -1 0 1 2 3 2005-01-03 2005-01-10 2005-01-17 2005-01-24 2005-01-31 2005-02-07 2005-02-14 2005-02-21 2005-02-28 2005-03-07 2005-03-14 2005-03-21 2005-03-28 2005-04-04 2005-04-11 2005-04-18 2005-04-25 2005-05-02 2005-05-09 2005-05-16 2005-05-23 2005-05-30 2005-06-06 2005-06-13 2005-06-20 2005-06-27 2005-07-04 2005-07-11 2005-07-18 2005-07-25 2005-08-01 2005-08-08 2005-08-15 Market Real Estate y =-0,11+0,41x+u Y=avkastning fastigheter X=avkastning brett aktieindex

Tänk! Är det rimligt att anta att sambanden du har funnit är stabila över tiden? Does history repeat itself? Kasualitet eller nonsens-samband? 18

y Beroende variabel Undersökningsvariabel Responsvariabel Resultatvariabler x 1, x 2,,x k Oberoende variabler Förklaringsvariabler Prediktorer Bakgrundsvariabler 19

y Dependent variable Explained variable Response variable Predicted variable Regressand x 1, x 2,,x k Independent variables Explanatory variables Control variables Predicted Variables Regressors 20

Varför urval (stickprov eller sampel)? För dyrt och/eller omöjligt med totalundersökning. Omöjligt fall: Sample = blodprov. Helt enkelt oetiskt, kan inte tömma människan på allt blod (=populationen). Småhusförsäljningar: Hur skulle en Drömsituation för fastställande av taxeringsvärden se ut? Diskutera olika faktorer som kan bidra till att ditt urval inte är representativt för den population du vill dra slutsatser om! 21

Skatta våra okända parametrar: Från population till skattningar Punktskattningar av medelvärdet μ (exempel på lägesmått) och variansen σ 2 (exempel på spridningsmått) i en population. Populationsparameter Skattning baserat på urval (stickprov) Medelvärde μ x = 1 n n i= 1 x i Varians σ 2 s 2 = 1 n 1 n i= 1 ( x i x) 2 Kovarians och Korrelation ) Se nedan! Våra Regressionskoefficienter : 22

23 Populationsmedelvärde: values in the population Number of 2... 1 1 = + + = = = N N x x x N x N N i i μ Urvalsmedelvärde aritmetiska medelvärdet values in the sample Number of 2... 1 1 = + + = = = n n x x x n x x n n i i

Medianen Ordna data stigande eller fallande. Medianen, X m, är det mellersta talet. Mao: Medianen är det tal i den ordnade datamängden som storleksmässigt ligger så att det finns lika många tal som är större än och mindre än medianen Om n är - udda, då utgörs X m av den mellersta obervationen; - Jämnt, då utgörs X m av medelvärdet av de två mellersta talen. 24

Ofta används som spridningsmått standardavvikelsen s: s = 1 n 1 n i= 1 ( x i x) 2 I vårt enkla linjära regressionsexempel ovan, vilka är - populationsparametrarna? - skattningsfunktionerna? 25

Samband mellan två slumpvariabler Hur är två variabler relaterade till varandra? Vi kan beskriva sambandet med hjälp av - spridningsdiagram (scatter plot), - kovariansen (the covariance), - korrelationskoefficient (the correlation coefficient. Vi studerar samband mellan två slumpvariabler, säger inget om kausalitet. 26

Spridningsdiagram visar - an indication of the strength of the relationship between two variables; - an indication of the direction of the relationship between two variables; - the range of each variable; - an indication of extreme values (outliers); - pattern of values over the range [3]. 27

Kovarians (baserat på urval) i= 1 Cov( x, y) = s = xy n ( x i x)( y n 1 i y) Vad indikerar en positiv kovarians? Vad indikerar en negativ kovarians? 28

29 Korrelationskoefficient ) ( ) ( ) )( ( 1 2 1 2 1 = = = = = n i i n i i n i i i y x xy xy y y x x y y x x s s s r Standardiserad kovarians mycket lättare att tolka. 1 till +1 (jmf spridningsdiagram) Vilka värden på korrelationskoefficienten vill du beskriva som Perfect, Strong, Moderate, Weak, No positive/negative linear relationship?

Stickprovets regressionslinje (vid enkel linjär regression) Med hjälp av minsta-kvadratmetoden (Ordinary Least Square) kan man anpassa en rät linje, en regressionslinje, till ett datamaterial bestående av n stycken observationspar (x i, y i ). Dvs, för att skatta de okända regressionsparametrarna β 0 och β 1 använder vi oss av OLS (MK-metoden). Hur? Välj estimatorerna (skattningsfunktionerna) så att summan av de kvadrerade avstånden från den anpassade räta linjen (regressionslinjen) och de observerade talparen (x i, y i ) minimeras. 30

Stickprovets regressionslinje (vid enkel linjär regression) Regressionslinjen skriver vi som = ˆ β + ˆ yˆ 0 β1 xˆ För en enskild observation har vi det anpassade värdet (i = 1,,n). ˆ ˆ yˆ i = β xˆ 0 + β1 i Residualen e i för observation i, är skillnaden mellan det faktiska y i och dess anpassade värde y : e i = y i ˆi ˆ ˆ yˆ i = yi β 0 + β1 xˆ i Det finns n stycken residualer. 31

32 Stickprovets regressionslinje (vid enkel linjär regression) Välj så att summan av de kvadrerade residualerna Blir så liten som möjligt. Lösningen till minimeringsproblemet ger oss skattningsfunktionerna 1 0 ˆ och ˆ β β = = = + = = N I i i N I i i N I i x y y y e 1 2 1 0 1 2 1 2 ) ˆ ˆ ˆ ( ) ˆ ( β β = = = = n i i n i i i x x y y x x x y 1 2 1 1 0 0 ) ( ) )( ( ˆ och ˆ ˆ β β β

Stickprovets regressionslinje Ovanstående formler gäller om vi har en oberoende variabel (dvs enkel linjär regressionsanalys). Om multipel linjär regressionsanalys, då är det matrisalgebra som gäller (mer om multipel regressionsanalys senare). Under vissa förutsättningar är OLS-skattningarna väntevärdesriktiga och effektivaste av alla möjliga skattningar. Nu när vi vet principen för hur vi finner våra OLSskattningar fortsätter vi med statistisk inferens och speciellt hypotesprövningar. SE WORDFIL LTH2007! 33

Klassisk ekonometrisk metod 1. Framställning av teori eller hypotes. 2. Specificering av den matematiska modellen för teorin. 3. Specificering av den ekonometriska modellen. 4. Erhålla data. 5. Estimering (skattning) av parametrarna som ingår i den ekonometriska modellen. 6. Hypotesprövningar. 7. Prediktioner 8. Använd modellen för policysyften eller kontroller. 34

Illustration av de åtta stegen Vi använder oss av ett klassiskt makroekonomiskt exempel: - Keynes konsumptionsteori och MPC (Marginal propensity to consume; den marginella konsumtionsbenägenheten). - Steg 1: Framställning av teori eller hypotes: Hushåll ökar sin konsumtion när den disponibla inkomsten stiger, dock inte med hela inkomstökningen. (Jmf Priset på bostadsrätter ökar med y% när den disponibla inkomsten stiger med x% ) 35

Illustration av de åtta stegen Steg 2: Specificering av den matematiska modellen för Keynes teori. : Låt C beteckna konsumtion och I disponibel inkomst. En matematisk modell för teorin kan då vara: C = β 0 + β 1 I - β 0 och β 1 är modellens parametrar: intercept- respektive lutningskoefficienterna. - β 0 anger hur stor konsumtionen är då inkomsten är 0 kr. - β 1 mäter den marginella konsumtionsbenägenheten. 36

Illustration av de åtta stegen Steg 2 fortsättning: C = β 0 + β 1 I Linjär konsumtionsfunktion. K är en funktion av I, därför säger vi att C är den beroende variabeln, medan I är den oberoende (förklarande) variabeln. Antagande om kausalitet (orsakssamband) mellan C och I: kausaliteten går in en riktning, dvs I antas orsaka C och inte tvärtom. 37

Illustration av de åtta stegen Steg 3: Specificering av den ekonometriska modellen. Notera följande i den matematiska modellen i steg 2: C = β 0 + β 1 I antar att det finns ett exakt eller deterministiskt samband mellan konsumtion och inkomst. Men relationer eller samband mellan ekonomiska variabler är vanligtvis inexakta: kan vi förvänta oss att alla datapunkter (C, I) ligger på en rät linje om vi samlar in data från säg 100 hushåll? Nej! Varför? Andra variabler påverkar konsumtion (ålder, storlek på hushållet, religion, etc etc). 38

Illustration av de åtta stegen Steg 3 fortsättning: Specificering av den ekonometriska modellen. Den ekonometriska modellen tar hänsyn till att ekonomisk teori inte kan exakt kan förklara hushållens beteenden. För att tillåta inexakta relationer eller samband mellan ekonomiska variabler specificerar vi följande ekonometriska modell: C = β 0 + β 1 I + u, där u är feltermen (error term, disturbance). Feltermen u representerar alla de variabler som påverkar konsumtionen, men som inte ingår i modellen explicit: våra unobserved. 39

Illustration av de åtta stegen Steg 3 fortsättning: Specificering av den ekonometriska modellen. C = β 0 + β 1 I + u Exempel på en enkel linjär regressionsmodell. Den ekonometriska modellen för konsumtion består av två komponenter: en del som beror linjärt på inkomsten I och en del som är slumpmässig. 40

Illustration av de åtta stegen Steg 4: Skaffa data. Data är observerbara värden på en variabel. year consumption income 1984 3081,5 4620,3 1985 3240,6 4803,7 1986 3407,6 5140,1 1987 3566,5 5323,5 1988 3708,7 5497,7 1989 3822,3 5649,5 1990 3972,7 5865,2 1991 4064,6 6062,0 1992 4132,2 6136,3 1993 4105,8 6079,4 1994 4219,8 6244,4 1995 4343,6 6389,6 1996 4486,0 6610,7 1997 4595,3 6742,1 1998 4714,1 6928,4 1999 4801,2 7100,6 2000 4920,5 7220,3 2001 5011,3 7350,3 2002 5140,5 7499,2 2003 5230,2 7600,0 2004 5330,7 7722,2 2005 5390,6 7832,4 2006 5500,0 7945,2 41

Illustration av de åtta stegen Steg 4 fortsättning: Skaffa data. Tvärsnittsdata består av urval av individer, hushåll, företag, regioner, städer, länder etc tagna vid en given tidpunkt (ignorerar små skillnader i timing). Exempel: huspriser 2006. BNP för alla länder 2006. Även för givna veckor, månader, kvartal, Tidsseriedata består av observationer på en eller flera variabler över tiden. Exempel: årliga huspriser 1980 till 2006. Svensk BNP för perioden 1980 till 2006. KPI. FPI. Vårt konsumtionsexempel. Datafrekvens: dagar, veckor, månader, kvartal, år, 42

Illustration av de åtta stegen Steg 4 fortsättning: Skaffa data. Vissa data har både tvärsnitts- och tidsseriedimension. Exempel: Paneldata (longitudinell data) består av observationer på en eller flera variabler på samma objekt/individer över tiden. Exempel: - BNP för alla världens länder för perioden 1970 till 2004. - Alla ni och era inkomster fr o m i år och 30 år framåt. - Repeated Sales Price Index (vad är objektet?) 43

Steg 4: Mer engelsk terminologi Cross section data: Data which consist of observations relating to units at a given point in time. Dvs Tvärsnittsdata. Time-series data: Data which describe the movement of a variable over time (daily, weekly, monthly, quarterly, yearly). Pooled data: Data which combine cross-section and time-series data. Panel data: same as pooled data, but the data consists of repeated observations on the same objects through time. 44

Illustration av de åtta stegen Steg 5: Estimering av den ekonometriska modellen. Med vår data kan vi estimera (skatta) parametrarna i konsumtionsfunktionen. De numeriska värdena vi erhåller ger konsumtionsfunktionen empiriskt innehåll. Vi estimerar parametrarna med den statistiska teknik som kallas regressionsanalys. Vi erhåller följande skattningar av β 0 och β 1 : 268,07 och 0,72. Sålunda har vi följande estimerade (skattade) konsumtionsfunktion: Ibland b 0 resp b 1 Cˆ = ˆ β + ˆ β I = 268,07 0, 72I 0 1 + 45

Illustration av de åtta stegen Steg 5: Estimering av den ekonometriska modellen. Cˆ = ˆ β + ˆ β I = 268,02 0, 72I 0 1 + Tolkning: För perioden 1984 2006 är lutningskoefficienten (dvs MPC) 0,72. Med andra ord, en ökning av den reala inkomsten med 1 dollar ledde, i genomsnitt, till en ökning av real konsumtion med 72 cents. 46

Illustration av de åtta stegen Steg 6: Hypotesprövning Statistisk hypotesprövning innebär att man med hjälp av slumpmässiga urval bedömer trovärdigheten i hypoteser antaganden angående populationen. Vi vill med hypotesprövning fastställa hur mycket bevis för att en viss hypotes är sann som finns i vårt urval. I vårt fall är nollhypotesen att MPC < 1. - Kan vi förkasta den eller inte? Begrepp: nollhypotes, alternativhypotes, teststatistika, kritisk region. 47

Illustration av de åtta stegen Steg 7: Prediktion Givet att vår modell inte har motbevisat vår teori eller hypotes, kan vi använda den för att göra prognoser (forecasts, predictions). Med hjälp av kända eller förväntade framtida värde(n) på den oberoende (förklarande) variabeln, kan vi erhålla prediktion av den beroende variabeln. Antag att vi vill göra en prediktion av den genomsnittliga konsumtionen för år 2008. Antag att vi förväntar oss att inkomsten (GDP) för 2008 kommer att bli 8050. Vi erhåller då prediktionen C ˆ = 268,02 + 0,72(8050) = 5535. 48

Illustration av de åtta stegen Steg 8: Använd modellen för policysyften eller kontroller Antag att regeringen tror att om konsumtionen uppgår till 5600 (miljarder dollar) kommer arbetslösheten hamna på 4,5%. Hur stor måste inkomsten vara för att konsumtionen ska uppnå 5600? 5600 = 268,02 + 0,72I I = 7414. Med finans- (och ev. penningpolitiska medel) kan regeringen manipulera kontrollvariablen I för att uppnå den önskvärda nivån på målvariabeln C. 49

Statistikprogram ett måste Excel SPSS Eviews Stata Matlab R SAS 50

Övningar på att tolka skattade regressionslinjer y = b 0 + b 1 * x 1 Modell Beroende variabel Oberoende variabel Tolkning av b 1 Level-level y x 1 Δy = b 1 Δx Log-log log(y) log(x 1 ) %Δy = b 1 %Δx Log-level log(y) x 1 %Δy = (100b 1 ) Δx 51

Övningar på att tolka skattade regressionslinjer pris = b 0 + b 1 *Boyta = 10 + 50 000*Boyta Tolkning: b 1 anger hur mycket pris ändras i genomsnitt när boyta ökar med en kvm. ln(pris) = b 0 + b 1 *ln(boyta) = 10 + 0,80*Boyta Tolkning: elasticiteter (här priselasticitet m.a.p. Boyta). b 1 anger hur många procent pris ändras i genomsnitt när boyta ökar med 1 procent. (1 procents ökning av boytan leder till att pris ökar med i genomsnitt 0.80%) 52

Övningar på att tolka skattade regressionslinjer ln(pris) = b 0 + b 1 *rum = 10 + 0.50*rum Tolkning: semi-elasticiteter b 1 anger hur många procent pris ändras i genomsnitt när rum ökar med 1 enhet. (För varje rum så ökar pris ökar med i genomsnitt 50%) 53

Övningar på att tolka skattade regressionslinjer pris = b 0 + b 1 *Boyta + b 2 *standardpoäng = 10 + 40 000*Boyta + 10 000*standardpoäng Tolkning: b 1 anger hur mycket pris ändras i genomsnitt när boyta ökar med en kvm, och standardpoäng är konstant (ceteris paribus tolkning). b 2 54

Övningar på att tolka skattade regressionslinjer (US-English) log(price) = 10 + 0.65*log(sqrft) 0.066*bedrooms + 0.15*baths - The price elasticity with respect to square footage is 0.65. Holding bedrooms and baths fixed, a 1 percentage increase in square footage is predicted to increase housing price (price) by about 0.65% (on average). - Given size (sqrft) and number of bedrooms, one more bathroom (baths) is predicted to increase housing price (price) by 15% (on average). - Varför negativt tecken på koefficienten för bedrooms? 55

Övningar på att tolka skattade regressionslinjer med dummyvariabler (binär variabel) log(pris) = b 0 + b 1 *log(boyta)+ b 2 *strandtomt = 10 + 0.70*log(Boyta) + 0.65* strandtomt - strandtomt är en dummyvariabel som är lika med 1 om huset är byggt på en strandtomt, annars 0. - Hus på strandtomter är i genomsnitt 65% dyrare än andra hus, allt annat lika. 56

Sammanfattning 1 Vi vill försöka fastställa kasualt samband mellan variabler. Vad har variabel x för kasual effekt på variabeln y? Att fånga in verkligheten i en modell. Teoretiska modellen (enkel linjär regression): y = β 0 + β 1 *x + u y: beroende variabel, undersökningsvariabel x: oberoende variabel, förklarande variabel u: felterm, slumpterm: fångar in de variabler som ej är observerade. β 0 och β 1 : regressionskoefficienter, okända parametrar som ska skattas. β 0 : intercept med y-axeln: värdet på y när x = 0. Ofta av lite intresse. β 1 : anger lutningen på regressionslinjen. Man kan säga att ett viktigt mål med regressionsanalys är att erhålla skattningar av de okända parametrarna (βparametrarna). 57

Sammanfattning 1 Den multipla linjära regressionsmodellen k oberoende variabler och ett intercept => finns k + 1 stycken (okända) parametrar att skatt (vilka?). Oavsett hur många oberoende variabler vi har inkluderat i vår modell kommer det alltid att finnas faktorer som vi inte kan inkludera. Än en gång är det feltermen u som samlar in alla icke observerade faktorer. Pris = f(x 1, x 2, x 3, ). Problem med multikollinearitet. Ceteris paribus tolkning. 58

Några datorövningar Gör övningar i Excel! Var kreativ, prova, experimentera! Rent rates.xls Huspriser Norra Ängby 1.xls Huspriser_1.xls Norra och Södra Ängby.xls Huspriser_2.xls Glöm ej deskriptiv statistik, korrelation etc. 59

Statistisk inferensteori & hypotesprövning Kom ihåg: Statistisk slutledning eller statistisk inferens är konsten att göra intelligenta gissningar med hjälp av slumpmässiga urval. Med ett slumpmässigt urval (exv. fastighetsförsäljningar ett visst år) kan vi skatta okända parametrar till exempel medelvärden och varianser för populationen. Dessutom kan vi pröva hypoteser antaganden om populationen. Se LTH 2008 Hypotesprövning 60

Statistisk inferens (jmf slides 4 och 5) Population - parametrar Urval - skattningar Statistiska slutsatser Skatta parametrar Testa hypoteser Vi vill med hjälp av vårt urval dra slutsatser om populationen! Population Samtliga fastigheter Urval Sålda fastigheter 61

Två Fallgropar Heteroskedasticitet - ej konstant varians Multikollinearitet - hög inbördes korrelation mellan olika oberoende variabler 62

Några referense [1]. D. Geltner, N.G. Miller, J. Cayton, and P. Eichholtz (2007). Commercial Real estate - Analysis and Investments, 2 nd ed. The MIT Press [2]. D. A. Lind, W. G. Marchal, and S.A. Wathen (2008). Statistical Techniques in Business and Economics, 13 th ed. McGraw-Hill Irwin [3]. P. Newbold, W. L. Carlson, and B. Thorne (2003). Statistics for Business and Economics, 5 th ed. Prentice Hall [4]. R. V. Hogg, and E. A. Tanis (2001). Probability and Statistical Inference, 6 th ed. Prentice Hall [5]. J. M. Wooldridge (2006). Introductory Econometrics A Modern Approach, 3 rd ed. Thomson South-Western [6]. G. R. Brown, and G. A. Matysiak (2000). Real Estate Investment A Capital Market Approach. Financial Times, Prentice Hall 63