4) Dra statistiska slutsatser (statistisk inferens) med hjälp av hypotestester av modellens regressionsparametrar.

Relevanta dokument
LTH, 23 september Ekonometrisk analys av fastighetsmarknader - en introduktion (tillämpad regressionsanalys)

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1

Linjär regressionsanalys. Wieland Wermke

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

Statistik B Regressions- och tidsserieanalys Föreläsning 1

InStat Exempel 4 Korrelation och Regression

Multipel Regressionsmodellen

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Regressions- och Tidsserieanalys - F4

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Höftledsdysplasi hos dansk-svensk gårdshund

Föreläsning G60 Statistiska metoder

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 12: Regression

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Repetitionsföreläsning

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Statistik 1 för biologer, logopeder och psykologer

Regressionsanalys. Mats Wilhelmsson. Priserna inom en region

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Skrivning i ekonometri torsdagen den 8 februari 2007

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Sänkningen av parasitnivåerna i blodet

Regressionsanalys av lägenhetspriser i Spånga

10.1 Enkel linjär regression

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

SAMBANDS- MODELLER, 15HP. Lärare: Ann-Charlotte Hallberg Tommy Schyman

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Grundläggande matematisk statistik

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Skrivning i ekonometri lördagen den 29 mars 2008

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Metod och teori. Statistik för naturvetare Umeå universitet

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Skrivning i ekonometri lördagen den 25 augusti 2007

Statistiska samband: regression och korrelation

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Föreläsning 7: Punktskattningar

Prediktion av villapris

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Föreläsning 7: Punktskattningar

Regressions- och Tidsserieanalys - F7

Lösningar till SPSS-övning: Analytisk statistik

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Laboration 2: Styrkefunktion samt Regression

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression

oberoende av varandra så observationerna är

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Datorövning 1 Enkel linjär regressionsanalys

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Regressionsanalys av huspriser i Vaxholm

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Att välja statistisk metod

Repetitionsföreläsning

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Samplingfördelningar 1

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

F11. Kvantitativa prognostekniker

Laboration 2 multipel linjär regression

Matematisk statistik för B, K, N, BME och Kemister

Efter att ha genomgått momentet Statistisk teori III, grundnivå, 7,5 högskolepoäng,

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Matematisk statistik för D, I, Π och Fysiker

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar

MVE051/MSG Föreläsning 7

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Skrivning i ekonometri lördagen den 15 januari 2005

Marknadsinformationsmetodik Inlämningsuppgift

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik för STS vt 2014

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

STATISTISK ANALYS AV KOMPLEXA DATA

LABORATION 3 - Regressionsanalys

Differentiell psykologi

Matematisk statistik, Föreläsning 5

STATISTISK ANALYS AV KOMPLEXA DATA

Transkript:

Lunds Tekniska Högskola, 26-27 november 2012 Ekonometrisk analys av fastighetsmarknader - fokus på hedoniska prismodeller för bostäder Må 26 nov: kl 13-15, föreläsning. Må 26 nov: kl 15-16, förberedelse datorövning. Ti 27 nov: kl 8-15, tre grupper á 2h: 8-10, 10-12, 13-15 Han-Suck Song Avdelningen för Bygg- och fastighetsekonomi (KTH) 1 Efter dagens föreläsningar och morgondagens övningar ska du kunna: Bygga ekonomiska modeller för att studera samband mellan huspriser och värdepåverkande faktorer. Hedoniska prismodeller. 1) Bygga motsvarande ekonometriska modeller för att estimera (skatta) sambanden enligt punkt (1). Linjära hedoniska regressionsmodeller. 2) Estimera (skatta) linjära hedoniska regressionsmodeller enligt punkt (2). Estimera regressionsparametrarna (b 0, b 1, b 2, och så vidare) 2 Forts: Efter dagens föreläsningar och morgondagen övningar ska du kunna: 3) Analysera och tolka regressionsmodellernas förklaringsgrad och de skattade regressionsparametrarna storlek och tecken. 4) Dra statistiska slutsatser (statistisk inferens) med hjälp av hypotestester av modellens regressionsparametrar. 5) Förstå artiklar som baseras på hedoniska modeller (se våra Hong Kong exempel). 3 1

Vad menas med Hedoniska modeller? Studerar hur olika egenskaper hos en vara, t ex hus, bostadsrätter, bilar, har för inverkan på priset. Egenskaper kan vara boyta, närhet till strand, hög standard, havsutsikt, har balkong. Fastighetsknutna Storlek, kvalitet, ålder. Områdesknutna Positiva och negativa externa effekter Förekomst av kollektiva varor Närhet till attraktiva miljöer. Tvärsnittsdata och/eller tidsseriedata? 4 Kommuner Vem är intresserad? Riksbanker och finansinspektion Finansdepartementet (regeringen) SCB (prisindex generellt) Valueguard bostadsprisindex Domstolar Byggföretag, fastighetsmäklare, konsulter 5 Vad är statistik The science of collecting, organizing, presenting, analyzing, and interpreting data to assist in making more effective decisions. [2] Två huvudkategorier: 1. Beskrivande (Deskriptiv) statistik (Descriptive statistics) 2. Statistisk inferens (Statistical inference) Referenser till engelskspråkig litteratur, se sista sliden. 6 2

Descriptive statistics Methods of organizing, summarizing, and presenting data in an informative way. [1] Descriptive statistics include graphical and numerical procedures that summarize and process data and are used to transform data to information. [2] 7 Statistical inference The methods used to estimate a property of a population on the basis of a sample. [2] Inferential statistics provide the basis for predictions, forecasts, and estimates that are used to transform information to knowledge. [3] 8 Population (Population) The entire set of individuals or objects of interest or the measurements obtained from all individuals or objects of interest. [2]. - N usually represents the population size. Urval, stickprov (Sample) An observed subset, portion, or part, of the population of interest [2]. - n usually represents the sample size. Vad utgör ett bra urval? 9 3

Varför urval (stickprov eller sampel)? För dyrt och/eller omöjligt med totalundersökning. Omöjligt fall: Sample = blodprov. Helt enkelt oetiskt, kan inte tömma människan på allt blod (=populationen). Småhusförsäljningar: Hur skulle en Drömsituation för fastställande av taxeringsvärden se ut? Diskutera olika faktorer som kan bidra till att ditt urval inte är representativt för den population du vill dra slutsatser om! 10 Matematik Statistik Ekonomi Ekonometri En ekonometriker ska i allmänhet vara en kompetent matematiker och statistiker med en i grund och botten ekonomisk skolning. De tre ingredienserna i ekonometri är -ekonomisk teori -ekonomiska data och - statistiska metoder (främst multipel regressionsanalys). 11 Vad är då ekonometri (econometrics)? Ekonometri handlar om samband mellan olika ekonomiska variabler. Några citat: Econometrics is concerned with the systematic study of economic phenomena using observed data. 12 4

Vad är ekonometri (econometrics)? Ekonometri handlar om samband mellan olika ekonomiska variabler. Några citat: Econometrics is concerned with the systematic study of economic phenomena using observed data. Econometrics is concerned with the empirical determination of economic laws. 13 Vad är ekonometri (econometrics)? Ekonometri handlar om samband mellan olika ekonomiska variabler. Några citat: Econometrics is concerned with the systematic study of economic phenomena using observed data. Econometrics is concerned with the empirical determination of economic laws. Econometrics is based upon the development of statistical methods for estimating economic relationships, testing economic theories, and evaluating and implementing government and business policy. 14 Linjär regressionsanalys Vi vill bygga och skatta en modell som kan förklara verkligheten what s going on out there? Vilka variabler ska ingå i modellen? Hur ska det matematiska sambandet mellan den oberoende variabeln och de förklarande variablerna se ut? 15 5

Linjär regressionsanalys Vi vill bygga och skatta en modell som kan förklara verkligheten what s going on out there? Vi är intresserade av Kausalitet: Beror BNPökningen på ökat byggande, eller ökat byggande på ökad BNP? Jämför korrelation: skilj på statistiska samband och kausala samband. Har vi tillgång till bra data (observationer)? 16 Tänk! Är det rimligt att anta att sambanden du har funnit är stabila över tiden? Does history repeat itself? Kausalitet eller nonsens-samband? 17 Ekonomisk modell: y = f(x 1, x 2,,x k ) Ekonometrisk modell Här: linjär regressionsekvation Beskrivning och analys av linjära samband mellan en beroende variabel (y) och en eller flera förklarande (oberoende) variabler (x 1, x 2,,x k ) 18 6

Linjär regressionsanalys Enkel linjär regressionsanalys: en förklarande variabel, t ex Pris = 0 + 1 Boyta + u Multipel linjär regressionsanalys: flera förklarande variabler, t ex Pris = 0 + 1 Boyta + 2 Standardpoäng + u 19 y x 1, x 2,,x k Beroende variabel Oberoende variabler Undersökningsvariabel Förklaringsvariabler Responsvariabel Prediktorer Resultatvariabler Bakgrundsvariabler 20 y Dependent variable Explained variable Response variable Predicted variable Regressand x 1, x 2,,x k Independent variables Explanatory variables Control variables Predicted Variables Regressors 21 7

Samband mellan två slumpvariabler Hur är två variabler relaterade till varandra? Vi kan beskriva sambandet med hjälp av - spridningsdiagram (scatter plot), - kovariansen (the covariance), - korrelationskoefficient (the correlation coefficient). Vi studerar samband mellan två slumpvariabler, säger inget om kausalitet. 22 Kovarians (baserat på urval) ( xi x)( yi y) i 1 Cov( x, y) sxy n 1 n Vad indikerar en positiv kovarians? Vad indikerar en negativ kovarians? 23 Korrelationskoefficient Standardiserad kovarians mycket lättare att tolka. sxy rxy s s x y n i 1 n i 1 ( x x)( y y) ( x x) i i 2 n i i 1 ( y y) 1 till +1 (jmf spridningsdiagram) Vilka värden på korrelationskoefficienten vill du beskriva som Perfect, Strong, Moderate, Weak, No positive/negative linear relationship? i 2 24 8

Kort sammanfattning: Regressionsanalys Vi vill försöka fastställa kausalt samband mellan variabler. Vad har variabel x för kausal effekt på variabeln y? Att fånga in verkligheten i en modell. Teoretiska modellen (enkel linjär regression): y = 0 + 1 *x + u y: beroende variabel, undersökningsvariabel x: oberoende variabel, förklarande variabel u: felterm, slumpterm: fångar in de variabler som ej är observerade. 0 och 1 : regressionskoefficienter, okända parametrar som ska skattas. 0 : intercept med y-axeln: värdet på y när x = 0. Ofta av lite intresse. 1 : anger lutningen på regressionslinjen. Man kan säga att ett viktigt mål med regressionsanalys är att erhålla skattningar av de okända parametrarna ( parametrarna). 25 Stickprovets regressionslinje (vid enkel linjär regression) Med hjälp av minsta-kvadratmetoden (Ordinary Least Square) kan man anpassa en rät linje, en regressionslinje, till ett datamaterial bestående av n stycken observationspar (x i, y i ). Dvs, för att skatta de okända regressionsparametrarna 0 och 1 använder vi oss av OLS (MK-metoden). Hur? Välj estimatorerna (skattningsfunktionerna) så att summan av de kvadrerade avstånden från den anpassade räta linjen och de observerade talparen (x i, y i ) minimeras. 26 Klassisk ekonometrisk metod 1. Framställning av teori eller hypotes. 2. Specificering av den matematiska modellen för teorin. 3. Specificering av den ekonometriska modellen. 4. Erhålla data. 5. Estimering (skattning) av parametrarna som ingår i den ekonometriska modellen. 6. Hypotesprövningar. 7. Prediktioner 8. Använd modellen för policysyften eller kontroller. 27 9

Modell Övningar på att tolka skattade regressionslinjer y = b 0 + b 1 * x 1 Beroende variabel Oberoende variabel Tolkning av b 1 Level-level y x 1 y = b 1 x Log-log log(y) log(x 1 ) % y = b 1 % x Log-level log(y) x 1 % y = (100b 1 ) x 28 Övningar på att tolka skattade regressionslinjer pris = b 0 + b 1 *Boyta = 10 + 50 000*Boyta Tolkning: b 1 anger hur mycket pris ändras i genomsnitt när boyta ökar med en kvm. ln(pris) = b 0 + b 1 *ln(boyta) = 10 + 0,80*Boyta Tolkning: elasticiteter (här priselasticitet m.a.p. Boyta). b 1 anger hur många procent pris ändras i genomsnitt när boyta ökar med 1 procent. (1 procents ökning av boytan leder till att pris ökar med i genomsnitt 0.80%) 29 Övningar på att tolka skattade regressionslinjer ln(pris) = b 0 + b 1 *rum = 10 + 0.50*rum Tolkning: semi-elasticiteter b 1 anger hur många procent pris ändras i genomsnitt när rum ökar med 1 enhet. (För varje rum så ökar pris ökar med i genomsnitt 50%) 30 10

Övningar på att tolka skattade regressionslinjer pris = b 0 + b 1 *Boyta + b 2 *standardpoäng = 10 + 40 000*Boyta + 10 000*standardpoäng Tolkning: b 1 anger hur mycket pris ändras i genomsnitt när boyta ökar med en kvm, och standardpoäng är konstant (ceteris paribus tolkning). b 2 31 Övningar på att tolka skattade regressionslinjer (US-English) log(price) = 10 + 0.65*log(sqrft) 0.066*bedrooms + 0.15*baths - The price elasticity with respect to square footage is 0.65. Holding bedrooms and baths fixed, a 1 percentage increase in square footage is predicted to increase housing price (price) by about 0.65% (on average). - Given size (sqrft) and number of bedrooms, one more bathroom (baths) is predicted to increase housing price (price) by 15% (on average). - Varför negativt tecken på koefficienten för bedrooms? 32 Övningar på att tolka skattade regressionslinjer med dummyvariabler (binär variabel) log(pris) = b 0 + b 1 *log(boyta)+ b 2 *strandtomt = 10 + 0.70*log(Boyta) + 0.65* strandtomt - strandtomt är en dummyvariabel som är lika med 1 om huset är byggt på en strandtomt, annars 0. - Hus på strandtomter är i genomsnitt 65% dyrare än andra hus, allt annat lika. 33 11

Statistisk inferensteori & hypotesprövning Kom ihåg: Statistisk slutledning eller statistisk inferens är konsten att göra intelligenta gissningar med hjälp av slumpmässiga urval. Med ett slumpmässigt urval (exv. fastighetsförsäljningar ett visst år) kan vi skatta okända parametrar till exempel medelvärden och varianser för populationen. Dessutom kan vi pröva hypoteser antaganden om populationen. Se Kompletterande litteratur 29 nov 2011 34 Statistisk inferens Population - parametrar Urval - skattningar Statistiska slutsatser Skatta parametrar Testa hypoteser Vi vill med hjälp av vårt urval dra slutsatser om populationen! Population Samtliga fastigheter Urval Sålda fastigheter 35 Två Fallgropar Heteroskedasticitet - ej konstant varians, vilket kan leda till felaktiga statistiska slutledningar. Multikollinearitet - hög inbördes korrelation mellan olika oberoende variabler 36 12

Exempel på studier RUTH (Riksbankens utredning): Sök Hedonisk Exempel tidesserieekonometri: Sök Ekonometrisk (t ex pdf-sidan 91) Residential Property Values in Hong Kong: Cemetery view Balcony 37 Några referense [1]. D. Geltner, N.G. Miller, J. Cayton, and P. Eichholtz (2007). Commercial Real estate - Analysis and Investments, 2 nd ed. The MIT Press [2]. D. A. Lind, W. G. Marchal, and S.A. Wathen (2008). Statistical Techniques in Business and Economics, 13 th ed. McGraw-Hill Irwin [3]. P. Newbold, W. L. Carlson, and B. Thorne (2003). Statistics for Business and Economics, 5 th ed. Prentice Hall [4]. R. V. Hogg, and E. A. Tanis (2001). Probability and Statistical Inference, 6 th ed. Prentice Hall [5]. J. M. Wooldridge (2006). Introductory Econometrics A Modern Approach, 3 rd ed. Thomson South-Western [6]. G. R. Brown, and G. A. Matysiak (2000). Real Estate Investment A Capital Market Approach. Financial Times, Prentice Hall 38 13