Analys av reporäntans påverkan på prissättningen av bostäder

Relevanta dokument
Multipel Regressionsmodellen

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Metod och teori. Statistik för naturvetare Umeå universitet

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Prediktion av bostadsrättspriser i Stockholms innerstad

10.1 Enkel linjär regression

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

7.5 Experiment with a single factor having more than two levels

Regressions- och Tidsserieanalys - F4

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Regressionsanalys av lägenhetspriser i Spånga

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Linjär regressionsanalys. Wieland Wermke

NÄR SKA MAN SÄLJA SIN BOSTAD?

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Regressions- och Tidsserieanalys - F1

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Regressions- och Tidsserieanalys - F1

Grundläggande matematisk statistik

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik,

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

7.5 Experiment with a single factor having more than two levels

Föreläsning 12: Regression

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Föreläsning 12: Linjär regression

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

LABORATION 3 - Regressionsanalys

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

LABORATION 3 - Regressionsanalys

EN UNDERSÖKNING KRING PRISPÅVERKAN VID INRÄTTANDE AV EN NYBYGGNATION

Regressions- och Tidsserieanalys - F7

Tentamen MVE302 Sannolikhet och statistik

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

Följande resultat erhålls (enhet: 1000psi):

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Matematisk statistik, Föreläsning 5

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Analys av bostadsrättspriset i Stockholms innerstad

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Uppgift 1. Produktmomentkorrelationskoefficienten

Skrivning i ekonometri torsdagen den 8 februari 2007

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression

F3 Introduktion Stickprov

Medicinsk statistik II

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Tentamen i Matematisk statistik Kurskod S0001M

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Tentamen i matematisk statistik

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Lösningar till SPSS-övning: Analytisk statistik

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1

Föreläsning G60 Statistiska metoder

Sänkningen av parasitnivåerna i blodet

Laboration 3: Enkel linjär regression och korrelationsanalys

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Tentamen för kursen. Linjära statistiska modeller. 20 mars

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Matematisk statistik KTH. Formelsamling i matematisk statistik

Examinationsuppgifter del 2

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Föreläsning 11: Mer om jämförelser och inferens

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

8.1 General factorial experiments

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

F11. Kvantitativa prognostekniker

Transkript:

DEGREE PROJECT, IN APPLIED MATHEMATICS AND INDUSTRIAL ECONOMICS, FIRST LEVEL STOCKHOLM, SWEDEN 2015 Analys av reporäntans påverkan på prissättningen av bostäder SLÅR REPORÄNTEFÖRÄNDRINGAR LIKA MYCKET PÅ BOSTÄDER AV OLIKA STORLEK? AMIT ALAM, INAS YAKUB KTH ROYAL INSTITUTE OF TECHNOLOGY SCI SCHOOL OF ENGINEERING SCIENCES

Analys av reporäntans påverkan på prissättningen av bostäder Slår reporänteförändringar lika mycket på bostäder av olika storlek? INAS YAKUB AMIT ALAM Examensarbete inom teknik: Tillämpad matematik och industriell ekonomi (15 credits) Civilingenjörsutbildning i industriell ekonomi (300 credits) Kungliga Tekniska Högskolan 2015 Handledare på KTH Boualem Djehiche och Anna Jerbrant Examinator Boualem Djehiche TRITA-MAT-K 2015:01 ISRN-KTH/MAT/K--15/01--SE Royal Institute of Technology School of Engineering Sciences KTH SCI SE-100 44 Stockholm, Sweden URL: www.kth.se/sci

Abstract The aim of this study is to investigate whether changes of the repo rate has diverse effects on apartments of different sizes, targeting specific areas in Stockholm. A conclusion, that the effect of the repo rate differs for apartments of different sizes, was made based on regression analysis and hypothesis testing. The housing market is characterized by vast shifts and the repo rate has reached a historical low-point of -0.25 per cent. It is reflected upon how the central bank s steering interest rate actually impacts the prices on the housing market and whether it has distinct effects on apartments of different sizes. Apartments sold between years 2005-2015 have been analyzed where the gravity of the repo rate has been taken into consideration and if its significance varies amongst apartments of different sizes. Important parameters concerning apartment prices have been utilized in the constructed model. 2

Sammanfattning Syftet med denna studie är att undersöka huruvida reporänteförändringar har diverse påverkan på bostäder av olika storlek, med fokus på ett antal områden i Stockholm. Efter utförda regressionsanalyser samt hypotesprövningar har det kunnat konstateras att reporäntans påverkan på bostadspriser skiljer sig åt för olika bostadsstorlekar. Bostadsmarknaden präglas idag av stora förändringar och reporäntan är på en historisk lågpunkt, -0.25%. Det spekuleras kring hur Riksbankens styrränta faktiskt påverkar priserna på bostadsmarknaden och om denna påverkar olika stora bostäder i olika stor grad. Sålda lägenheter mellan åren 2005-2015 har analyserats där hänsyn har tagits till reporäntan. Analysens fokus har varit på reporäntans betydelse samt om denna betydelse varierar för olika stora bostäder. Viktiga parametrar kring pris av bostadsrätter har använts i modellen som konstruerats. 3

Innehållsförteckning 1. Inledning... 6 1.1. Problemformulering och frågeställning... 6 1.2. Syfte... 6 1.3. Avgränsningar... 6 2. Teori... 7 2.1. Linjär regression... 7 2.2. Föklaringsgrad R 2... 8 2.3. Heteroskedasticitet... 8 2.4. F- test och p- värde... 9 2.5. Multikollinaritet... 10 2.6. Dummy variabler... 10 2.7. Akaike Information Criterion... 11 2.8. Hypotesprövning... 11 3. Metod... 11 3.1. Val av metod... 11 3.2. Modell... 12 3.3. Datainsamling... 12 3.3.1. Valueguard... 12 3.3.2. Val av variabler... 12 3.3.3. Bortfall av data... 13 4. Genomförande... 14 5. Resultat... 17 5.1. Enrumslägenheter... 18 5.3. Trerumslägenheter... 20 5.4. Fyrarumslägenheter... 21 5.5. Sammanfattning av resultat ur data för reporänta... 22 5.6. AIC... 22 5.7. Ytterligare kring AIC och R 2... 23 5.7.1. Sammanfattning för AIC och R 2 för modell med/utan reporanta.. 24 5.8. Heteroskadisticitet... 25 5.8.1. Breusch- Pagan test, Normal Q- Q samt linjäranpassning... 25 5.9. Multikollinaritet... 27 5.9.1. Varians Inflations Faktorn, VIF... 27 5.10. Hypotesprövning... 28 6. Diskussion... 30 6.1. Analys av resultat... 30 6.2. Tillämpning... 31 7. Hur reporäntan påverkar bostadspriserna ur ett nationalekonomiskt perspektiv... 32 7.1. Introduktion... 32 7.2. Problemformulering och syfte... 32 7.3. Metod... 33 7.4. Teoretisk referensram... 33 4

7.4.1. Reporänta... 34 7.4.2. Inflation... 36 7.4.3. Bolåneränta... 37 7.4.4. Arbetslöshet... 37 7.4.5. Dagslåneränta... 38 7.5. Resultat INDEK... 39 7.6. Diskussion... 41 8. Slutsats... 43 9. Referenser... 44 10. Appendix... 47 5

1. Inledning Reporäntan har under det senaste halvåret genomgått historiska förändringar i Sverige. 1 Riksbanken har sänkt reporäntan två gånger på väldigt kort tid och idag ligger denna på -0,25% 2. En förändring av sådant slag påverkar mycket, inte minst kan reporäntan kopplas till priserna på bostadsmarknaden. Många studier har gjorts kring bostadsmarknaden, där bland prediktion av bostadspriser samt vilken tid på året som är bäst för ett bostadsköp. Dock har inga fördjupningar kring reporäntans påverkan på bostadsmarknaden tidigare gjorts eller kring huruvida olika stora bostäder påverkas till olika stor grad av reporänteförändringar vilket i sig är ett aktuellt område att studera. 1.1. Problemformulering och frågeställning Den frågeställning som undersöks i detta kandidatexamensarbete lyder: i. Slår reporänteförändringar olika mycket på bostadsrätter av olika storlek?. Det som är av intresse är hur förändring av reporäntan slår på små bostäder jämfört med stora bostäder. Utöver den matematiska frågeställningen ovan undersöks reporäntans påverkan på bostadsmarknaden ur nationalekonomiskt perspektiv med frågeställning: ii. Hur påverkar reporäntan bostadsmarknaden ur nationalekonomiskt perspektiv? 1.2. Syfte Syftet med kandidatexamensarbetet är att genom statistiska metoder analysera och bidra med relevanta resultat till företaget Valueguard. I dessa resultat ska det tydliggöras om reporäntans påverkan på bostadspriset skiljer sig åt beroende på bostadens storlek. Undersökningen om hur reporäntan påverkar bostadsmarknaden ur nationalekonomiskt perspektiv kommer att bidra till en djupare förståelse. Detta då bostadsmarknaden förklaras utöver de matematiska analyser som görs samt kopplas ihop med dessa. 1.3. Avgränsningar En avgränsning som görs är att endast fokusera på lägenheter i ett antal områden i Stockholm. Områdena som väljs kommer att vara av olika typer - ett par områden som ligger i utkanten av Stockholm - Sollentuna, Solna, Sundbyberg har valts för att fokusera på, samt några i centrala Stockholm. Detta urval har gjorts utav 1 Ekonomifakta (2015), Reporäntans utveckling [www]. Hämtat från <http://www.ekonomifakta.se/sv/fakta/ekonomi/finansiell-utveckling/styrrantan/>. Publicerat 18 mars 2015. Hämtat 24 mars 2015. 2 Reporänta (2015), Reporäntebeslut[www]. Hämtat från <http://www.riksbank.se/sv/penningpolitik/prognoser-och-rantebeslut/reporantebeslut/2015/reporantebeslut- 28-april-2015/>. Publicerat 28 april 2015. Hämtat 28 april 2015. 6

vicedirektören för Valueguard, Lars-Erik Eriksson, och baseras på områden som är av intresse för företaget. Olika områden väljs för att priset för lägenheter tenderar att vara lägre i de förstnämnda områdena samt högre i centrala Stockholm och en övergripande analys eftersträvas. De lägenheter som sålts i dessa områden delas in i olika kategorier efter antal rum där de lägenheter som avviker starkt ur det normala för det antal rum, vad gäller kvadratur bland annat, väljs bort. 2. Teori 2.1. Linjär regression Inom statistisk analys är det vanligt förekommande att en responsvariabel kan förklaras genom förklarande variabler, så kallade kovariat. Dessa kovariat kan vara kvalitativa eller kvantitativa, experimentella eller observationsbaserade. 3 Linjär regression är en statistik modell genom vilken man studerar samband mellan variabler. I modellen ingår en responsvariabel y, vars värde beror på en eller flera förklarande variabler, kovariat, x. Den generella modellen för linjär regression skrivs enligt: 4 y i = k j=0 x ij β j +ε i, i =1,..., n I följande modell är en observation av den beroende variabeln y vars värde beror på de förklarande variablerna samt residualen. Residualerna antas vara oberoende mellan observationerna så att: E(ε i ) = 0 samt E(ε i 2 ) = σ 2 där σ är okänd. Vanligtvis är kovariaten konstant 1 och β 0 är intercept. Efter introduktion av xi = ( xi0... xik ), i = 1,..., n samt β = (β 0...β k ) t kan modellen för regressionsanalys nu skrivas som: y i = x i β +ε i 5 Regressionskoefficienten β j, som anger den genomsnittliga förändringen för y när x n ändras med en enhet, är obekant och kommer att beräknas från det data som finns. β 0 är det uppskattade värdet av y (när x = 0). Feltermer betecknas med ε i. För att anpassa en linjär modell som förklarar sambandet mellan residualen y i och kovariaten x i behöver vi uppskatta värdena för β, som betecknas ˆβ, genom att minimera kvadratsumman av residualen 2 ε. Detta kan göras med: Y = X β +ε n i=1 3 Lang, Harald. Elements of Regression Analysis 4 Miller, Michael B. Mathematics and Statistics for Financial Risk Management, Wiley, 2012, 2nd Edition 5 Lang, Harald. Lang, Harald. Elements of Regression Analysis 7

2.2. Föklaringsgrad R 2 R 2, som ofta kallas för förklaringsgrad eller determinationskoefficient, är ett statistiskt mått på hur nära datat är regressionslinjen. R 2 -koefficienten anger hur stor del av variationerna av y som kan förklaras av variationer av de oberoende variablerna x. Koefficienten antar värden 0 till 1 (eller 0% till 100%) där ett värde på 1 indikerar att regressionslinjen passar datat perfekt. Målet är att residualerna minimeras - att uppnå ett högt värde för R 2. Förklaringsgraden R 2 är lika med den del av den totala kvadratsumman som utgörs av den residuala kvadratsumman:. R! = kvadratsumman residual kvadratsumman total = (y! y)! (y! y)! Där y! är det förväntade värdet av y i och y är medelvärdet av y i. R 2 värdet ökar med varje oberoende variabler x som läggs till i modellen. Konsekvenserna av detta blir en chans till ett falskt R 2 -värde samt högre osäkerhet. Användningen av ett korrigerat R 2 tar hänsyn till detta genom att istället minska i värde då extra x-variabler läggs till. R! = 1 e!! n K / y!! n 1 där n är totala datamängd, K är antal oberoende variabler. R 2 är alltid R 2 och kan anta negativa värden. Summan av residualerna är ickeväxande för varje variabel som läggs till men antalet frihetsgrader ökar med en. Den! tillagda variabeln kan medföra till ett sänkt e! n K vilket innebär en ökning av R 2. R 2 når ett maximalt värde då ett visst antal variabler läggs till. Vid denna punkt har regressionen en ideal kombination av goodness of fit och exkludering av onödiga termer. Det går att dra samband mellan R 2 och R 2 på följande vis 6 : 1 R 2 = (1 R! ) n 1 n K 2.3. Heteroskedasticitet Det vanliga antagandet är att alla residualer ε! har samma standardavvikelse σ. Detta antagande är ofta obefogat - det existerar då heteroskedastiska residualer. k y i = x ij β j + e i, i =1,..., n där E(e i ) = 0 och E(e 2 2 i ) = σ i j=0 Om modellen är felaktigt specificerad som en homoskedastisk ekvation orsakar denna felaktiga specificering att standardavvikelsen för parameterestimeringarna är 6 Baltagi,Badi H. Econometrics, Springer, 2008, 4 th Edition. 8

inkonsistenta. Utöver detta blir F-testets resultat då ogiltigt. Vid heteroskedasticitet är det viktigt att omformulera modellen med avsikten att heteroskedasticitet inte ska förekomma. När feltermerna ε! har en konstant standardavvikelse råder homoskedasticitet, variansen kan förklaras Var e! x! = σ!. Det råder istället heteroskedasticitet vid fall då feltermerna inte är konstanta och variansen istället beror på x i : Var e! x! = f(x! ). Enklaste sättet att undersöka och upptäcka heteroskedasisticitet är att rita residualernas fördelning för varje variabel och se ifall feltermerna är konstanta eller ändras för varje x i. 7 Även genom utförandet av Breusch-Pagan test kan man undersöka existensen av heteroskedasticitet. Det som studeras då är utifall att den estimerade variansen av residualerna är beroende av kovariaten. Vid utförandet av en Ordinary Least Squares regression erhålls ε i, residualer. En hjälpregression utförs förε i 2 : ε i 2 = α 0 +α 1 X i1 +... +α p X ip + u i där i =1,..., p och u i är regressionens residual. Vidare ställs hypoteser upp: H 0 :γ 1 = γ 2 = γ n = 0 H 1 = γ n 0 för alla i =1,..., n 2 Dessa hypoteser prövas genom att en förklaringsgrad för given residual 2 Rˆεi beräknas vilken hypotesprövningarna sedan grundas på. Hypotesen om homoskedasticitet förkastas endast om H 0 förkastas på vald signifikansnivå. 8 2.4. F-test och p-värde Estimationen av standard avvikelsen, det så kallade standardfelet, av β j är SE(β j ). Ett konfidensintervall för nivån α för β j är: β j± F α (1, n k 1)SE(β j ) där F α (1, n k 1) är α-kvantilen för F-fördelningen för täljare med en frihetsgrad samt nämnare med n k 1frihetsgrader. F-statistiken blir då: 2 # F = β 0 & % j β j ( % SE(β ( $ j )' p-värdet är Pr(X>F) där X har F-fördelning som ovan. betecknar residualer från en obegränsad regression samt e * residualerna från en begränsad regression, vid en hypotesprövning för ett flertal β. Om residualen e är e 7 Lang, Harald. Elements of Regression Analysis 8 Drew Fudenberg, Dorothy Hodges Econometrica, 1997, Volume 65 9

normalfördelad är det exakta F-testet: F = 1 e 2 * e 2 # = n k 1 e 2 & % * ( % r s 2 r 1 ( e 2 % ( % ( $ ' F är F(r, n k 1) fördelad under noll och hypotesen förkastas då F är stort. 9 2.5. Multikollinaritet Multikollinaritet existerar när två eller flera kovariat är linjärt beroende. Multikollinaritet kan upptäckas genom att observera att de uppskattade standardavvikelserna för vissa av regressionkoefficienterna är väldigt stora. En annan indikator för multikollinaritet är Varians Inflations Faktorn, VIF. En hjälpregression där en av kovariaten används som beroende variabel vid skattning av resterande kovariat görs. Utgångsmodellen är Y = β 0 + β 1 X 1 + β 2 X 2 +... + β K X K +ε via vilken en hjälpregression kan utföras för varje kovariat där ett R 2 erhålls genom vilket VIF kan beräknas enligt: 1 VIF i = 1 R 2 Ett värde över 10 för VIF indikerar att multikollinaritet existerar för det givna kovariatet. 10 2.6. Dummy variabler I många modeller kan det ingå kvalitativa och förklarande kovariat och då är det passande med dummy variabler. I fall där en variabel är en dummy variabel kan denna anta värdet 0 eller 1. Dummy variabler som alla beskriver en och samma egenskap ska ha ett värde på 1; om säsongen för försäljning av en bostad ska ingå i modellen kommer den säsong då bostaden är såld att ha värdet 1 vid sig och resterande säsonger värdet 0. Vid liknande kategorier brukar man använda sig av n 1antal dummy variabler; det finns fyra säsonger under ett år och i modellen kommer det därför att användas tre kategorier för dessa och den fjärde säsongen kommer att istället väljas som en referenspunkt (benchmark). 11 9 Lang, Harald. Elements of Regression Analysis 10 Westerlund, Joakim. Introduktion till ekonometr, Studentliteratur, 2005, Upplaga 1 11 Baltagi,Badi H. Econometrics, Springer, 2008, 4 th Edition. 10

2.7. Akaike Information Criterion Vid osäkerhet kring huruvida en kovariat bör vara med i en modell kan man utföra ett så kallat Akaike Information Criterion, AIC test. Introduktionen av AIC år 1973 av Aikaike har främjat erkännandet av vikten av god modellering inom statistik. Utifrån denna modell har flera andra viktiga statistiska modeller inom bland annat ekonometri utvecklats. 12 Den modell som minimerar n ε! + 2k väljs, där n är antal observationer och k är antal kovariat. Vid logit minimeras 2ln(L)+ 2k där ln(l) är log-likelihood funktionen: 13 n ) ln(l) = ln+ 2d i 1 i=1 * # $ ( ) p% x i β &, (+1 d ' i. - Ett lägre värde vid utfört AIC-test indikerar en bättre modell. 2.8. Hypotesprövning Vid hypotesprövning testar man om en okänd parameter θ är lika stor som θ 0. Vid hypotesprövningen studeras alla hypoteser θ = a för alla möjliga a. Med en accepterad felfrekvens α gäller då att varje hypotes θ = a som genererar ett p- värde som störst α måste vara falsk och kan då förkastas. Om en hypotesprövning görs för ett flertal β -värden görs detta med F -test. F har en F(r, n k 1) fördelning och hypotesen förkastas om F -värdet är stort. 14 3. Metod 3.1. Val av metod Metoderna som används är huvudsakligen regressionsanalys samt andra statistiska analyser där bland undersökning av p-värden, som beräknas från F-tester för undersökning av variablernas signifikans, samt Breusch-Pagan test för heteroskedasticitet. Därav har arbetet en kvantitativ ansats. 12 H. Bozdogan, Model Selection and Akaike s Information Criterion (AIC): The General Theory and Its Analytical Extensions, Psychometrika, 52 (1987), 345 370. 13 Lang, Harald. Elements of Regression Analysis 14 Ibid 11

3.2. Modell En grundmodell för priset per kvadratmeter med förklarande variabler har konstruerats, där separata modeller sätts upp och analyseras för kategorier med olika antal rum. Pris per kvardratmeter = β + β x + β x β x 9 β x 12 β x 15 β x 22 5 Ort + β x Byggnadsår (1950 1959) Byggnadsår (1980 1989) Byggnadsår (2010 2015) Toppvåning 6 Byggnadsår (1800 1899) + ε i + β x 10 + β x 13 + β x 16 0 Sommar 1 + β x Reporänta Byggnadsår (1960 1969) 7 Byggnadsår (1990 1999) + β x Höst + β x Byggnadsår (1900 1939) 17 2 + β x + β x + β x Månadsavgift/ kvm 14 18 Vår + β x + β x + β x 11 Byggnadsår (1970 1979) 8 Byggnadsår (2000 2009) 19 Boyta + β x + β x Byggnadsår (1940 1949) Vinter 3 + + 20 4 + Hiss Bottenvåning + + β x 21 Mellanvåning + i = 1,..., n Utöver denna grundmodell för respektive lägenhetskategori används en sammanslagen modell för bland annat hypotesprövning där samtliga lägenhetskategorier ingår. Denna sammanslagna modell är likadan som grundmodellen men data för samtliga lägenhetskategorier slås ihop. 3.3. Datainsamling 3.3.1. Valueguard Statistik kring bostadspriser och relaterade faktorer erhålls via företaget Valueguard. Det är viktigt att kunna ha en stor överblick över försäljningen av lägenheter för att kunna dra slutsatser kring reporäntan och dess påverkan. Datat omfattar lägenheter sålda i Stockholms innerstad samt ett antal områden utanför Stockholms innerstad mellan åren 2005-2015. 3.3.2. Val av variabler Pris/kvadratmeter [SEK]: Försäljningspriset per kvadratmeter av bostaden. Detta blir modellens responsvariabel(output). Nedan följer modellens kovariat: Reporänta [procent]: Anger reporäntan vid försäljningdatum. Hämtas från Riksbankens hemsida. 12

Bostadsavgift/kvm [SEK/månad] : Avgift som betalas in till bostadsföreningen som täcker de gemensamma kostnaderna. Denna kovariat kommer att anges i SEK/kvm för att undvika eventuell korrelation mellan kovariatet gentemot arean. Boyta [m 2 ]: Anger lägenhetens totala area i kvadratmeter. Våning [Dummyvariabel; Ja(1)/Nej(0)]: Denna variabel delas in i tre kategorier: botten, mellan, topp. Anger om lägenheten befinner sig på bottenvåning, toppvåning eller våning emellan. Hiss [Dummyvariabel; Ja(1)/Nej(0)] : Anger om byggnaden har tillgång till hiss. Ort [Dummyvariabel; Innerstan(1)/Förort(0)]: Anger om bostadsrätten befinner sig i Stockholms innerstan (Ort=1) eller i en Stockholms förort (Ort=0). Byggnadsår [Dummyvariabel; Ja(1)/Nej(0)]: Variabeln är indelad i sex tidsintervaller och anger ifall bostadsrätten byggdes mellan 1800-1899, 1900-1939, 1940-1949, 1950-1959, 1960-1969, 1970-1979, 1980-1989, 1990-1999, 2000-2009 eller 2010-2015. Säsong [Dummyvariabel; Ja(1)/Nej(0)]: Variabeln delas in fyra kategorier: vår, sommar, höst, vinter. Anger om lägenheten blev såld under vår-, sommar-, höst-, vinterperiod. 3.3.3. Bortfall av data Endast utvalda variabler inkluderas i modellen på grund av relevans samt brist på datamängd för vissa variabler. 3.3.3.1. Extremvärden Lägenheterna delas in de i olika kategorier baserat på det antal rum som bostadsrätten har. Fokus blir då endast på enrumslägenheter, tvårumslägenheter, trerumslägenheter samt fyrarumslägenheter och därmed exkluderas lägenheter med fem eller fler rum. Utöver denna indelning har lägenheter mellan 10:e samt 90:e percentilen tagits med för att allt för avvikande kvadratur inte ska ingå. Extremvärden kring byggnadsår har uteslutits - alla lägenheter som byggts innan år 1800 har uteslutits. Även alla bostadsrätter med en bostadsavgift under 1000 kr har exkluderats ur datamängden. Dessutom har lägenheter som saknar information kring huruvida det finns hiss eller ej i huset valts bort ur datamängden. Dessa val har gjorts då avvikelser likt ovannämnda fall kan innebära felaktig information som kan leda till vilseledande resultat i analysen. 3.3.3.2. Variabler En påverkande faktor till slutpriset av en bostadsrätt är bland annat närheten till kollektivtrafik. En bostad som har nära till en busstation eller liknande har ett högre värde. Att ta fram data för detta visade sig vara ogenomförbart och därför utesluts denna variabel ur modellen. 13

Om en bostad har en balkong eller inte påverkar pris samt efterfrågan på bostaden. I den datasamling som tillhandahölls av Valueguard var datat för denna variabel inte komplett för alla objekt, det saknades information kring huruvida en stor del av bostäderna hade en balkong eller ej, och därför uteslöts denna variabel. Det är inte konsekvent att anta huruvida en lägenhet har en balkong eller ej då datat är bristfälligt. Variabeln Våning är som tidigare nämnt indelad i tre kategorier. En bostad som ej faller in i någon av dessa kategorier anses befinna sig på etageplan. Dessa bostäder har exkluderats då chansen finns att dessa inte är lägenheter utan någon annan typ av bostadsform. Vad gäller kategorierna Säsong, Våning samt Byggnadsår har alternativen Vinter för Säsong, Mellanvåning för Våning samt Byggnadsår 1900-1939 för Byggnadsår valts ut till att vara variabler av referenstyp, så kallade benchmarks. 15 4. Genomförande Data för 185 075 bostäder sålda mellan åren 2005 till början på år 2015 har erhållits via Valueguard. Efter bortfall av extremvärden har ett slutgiltigt antal av 151 354 bostäder satt grunden för den analys som genomförts. Till en början fanns det 48 olika förklarande variabler kring dessa bostäder. Efter en genomgång av dessa variabler valdes ungefär hälften bort. Variabler så som vilket år och vilken månad lägenheten har sålts samt en kombination av dessa två har tagits bort och datum för lägenhetsförsäljningen har behållts. Koordinater för de sålda bostadsrätterna kommer inte att vara av nytta då det saknas koordinater för närmsta station för kollektivtrafik. Kategorisering av de olika lägenheterna görs efter antal rum. Denna kategorisering görs då regressionsanalyser ska utföras dels för varje enskild lägenhetskategori samt för hela datamängden. Efter indelning i kategorier begränsas varje kategori inom ett rimligt intervall. Detta för att lägenheter med för avvikande yta inte ska bidra till missvisning. Dessa intervaller utgörs av data mellan den 10:e och 90:e percentilerna ur datasamlingen för area. Efter exkludering av lägenheter som inte ligger inom intervallerna ser indelningen för varje kategori ut som nedan: Enrumslägenheter Tvårumslägenheter Trerumslägenheter 25-44 kvadratmeter 41-68 kvadratmeter 66-90 kvadratmeter Fyrarumslägenheter 84-118 kvadratmeter 15 Lang, Harald. Elements of Regression Analysis 14

Efter denna indelning i intervall kvarstår följande mängd data kring sålda bostäder: Totalt antal Antal efter urval Enrumslägenheter 31 440 25 962 Tvårumslägenheter 63 926 52 085 Trerumslägenheter 37 487 30 357 Fyrarumslägenheter 14 708 11 975 Totalt 120 379 Kategorisering rörande byggnadsår görs dessutom. Bostadsrätter som byggts innan år 1800 exkluderas ur datamängden och sedan delas byggnadsåren in i följande kategorier: År 1800-1899 1900-1939 1940-1949 1950-1959 1960-1969 1970-1979 1980-1989 1990-1999 2000-2009 2010-2015 15

Sex stycken hypotesprövningar har gjorts där det undersökts huruvida nollhypotesen för att β -värdena för kovariatet reporänta för två olika lägenhetskategorier är likadana, kan förkastas eller ej. Följande hypoteser ställs upp och testas på signifikansnivån 5%: 1. H 0 :β reporänta _ enrumslägenheter = β reporänta _ tvårumslägenheter H 1 :β reporänta _ enrumslägenheter β reporänta _ tvårumslägenheter 2. H 0 :β reporänta _ enrumslägenheter = β reporänta _ trerumslägenheter H 1 :β reporänta _ enrumslägenheter β reporänta _ trerumslägenheter 3. H 0 :β reporänta _ enrumslägenheter = β reporänta _ fyrarumslägenheter H 1 :β reporänta _ enrumslägenheter β reporänta _ fyrarumslägenheter 4. H 0 :β reporänta _ tvårumslägenheter = β reporänta _ trerumslägenheter H 1 :β reporänta _ tvårumslägenheter β reporänta _ trerumslägenheter 5. H 0 :β reporänta _ tvårumslägenheter = β reporänta _ fyrarumslägenheter H 1 :β reporänta _ tvårumslägenheter β reporänta _ fyrarumslägenheter 6. H 0 :β reporänta _ trerumslägenheter = β reporänta _ fyrarumslägenheter H 1 :β reporänta _ trerumslägenheter β reporänta _ fyrarumslägenheter 16

5. Resultat Nedan följer en sammanställning av betavärden för kovariatet reporänta för samtliga lägenhetskategorier. Resterande resultat av den sammanslagna regressionsanalysen återfinns i appendix. Residuals: Min 1Q Median 3Q Max - 3.04158-0.18352 0.02173 0.20209 1.69827 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 11.6803401 0.0109521 1066.494 < 2e- 16 *** Enrumreporanta - 8.6144032 0.1653585-52.095 < 2e- 16 *** Tvårumreporanta - 7.7027363 0.1154365-66.727 < 2e- 16 *** Trerumreporanta - 7.9970659 0.1550494-51.578 < 2e- 16 *** Fyrarumreporanta - 7.2649167 0.2475078-29.352 < 2e- 16 *** - - - Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 0.3131 on 120301 degrees of freedom Multiple R- squared: 0.5273, Adjusted R- squared: 0.527 F- statistic: 1766 on 76 and 120301 DF, p- value: < 2.2e- 16 Denna sammanslagna grundmodell genererar ett R 2 värde på 0.5273 samt ett R 2 på 0.527, vilket tyder på att regressionslinjen inte passar datat perfekt samt att residualerna inte är minimerade på bästa sätt. 17

5.1. Enrumslägenheter Kovariatet reporänta har ett β -värde på -8.6144032 för enrumslägenheter med boyta på 25-44 kvm vilket visar att då reporäntan ökar sänks försäljningspriset/kvm för enrumslägenheter. Detta β -värde används för att bland annat svara på frågeställningen om hur reporäntan påverkar priset av olika stora lägenheter. Nedan presenteras resultat ur ANOVA-analys för enrumslägenheter. Detta görs för att få fram F -värden för varje kovariat som indikerar signifikansnivån för respektive. Analysis of Variance Table Response: log(pris_per_kvm) Df Sum Sq Mean Sq F value Pr(>F) reporanta 1 240.98 240.98 3496.4315 < 2.2e- 16 *** monthly_kvm 1 74.24 74.24 1077.2204 < 2.2e- 16 *** h_area 1 351.38 351.38 5098.3226 < 2.2e- 16 *** b_elevator 1 106.78 106.78 1549.3323 < 2.2e- 16 *** Ort2 1 131.71 131.71 1911.0344 < 2.2e- 16 *** b_year1800_1899 1 43.72 43.72 634.4090 < 2.2e- 16 *** b_year1940_1949 1 0.07 0.07 1.0262 0.3111 b_year1950_1959 1 198.76 198.76 2883.8984 < 2.2e- 16 *** b_year1960_1969 1 104.71 104.71 1519.2093 < 2.2e- 16 *** b_year1970_1979 1 136.81 136.81 1984.9761 < 2.2e- 16 *** b_year1980_1989 1 4.82 4.82 69.9629 < 2.2e- 16 *** b_year1990_1999 1 23.25 23.25 337.3867 < 2.2e- 16 *** b_year2000_2009 1 67.97 67.97 986.2111 < 2.2e- 16 *** b_year2010_2015 1 35.80 35.80 519.4216 < 2.2e- 16 *** Spring 1 4.02 4.02 58.3032 2.324e- 14 *** Summer 1 0.08 0.08 1.1771 0.2780 Autumn 1 0.17 0.17 2.4105 0.1205 Botten 1 1.36 1.36 19.7369 8.924e- 06 *** Topp 1 0.02 0.02 0.3324 0.5642 Residuals 25941 1787.89 0.07 - - - Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Variabeln reporänta har ett högt F -värde, närmre bestämt 3496.4315, vilket resulterar i ett lågt p-värde. Reporänta har med andra ord en hög signifikans för modellen för enrumslägenheter. De variabler som erhåller ett lågt F -värde/högt p- värde i denna modell för enrumslägenheter är: b_year1960_1969, b_year1980_1989, Summer, Autumn, Mellan. 18

5.2. Tvårumslägenheter Kovariatet reporänta har ett β -värde på -7.7027363 för tvårumslägenheter med boyta på 41-68 kvm vilket visar återigen att då reporäntan höjs sänks försäljningspriset/kvm. Detta β -värde är mindre negativ än för enrumslägenheter. Nedan presenteras resultat ur ANOVA-analysen för tvårumslägenheter. Detta görs för att få fram F -värden för varje kovariat som indikerar signifikansnivån för respektive. Analysis of Variance Table Response: log(pris_per_kvm) Df Sum Sq Mean Sq F value Pr(>F) reporanta 1 371.1 371.10 4231.3235 < 2.2e- 16 *** monthly_kvm 1 901.1 901.14 10274.9592 < 2.2e- 16 *** h_area 1 542.1 542.07 6180.7548 < 2.2e- 16 *** b_elevator 1 377.1 377.13 4300.1695 < 2.2e- 16 *** Ort2 1 265.4 265.39 3026.0261 < 2.2e- 16 *** b_year1800_1899 1 279.0 279.04 3181.7295 < 2.2e- 16 *** b_year1940_1949 1 5.4 5.38 61.2903 5.018e- 15 *** b_year1950_1959 1 431.6 431.59 4921.0813 < 2.2e- 16 *** b_year1960_1969 1 240.4 240.40 2741.0622 < 2.2e- 16 *** b_year1970_1979 1 528.2 528.15 6022.1222 < 2.2e- 16 *** b_year1980_1989 1 188.5 188.47 2148.9308 < 2.2e- 16 *** b_year1990_1999 1 161.3 161.29 1839.0132 < 2.2e- 16 *** b_year2000_2009 1 121.9 121.88 1389.7473 < 2.2e- 16 *** b_year2010_2015 1 57.7 57.69 657.8465 < 2.2e- 16 *** Spring 1 3.1 3.11 35.5000 2.567e- 09 *** Summer 1 0.8 0.82 9.4009 0.00217 ** Autumn 1 0.0 0.00 0.0461 0.83005 Botten 1 0.5 0.47 5.3731 0.02045 * Topp 1 0.5 0.55 6.2199 0.01264 * Residuals 52065 4566.2 0.09 - - - Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Kovariatet reporänta har ett högt F -värde, 4231.3235, vilket resulterar i ett lågt p- värde. Reporänta har här med andra ord en hög signifikans för modellen. De variabler som erhåller ett lågt F -värde/högt p-värde i denna modell för tvårumslägenheter är: Summer, Botten, Mellan. 19

5.3. Trerumslägenheter Kovariatet reporänta har ett β -värde på -7.9970659 för trerumslägenheter med boyta 66-90 kvm vilket återigen visar att reporäntan har en negativ påverkan på priset. Detta β -värde är mindre negativ än för enrumslägenheter men mer negativ än för tvårumslägenheter. Nedan presenteras resultat ur ANOVA-analysen för trerumslägenheter. Detta görs för att få fram F -värden för varje kovariat som indikerar signifikansnivån för respektive. Analysis of Variance Table Response: log(pris_per_kvm) Df Sum Sq Mean Sq F value Pr(>F) reporanta 1 281.0 280.98 2240.9919 <2e- 16 *** monthly_kvm 1 582.4 582.37 4644.7445 <2e- 16 *** h_area 1 20.3 20.34 162.1977 <2e- 16 *** b_elevator 1 342.9 342.87 2734.6115 <2e- 16 *** Ort2 1 206.8 206.82 1649.4967 <2e- 16 *** b_year1800_1899 1 260.1 260.14 2074.8039 <2e- 16 *** b_year1940_1949 1 88.3 88.31 704.3263 <2e- 16 *** b_year1950_1959 1 81.0 81.00 646.0433 <2e- 16 *** b_year1960_1969 1 374.6 374.64 2987.9743 <2e- 16 *** b_year1970_1979 1 1075.6 1075.60 8578.5859 <2e- 16 *** b_year1980_1989 1 194.6 194.60 1552.0633 <2e- 16 *** b_year1990_1999 1 46.6 46.62 371.7968 <2e- 16 *** b_year2000_2009 1 42.7 42.72 340.7546 <2e- 16 *** b_year2010_2015 1 38.3 38.32 305.6294 <2e- 16 *** Spring 1 0.1 0.11 0.8580 0.3543 Summer 1 0.2 0.22 1.7860 0.1814 Autumn 1 0.3 0.31 2.4454 0.1179 Botten 1 0.0 0.03 0.2149 0.6430 Topp 1 0.0 0.01 0.1124 0.7375 Residuals 30337 3803.7 0.13 - - - Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Kovariatet reporänta har ett högt F -värde, 2240.9919, vilket resulterar i ett lågt p- värde. Reporänta har här med andra ord en hög signifikans för modellen. De variabler som erhåller ett lågt F -värde/högt p-värde i denna modell för trerumslägenheter är: b_year2000_2009, Summer, Autumn, Spring, Botten, Mellan. 20

5.4. Fyrarumslägenheter Kovariatet reporänta har ett β -värde på -7.2649167 för fyrarumslägenheter med boyta på 84-118 kvm vilket visar återigen reporäntan har en negativ påverkan på priset. Detta β -värde är mindre negativ än för enrums-, tvårums samt trerumslägenheter. Nedan presenteras resultat ur utförd ANOVA-analys för fyrarumslägenheter. Detta görs för att få fram F -värden för varje kovariat som indikerar signifikansnivån för respektive. Analysis of Variance Table Response: log(pris_per_kvm) Df Sum Sq Mean Sq F value Pr(>F) reporanta 1 81.78 81.78 599.3288 < 2.2e- 16 *** monthly_kvm 1 508.18 508.18 3724.4072 < 2.2e- 16 *** h_area 1 51.86 51.86 380.0452 < 2.2e- 16 *** b_elevator 1 101.13 101.13 741.1624 < 2.2e- 16 *** Ort2 1 62.05 62.05 454.7308 < 2.2e- 16 *** b_year1800_1899 1 55.32 55.32 405.4376 < 2.2e- 16 *** b_year1940_1949 1 19.81 19.81 145.1891 < 2.2e- 16 *** b_year1950_1959 1 35.87 35.87 262.9105 < 2.2e- 16 *** b_year1960_1969 1 119.24 119.24 873.9281 < 2.2e- 16 *** b_year1970_1979 1 171.30 171.30 1255.4367 < 2.2e- 16 *** b_year1980_1989 1 81.19 81.19 595.0542 < 2.2e- 16 *** b_year1990_1999 1 40.38 40.38 295.9740 < 2.2e- 16 *** b_year2000_2009 1 11.62 11.62 85.1739 < 2.2e- 16 *** b_year2010_2015 1 6.28 6.28 45.9932 1.243e- 11 *** Spring 1 0.01 0.01 0.0575 0.8106 Summer 1 0.15 0.15 1.1019 0.2939 Autumn 1 0.04 0.04 0.2763 0.5992 Botten 1 0.01 0.01 0.0373 0.8469 Topp 1 0.19 0.19 1.4256 0.2325 Residuals 11955 1631.22 0.14 - - - Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Kovariatet reporänta har ett högt F -värde på 599.3288 vilket resulterar i ett lågt p- värde. Reporänta har här med andra ord en hög signifikans för modellen. De variabler som erhåller ett lågt F -värde/högt p-värde i denna modell för fyrarumslägenheter är: b_year2000_2009, Summer, Autumn, Spring, Botten, Mellan. 21

5.5. Sammanfattning av resultat ur data för reporänta Nedan presenteras en sammanställning av alla resultat kring kovariatet reporänta från regressionsanalyserna samt ANOVA analyser för de olika rumskategorierna. Reporänta Enrumslägenheter Tvårumslägenheter Trerumslägenheter Fyrarumslägenheter Estimate -8.6144032-7.7027363-7.9970659-7.2649167 Std. Error 0.0109521 0.1154365 0.1550494 0.2475078 t value -52.096-66.272-51.578-29.352 Pr(> t ) < 2e-16 *** < 2e-16 *** < 2e-16 *** < 2e-16 *** Df 1 1 1 1 Sum Sq 240.98 371.1 281.0 81.78 Mean Sq 240.98 371.10 280.98 81.78 F value 3496.4315 4231.3235 2240.9919 599.3288 Pr(>F) < 2.2e-16 *** < 2.2e-16 *** < 2.2e-16 *** < 2.2e-16 *** Det framgår tydligt att reporäntan påverkar priset negativt för alla bostäder. Enligt F -värdena har reporänta högst signifikans för tvårumsmodellen därefter för enrums-, trerums- och sist fyrarumsmodellen. 5.6. AIC Undersökning kring modell utan kovariat reporänta där reg är modell med reporänta som kovariat och reg3 modell utan reporänta. Ettor df AIC reg3 21 4255.953 reg3 20 7832.118 Treor df AIC reg 21 23138.51 reg3 20 25129.41 Tvåor Df AIC reg 21 21067.85 reg3 20 25775.59 Fyror df AIC reg 21 10153.49 reg3 20 10732.81 En modell med så lågt AIC som möjligt eftersträvas då detta indikerar en bättre modell. Ovan framgår det tydligt att en modell med kovariat reporänta har lägre AIC-värde för samtliga rumskategorier jämfört med en modell utan reporänta. Detta stärker att reporänta som kovariat med säkerhet bör inkluderas i samtliga modeller. 22

5.7. Ytterligare kring AIC och R 2 Ur regressionsanalyserna för de olika rumskategorierna erhölls R 2 värden mellan 0.452 och 0.495 för de olika rumskategorierna, vilket inte anses vara högt. Ur ANOVA-analyserna kunde det observeras att olika kovariat erhöll låga F -värden för de olika rumskategorier. Dessa sammanställs nedan: Ettor b_year1960_1969, b_year1980_1989, Summer, Autumn, Mellan Tvåor Summer, Botten, Mellan Treor b_year2000_2009, Summer, Autumn, Spring, Botten, Mellan Fyror b_year2000_2009, Summer, Autumn, Spring, Botten, Mellan Det blir tydligt att vissa dummyvariabler under variabelkategorier Byggnadsår, Säsong och Våning visade sig ha låga F-värden, alltså låg signifikans för modellen. Genom att exkludera variabler som är mindre signifikanta för modellen är det möjligt att höja R 2 värdet av modellen vilket vi strävar efter att göra. Undersökning för varje kovariat görs huruvida exkludering av kovariat x i leder till ett högre R 2. Även AIC-värden jämförs för alla kovariat, där det has i åtanke att en modell utan reporänta ger ett högre AIC. Undersökning kring modell utan kovariat x i för alla i där initial är modell med samtliga kovariat och modell - x i är modell där kovariat x i har exkluderats. Signifikans enrumslägenheter Enrumslägenheter AIC R 2 R 2 Good/Bad initial 4255.953 0.4606 0.4602 -reporanta 7832.118 0.3809 0.3805 Good -monthly/kvm 4926.619 0.4464 0.4461 Good -h_area 7378.142 0.3916 0.3912 Good -b_elevator 5645.627 0.4309 0.4305 Good -Ort2 4611.770 0.4531 0.4527 Good -Byggnadsår 11421.825 0.2887 0.2884 Good -Säsong 4312.340 0.4593 0.459 Good -Våning 4272.030 0.4602 0.4598 Good Signifikans tvårumslägenheter Tvårumslägenheter AIC R 2 R 2 Good/Bad initial 21067.85 0.495 0.4948 -reporanta 25775.59 0.4472 0.447 Good -monthly/kvm 25468.68 0.4504 0.4503 Good -h_area 23266.70 0.4732 0.473 Good -b_elevator 24060.38 0.4651 0.4649 Good -Ort2 21417.04 0.4916 0.4914 Good -Byggnadsår 40028.75 0.273 0.2728 Good -Säsong 21106.17 0.4946 0.4944 Good -Våning 21075.44 0.4949 0.4947 Good 23

Signifikans trerumslägenheter Trerumslägenheter AIC R 2 R 2 Good/Bad initial 23138.51 0.4887 0.4884 -reporanta 25129.41 0.454 0.4537 Good -monthly/kvm 27722.89 0.4053 0.405 Good -h_area 23176.39 0.4881 0.4878 Good -b_elevator 24376.37 0.4674 0.4671 Good -Ort2 23264.36 0.4866 0.4863 Good -Byggnadsår 36880.50 0.1955 0.1953 Good -Säsong 23137.57 0.4886 0.4884 OK -Våning 23134.83 0.4887 0.4884 OK Signifikans fyrarumslägenheter Fyrarumslägenheter AIC R 2 R 2 Good/Bad initial 10153.49 0.4522 0.4513 -reporanta 10732.81 0.4249 0.4241 Good -monthly/kvm 12623.11 0.3266 0.3256 Good -h_area 10151.60 0.4522 0.4513 OK -b_elevator 10620.14 0.4303 0.4295 Good -Ort2 10294.04 0.4456 0.4448 Good -Byggnadsår 13554.60 0.2711 0.2705 Good -Säsong 10148.92 0.4521 0.4514 Bad -Våning 10150.96 0.4521 0.4513 OK Tabellerna visar inte att exkludering av en viss variabel leder till ett högre R 2. Trots det finns det i vissa fall variabler som inte har någon påverkan på R 2, exkludering av dessa erhåller i flesta fall ett lägre AIC värde. Slutsatsen här blir att R 2 -värdet inte kan ökas genom att exkludera ett visst kovariat ur modellen. 5.7.1. Sammanfattning för AIC och R 2 för modell med/utan reporanta Enrumslägenheter Tvårumslägenheter Treor Fyror AIC (inital) 4255.953 21067.85 23138.51 10153.49 AIC (-reporanta) 7832.118 25775.59 25129.41 10732.81 R 2 (inital) 0.4606 0.495 0.4887 0.4522 R 2 (-reporanta) 0.3809 0.4472 0.454 0.4249 R 2 (inital) 0.4602 0.4948 0.4884 0.4513 R 2 (-reporanta) 0.3805 0.447 0.4537 0.4241 Med variabeln reporanta erhålls det för alla kategorier ett lägre AIC och ett högre R 2 & R 2. 24

5.8. Heteroskadisticitet 5.8.1. Breusch-Pagan test, Normal Q-Q samt linjäranpassning Följande resultat fås vid utförandet av Breusch-Pagan testet för existens av heteroskadisticitet: Enrumslägenheter studentized Breusch- Pagan test data: p BP = 1400.897, df = 19, p- value < 2.2e- 16 Tvårumslägenheter studentized Breusch- Pagan test data: p BP = 5112.933, df = 19, p- value < 2.2e- 16 Trerumslägenheter studentized Breusch- Pagan test data: p BP = 2846.177, df = 19, p- value < 2.2e- 16 Fyrarumslägenheter studentized Breusch- Pagan test data: p BP = 1464.676, df = 19, p- value < 2.2e- 16 För samtliga rumskategorier fås ett positivt värde för Breusch-Pagan testet samt ett lågt p-värde vilket visar att heteroskedasticitet förekommer. 25

Vidare kring heteroskedasticitet undersöktes den sammanslagna modellens Normal Q-Q samt linjäranpassning till datapunkterna. Figur 1. Normal Q-Q samt linjäranpassning av den sammanslagna grundmodellens datamängd. 26

5.9. Multikollinaritet 5.9.1. Varians Inflations Faktorn, VIF Via VIF undersöks huruvida multikollinaritet förekommer bland kovariaten. Enrumslägenheter reporanta monthly_kvm h_area 1.028465 1.227568 1.123241 b_elevator Ort2 b_year1800_1899 1.131804 1.123654 1.040608 b_year2010_2015 b_year1940_1949 b_year1950_1959 1.065200 1.113810 1.111438 b_year1960_1969 b_year1970_1979 b_year1980_1989 1.073476 1.128927 1.007799 b_year1990_1999 b_year2000_2009 Spring 1.074641 1.154767 1.601265 Summer Autumn Botten 1.516722 1.605075 1.072289 Topp 1.079465 Tvårumslägenheter reporanta monthly_kvm h_area 1.025366 1.455698 1.218675 b_elevator Ort2 b_year1800_1899 1.380455 1.101036 1.113613 b_year2010_2015 b_year1940_1949 b_year1950_1959 1.167472 1.509670 1.247005 b_year1960_1969 b_year1970_1979 b_year1980_1989 1.172562 1.101953 1.157177 b_year1990_1999 b_year2000_2009 Spring 1.336488 1.484380 1.598694 Summer Autumn Botten 1.496022 1.600935 1.063924 Topp 1.084115 27

Trerumslägenheter reporanta monthly_kvm h_area 1.033689 1.489389 1.191750 b_elevator Ort2 b_year1800_1899 1.342739 1.075174 1.215408 b_year2010_2015 b_year1940_1949 b_year1950_1959 1.444972 1.606127 1.863868 b_year1960_1969 b_year1970_1979 b_year1980_1989 1.720565 1.562443 1.456438 b_year1990_1999 b_year2000_2009 Spring 1.728727 2.216170 1.605148 Summer Autumn Botten 1.496090 1.601900 1.067258 Topp 1.091640 Fyrarumslägenheter reporanta monthly_kvm h_area 1.043101 1.563991 1.155969 b_elevator Ort2 b_year1800_1899 1.243268 1.070715 1.247696 b_year2010_2015 b_year1940_1949 b_year1950_1959 1.773905 1.210197 1.668957 b_year1960_1969 b_year1970_1979 b_year1980_1989 1.732934 1.403235 1.626981 b_year1990_1999 b_year2000_2009 Spring 2.074621 2.625715 1.623093 Summer Autumn Botten 1.479479 1.622430 1.081116 Topp 1.069900 Ovan observeras att samtliga VIF-värden är mindre än 10 vilket indikerar att multikollinaritet inte existerar. 5.10. Hypotesprövning Samtliga hypotesprövningar som ställts upp resulterar i skilda resultat. För hypotesprövning 1 fås ett p-värde på 5.602e-06 vilket gör att vi kan förkasta nollhypotesen om β reporänta _ enrumslägenheter = β reporänta _ tvårumslägenheter på 5% signifikansnivån. Hypotesprövning 2 resulterar i ett p-värde på 0.006374. Även för denna hypotesprövning kan nollhypotesen om likadana β -värdena förkastas på signifikansnivån 5%. 28

Hypotesprövning 3 visar att nollhypotesen om β reporänta _ enrumslägenheter = β reporänta _ fyrarumslägenheter kan förkastas på signifikansnivån 5% då p-värdet är 5.674e-06. För hypotesprövning 4 fås ett p-värde på 0.1271 vilket innebär att nollhypotesen inte kan förkastas med säkerhet på signifikansnivån 5%. Hypotesprövning 5 resulterar i ett p-värde på 0.1085 vilket innebär att även denna nollhypotes inte kan förkastas på en signifikansnivå på 5%. Hypotesprövning 6 ger ett p-värde på 0.01215 vilket innebär att nollhypotesen om β reporänta _ trerumslägenheter = β reporänta _ fyrarumslägenheter kan förkastas på signifikansnivån 5%. 29

6. Diskussion 6.1. Analys av resultat Från de utförda regressionsanalyserna kan det observeras hur de valda kovariaten påverkar bostadspriset. I denna studie har fokus lagts just på reporäntan samt hur den påverkar priserna av bostäder av olika storlek. Ur den sammanslagna regressionsanalysen kan det konstateras att β -värdena för reporäntekovariatet skiljer sig åt för de olika lägenhetskategorierna. De hypotesprövningar som gjorts, för undersökning kring huruvida man kan förkasta en hypotes om att β -värdena för de olika lägenhetskategorierna är likadana, visar blandade resultat. Hypotesprövningarna visar att hypoteser för att β -värdena för reporäntan för enrumslägenheter gentemot två-, tre- samt fyrarumslägenheter ska vara likadana kan förkastas med den valda signifikansnivån. Utöver detta kan hypotesen om likadan β -värden för reporänta för trerums- mot fyrarumslägenheter förkastas på den valda signifikansnivån. Dock kan det inte med säkerhet förkastas att β -värdena för reporänta är likadana för tvårumslägenheter mot tre- samt fyrarumslägenheter med 5% signifikansnivå. Utifrån dessa resultat för hypotesprövningar kan det alltså observeras att reporäntan faktiskt har en skild påverkan på bostadspris för de olika lägenhetsstorlekarna, det kan konstateras att β - värdena inte är lika för de olika kategorierna. Reporäntan påverkar alltså modellerna för de olika stora lägenheterna olika mycket. Skillnaden är inte enorm men påtaglig. Vidare framgår det ur resultaten hur resterande kovariat påverkar modellerna, Säsong till exempel tyder på att det är mest givande att sälja en lägenhet under hösten och beroende på lägenhetens storlek är det bäst att köpa på sommaren för trerumslägenheter och fyrarumslägenheter samt våren för enrumslägenheter och tvårumslägenheter, med vinter som referenspunkt. En punkt som är viktigt att ta hänsyn till är förklaringsgraden R 2 för respektive modell. I de regressionsanalyser som utförs erhålls ett R 2 -värde kring 0.53 för samtliga modell vilket leder till att man inte med säkerhet kan påstå att datat ligger nära regressionlinjen, alltså är inte residualerna minimerade på effektivaste möjliga sätt. Baserat på detta görs en undersökning kring huruvida R 2 -värdet ökar vid exkludering av mindre signifikanta kovariat. Resultaten av denna påbyggande undersökning bidrar till att det konkluderas att R 2 -värdet inte ökar markant. Ett antagande kan vara att R 2 -värdet ökar vid tillägg av nya kovariat av signifikans då inkludering av kovariat av mindre signifikans, till exempel Säsong och Våning, inte bidrar till ett högre R 2 -värde. Efter att ha noterat signifikansvärdena för de olika kovariaten kan det konstateras att vissa kovariat är av högre signifikans än andra för de olika stora bostadskategorierna. Arean är till exempel av lägre signifikans för trerums- och fyrarumslägenheter än för enrums- samt tvårumslägenheter. Visserligen är ett R 2 -värde alltid önskvärt men att R 2 -värdet inte ligger närmare 1 i dessa fall kan accepteras då syftet med analysen är att verifiera huruvida reporäntan påverkar de olika stora lägenheterna olika mycket. 30

Standardavvikelsen är inte hög för någon av kovariaten vilket tyder på att multikollinaritet inte existerar. Ett annat sätt att indikera ifall multikollinaritet förekommer är genom att undersöka Varians Inflations Faktorn för varje kovariat. I resultaten observeras att samtliga VIF-värden är mindre än 10 vilket per definition förklarar att multikollinaritet inte existerar. Detta innebär att två eller flera kovariat inte är linjärt beroende. Vid undersökning av huruvida reporäntan bör ingå i modellen för pris per kvadratmeter utförs bland annat AIC test. AIC-värdet av modell utan reporänta som kovariat är beräknat till att vara högre än AIC-värdet av den ursprungliga modellen för alla rumskategorier, vilket indikerar att modellen blir sämre om reporäntan exkluderas. För tre- och fyrarumslägenheter drar man slutsatsen att AIC-värdet blir lägre, alltså att modellen blir bättre, om man exkluderar kovariat rörande Säsong samt Våning. En annan punkt som tyder på att reporäntan är ett viktigt kovariat för modellen är att det vid exkludering av kovariatet fås ut ett lägre R 2 -värde. Det utförda Breusch-Pagan testet visade ett positivt Breusch-Pagan värde samt ett lågt p-värde vilket tyder på att det råder heteroskedasticitet. Detta innebär att feltermerna inte är konstanta. Utifrån Normal Q-Q, Figur 1, kan det konstateras att det finns ett antal punkter som approximativt inte tillhör normalfördelningen. Bortsett från dessa följer de flesta punkterna normalfördelningen bra. Utöver Normal Q-Q visar den linjära anpassningen till datapunkterna en relativt god linjär anpassning. Därav har modellen inte omformulerats för att eliminera heteroskedasticitet. 6.2. Tillämpning Studien och dess resultat kan först och främst komma att användas av företaget Valueguard. Som tidigare nämnt görs detta kandidatexamensarbete i ett mindre samarbete med företaget. Resultaten av studien kan komma att gynna Valueguards verksamhet och dess intressenter då ytterligare klarhet ges kring bostadsmarknadens dynamik. För vidare forskning kan det vara av intresse att undersöka om reporäntan är av lika stor vikt för olika områden i Sverige. 31

7. Hur reporäntan påverkar bostadspriserna ur ett nationalekonomiskt perspektiv 7.1. Introduktion Enligt Nasdaq OMX Valueguard-KTH Housing Index (HOX) har priserna på bostadsrätter i Sverige fördubblats sedan 2006. 16 När man gör ett försök till att förklara denna väldiga prisökning nämns en del olika faktorer som bostadsbrist, stärkt svensk ekonomi, ökad efterfrågan på bostäder och lägre ränta. Bostadsmarknaden påverkas av reala, institutionella och finansiella faktorer där bland skatter och kreditutbud. Penningpolitiken påverkar bostadsmarknaden allra mest genom att effekter på kostnader för hushållens bolån uppstår. 17 Ett vanligt argument för prisökning på bostadsmarknaden är sänkt reporänta. En sänkt reporänta innebär i regel att marknadsräntorna sjunker. Detta påverkar bostadslån för de låntagare med rörlig ränta då lånet blir billigare. Det i sin tur leder till att man har mer pengar över och en ökad konsumtions- och investeringsvilja blir då resultatet. Ett påstående kan då göras - att en köpare i en sådan situation är villig att betala mer för en bostadsrätt då det är billigare att låna vid låg reporänta, vilket leder till ökning av bostadspriser. 18 7.2. Problemformulering och syfte ii. Hur påverkar reporäntan bostadsmarknaden ur nationalekonomiskt perspektiv? För att undersöka hur reporäntan påverkar bostadspriserna ur ett nationalekonomiskt perspektiv behöver hänsyn tas till ett antal variabler som påverkar vad reporäntan sätts till av Riksbanken, som i sin tur påverkar bostadspriserna. Att tydliggöra vilka faktorer som ligger till grund för de ekonomiska förändringar som sker idag samt förstå hur alla dessa faktorer påverkar varandra och vår vardag är av vikt för att kunna förstå dagens ekonomiska situation. 16 Valueguard (2015). Nasdaq OMX Valueguard-KTH Housing Index (HOX) Sverige BR [www]. Hämtat från <http://www.valueguard.se/sverigebr >. Publicerat 13 mars 2015. Hämtat 29 mars 2015. 17 Sveriges Riksbank(2015). Riksbankens Utredning om risker på den svenska bostadsmarknaden [www.] Hämtad från <http://www.riksbank.se/sv/press-och-publicerat/publicerat-fran-riksbanken/ovrigarapporter/riksbankens-om-risker-pa-den-svenska-bostadsmarknaden/>. Hämtat den 12 maj 2015 18 Hörngren, Lars(1995). Penningpolitik i teori och praktik [www] Hämtat från <http://www.riksbank.se/upload/dokument_riksbank/kat_publicerat/artiklar_pv/pv_95_3_artikel1.pdf>. Hämtat 12 maj 2015 32