Bolåneräntor i Sverige
|
|
- Isak Lindgren
- för 8 år sedan
- Visningar:
Transkript
1 DEGREE PROJECT, IN APPLIED MATHEMATICS AND INDUSTRIAL ECONOMICS, FIRST LEVEL STOCKHOLM, SWEDEN 2014 Bolåneräntor i Sverige EN ANALYS AV INDIVIDUELLA RÄNTOR MED MULTIPEL LINJÄR REGRESSION ANDRÉ BERGLUND, ERIK HELLGREN KTH ROYAL INSTITUTE OF TECHNOLOGY SCI SCHOOL OF ENGINEERING SCIENCES
2
3 Bolåneräntor i Sverige En analys av individuella räntor med multipel linjär regression A NDRÉ B ERGLUND E RIK H ELLGREN Examensarbete inom teknik: Tillämpad matematik och industriell ekonomi (15 credits) Civilingenjörsutbildning i industriell ekonomi (300 credits) Kungliga Tekniska Högskolan 2014 Handledare på KTH Tatjana Pavlenko Examinator Tatjana Pavlenko TRITA-MAT-K 2014:03 ISRN-KTH/MAT/K--14/03--SE Kungliga Tekniska Högskolan Skolan för Teknikvetenskap KTH SCI SE Stockholm, Schweden URL:
4
5 Sammanfattning I denna rapport undersöks hur ett antal kundspecifika faktorer som belåningrad, bank och inkomst påverkar svenska hushålls individuella bolåneräntor. Metoden som används är multipel linjär regression med transformeringar av förklarande variabler. Transformer som används är log-linjär, linjär-log, log-log samt styckvis linjär. Datan innehåller ett stickprov om ca rörliga bolån från juli 2013 insamlade av organisationen Villaägarna på frivillig basis. Variablerna belåningsgrad, lånets storlek och bank bidrar mest till att förklara räntan. Vår analys visar att stora lån i kombination med låg belåningsgrad tenderar till att ge lägst ränta samtidigt som det finns signifikanta skillnader i bolåneränta mellan bankerna även om deras listräntor är lika. Abstract This report investigates how a number of customer-specific factors affect individual interest rates for Swedish home mortgages. The method used is multiple linear regression with transformations of the explanatory variables. Transformations that we employ are log-linear, linear-log, log-log and piecewise linear. The dataset consists of approximately 7000 Swedish home mortgages with floating interest rates from July Loan to value ratio, loan size and the the choice of mortgage lender are identified as the most important factors that influence individual interest rates. We find that large loans in combination with low loan to value ratio tend to lead to lower interest rates. There are also significant differences in interest rates depending on the mortgage lender. 2
6
7 Innehåll 1 Inledning Bakgrund Problemformulering och frågeställning Syfte Rapportens disposition Statistisk analys Generell metod Avgränsningar Linjär regression: teori Modellspecifikation Skattning av β R 2 och R BIC Backward elimination Dummy-variabler Transformation av variabler Heteroskedasticitet Whites konsistenta variansskattning Endogenitet Multikollinearitet F-test och t-test Q-Q plot Data Allmänt om datan Befintliga Variabler Orimliga värden Rensning av orimliga värden Skapade Variabler Genomförande Allmänt om genomförandet Undvikande av multikollinearitet Modell 1 - linjär Modell Resultat Modell 2 - linjär med interaktioner Modell Resultat Modell 3 - logaritmerad beroende variabel Modell Resultat Modell 4 - transformerade förklarande variabler Modell Resultat Modell Modell Resultat
8 3.7 Modell Modell Resultat Modell Resultat Analys Val av modell Mätfel Diskussion Val av kovariater Individuell förhandling av räntan Modellspecifikation Internetrelaterade tjänster och deras påverkan på bolånemarknaden Metod Information och sökkostnader Industriell omvandling och strategier Förutsägelser kring den digitala revolutionen på bolånemarknaden Utvecklingen av den svenska marknaden för bolån Analys av befintliga tjänster Regressionsmodellens bidrag Diskussion Slutsats 34 8 Referenser 35
9 1 Inledning 1.1 Bakgrund De senaste årens stigande bostadspriser har bidragit till att öka svenska hushålls skuldsättningsgrad och därmed också deras känslighet mot räntor och ränteförändringar. Under fjärde kvartalet 2013 var hushållens skuldsättning 174.5% av den disponibla inkomsten (Finansinspektionen, 2014). Bankernas marginaler på bolån, individuella ränterabatter och de vinster svenskarnas bolån genererar har under en längre tid varit föremål för flitig debatt. Kunderna har uppmanats att informera sig och förhandla om villkoren för bolånen, vilket dock är lättare sagt än gjort. Den svenska bolånemarknaden domineras av ett fåtal banker och bolåneinstitut. Deras aktuella listräntor finns tillgängliga på internet och publiceras dagligen i tidningar. Listräntorna varierar inte i någon större utsträckning mellan bankerna utan ligger generellt väldigt nära varandra. Listräntan kan ses som ett riktmärke på vilken ränta som kunden kan förvänta sig men den slutliga räntan är i de flesta fall förhandlingsbar. Varje enskilt bolån ger upphov till en kreditrisk för bolåneinstitutet vilket gör att räntan måste anpassas. Det finns således ingen garanti för att man kan förvänta sig att få låna till listräntan. Finansinspektionen (2013b) har föreslagit att bankerna 1 ska bli skyldiga att redovisa vad som påverkar den individuella kundräntan som en åtgärd för att skapa ökad öppenhet kring bolåneräntan. I kölvattnet av diskussionen i media kring så kallade ränterabatter har flera internettjänster skapats för att bidra till mer öppenhet kring bolåneräntorna. Under 2012 lanserade SvD Räntekartan där användarna kan uppge sin ränta och jämföra med vilken ränta andra har uppgett att de har. Villaägarnas tjänst Räntekollen ger en indikation på det maximala förhandlingsutrymmet baserat på den personliga kreditrisken och bankens upplåningskostnad. 1.2 Problemformulering och frågeställning En bolånetagares slutgiltiga bolåneränta förhandlas i regel mellan banktjänstemannen och kunden och behöver som sagt inte nödvändigtvis vara samma som listräntan. Allmänhetens insyn i vad som påverkar den bolåneränta som kunden slutligen får är begränsad eftersom bankerna inte delger allmänheten den internprissättning de använder sig av vid utlåning och räntan förhandlas individuellt. Prisättningsmodellen betraktas som en affärshemlighet och ett konkurrensmedel. Genom Yellow-Belly som har utvecklat tjänsten Räntekollen har vi fått tillgång till ett dataset med svenska bolånekunder, deras ränta och andra uppgifter som inkomst och bostadsvärde. Då datan samlats in på frivillig basis och enbart innehåller uppgifter om bolånekunder som använt Räntekollen kan den inte antas vara representativ för hela befolkningen. Vår analys gäller därför enbart för den intresserade bolånekunden. I den kvantitativa delen av detta examensarbete söker vi med hjälp av statistiska metoder svar på frågan: (I) Vilka kundspecifika faktorer påverkar räntan för den intresserade bolånetagaren? Då listräntan bara kan ses som ett riktmärke för boräntan har prisjämförelser mellan banker varit svåra och kunden har fått vända sig till flera olika banker för att få ett perspektiv på vad som är en rimlig ränta givet densammes ekonomiska situation. Ett annat alternativ har varit att fråga vänner och bekanta om vilken ränta de har. Detta kan vara 1 I denna rapport används bank och bolåneinstitut synonymt 5
10 svårt i praktiken då även personernas privatekonomi behöver jämföras för att jämförelsen ska vara relevant. Under åren 2012 och 2013 har nya tjänster lanserats som använder sig av internet för bolånerådgivning och datainsamling, t.ex. Räntekartan och Räntekollen. Bolånetjänsters data över svenska bolån och tillhandahållande av relevant information till kunderna har potential att verka som omvandlingstryck på bolånebranschen. Detta leder till den andra frågeställningen som detta arbete besvarar: (II) På vilket sätt har marknaden för bolån påverkats av internetrelaterade tjänster och vilka utmaningar står bolånebranschen inför? 1.3 Syfte Syftet med denna rapport är tvådelat. Vi vill för det första undersöka vilka faktorer som påverkar bolåneräntan för konsumenten och bedöma om denna går att förklara med statistiska metoder. För det andra vill vi studera hur ökad digitalisering och informationsutbyte i allmänhet kan påverka marknaden för bolån. 1.4 Rapportens disposition I detta examensarbete utreds två frågeställningar. I kapitel 3 och 4 behandlas frågeställning I. I kapitel 5, Internetrelaterade tjänster och deras påverkan på bolånebranschen behandlas frågeställning II där även resultaten från den statistiska analysen i kapitel 3 och 4 integreras. 2 Statistisk analys 2.1 Generell metod För att söka svar på vår frågeställning om vilka kundspecifika faktorer som påverkar bolåneräntan ämnar vi använda multipel linjär regressionsanalys på ett dataset innehållande befintliga bolån. Datan kommer från befintliga bolånekunder som själva uppgett sin nuvarande ränta och andra personliga uppgifter såsom inkomst och lånebelopp i syfte att se hur mycket förhandlingsutrymme deras bank teoretiskt har. Datan fångar upp de kvantitativa aspekterna av en kunds risk och potentiella affär med banken men utelämnar mjuka uppgifter hos bolånetagaren som också kan vara relevanta men är svåra eller omöjliga att studera med vår metod (se avsnitt 5.1). Genom en regressionsmodell kan vi få ökad insikt i hur de kvantitativa variablerna påverkar bolåneräntan. 2.2 Avgränsningar De lån vi har valt att studera är existerande lån hos olika bolåneinstitut vilket medför att lån som inte blivit medgivna av bankerna inte heller är representerade i vår undersökning. Vidare har vi valt att begränsa oss till att undersöka rörliga bolån med 3-månadersränta. Ett befintlig lån med längre bindningstid, t. ex. tre år kan ha en ränta som bundits upp till tre år bakåt i tiden vilket gör att dessa inte är lämpliga för en undersökning då räntan varierar över tiden. Rörliga bolån däremot har en ränta som har bestämts tidigast tre månader bakåt i tiden. Vi har valt att utföra vår analys på data från juli 2013 eftersom listräntan då hade varit relativt stabil under föregående månader. Vi har även valt att begränsa undersökningen till de åtta största aktörerna som tillsammans har 95% av den svenska bolånemarknaden (Finansinspektionen, 2013a). 6
11 Datan innehåller uppenbara felinmatningar som sållas bort. Kriterierna som används för att göra detta är emellertid avgränsningar i sig (se avsnitt 2.4.3). 2.3 Linjär regression: teori Modellspecifikation Den multipla linjära regressionsmodellen är specificerad enligt följande: k y i = x ij β j + e i, i = 1,..., n (1) j=0 där y kallas för beroende variabel, x j för förklarande variabel, β j för regressionskoefficient eller kovariat och e i för felterm. I det här fallet finns n observationer med k förklarande variabler. Ekvation (1) kan skrivas om till formen där Skattning av β Y = Xβ + e, (2) Y = y., β = β., e = e. y n β k e n 1 x 11 x 1k X = x n1 x nk Ordinary Least Squares (OLS) skattningen av β, betecknat ˆβ, minimerar n i=1 ê i 2 genom att lösa normalekvationerna X t ê = 0, (3) där ê = Y X ˆβ. Då fås OLS-skattningen ˆβ = (X t X) 1 X t Y (4) av β. För en härledning se (Lang, 2013). Denna modell bygger emellertid på att vissa antaganden om feltermernas natur. Dessa är: 1. E[e X] = 0. Det betingade väntevärdet för feltermerna antas vara noll. 2. E[ee t X] = σ 2 I. Feltermerna antas ha samma varians (homoskedasticitet) och vara oberoende mellan observationer. Då minstakvadratproblemet lösts fås prediktionen av Y, Ŷ = X ˆβ. 7
12 2.3.3 R 2 och R 2 Vid en regressionsmodell är det önskvärt att anpassa en modell som med hjälp av kovariaterna förklarar den beroende variabeln så bra som möjligt. R 2 är ett mått på förklaringsgrad och är definierat enligt R 2 = ni=1 (ŷ i ȳ) 2 ni=1 (y i ȳ) 2 = 1 ni=1 ê i 2 ni=1 (y i ȳ) 2, (5) där n i=1 (ŷ i ȳ) 2 kallas för ESS (explained sum of squares) och n i=1 ê 2 i för RSS (residual sum of squares). R 2 mäter alltså hur bra modellen förklarar data. R 2 tar inte hänsyn till hur många förklarande variabler som finns med i modellen. Många förklarande variabler ökar förklaringsgraden men modellen kan då istället vara överspecificerad. R 2 är definierat enligt R 2 = 1 n 1 ni=1 2 ê i n k 1 ni=1 (y i ȳ) 2 (6) och är minskande i k, antalet förklarande variabler BIC Vid val av vilka förklarande variabler som ska tas med i ekvation (1) kan BIC (Bayesian Information Criterion) användas. Den modell som väljs med hjälp av BIC minimerar nln( ê 2 ) + kln(n). (7) BIC är ökande i k för att motverka överspecificerade modeller Backward elimination Vid val av linjär modell är det lätt att använda för många förklarande variabler, s.k.overfitting. Då finns en risk för att vissa variabler inte bär på någon egentlig information utan istället beskriver fluktuationer i feltermen. BIC kan då användas för val av modell. En metod för att göra detta kallas backward elimination och sker i följande steg: 1. Börja med samtliga variabler. 2. Ta bort den variabeln som förbättrar modellen mest enligt valt kriterium. I fallet med BIC är det variabeln som, om den tas bort, minskar BIC-värdet mest. 3. Fortsätt med ovanstående metod tills ingen förklarande variabel kan uteslutas. För att använda backward elimination är det viktigt att det inte råder multikollinearitet (se avsnitt för en definition av multikollinearitet). Då kan relevanta variabler uteslutas tidigt eftersom de är för starkt korrelerade med andra variabler i modellen Dummy-variabler Dummy-variabler används som förklarande variabler för att beskriva en binär egenskap, till exempel om man har a-kassa eller inte. Dummy-variabeln antar värdet 1 om personen i fråga är medlem i en a-kassa och 0 annars. Den tillhörande koefficienten beskriver hur mycket den beroende variabeln ökar eller minskar om dummy-variablen är 1. Då det kan existera interaktionseffekter mellan dummy-variabeln och andra förklarande variabler kan interaktioner av formen (a kassa) (lön) tas med. 8
13 2.3.7 Transformation av variabler OLS används för linjära samband, men med transformation av variabler kan vissa ickelinjära samband skrivas linjärt. Tre välkända transformationer kommer att användas i detta arbete 1. log-linjär: ln(y) = β 1 x 1 + e. I detta fall leder en absolut förändring av kovariaten x 1 till en procentuell förändring av y då y y x 1β linjär-log: y = β 1 ln(x 1 ) + e. En procentuell förändring av x 1 leder i detta fall till en absolut förändring av y då y β x x. 3. log-log: ln(y) = β 1 ln(x 1 )+e. En procentuell förändring av x i leder till en procentuell förändring av y eftersom y y β 1 x x. En närmare beskrivning återfinns i (Kennedy, 2008) Heteroskedasticitet Heteroskedasticitet uppstår när feltermernas varians skiljer sig mellan observationer, alltså att E[ee t X] σ 2 I. Ett typiskt fall av heteroskedasticitet är när feltermernas varians beror på kovariaternas värden. Heteroskedasticitet kan upptäckas genom att plotta residualerna mot varje kovariat och man kan då grafiskt urskilja om feltermerna beror på kovariaternas värden. När modellen inkluderar många kovariater blir den metoden snabbt oöverskådlig. Istället kan man plotta residualerna mot de predikterade värdena för att få en uppfattning om variansen är konstant över observationer. Heteroskedasticitet är ett tecken på att modellen kan vara felformulerad. Om heteroskedasticitet upptäcks är det första steget därför att omformulera modellen, t. ex. genom att transformera variabler. Kvarstår problemet kan man använda sig av White s korrigerade standardel (Lang, 2013) Whites konsistenta variansskattning Heteroskedastiska residualer ger felaktiga skattningar av regressionskoefficienternas standardfel. Ett första steg för att åtgärda detta är att transformera variabler. Om heteroskedastisitet återstår kan Halbert Whites metod användas. Whites konsistenta variansskattning är då Cov( ˆβ) = (X t X) 1 X t D(ê 2 )X(X t X) 1 n = (X t X) 1 ( ê 2 i x t ix i )(X t X) 1, i=0 (8) där D(ê) 2 är en n n diagonalmatris n n vilkens i:te diagonalelement är ê i 2.(Lang, 2013) Endogenitet Endogenitet uppstår då en eller flera kovariater är korrelerade med feltermen vilket strider mot ett av antagandena vid användningen av OLS som då inte kommer att ge konsistenta skattningar av β (Lang, 2013). Urvalsfel, selection bias, kan ge upphov till endogenitet. I vårt fall, då data samlats in från bolånetagare som själva uppgett vad de har för ränta, kan denna inte ses som representativ för hela populationen. Om vi istället inskränker undersökningen till att gälla den intresserade bolånekunden antar vi inte längre att vår data är representativ för alla bolånekunder och har således inget endogenitetsproblem. 9
14 När relevanta förklarande variabler inte är inkluderade i modellen hamnar de istället i feltermen. Om någon av våra kovariater är korrelerad med en variabel som inte tagits med i modellen är den då också korrelerad med feltermen vilket innebär endogenitet. Detta är inget problem vid prediktion men kan förändra tolkningen av regressionskoefficienterna Multikollinearitet Multikollinearitet uppstår när kovariaterna är linjärt beroende eller nästan linjärt beroende. Förenklat kan då sägas att effekten av en viss förklarande variabel blir svår att isolera vilket ger upphov till stora skattningar av regressionskoefficientens standardfel (Hill m.fl., 2008). Multikollinearitet kan till exempel uppstå vid användningen av dummy-variabler. Om till exempel variabeln (kvinna) tas med samtidigt som variabeln (man) är dessa uppenbarligen linjärt beroende då (kvinna)+(man) = 1. Istället väljer man att bara ta med en dummy-variabel och välja den andra som referenspunkt, en s.k. benchmark. Ett mått på multikollinearitet är Variance inflation factors (VIF) och är för kovariat i definierat enligt 1 V IF i = 1 Ri 2, (9) där Ri 2 fås genom att regressera kovariaten i mot resterande kovariater från modellen. Ett högt Ri 2 och indikerar att kovariaten i väl förklaras av de andra kovariaterna. En tumregel är att V IF i > 10 är skadligt för modellen (Kennedy, 2008, s. 199) F-test och t-test För att testa om regressionsmodellens skattade kovariater är statistiskt signifikanta används students t-test. För att testa en skattad koefficient ˆβ tas värdet av testvariablen t = ˆβ β 0 SE( ˆβ) (10) fram, där SE( ˆβ) är standardavvikelsen för skattningen ˆβ och β 0 är värdet det testas mot. Nollhypotesen β 0 = 0 används då den skattade kovariatens statistiska signifikans kontrolleras. Under nollhypotesen har t en students t-fördelning med n k 1 frihetsgrader där n = antal observationer och k = antal kovariater. Motsvarande p-värde är p = 2P r(t t ) (11) där T är t(n k 1)-fördelad. Nollhypotesen ˆβ = β 0 förkastas om p är mindre än en tidigare bestämd signifikansnivå α. (Lang, 2013) För att testa nollhypotesen att en eller flera β = 0 kan ett F-test användas. Testvariabeln för F-testet är F = n k 1 ( ê 2 ) r ê 2 1 (12) där r = antal restriktioner, ê 2 är RSS för en komplett modells regression och ê 2 är RSS för samma modell med önskade kovariaters koefficienter satta till noll. Motsvarande p-värde är p = P r(z F ) (13) där Z är F (r, n k 1)-fördelad. Nollhypotesen förkastas om p < α. F-testet och t-testet förutsätter att residualerna är normalfördelade. Om vi inte vet feltermernas fördelning förutom att de är oberoende och identiskt fördelade finns inget exakt test för nollhypoteserna. F-testet är däremot fortfarande assymptotiskt giltigt för stora n. (Lang, 2013) 10
15 Q-Q plot Q-Q plottar används för att jämföra sannolikhetsfördelningen av empirisk data mot en teoretisk fördelning, t.ex. normalfördelningen. Detta uppnås genom att plotta empiriska kvantiler mot teoretiska kvantiler för en jämförelsefördelning. De empiriska kvantilerna ges av n datapunkter z 1,n,... z n,n sorterade i storleksordning. En Q-Q plot är en plot av punkterna: {( F 1 ( n k + 1 n + 1 ) ) }, z k,n : k = 1,..., n, där F är fördelningsfunktionen för jämförelsefördelningen, t.ex. Φ vid normalfördelning. Stämmer fördelningarna överens ska punkterna ligga approximativt på en linje. (Hult m.fl., 2012) 2.4 Data Allmänt om datan Den statistiska analysen är baserad på bolånedata, erhållen av vår sammarbetspartner Yellow-Belly. Datan, innehållande bolånetagares ränta och annan information om bolånetagaren, är insamlad genom Villaägarnas tjänst Räntekollen som tillhandahåller en modell av bankens teoretiska marginalkostnad för bolån. Användaren ombeds fylla i ett formulär med uppgifter vilka vi har fått ta del av. De observationer för 3-månaderslån under juli 2013 vi har valt att avgränsa undersökningen till kan ses i figur 1. En delmängd bestående av observationer tillhörande bank 1 kan ses i figur 2 där listräntan vid tidpunkten är markerad som en röd linje. I båda figurer kan man se att observationerna ser ut att bilda linjer vilket betyder att räntan ofta antar diskreta värden. En ränta om 3.0% förekommer exempelvis ofta. Figur 1: Ränta observationer Figur 2: Ränta observationer bank Befintliga Variabler De variabler som finns tillgängliga i datan följer nedan. Ibland finns två låntagare, men vi har enbart datan för bolånetagare A. (ränta): Den erhållna 3-månadersräntan för respektive låntagare 11
16 (inkomst): Den viktade hushållsinkomsten. Viktat enligt (inkomst) = q(inkomst A ) + (1 q)(inkomst B ) där q = (ålder): Ålder låntagare A (inkomst A ) (inkomst A )+(inkomst B ). (skulder): Bolånetagarens skulder utöver bostadslånet (a-kassa): Dummy-variabel för om låntagare A är medlem i en a-kassa (postnummer): Bostadens postnummer (fasta kostnader): Fasta boendekostnader (t. ex. avgift) som inte är räntekostnader, i SEK. (lånebelopp): Lånets storlek i SEK (värde): Bostadens uppskattade marknadsvärde i SEK (belåningsgrad): (lånebelopp) (värde) (bank i ): Dummy-variabel som är 1 om kunden har bank i Orimliga värden Då datan är insamlad via ett formulär på internet förekommer felinmatningar. Enstaka orimliga felinmatningar kan påverka OLS-skattningen av β mycket och göra att modellen anpassas dåligt i intervallet där de flesta observationerna ligger. Ett exempel på detta i datan är exempelvis (ålder) = 999. Observationerna tas antingen bort eller konverteras till rätt format. Notera att de gränser vi har satt upp för de olika variablerna även utgör avgränsningar för detta arbete. Ålder Data för ålder är rapporterad som antingen ålder i antal år eller födelseår vilket vi konverterar till enbart ålder i antal år. Alla observationer med en ålder under 18 år eller över 100 år ses som felaktiga och tas bort ur vårt dataset. Bostadens värde Bostäder med ett uppskattat värde över SEK och under SEK inkluderar majoriteten av bostäderna på den svenska bostadsmarknaden och vi begränsar vårt dataset till detta intervall. Lånebelopp Justering för lånebelopp till följd av vår inskränkning av bostadens värde medför att endast observationer med lånebelopp i intervallet SEK tas med. Fasta kostnader Alla observationer med fasta kostnader över SEK anses orimliga med avseende på vår inskränking av bostadens värde och tas därmer bort ur vårt dataset. Ränta Observationer med en rörlig ränta under 1.5% och över 5% exkluderas ur vårt dataset. Den rörliga listräntan (3-mån) var under perioden för observationerna i intervallet 2-3%. 12
17 Under samma period var STIBOR % (Riksbanken) (relevant för bolåns upplåningskostnad) och rapporterade upplåningsräntor omkring 2% (SBAB; Swedbank). Bolån med rörlig ränta under cirka 1.5% är förmodligen inte lönsamma för bankerna under perioden. Därmed är dessa bolån förhandlade under andra vilkor än övriga observationer. För den övre begränsningen på 5% har vi använt oss av Yellow-Bellys uträknade kostnader för utlåning till en konsument med relativt hög risk och maximal belåningsgrad. De uppskattar att banken ska begära en ränta på minst 4% för denna kund (Villaägarna, 2013) och vi har begränsat vårt dataset att ta med observationer med 5% ränta. Belåningsgrad Kravet på en maximal belåningsgrad på 85% vid tecknande av bolån kombinerat med de senaste årens kraftiga prisuppgång på bostadsmarknaden medför att vi anser att belåningsgrader över 100% är orimliga. Vårt dataset begränsas därmed till observationer med en belåningsgrad mellan 0% och 100%. Inkomst Enbart observationer med inkomst i intervallet SEK inkluderas. En månadsinkomst under SEK anser vi orimligt låg och det finns möjligtvis en utomstående medlåntagare eller borgensman skriven på bolånet som hjälper till med betalning. Dessa observationer har inte samma förutsättningar som övriga. Den övre gränsen på SEK inkluderar de flesta bolånetagarna samt exkluderar majoriteten av potentiella observationer som missuppfattat månadsinkomst för årsinkomst Rensning av orimliga värden Datasetet för rörliga bolån insamlade under juli månad innan rensning innehåller 6944 observationer. Efter rensning som sammanfattas i tabell 1 återstår 6269 observationer. Tabell 1: Rensning av data observationer Ålder -5 Bostadens värde -62 Fasta kostnader -61 Ränta -63 Lånebelopp -74 Belåningsgrad -107 Inkomst -303 total Skapade Variabler (stockholm) Dummy-variabel som är 1 om bostaden finns i stockholmsområdet, dvs postnumret börjar på 1. I Stockholm finns många bankkontor vilket kan påverka konkurrensen och räntorna. 13
18 (belåningsgrad topp) Förhållandet mellan ränta och belåningsgrad är inte nödvändigtvis linjärt. SBAB:s modell för räntan i relation till belåningsgraden är inte linjär som figur 3 illustrerar. Vi ser att grafen ändrar stigning vid en belåningsgrad som är ca Låt oss därför införa variabeln (belåningsgrad topp) = max((belåningsgrad) 0.75, 0). (14) Linjärkombinationen a(belåningsgrad topp) + b(belåningsgrad) beskriver då alla möjliga kombinationer av stigningar på intervallen [0, 0.75) och (0.75, 1]. Ett annat alternativ är att göra två separata regressioner, även kallat piecewise linear regression, för de två linjestyckena. Grafen i figur tre skiftar uppåt och nedåt beroende på lånets storlek vilket motiverar att ha med variabeln (lånebelopp) separat. Figur 3: SBABs ränta för olika belåningsgrader , bostadsvärde 2Mkr 3 Genomförande 3.1 Allmänt om genomförandet För att svara på frågeställningen vilka kundspecifika faktorer som påverkar bolåneräntan kommer vi att anpassa olika linjära modeller till datan och utvärdera dessa. För varje linjär modell reducerar vi antalet förklarande variabler genom att använda oss av backward elimination och funktionen stepwise i den statistiska programvaran R. Med hjälp av den modell som bäst förklarar datan kan vi sedan dra slutsatser om vad som påverkar den slutgiltiga kundräntan Undvikande av multikollinearitet För att undvika multikollinearitet använder vi dummy-variabler för de åtta olika bankerna med en bank som benchmark. Banken som används som benchmark är en av de största 14
19 aktörerna vilket minskar risken för multikollinearitet. Variabeln (värde) tas inte heller med i någon modell eftersom VIF då blir för högt. Vid transformering av enskilda variabler, t. ex. genom logaritmering kan också multikollinearitet uppstå om ursprungsvariabeln finns kvar i modellen. 3.2 Modell 1 - linjär Modell Som ett första steg för att anpassa en modell till datan genomför vi en linjär regression utan transformerade variabler. Modellen är (ränta) = β 0 + β 1 (inkomst) + β 2 (ålder) + β 3 (fasta kostnader) + β 4 (lånebelopp) + β 5 (belåningsgrad) + β 6 (skulder) + β 7 (a-kassa) + β 8 (stockholm) + β 8 (bank 2 ) β 14 (bank 8 ) + e. (15) Resultat Efter backward elimination återstår kovariaterna i tabell 3. Bank 2 och 8 samt variablerna för a-kassa, skulder och inkomst faller bort. Modellen har en förklaringsgrad R 2 = och R 2 = Figur 4 och 6 visar att residualerna inte är normalfördelade utan snedvridna åt höger. Linjen i figur 4 är anpassad med minstakvadratmetoden och ger de normalfördelningsparametrarna som passar residualernas fördelning bäst. Figur 6 är ett histogram över residualerna och kurvan i figur 6 är en plot av den normalfördelning som resulterar från minstakvadratanpassningen. Figur 5 visar tecken på heteorskedasticitet; residualernas varians tycks bero på det predikterade värde ŷ i. I modell 3 (avsnitt 3.4) transformeras därför den beroende variabeln (ränta). Tabell 2 visar vilka kovariater som elimineras med BIC och hur mycket det förbättrar modellen med avseende på BIC. Tabell 3 redovisar hur mycket varje återstående kovariat höjer RSS om den tas bort. Ett högt SS betyder alltså att kovariaten bidrar till mycket av förklaringsgraden. Tabell 2: Uteslutna kovariater Kovariat BIC (bank 2 ) (a-kassa) (inkomst) (skulder) (bank 8 ) (stockholm) Tabell 3: Analys av varians Källa SS F (ålder) (fasta kostnader) (lånebelopp) (belåningsgrad) (bank 3 ) (bank 4 ) (bank 5 ) (bank 6 ) (bank 7 ) Residual
20 Tabell 4: Koefficienttabell modell 1 ˆβ standardfel t-värde p-värde (Intercept) e e e e+00 (ålder) e e e e-10 (fasta kostnader) e e e e-06 (lånebelopp) e e e e-65 (belåningsgrad) e e e e-20 (bank 3 ) e e e e-96 (bank 4 ) e e e e-08 (bank 5 ) e e e e-04 (bank 6 ) e e e e-03 (bank 7 ) e e e e-13 Figur 4: Q-Q plot för residualerna Figur 5: Plot över residualer 16
Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING
Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population
Läs merRegressionsanalys av lägenhetspriser i Spånga
Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016
Läs merF19, (Multipel linjär regression forts) och F20, Chi-två test.
Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med
Läs mer732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris
Läs merAnalys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression
Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Christian Aguirre Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:17 Matematisk
Läs merRegressions- och Tidsserieanalys - F4
Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1
Läs merMultipel Regressionsmodellen
Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b
Läs merFöreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
Läs merGrundläggande matematisk statistik
Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x
Läs merSkrivning i ekonometri torsdagen den 8 februari 2007
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)
Läs merKapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information
Läs merFöreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3
Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest
Läs merAnalys av bostadsrättspriset i Stockholms innerstad
Analys av bostadsrättspriset i Stockholms innerstad En multipel linjär regression Kandidatexamensarbete i Teknisk Fysik Anda Zhang andaz@kth.se Handledare Boualem Djehiche Avdelningen för Matematisk Statistik
Läs merRegressions- och Tidsserieanalys - F7
Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys
Läs merLABORATION 3 - Regressionsanalys
Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet
Läs merLABORATION 3 - Regressionsanalys
Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik, LP1, HT 2015, Adam Jonsson LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i enkel regressionsanalys
Läs mera) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal
Läs merRepetitionsföreläsning
Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning
Läs merSTOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys
STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består
Läs merF13 Regression och problemlösning
1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell
Läs merMatematisk statistik, Föreläsning 5
Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk
Läs merKorrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION
KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat
Läs merVerksamhetsutvärdering av Mattecentrum
Verksamhetsutvärdering av Mattecentrum April 2016 www.numbersanalytics.se info@numbersanalytics.se Presskontakt: Oskar Eriksson, 0732 096657 oskar@numbersanalytics.se INNEHÅLLSFÖRTECKNING Inledning...
Läs merPoolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.
PANELDATA Poolade data över tiden och över tvärsnittet Alternativ 1: Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. Oberoende stickprov dragna från stora populationer vid olika tidpunkter.
Läs merFöreläsning 4. Kap 5,1-5,3
Föreläsning 4 Kap 5,1-5,3 Multikolinjäritetsproblem De förklarande variablerna kan vara oberoende (korrelerade) av varann men det är inte så vanligt. Ofta är de korrelerade, och det är helt ok men beroendet
Läs merMultipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm
Kungliga Tekniska Högskolan Kandidatexamensarbete i Teknisk Fysik Institutionen för Matematisk Statistik Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm Författare:
Läs mer732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20
732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta
Läs merFöreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
Läs merF18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
Läs mer2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer
Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna
Läs merFöreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B
Föreläsning 4 Kap 3.5, 3.8 Material om index 732G71 Statistik B Skötsel (y) Transformationer Ett av kraven för regressionsmodellens giltighet är att residualernas varians är konstant. Vad gör vi om så
Läs merFöreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
Läs merMetod och teori. Statistik för naturvetare Umeå universitet
Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån
Läs merKapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER
Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER När vi mäter en effekt i data så vill vi ofta se om denna skiljer sig mellan olika delgrupper. Vi kanske testar effekten av ett
Läs merSänkningen av parasitnivåerna i blodet
4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet
Läs merMedicinsk statistik II
Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning
Läs merSTOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.
MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på
Läs merMindre lån dyrare ränta
Mindre lån dyrare ränta Resultat från Räntekollen Postadress Besöksdress Telefon Fax E-post Hemsida Box 7118, 192 07 Sollentuna Johan Berndes väg 8-10 010-750 01 00 010-750 02 50 info@villaagarna.se www.villaagarna.se
Läs merFöreläsning 10, del 1: Icke-linjära samband och outliers
Föreläsning 10, del 1: och outliers Pär Nyman par.nyman@statsvet.uu.se 19 september 2014-1 - Sammanfattning av tidigare kursvärderingar: - 2 - Sammanfattning av tidigare kursvärderingar: Kursen är för
Läs merDen svenska arbetslöshetsförsäkringen
Statistiska Institutionen Handledare: Rolf Larsson Kandidatuppsats VT 2013 Den svenska arbetslöshetsförsäkringen En undersökning av skillnaden i genomsnittligt antal ersättningsdagar som kvinnor respektive
Läs merKapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN
Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två
Läs merLaboration 2 multipel linjär regression
Laboration 2 multipel linjär regression I denna datorövning skall ni 1. analysera data enligt en multipel regressionsmodell, dvs. inkludera flera förklarande variabler i en regressionsmodell 2. studera
Läs merRegressions- och Tidsserieanalys - F1
Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp
Läs merLaboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 Hp Vårterminen 2017 Laboration 2 Omprovsuppgift Regressionsanalys, baserat på Sveriges kommuner
Läs merBild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
Läs merFöljande resultat erhålls (enhet: 1000psi):
Variansanalys Exempel Aluminiumstavar utsätts för uppvärmningsbehandlingar enligt fyra olika standardmetoder. Efter behandlingen uppmäts dragstyrkan hos varje stav. Fem upprepningar görs för varje behandling.
Läs merPreliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet
Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden
Läs merLinjär regressionsanalys. Wieland Wermke
+ Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån
Läs merRegressions- och Tidsserieanalys - F1
Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,
Läs merRegressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet
Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.
Läs merEffekter av bolånetaket
Effekter av bolånetaket EN FÖRSTA UTVÄRDERING 6 APRIL 2011 April 2011 Dnr 11-1622 INNEHÅLL Sammanfattning 3 Bolån efter taket en ögonblicksbild 4 Frågorna samt sammanfattning av bankernas svar 4 2 SAMMANFATTNING
Läs merGör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).
Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta
Läs mer10.1 Enkel linjär regression
Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot
Läs merFörhandling. Du kan tjäna cirka 10.000 kronor per år på en lyckad förhandling (räknat på bolån på 2 miljoner kronor)
BOLÅNEBOK #1 Förhandling Du kan tjäna cirka 10.000 kronor per år på en lyckad förhandling (räknat på bolån på 2 miljoner kronor) En lyckad förhandling kräver: o Att du har en någorlunda god privatekonomi
Läs merLÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29
UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN
Läs merSkrivning i ekonometri lördagen den 29 mars 2008
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan
Läs merInstuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8
1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,
Läs merStatistik 1 för biologer, logopeder och psykologer
Innehåll 1 Korrelation och regression Innehåll 1 Korrelation och regression Spridningsdiagram Då ett datamaterial består av två (eller era) variabler är man ofta intresserad av att veta om det nns ett
Läs merBolånetagarnas amorteringar har ökat sedan införandet av individuella amorteringsplaner
PROMEMORIA Datum 2014-11-11 FI Dnr 14-15503 Författare Johan Berg, Maria Wallin Fredholm Finansinspektionen Box 7821 SE-103 97 Stockholm [Brunnsgatan 3] Tel +46 8 787 80 00 Fax +46 8 24 13 35 finansinspektionen@fi.se
Läs merMVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
Läs merLUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB2 Skrivning i ekonometri onsdagen den 1 juni 211 1. Vi vill undersöka hur variationen i försäljningspriset för ett hus (i en liten stad i USA
Läs merEstimation av bostadsrättspriser i Stockholms innerstad medelst multipel regressionsanalys
Estimation av bostadsrättspriser i Stockholms innerstad medelst multipel regressionsanalys Rickard Gunnvald F-09 Patrik Gunnvald F-09 ricgun@kth.se gunnvald@kth.se Kurs SA104X Examensarbete inom teknisk
Läs merLogistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013
Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas
Läs merResidualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen
Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då
Läs merFöreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
Läs mer2 Dataanalys och beskrivande statistik
2 Dataanalys och beskrivande statistik Vad är data, och vad är statistik? Data är en samling fakta ur vilken man kan erhålla information. Statistik är vetenskapen (vissa skulle kalla det konst) om att
Läs merSkrivning i ekonometri lördagen den 25 augusti 2007
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA10:3 Skrivning i ekonometri lördagen den 5 augusti 007 1. Vi vill undersöka hur variationen i ölförsäljningen i ett bryggeri i en stad i USA
Läs merMatematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)
Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,
Läs merFinansiell statistik. Multipel regression. 4 maj 2011
Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi
Läs merStatistik B Regressions- och tidsserieanalys Föreläsning 1
Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs
Läs merSkrivning i ekonometri lördagen den 15 januari 2005
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA102:3 Skrivning i ekonometri lördagen den 15 januari 5 1. Vi vill undersöka hur variationen i försäljningspris = price för hus i en liten stad
Läs merF3 Introduktion Stickprov
Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever
Läs merI vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt
Introduktion Vi har fått ta del av 13 mätningar av kroppstemperatur och hjärtfrekvens, varav på hälften män, hälften kvinnor, samt en studie på 77 olika flingsorters hyllplaceringar och sockerhalter. Vi
Läs merFör logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Läs merRegressionsanalys av huspriser i Vaxholm
Regressionsanalys av huspriser i Vaxholm Rasmus Parkinson Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:19 Matematisk statistik Juni 2015 www.math.su.se
Läs mer1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att
Läs merTvå innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval
Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande
Läs merF16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data
Stat. teori gk, ht 006, JW F16 MULTIPEL LINJÄR REGRESSION (NCT 13.1-13.3, 13.9) Anpassning av linjär funktion till givna data Data med en beroende variabel (y) och K stycken (potentiellt) förklarande variabler
Läs merIntroduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab
Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts
Läs merAtt välja statistisk metod
Att välja statistisk metod en översikt anpassad till kursen: Statistik och kvantitativa undersökningar 15 HP Vårterminen 2018 Lars Bohlin Innehåll Val av statistisk metod.... 2 1. Undersökning av en variabel...
Läs merLäs noggrant informationen nedan innan du börjar skriva tentamen
Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2013-03-27
Läs merTentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4
MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas
Läs merLaboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall
Läs merLektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
Läs merBayesiansk statistik, 732g43, 7.5 hp
Bayesiansk statistik, 732g43, 7.5 hp Moment 2 - Linjär regressionsanalys Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA, LiU) Bayesiansk statistik 1 / 29 Översikt moment 2: linjär
Läs merSpridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.
Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:
Läs merRegressionsanalys med SPSS Kimmo Sorjonen (2010)
1 Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1. Multipel regression 1.1. Variabler I det aktuella exemplet ingår följande variabler: (1) life.sat, anger i vilket utsträckning man är nöjd med livet;
Läs merFöreläsning 12: Linjär regression
Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera
Läs merPoissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)
Poissonregression En lämplig utgångspunkt om vi har en beroende variabel som är en count variable, en variabel som antar icke-negativa heltalsvärden med ganska liten variation E(y x1, x2,.xn) = exp( 0
Läs mera) Anpassa en trinomial responsmodell med övriga relevanta variabler som (icketransformerade)
5:1 Studien ifråga, High School and beyond, går ut på att hitta ett samband mellan vilken typ av program generellt, praktiskt eller akademiskt som studenter väljer baserat på olika faktorer kön, ras, socioekonomisk
Läs mer1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell
Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning
Läs mer732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29
732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann
Läs mer, s a. , s b. personer från Alingsås och n b
Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen
Läs merTentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.
Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, VT2014 2014-05-26 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller
Läs merNÄR SKA MAN SÄLJA SIN BOSTAD?
NÄR SKA MAN SÄLJA SIN BOSTAD? En multipel regressionsanalys av bostadsrätter i Stockholm Oscar Jonsson Moa Englund Stockholm 2015 Matematik Institutionen Kungliga Tekniska Högskolan Sammanfattning Projektet
Läs merKapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT
Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT Regressionsanalys handlar om att estimera hur medelvärdet för en variabel (y) varierar med en eller flera oberoende variabler (x). Exempel: Hur
Läs merPrediktion av villapris
Prediktion av villapris och dess faktorers inverkan Examensarbete inom farkostteknik, grundnivå, SA105X Institutionen för Matematik, inriktning Matematisk Statistik Kungliga Tekniska Högskolan Maj 2013
Läs merÖvningshäfte till kursen Regressionsanalys och tidsserieanalys
Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström October 31, 2010 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande
Läs mer34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD
6.4 Att dra slutsatser på basis av statistisk analys en kort inledning - Man har ett stickprov, men man vill med hjälp av det få veta något om hela populationen => för att kunna dra slutsatser som gäller
Läs mer7.5 Experiment with a single factor having more than two levels
7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan
Läs mer