Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Storlek: px
Starta visningen från sidan:

Download "Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p."

Transkript

1 Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: Betygsgränser: 732G21 Sambandsmodeller , 8-12 Kalle Wahlin, Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p. Redovisa och motivera tydligt alla dina lösningar! Uppgift 1 (5.5p) En marknadsanalytiker hos en bank drar ett stickprov om 8 av bankens kunder för att undersöka om det finns något samband mellan hushållets sammanlagda inkomst och hur stort lån man har hos banken. Följande data erhålles (uttryckt i tusentals kronor): Kund nr Inkomst (x) Sammanlagt lån (y) a) Plotta inkomst mot sammanlagt lån. Vilken typ av regressionsmodell verkar lämplig? Uttryck modellen med de beteckningar som använts under kursen. (0.5p) b) Beräkna punktskattningar av parametrarna i den valda modellen. (1p) c) Tolka modellens parametrar i ord så att en ickestatistiker förstår det eventuella sambandet mellan inkomst och sammanlagt lån. (0.5p) d) Hur stort lån kan man förvänta sig för ett hushåll vars sammanlagda inkomst är 45 (tkr)? (0.5p) 1

2 e) Plotta residualerna mot x. Verkar modellen välanpassad? (1p) f) Marknadsanalytikern vill nu även införa information om huruvida kunden är kvinna eller man. Beskriv med de beteckningar som använts under kursen hur modellen kan utvecklas så att regressionslinjer med olika intercept och olika lutning erhålles i en enda modellanpassning. (1p) g) Antag att man nu för var och en av de 8 kunderna har gjort en bedömning om huruvida de bör få utöka sitt lån (kodat som 1) eller ej (kodat som 0). Beskriv med de beteckningar som använts under kursen en lämplig typ av regressionsmodell för att modellera sambandet mellan huruvida lånet ska få utökas eller ej (y) och hushållets inkomst (x). (1p) Uppgift 2 (4.5p) Föreliggande är ett datamaterial bestående av ett större antal försäljningar av privatbostäder i USA år För varje husförsäljning finns information om y x 1 x 2 x 3 x 4 x 5 x 6 x 7 X 8 Försäljningspris (dollar) Bostadsyta (kvadratfot) Antal sovrum Antal badrum Förekomst av luftkonditionering, 1 = luftkonditionering finns, 0 annars Antal bilar som garaget är konstruerat för Förekomst av pool, 1 = pool finns, 0 annars Byggnadsår Tomtstorlek (kvadratfot) a) Till följd av det stora antalet möjliga modeller börjar man med att köra best subsets regression i Minitab: Best Subsets Regression: y versus x1; x2; x3; x4; x5; x6; x7; x8 Response is y Mallows x x x x x x x x Vars R-Sq R-Sq(adj) Cp S X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X 2

3 och baserat på detta har ett antal modeller anpassats (se nedan). Vilken modell anser du är den bästa? Motivera! (1.5p) Modell 1: Regression Analysis: y versus x1; x2; x5; x7; x8 The regression equation is y = x x x x x8 Predictor Coef SE Coef T P VIF Constant x x x x x S = R-Sq = 75.0% R-Sq(adj) = 74.8% Analysis of Variance Source DF SS MS F P Regression E E Residual Error E Total E+12 Source DF Seq SS x E+12 x x E+11 x E+11 x E+11 Predicted Values for Observations Obs Fit SE Fit 95% CI 95% PI (119696; ) (-343; ) Values of Predictors for Observations Obs x1 x2 x5 x7 x Modell 2: Regression Analysis: y versus x1; x2; x3; x5; x7; x8 The regression equation is y = x x x x x x8 Predictor Coef SE Coef T P VIF Constant x x

4 x x x x S = R-Sq = 75.1% R-Sq(adj) = 74.8% Analysis of Variance Source DF SS MS F P Regression E E Residual Error E Total E+12 Source DF Seq SS x E+12 x x E+11 x E+11 x E+11 x E+11 Predicted Values for Observations Obs Fit SE Fit 95% CI 95% PI (118563; ) (-1229; ) Values of Predictors for Observations Obs x1 x2 x3 x5 x7 x Modell 3: Regression Analysis: y versus x1; x2; x5; x6; x7; x8 The regression equation is y = x x x x x x8 Predictor Coef SE Coef T P VIF Constant x x x x x x S = R-Sq = 75.1% R-Sq(adj) = 74.8% Analysis of Variance Source DF SS MS F P Regression E E Residual Error E

5 Total E+12 Source DF Seq SS x E+12 x x E+11 x x E+11 x E+11 Predicted Values for Observations Obs Fit SE Fit 95% CI 95% PI (119086; ) (-877; ) Values of Predictors for Observations Obs x1 x2 x5 x6 x7 x Modell 4: Regression Analysis: y versus x1; x2; x3; x5; x6; x7; x8 The regression equation is y = x x x x x x x8 Predictor Coef SE Coef T P VIF Constant x x x x x x x S = R-Sq = 75.2% R-Sq(adj) = 74.9% Analysis of Variance Source DF SS MS F P Regression E E Residual Error E Total E+12 Source DF Seq SS x E+12 x x E+11 x E+11 x x E+11 x E+11 5

6 Predicted Values for Observations Obs Fit SE Fit 95% CI 95% PI (118098; ) (-1666; ) Values of Predictors for Observations Obs x1 x2 x3 x5 x6 x7 x Modell 5: Regression Analysis: y versus x1; x2; x3; x4; x5; x7; x8 The regression equation is y = x x x x x x x8 Predictor Coef SE Coef T P VIF Constant x x x x x x x S = R-Sq = 75.1% R-Sq(adj) = 74.8% Analysis of Variance Source DF SS MS F P Regression E E Residual Error E Total E+12 Source DF Seq SS x E+12 x x E+11 x x E+11 x E+11 x E+11 Predicted Values for Observations Obs Fit SE Fit 95% CI 95% PI (118353; ) (-1369; ) Values of Predictors for Observations 6

7 Studentized deleted residuals Obs x1 x2 x3 x4 x5 x7 x b) Hur många husförsäljningar har din valda regressionsanalys baserats på? (0.5p) c) Från datamaterialet har också en modell med p = 8 parametrar anpassats och nedanstående residualplottarna tagits fram. Baserat på (en av) dessa, finns det några indikationer på outliers med avseende på de förklarande variablerna (x)? (1p) 6 Scatterplot of Studentized deleted residuals vs y y

8 COOKS DISTANCE Leverage values 0.14 Scatterplot of Leverage values vs y y Scatterplot of COOKS DISTANCE vs y y

9 DFFITS Scatterplot of DFFITS vs y y d) Baserat på din valda modell, ange ett 95% intervall för det förväntade försäljningspriset för ett specifikt hus som är 1500 kvadratfot stort och som har 4 sovrum, 2 badrum, luftkonditionering, garage för 1 bil, ingen pool, byggnadsår 1974 och med en tomtyta om kvadratfot. (0.5p) e) Beskriv i ord metodiken för att göra en stepwise regression. (1p) 3 Vid ett forskningslaboratorium ville man få fram en komponent för lindring av hösnuva. I ett experiment utsattes 36 frivilliga för två olika substanser med varierande koncentration. De två substanserna kallas här A och B. Responsvariabel Y är tiden tills lindring. Till var och en av de 9 kombinationerna slumpades 4 frivilliga. Se korstabell: Rows: B Columns: A Tabell med medelvärden för Y. låg medel hög All låg 24,75 46,00 45,75 38,83 9

10 medel 54,50 81,75 91,25 75, hög 59,75 102,75 132,50 98, All 46,33 76,83 89,83 71, Cell Contents: Y : Mean Count Nedan har två modeller anpassats. Modell 1 = Yijk i j ijk samt modell 2 = Yijk i j ij ijk Uppgifterna kommer efter alla utskrifter. Modell 1 The GLM Procedure Class Level Information Class Levels Values A B Number of Observations Read 36 Number of Observations Used 36 10

11 Dependent Variable: Y Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE Y Mean Source DF Type III SS Mean Square F Value Pr > F A <.0001 B <.0001 Modell 2 The GLM Procedure Dependent Variable: Y Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE Y Mean

12 Mean Source DF Type III SS Mean Square F Value Pr > F A <.0001 B <.0001 A*B < Interaction Plot for Y Data Means A B 3 a) Pröva på 1% signifikansnivå om Substans B har effekt i modell 1. 1p b) Bilda konfidensintervall med Tukeys metod för alla differenser mellan nivåerna på substans B i modell 1. 2p c) Ta hjälp av interaktionsplotten för att avgöra om interaktion kan vara närvarande. Hur kan en interaktion tolkas i detta exempel? d) Skatta, samt i modell 2. 1p 1p e) Genom att bara titta på data så ser det inte ut att vara någon större skillnad mellan medel- och hög koncentration för de båda substanserna. Bilda därför ett % konfidensintervall för kontrasten. 2 2 Motivera noggrant vilket MSE du använder för detta konfidensintervall. 3p 4 a) Ge ett exempel på då man hellre vill ha varianskomponenter istället för fixa effekter. 1p 12

13 b) Förklara varför man inte kan ha interaktionsterm vid randomiserat blockförsök med en obs per cell. 13

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt. Tentamen i Matematisk statistik, S0001M, del 1, 007-10-30 1. En viss typ av komponenter tillverkas av en maskin A med sannolikheten 60 % och av en maskin B med sannolikheten 40 %. För de komponenter som

Läs mer

MINITAB i korthet. release 16. Jan-Eric Englund. SLU Alnarp Kompendium 2011. Swedish University of Agricultural Sciences Department of Agrosystems

MINITAB i korthet. release 16. Jan-Eric Englund. SLU Alnarp Kompendium 2011. Swedish University of Agricultural Sciences Department of Agrosystems MINITAB i korthet release 16 Jan-Eric Englund SLU Alnarp Kompendium 2011 Område Agrosystem Course notes Swedish University of Agricultural Sciences Department of Agrosystems Jan-Eric Englund är universitetslektor

Läs mer

HEMUPPGIFT. Att brygga det godaste kaffet försöksplanering och faktorförsök. IEK203 Försöksplanering Vt-2005

HEMUPPGIFT. Att brygga det godaste kaffet försöksplanering och faktorförsök. IEK203 Försöksplanering Vt-2005 HEMUPPGIFT Att brygga det godaste kaffet försöksplanering och faktorförsök IEK203 Försöksplanering Vt-2005 Pernilla Engström Mathias Larsson Patrik Paulsson Anna-Maria Ullnert Luleå Tekniska Universitet

Läs mer

Antal hörnor i Premier League-matcher En modell för att uppskatta antalet hörnor i fotbollsmatcher

Antal hörnor i Premier League-matcher En modell för att uppskatta antalet hörnor i fotbollsmatcher KANDIDATUPPSATS Hösten 2013 Statistiska institutionen Uppsala Antal hörnor i Premier League-matcher En modell för att uppskatta antalet hörnor i fotbollsmatcher Handledare: Rolf Larsson Författare: Erik

Läs mer

Analys av köpviljan avseende försäkring med logistisk regression och bootstrap

Analys av köpviljan avseende försäkring med logistisk regression och bootstrap Matematisk statistik Stockholms universitet Analys av köpviljan avseende försäkring med logistisk regression och bootstrap Anna Sandler Examensarbete 2007:11 Postadress: Matematisk statistik Matematiska

Läs mer

Prediktion av lägenhetspriser i Stockholm - en statistisk undersökning

Prediktion av lägenhetspriser i Stockholm - en statistisk undersökning Prediktion av lägenhetspriser i Stockholm - en statistisk undersökning Anna Flodström Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2009:7 Matematisk

Läs mer

Lösningar till övningsuppgifterna

Lösningar till övningsuppgifterna Lösningar till övningsuppgifterna Kapitel 1 1.1 Population: alla väljare. Exemplet är en observationsstudie. 1.2 Populationer: Berlinare med respektive utan lungcancer. Exemplet är en observationsstudie.

Läs mer

Kandidatuppsats Statistiska institutionen

Kandidatuppsats Statistiska institutionen Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2013:1 Prognosmodell för den relativa arbetslösheten i Sverige Forecast model for the relative unemployment rate in

Läs mer

Parametiskt vs. icke-parametriskt

Parametiskt vs. icke-parametriskt TENTAFRÅGOR & SVARSFÖRSLAG PSYKOLOGISK FORSKNINGSMETOD II Frågorna är tagna ur tentorna den 17 oktober 20??, 21 december 2005, 7 juni 2006, 22 augusti 2006, 5 juni 2007, 5 juni 2008, 4 juni 2009, 21 augusti

Läs mer

Prognos av framtida inkomster hos CSN:s låntagare

Prognos av framtida inkomster hos CSN:s låntagare Prognos av framtida inkomster hos CSN:s låntagare En jämförande regressionsanalys mellan flera regressionsmetoder vid vänstertrunkerad data Qun Wang Ali-Reza Rezaie Student VT-2011 Examensarbete, 15 hp

Läs mer

Datoro vning 1-2 Statistisk analys av kodade svar

Datoro vning 1-2 Statistisk analys av kodade svar Datoro vning 1-2 Statistisk analys av kodade svar 732G19 Utredningskunskap I Denna datorövning utförs i grupper om 2-4 personer och ska ses som en instruktion i att analysera resultaten av en enkät. Ingen

Läs mer

Riskbedömning och abonnemangstandvård

Riskbedömning och abonnemangstandvård Anders Jonsson Riskbedömning och abonnemangstandvård Risk assessment and contract dental care Statistik C-uppsats Datum/Termin: Juni 008/VT 08 Handledare: Christian Tallberg Examinator: Abdullah Almasri

Läs mer

Två uppsatser om förares syn på antisladdsystem

Två uppsatser om förares syn på antisladdsystem VTI notat 29-2008 Utgivningsår 2008 www.vti.se/publikationer Två uppsatser om förares syn på antisladdsystem Antisladdsystem Förarens kunskap om antisladdsystem och hur de påverkas av systemet Jonna Alnervik

Läs mer

Framtagning av komposita prisindex

Framtagning av komposita prisindex Framtagning av komposita prisindex Han-Suck Song och Mats Wilhelmsson (KAFI AB och Centrum för bank och finans, KTH) på uppdrag av Valueguard AB finansierat av Vinnova Stockholm 2010-05-25 1 1. Introduktion

Läs mer

Vad påverkar priset på en bostadsrätt?

Vad påverkar priset på en bostadsrätt? Företagsekonomiska institutionen STOCKHOLMS UNIVERSITET Kandidatuppsats 10 poäng HT 2005 Vad påverkar priset på en bostadsrätt? Författare: Niclas Roll Handledare: Claes Hägg Sammanfattning Fastighetsmarknaden

Läs mer

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, VT2014 2014-05-26 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

tentaplugg.nu av studenter för studenter

tentaplugg.nu av studenter för studenter tentaplugg.nu av studenter för studenter Kurskod Kursnamn R0008N Inledande extern redovisning Datum 2013-10-31 Material Kursexaminator Betygsgränser Tentamenspoäng Tentamen Monika Kurkkio G 42; VG 56 58

Läs mer

Övningstentamen i matematisk statistik för kemi

Övningstentamen i matematisk statistik för kemi Övningstentamen i matematisk statistik för kemi Uppgift 1: Bill och Georg har gått till puben tillsammans. De beslutar sig för att spela dart (vilket betyder kasta pil mot en tavla). Sedan gammalt vet

Läs mer

Penningpolitiska förväntningar

Penningpolitiska förväntningar NATIONALEKONOMISKA INSTITUTIONEN Uppsala Universitet Uppsats fortsättningskurs C Författare: Arash Bigloo och Lars Björn Handledare: Per Engström Vårterminen 2007 Penningpolitiska förväntningar en empirisk

Läs mer

En familjepizza eller två vanliga pizzor?

En familjepizza eller två vanliga pizzor? En familjepizza eller två vanliga pizzor? Ett arbete med syftet att utreda vilket som är mest ekonomiskt köp, en familjepizza eller två vanliga pizzor Jens Roat Kultima 100 p projektarbete Gislaveds Gymnasium

Läs mer

Bolåneräntor i Sverige

Bolåneräntor i Sverige DEGREE PROJECT, IN APPLIED MATHEMATICS AND INDUSTRIAL ECONOMICS, FIRST LEVEL STOCKHOLM, SWEDEN 2014 Bolåneräntor i Sverige EN ANALYS AV INDIVIDUELLA RÄNTOR MED MULTIPEL LINJÄR REGRESSION ANDRÉ BERGLUND,

Läs mer

Småhustomters marginalvärde

Småhustomters marginalvärde Småhustomters marginalvärde Alexander Haglund & Emil Nilsson LTH Copyright Alexander Haglund och Emil Nilsson, 2014 Email: mt07ah0@student.lu.se och zba08eni@student.lu.se Båda författarna har gemensamt

Läs mer

Användarhandledning för VD Link för Småhus Vitec

Användarhandledning för VD Link för Småhus Vitec Innehållsförteckning Användarhandledning, VD Link för Småhus...3 1. Valfri sökning...4 Standardsökning...5 Kartsökning...7 Utökad sökning...8 Resultat av sökning...9 Detaljerad information om en försäljning...9

Läs mer

Hur påverkas priset på guld av olika makroekonomiska variabler och avkastningen på alternativa tillgångar?

Hur påverkas priset på guld av olika makroekonomiska variabler och avkastningen på alternativa tillgångar? Hur påverkas priset på guld av olika makroekonomiska variabler och avkastningen på alternativa tillgångar? Författare: Fredrik Matsgård Gustaf Danielsson Kandidatuppsats VT 2013 Handledare: Anne-Marie

Läs mer

Sannolikhet och statistik med Matlab. Måns Eriksson

Sannolikhet och statistik med Matlab. Måns Eriksson Sannolikhet och statistik med Matlab Måns Eriksson 1 Inledning Det här kompiet är tänkt att användas för självstudier under kursen Sannolikhet och statistik vid Uppsala universitet. Målet är att använda

Läs mer

Östgötens psykiska hälsa. Kommunrapport om självskattad psykisk hälsa

Östgötens psykiska hälsa. Kommunrapport om självskattad psykisk hälsa Östgötens psykiska hälsa Kommunrapport om självskattad psykisk hälsa Rapport 2004:2 Linköping mars 2004 Madeleine Borgstedt-Risberg Tommy Holmberg Per Nettelbladt Helle Noorlind Brage Marika Wenemark Ingemar

Läs mer

Det är bara att låna och köpa

Det är bara att låna och köpa Lunds universitet Nationalekonomiska institutionen Kandidatuppsats 2014-05-28 Handledare: Erik Norrman Det är bara att låna och köpa Välkommen på visning till ränteavdraget och bostadspriser Adam Strandh

Läs mer

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD 6.4 Att dra slutsatser på basis av statistisk analys en kort inledning - Man har ett stickprov, men man vill med hjälp av det få veta något om hela populationen => för att kunna dra slutsatser som gäller

Läs mer

Hur skuldsatta är de svenska hushållen?

Hur skuldsatta är de svenska hushållen? n Ekonomiska kommentarer Analysen av hushållens skuldsättning har under de senaste åren baserats på aggregerade data eller stickprov på nya låntagare. I den aggregerade statistiken är det inte möjligt

Läs mer

Regressionsanalys av tillströmningen till svenska universitet och högskolor. Lisa Wimmerstedt i

Regressionsanalys av tillströmningen till svenska universitet och högskolor. Lisa Wimmerstedt i Regressionsanalys av tillströmningen till svenska universitet och högskolor -en studie av variationen i antalet inskrivna studenter Lisa Wimmerstedt i Syftet med Sveriges utbildningssystem är att göra

Läs mer