TAMS65 DATORÖVNING 2

Relevanta dokument
TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

TAMS 28 DATORÖVNING 2

REGRESSIONSANALYS. Martin Singull

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

TAMS65 - Seminarium 4 Regressionsanalys

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen

F13 Regression och problemlösning

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Föreläsning 12: Linjär regression

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Matematisk statistik för D, I, Π och Fysiker

Laboration 4: Lineär regression

Laboration 4 R-versionen

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

MVE051/MSG Föreläsning 14

Laboration 2: Styrkefunktion samt Regression

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Matematisk statistik, Föreläsning 5

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Laboration 2 multipel linjär regression

Föreläsning 12: Regression

10.1 Enkel linjär regression

Sänkningen av parasitnivåerna i blodet

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

Datorövning 1 Enkel linjär regressionsanalys

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

förstå modellen enkel linjär regression och de antaganden man gör i den Laborationen är dessutom en direkt förberedelse inför Miniprojekt II.

LABORATION 3 - Regressionsanalys

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

TVM-Matematik Adam Jonsson

oberoende av varandra så observationerna är

Matematisk statistik för B, K, N, BME och Kemister

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08

Datorövning 5 Exponentiella modeller och elasticitetssamband

Regressions- och Tidsserieanalys - F1

Föreläsning 9: Linjär regression del II

Tentamen för kursen. Linjära statistiska modeller. 17 februari

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

1 Förberedelseuppgifter

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Laboration 4 Regressionsanalys

Föreläsning 13: Multipel Regression

Regressions- och Tidsserieanalys - F1

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

Föreläsning 4. Kap 5,1-5,3

Grundläggande matematisk statistik

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Bayesiansk statistik, 732g43, 7.5 hp

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Föreläsning 15, FMSF45 Multipel linjär regression

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Multipel Regressionsmodellen

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Regressions- och Tidsserieanalys - F3

Enkel och multipel linjär regression

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

tentaplugg.nu av studenter för studenter

Metod och teori. Statistik för naturvetare Umeå universitet

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Examinationsuppgifter del 2

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Regressionsanalys av lägenhetspriser i Spånga

Regressions- och Tidsserieanalys - F4

InStat Exempel 4 Korrelation och Regression

GRUNDLÄGGANDE REGRESSIONSANALYS Problemsamling

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Föreläsning G60 Statistiska metoder

Linjär regressionsanalys. Wieland Wermke

lära dig tolka ett av de vanligaste beroendemåtten mellan två variabler, korrelationskoefficienten.

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

LABORATION 3 - Regressionsanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Lunds tekniska högskola Matematikcentrum Matematisk statistik. FMS035: Matematisk statistik för M Datorlaboration 5

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Enkel linjär regression: skattning, diagnostik, prediktion. Multipel regression: modellval, indikatorvariabler

Skrivning i ekonometri lördagen den 29 mars 2008

Föreläsning 13, Matematisk statistik 7.5 hp för E, HT-15 Multipel linjär regression

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning G60 Statistiska metoder

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Instruktioner till Frivillig Inlämningsuppgift 2 och Datorövning 3-4. Fortsättningskurs i statistik, moment 1, Statistisk Teori, 10 poäng.

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

F11. Kvantitativa prognostekniker

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Kovarians och kriging

Del 2 tillsammans med förberedelsefrågor - tid för inlämning och återlämning meddelas senare.

Transkript:

TAMS65 DATORÖVNING 2 Datorövningen behandlar multipel linjär regression Förberedelser Läs allmänt om regressionsanalys i boken och på föreläsningsanteckningarna Glöm inte att rensa minnet och alla fönster mellan varje uppgift så att det inte finns något gammalt sparat som kan störa dina resultat Du kommer att behöva filerna uppg21m, uppg22m, uppg23m, uppg24m, uppg25m som finns att ladda ner från kurshemsidan Redovisning Datorövningen ska göras, individuellt eller i grupp om två, innan redovisningstillfället som ni bokar med er lektionshandledare Anmäl er till vilken tid som ni ska redovisa på listor som lektionshandledarna har Om ni har problem att boka en tid med er lektionshandledare kontakta examinatorn för kursen Skriv en väldigt enkel rapport Max en sida per uppgift Fyll i redovisningsbladet sist i det här häftet och gör anteckningar så att ni kan diskutera uppgifterna och svara på följdfrågor Rapporten och en kopia av redovisningsbladet ska lämnas till lektionshandledaren senast klockan 16 vardagen innan redovisningen Det går även bra att skicka en kopia med e-post senast klockan 16 dagen innan redovisningen (dvs även söndag om redovisningen är på en måndag) Skriv ut intressant kod och plottar som kan vara bra att ha vid redovisning då ni ska diskutera uppgifterna och svara på följdfrågor Spara alla filer med kod (där ni lätt kan komma åt det) så att ni är beredda att visa det eller testköra under redovisningstillfället 1

Uppgift 1 Enkel linjär regression En gejser är en varm källa, som mer eller mindre regelbundet får utbrott, varvid vattnet kan spruta högt upp i luften Old Faithful Geyser i Wyoming är en sådan källa som blivit en turistattraktion Eftersom det är ganska långt mellan utbrotten, är man intresserad av att kunna prediktera tiden till nästa utbrott och man tror att denna tid beror på längden av det närmast föregående utbrottet För att konstruera en prognosformel har man registrerat samhörande värden på x = längden av det senaste utbrottet (enhet:min) och y = tiden till nästa utbrott (enhet:min), under ett antal dagar Vi skall analysera datamaterialet enligt modellen där Y j = β 0 + β 1 x j + ε j ε 1,, ε n är oberoende och N(0, σ) På filen uppg21m finns samhörande värden på x och y Börja med att plotta y mot x för att se att en linjär regression kan vara intressant att göra Även korrelationskoefficienten är ett mått på graden av linjärt samband Beräkna korrelationen med hjälp av kommandot corr Gör sedan en regressionsanalys med kommandot regstats; enligt stats = regstats(y,x, linear, all ); betahat = statststatbeta se = statststatse t = statststatt s2 = statsmse fstat = statsfstat b) Hur ser den skattade regressionslinjen ut? Skriv upp ekvationen Plotta den skattade regressionslinjen enligt scatter(x,y, * ) xlabel( x ), ylabel( y ) hold on lsline % ls = least square, dvs minsta-kvadrat anpassning c) I datautskriften hittar du de skattade standardavvikelserna d( ˆβ 0 ) och d( ˆβ 1 ), (se = standard error) dvs s h 00 och s h 11 Skriv upp formeln på hur variansen σ 2 skattas, vilken kvadratsumma ska användas Vad är frihetsgraderna för σ 2 -skattningen? d) Testa på nivån 001 H 0 : β 1 = 0 mot H 1 : β 1 0 med hjälp av t-test; ledning: teststorheten har beräknats enligt formeln ˆβ 1 /d( ˆβ 1 ) 2

För att se om normalfördelningsantagandet i modellen är ok kan en residualanalys göras Residualerna är beräknade i MATLAB Ta fram dem genom kommandot statsr och plotta med scatter, hist och normplot, tex enligt residualer = statsr; scatter(x,residualer, filled ) title( Residualer ) hist(residualer) title( Histogram för residualer ) normplot(residualer) f) Vad visar de olika residualplottarna? Är du nöjd med residualplottarna? e) Ett utbrott på 4 minuter har just avslutats Beräkna ett 95% prediktionsintervall för tiden till nästa utbrott Matrisen (X T X) 1 kan beräknas enligt XtXinv = statscovb/statsmse Fyll i redovisningsbladet, spara koden och spara eller skriv ut plottar Uppgift 2 Användning av dummy-variabler; beräkning av prediktionsintervall I en undersökning ville man studera om ett aktivt säkerhetsprogram har betydelse för antalet arbetstimmar som förloras på grund av olyckor i arbetet Man valde slumpmässigt ut 40 företag, 20 bland företag med säkerhetsprogram och 20 bland företag utan säkerhetsprogram För varje företag observerades Y = antalet förlorade arbetstimmar under 1 år, x 1 = antalet anställda, { 1, om man har säkerhetsprogram; x 2 = 0, annars Antalet Säkerhetsprogram Antalet förlorade arbetstimmar (y) anställda (x 1 ) (x 2 ) (årsvis, tusentals timmar) 6490 0 121 7244 0 169 5526 0 123 3077 1 44 6600 1 73 1701 1 6 3

Data finns i filen uppg22m För att bedöma vilken analysmodell som är lämplig kan man plotta y mot x 1 med olika symboler för företag med och utan säkerhetsprogram plot(x1(1:20),y(1:20), b* ) hold on plot(x1(21:40),y(21:40), r* ) Du ska nu välja mellan två modeller med olika egenskaper Modell 1: Y = γ 0 + γ 1 z 1 + γ 2 x 2 + ε, där z 1 = x 1 /1000 och x 2 = 1 om man har säkerhetsprogram och annars x 2 = 0 och där z 2 = x 2 z 1 För Modell 1 har vi väntevärde { γ 0 + γ 1 z 1 + γ 2, E(Y ) = γ 0 + γ 1 z 1, Modell 2: Y = β 0 + β 1 z 1 + β 2 z 2 + ε, för företag med säkerhetsprogram, för företag utan säkerhetsprogram Det blir alltså en väntevärdeslinje för varje fall Hur ligger de i förhållande till varandra? Förklara med hjälp av plotten du gjorde varför Modell 1 inte passar så bra För Modell 2 har vi väntevärde { β 0 + (β 1 + β 2 )z 1, E(Y ) = β 0 + β 1 z 1, för företag med säkerhetsprogram, för företag utan säkerhetsprogram Tänk efter varför Även här blir det en väntevärdeslinje för varje fall Hur ligger de i förhållande till varandra? Förklara varför den här modellen fungerar bättre med hänsyn till plotten du gjorde Du ska nu skapa de kolumner du behöver för att göra analyser enligt de båda modellerna Låt z1 = x1/1000; z2 = z1*x2; Genomför först en regressionsanalys enligt Modell 1 och sedan enligt Modell 2 Tänk efter vilka förklaringsvariabler du utnyttjar i respektive fall Använd regstats och beräkna prediktionsintervall för ett företag med säkerhetsprogram och 6600 anställda Glöm inte att z 1 = x 1 /1000 a) Skriv upp de skattade regressionslinjerna för de två modellerna b) Jämför R 2 -värdena för de båda modellerna c) Skriv upp de båda prediktionsintervallen d) Ger analys nr 2 indikationer på att säkerhetsprogram leder till färre förlorade arbetstimmar? Konstruera ett 95% konfidensintervall för en lämplig parameter och dra slutsatser med hjälp av detta Gör intervallet för hand eller använd regress i MATLAB Fyll i redovisningsbladet, spara koden och spara eller skriv ut plottar 4

Uppgift 3 Bedömning av lineariteten hos data Vid elektrisk svetsning har strömstyrkan betydelse för svetsfogens hållfasthet I ett försök studerades sex olika strömstyrkor För varje strömstyrka tillverkades tre svetsfogar vars hållfastheter bestämdes Resultat: x y 4000 600 750 550 5000 1850 2000 1750 6000 2700 2650 2650 7000 3650 3800 3600 8000 4400 4550 4350 9000 4900 4800 4850 Datamaterialet finns lagrat i filen uppg23m Plotta y mot x Det verkar inte helt orimligt att använda ett linjärt samband mellan x och y Modell 1: Y = β 0 + β 1 x + ε där ε N(0, σ 1 ) Du ska göra en analys enligt denna modell med följande kommando regr = regstats(y,x, linear, all ); Plotta y mot x igen, och lägg till den skattade regressionslinjen (du kan använda tex lsline) Hur ligger de observerade punkterna i förhållande till den skattade regressionslinjen? Är Du nöjd? Gör även en residualanalys enligt residualer = regrr; scatter(x,residualer, filled ) a) Ta fram den skattade standardavvikelsen ˆσ 1 = s 1 Skriv ner den i redovisningsbladet b) I residualplotten hittar du ett tydligt mönster vilket innebär att den linjära modellen nog inte är så bra Vilket mönster ser du? Jämför mönstret och den skattade regressionslinjen i plotten ovan Formen på residualplotten för Modell 1 antyder att kan vara aktuell Varför? Modell 2: Y = β 0 + β 1x + β 2x 2 + ε där ε N(0, σ 2 ) Bilda x 2 genom x2 = x^2; Genomför en regressionsanalys enligt Modell 2 För att plotta den skattade linjen från Modell 2, skriv xx = [4000:10:9000] ; xx2 = xx^2; 5

yy = [ones(length(xx),1) xx xx2]*betahat; scatter(x,y, * ) hold on plot(xx,yy) där betahat ska vara vektorn med de tre parameterskattningarna ˆβ 0, ˆβ 1 och ˆβ 2 från Modell 2 c) Anteckna σ 2 -skattningen ˆσ 2 = s 2 d) Plotta residualerna mot x och skriv ut Är Du nöjd med den här residualplotten? Är du nöjd med Modell 2? e) Skulle man kunna använda regressionssambandet för att förutsäga hållfastheten vid strömstyrkan 12000? Fyll i redovisningsbladet, spara koden och spara eller skriv ut plottar Uppgift 4 Stegvis regression enligt framåtvalsprincipen En amerikansk fastighetsmäklare vill utveckla en regressionsmodell med vars hjälp man kan prissätta stora enfamiljshus i utkanterna av en stad I datamaterialet finns uppgifter om 30 hus som nyligen sålts i det aktuella området Property Lot Attrac- Selling Taxes House Size Lot Size Size tiveness Price Property (dollars) (sq feet) (acres) Sq Index ($000) i x i1 x i2 x i3 x i4 x i5 y i 1 7337 3000 36 1296 64 550 2 4204 2300 12 144 69 461 30 4612 2900 11 121 74 477 Öppna filen uppg42m Ni ska nu välja en regressionsmodell enligt framåtvalsprincipen, dvs först ska ni välja den förklaringsvariabel som har störst korrelation med y för att sedan lägga till en variabel i taget enligt vissa kriterier 1 Sök först upp den x-variabel som är starkast korrelerad med Y Gör sedan en regressionsanalys med denna bästa ensamma förklaringsvariabel Anteckna modellen, residualkvadratsumman (sse) och dess frihetsgrad (dfe) Undersök om sambandet är signifikant (nivå 5%), dvs avgör med ett test om β-koefficienten framför x-variabeln är skild från noll (vilket görs enklast med hjälp av t-kvoten som i uppgift 1) Om β-koefficienten är signifikant skild från noll är det klart att denna första förklaringsvariabel ska ingå i modellen 2 Nästa steg är då att kombinera var och en av de övriga förklaringsvariablerna med den först 6

valda och genomföra regressionsanalyser för att hitta det par, som bäst förklarar variationen hos Y, dvs ger minst residualkvadratsumma Du behöver alltså göra fyra olika regressionsanalyser Anteckna modellen, residualkvadratsumman och dess frihetsgrad för varje analys Undersök för det bästa paret om den nya förklaringsvariabeln gör signifikant nytta (t-test på nivå 5%) 3 Om även den andra förklaringsvariabeln du hittat skall ingå i modellen, så är nästa steg att man studerar alla modeller med tre förklarande variabler, där de båda först valda ingår Fortsätt enligt framåtvalsprincipen och plocka in flera förklaringsvariabler i modellen (nivå 5% för samtliga test) Proceduren slutar då β-koefficienten framför den senaste förklaringsvariabeln inte är signifikant skild från noll a) Vilken modell ger framåtvalsprincipen? b) Gör ytterligare en analys enligt den valda modellen Genomför också en regressionsanalys med samtliga förklaringsvariabler och undersök om denna modell är signifikant bättre än slutmodellen i a) med hjälp av ett F-test på nivån 5% c) Studera i den fullständiga modellen, med alla fem förklaringsvariabler, ˆβ 3 och ˆβ 4 och deras t-värden Är β 3 och β 4 skilda från 0 på nivån 005? Jämför med resultatet i analysen enligt framåtvalsprincipens modell Förklaringen till det något egendomliga resultatet är att x 3 och x 4 är starkt korrelerade d) Beräkna korrelation mellan x 3 och x 4 Fyll i redovisningsbladet, spara koden och spara eller skriv ut plottar Anm 1 När man som i uppgiften ovan har tagit fram en regressionsmodell, bör man innan man accepterar modellen också göra alla upptänkliga residualplottar för att förvissa sig om att antagandena i modellen är rimliga Anm 2 Starkt korrelerade förklaringsvariabler kan ge konstiga β-skattningar, varför man bör vara extra försiktig beträffande slutsatserna om variablers inverkan i sådana situationer Undvik alltså om möjligt starkt korrelerade förklaringsvariabler Anm 3 Tumregel : Man bör ha åtminstone cirka 10p observationer om man har p förklaringsvariabler Anm 4 Kom ihåg att man via regressionsanalys inte kan bevisa orsakssamband 7

Uppgift 5 Avvikande värden, så kallade outliers I samband med presidentvalet i USA 2000 förekom mycket diskussioner kring valresultatet framför allt för Florida Bland annat klagade flera röstande i Palm Beach över att de missförstått valblanketten och av misstag röstat på Buchanan Vi ska med hjälp av regressionsanalyser försöka avgöra om resultatet för Palm Beach avviker från resultaten i övriga valdistrikt I tabellen nedan finns resultaten för olika valdistrikt i Florida County Bush Gore Buchanan Total Alachua 34124 47365 263 85729 Baker 5610 2392 73 8154 Palm Beach 152951 269732 3411 433186 Washington 4994 2798 88 8025 Absentee 1575 836 5 2490 I filen uppg25m finns dels det totala antalet röstande (x), dels Buchanans röstetal (Y ), men Palm Beach har tagits bort Plotta Y mot x Det finns ett samband mellan x och Y, men spridningen är mycket större för stora värden I stället för ett linjärt samband mellan x och Y skulle man kunna studera ett linjärt samband mellan de logaritmerade värdena a) Använd log10 i MATLAB för att logaritmera x och y Plotta 10 log y mot 10 log x och lägg till regressionslinjem med lsline Genomför en regressionsanalys med de logaritmerade värdena b) Gör ett 995% prediktionsintervall för Buchanans röstetal i Palm Beach (x = 433186), alltså för 10 log x = 10 log 433186 = 56367 Beräkna med hjälp av prediktionsintervallet för 10 log Y ett prediktionsintervall för Y = antalet röster för Buchanan i Palm Beach och jämför med det verkliga antalet, dvs 3411 Fyll i redovisningsbladet, spara koden och spara eller skriv ut plottar Anm Här ser det ut som att vi har ett avvikande värde i förhållande till övriga valdistrikt Men, vi har letat upp den mest avvikande valkretsen och sedan genomfört ett test, samtidigt som den simultana signifikansnivån är som störst 68 0005 = 034 Alltså vi har en ganska stor felrisk 8

REDOVISNINGSBLAD Fyll i namn och personnr med bläck 1) 2) Uppgift 1 a) Skattad korrelation mellan y och x: b) Skattad regressionslinje c) d( ˆβ 0 ) = d( ˆβ 1 ) = Formel s 2 = Frihetsgrad för s 2 : d) Teststorheten T = ; kritisk gräns för T : ; Förkastas H 0? e) Prediktionsintervall för tiden till nästa utbrott: (X T X) 1 = e) Är residualplottarna OK? OK Uppgift 2 a) Skriv upp de skattad regressionslinje för de två modellerna Modell 1: Modell 2: Förklara kort vad som är skillnaden mellan Modell 1 och Modell 2 och varför Modell 2 borde vara bättre Modell 1 Modell 2 b) R 2 -värde: c) Prediktionsintervall: d) Konfidensintervall: OK 9

Uppgift 3 a) s 1 = b) Vad är det för mönster i residualplotten? Skissa: c) s 2 = d) Är residualplotten OK? Är modell 2 OK? e) Svar: Varför? OK Uppgift 4 Bästa ensamma förklaringsvariabel: a) Modell enligt framåtvalsprincipen (skriv in den teoretiska modellen inte den med skattade parametrar): b) Teststorhet v = Kritisk gräns: Slutsats: c) ˆβ 3 = T 3 = ˆβ 4 = T 4 = Kritisk gräns för T i : Korrelation mellan x 3 och x 4 : OK Uppgift 5 a) Är du nöjd med den skattade regressionslinjen? b) Prediktionsintervall för Buchanans röstetal: OK 10