Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Relevanta dokument
F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F3

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Metod och teori. Statistik för naturvetare Umeå universitet

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F3

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Regressions- och Tidsserieanalys - F4

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

7.5 Experiment with a single factor having more than two levels

10.1 Enkel linjär regression

Examinationsuppgifter del 2

Regressions- och Tidsserieanalys - F7

Följande resultat erhålls (enhet: 1000psi):

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Laboration 2 multipel linjär regression

TENTAMEN I MATEMATISK STATISTIK

Multipel Regressionsmodellen

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Tentamen Tillämpad statistik A5 (15hp)

Matematisk statistik för D, I, Π och Fysiker

Statistisk försöksplanering

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Statistisk försöksplanering

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Statistik för teknologer, 5 poäng Skrivtid:

TENTAMEN I STATISTIK B,

7.5 Experiment with a single factor having more than two levels

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Tentamen i matematisk statistik

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

F11. Kvantitativa prognostekniker

Tentamen Tillämpad statistik A5 (15hp)

Tentamen i matematisk statistik

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

Exempel 1 på multipelregression

Skrivning i ekonometri torsdagen den 8 februari 2007

Tentamen i Matematisk statistik Kurskod S0001M

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Matematisk statistik för B, K, N, BME och Kemister

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Föreläsning G60 Statistiska metoder

Tentamen Tillämpad statistik A5 (15hp)

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik, Föreläsning 5

Skrivning i ekonometri lördagen den 29 mars 2008

Föreläsning 15: Faktorförsök

Räkneövning 3 Variansanalys

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

F7 Polynomregression och Dummyvariabler

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

tentaplugg.nu av studenter för studenter

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Föreläsning 12: Linjär regression

F13 Regression och problemlösning

Tentamen i Matematisk statistik Kurskod S0001M

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Lektionsanteckningar 11-12: Normalfördelningen

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Tentamen för kursen. Linjära statistiska modeller. 22 februari

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

Regressions- och Tidsserieanalys - F5

Icke-parametriska/fördelningsfria test. Finansiell statistik, vt-05. Teckentest. Teckentest. Vi gör observationer för =1,, på variablerna.

Tentamen i Matematisk statistik Kurskod S0001M

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Enkel och multipel linjär regression

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Transkript:

Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då var skattningarna BLUE (bästa lineära vvr-skattningen och våra hypotestest har önskade signifikansnivåer att undersöka ger oss indikationer på antagandena gäller Johan Koskinen, Department of Statistics 5-5-9 Normalfördelade? Avvikelser från normalfördelningsantagandet Normalfördelningsdiagram Normalfördelade? Histogram tal från N(, tal från N(, tal från N(, tal från N(, Johan Koskinen, Department of Statistics 5-5-9 3 I praktiken svårt att avgöra Johan Koskinen, Department of Statistics 5-5-9 4

Normalfördelningsdiagram Normalfördelade? Normalfördelade? Om vi har starka skäl att tvivla på normalfördelningsantagandet tvivlar vi på att t.ex. estimatorernas samplingfördelning normal m.a.o. behöver inte hypotestesten gälla... tal från χ ( tal från χ ( Johan Koskinen, Department of Statistics 5-5-9 5 Johan Koskinen, Department of Statistics 5-5-9 6 Oberoende Om ε, ε,..., ε är oberoende borde vi ej se ngt mönster Antag att vi har följande data Beroende över tid relativt tiden relativt ordning relativt beroende variabel Regression Analysis: y versus x y 6.5 + 5.4 x relativt oberoende variabel relativt ngn annan variabel Constant 6.535.977 6.9. x 5.49.575 3.44. S.77 R-Sq 9.7% R-Sq(adj 7.% Johan Koskinen, Department of Statistics 5-5-9 7 Johan Koskinen, Department of Statistics 5-5-9 8

Vilket ger na Beroende över tid Inget märkligt tills trend över tid Johan Koskinen, Department of Statistics 5-5-9 9 Beroende av förklarande var. Regression Analysis: y versus x y.8 + 4.3 x Constant.774.4 9.44. x 4.3.3888.88. Johan Koskinen, Department of Statistics 5-5-9 S.544899 R-Sq 8.9% R-Sq(adj 8.% Beroende av ytterligare variabler Lika varians Om ε, ε,..., ε har samma varians σ ej se ngt mönster Lika varians: hoscedasicitet olika varians: heteroscedasicitet Regression Analysis: y versus x y 4.6 +.3 x Constant 4.69.7 9.66. x.37.34 5.95. Johan Koskinen, Department of Statistics 5-5-9 S.4787 R-Sq 55.8% R-Sq(adj 54.3% Johan Koskinen, Department of Statistics 5-5-9

Heteroscedasicitet Heteroscedasicitet Data Data $# Johan Koskinen, Department of Statistics tiden 5-5-9 3 Johan Koskinen, Department of Statistics 5-5-9 4 # tiden Heteroscedasicitet Andra exempel på fel modellantaganden Data olika varians beroende på tredje variabel Utöver ovan nämnda tekniska bitar Vad påverkar vad? vi antar linjär model och fix % % Johan Koskinen, Department of Statistics 5-5-9 5 Johan Koskinen, Department of Statistics 5-5-9 6

Multipel regression - dummyvariabler Antag att vin har typer av enheter i populationen A & B och vi tror på modellen ska vi då skatta en modell för A och en för B? Låt Multipel regression - dummyvariabler och skriv modellen så får vi Johan Koskinen, Department of Statistics 5-5-9 7 Johan Koskinen, Department of Statistics 5-5-9 8 Multipel regression - dummyvariabler Vilket vi kan tolka s alltså är de förväntade värdet på den oberoende variabeln när m.a.o. sambandet är likadant mellan och men linjerna ligger på olika nivåer Johan Koskinen, Department of Statistics 5-5-9 9 Multipel regression - dummyvariabler Om vi tror på en modell med olika lutning för A & B Johan Koskinen, Department of Statistics 5-5-9 och skriv modellen 3 + ( så får vi 3

Multipel regression - dummyvariabler Multipel regression - mer generellt Vilket vi kan tolka s 3 Antag att det t.ex. finns variabler och s förklarar den beroende variabeln Johan Koskinen, Department of Statistics 5-5-9 Johan Koskinen, Department of Statistics 5-5-9 Multipel regression - mer generellt Multipel regression - mer generellt Att anpassa en modell ε (, σ är då att anpassa en yta Precis s för enkel linjär regression ( MK-skattningen är s gör kvadratsumman ( ( Johan Koskinen, Department of Statistics 5-5-9 3 så liten s möjligt 5-5-9 Johan Koskinen, Department of Statistics 4

Multipel regression - mer generellt och den totala variationen kan delas upp Multipel regression - mer generellt Vi kan ha många, stycken förklarande variabler,,, s tillsammans förklarar den beroende variabeln + ε (, σ Johan Koskinen, Department of Statistics 5-5-9 5 Det förväntade värdet på givet,,, är alltså en lineär funktion av de oberoende variablerna Dock svårt att rita ytan i fler dimensioner fortfarande har vi däremot + ( + ( ( Johan Koskinen, Department of Statistics 5-5-9 6 Multipel regression - ANOVA För anpassad modell + Vi ställer upp hur variationen fördelar sig i en ANOVA-tabell Multipel regression - signifikant förklarande? För modell med stycken förklarande variabler,,, + För anpassad modell ε (, σ + variation i regression kvadratsumma frihetsgrader medelkvadratsumma ( / gäller att givet att förutsättningarna A-E är uppfyllda När totalt ( ( /( /( Johan Koskinen, Department of Statistics 5-5-9 7 regressionskvadratsumman/ residualkvadratsumman/( (, Johan Koskinen, Department of Statistics 5-5-9 8

Multipel regression - signifikant förklarande? För s.v.,,,, ( µ testa H : µ µ för alla, alltså ingen regression, alltså mot H : för minst ett, på signifikansnivån α + +, Multipel regression - signifikant förklarande? / /( S.9669 R-Sq 95.5% R-Sq(adj 95.4% Analysis of Variance Source DF SS MS F P Regression 5.5 5.57 6.4. Residual Error 57 46.85.8 Total 59 5. Förutsatt A-E är teststatistikan / (, /( Vi förkastar H : (ingen regression på signifikansnivån α då det observerade värdet på teststatistikan är större än,-- α vi då H är sann. Johan Koskinen, Department of Statistics 5-5-9 9 säger att regressionen är signifikant förklarande Regression Analysis: förs versus inköp; nederbörd förs 5.8 +.5 inköp - 9.9 nederbörd Constant 5.83.333 5.89. inköp.473.47 4.5. nederbörd -9.94.47-4.8. (, 57 Johan Koskinen, Department of Statistics 5-5-9 3 Multipel regression - test av individuella koefficienter Att vi förkastar H betyder alltså att vi tror på H : för minst ett, lite trubbigt testa: givet förutsättningarna A-E är uppfyllda: ( ( testa H : mot H : ( testa H : mot H :... ( testa H : mot H : då H : är sann. nederbörd -9.94.47-4.8. 5-5-9 Johan Koskinen, Department of Statistics 5-5-9 3 Multipel regression - test av individuella koefficienter Regression Analysis: förs versus inköp; nederbörd förs 5.8 +.5 inköp - 9.9 nederbörd Constant 5.83.333 5.89. inköp.473.47 4.5. ( testa H : inköp mot H : inköp inköp då H ( : inköp är sann., 47 4, 5, 47 (57 Johan Koskinen, Department of Statistics 3