Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då var skattningarna BLUE (bästa lineära vvr-skattningen och våra hypotestest har önskade signifikansnivåer att undersöka ger oss indikationer på antagandena gäller Johan Koskinen, Department of Statistics 5-5-9 Normalfördelade? Avvikelser från normalfördelningsantagandet Normalfördelningsdiagram Normalfördelade? Histogram tal från N(, tal från N(, tal från N(, tal från N(, Johan Koskinen, Department of Statistics 5-5-9 3 I praktiken svårt att avgöra Johan Koskinen, Department of Statistics 5-5-9 4
Normalfördelningsdiagram Normalfördelade? Normalfördelade? Om vi har starka skäl att tvivla på normalfördelningsantagandet tvivlar vi på att t.ex. estimatorernas samplingfördelning normal m.a.o. behöver inte hypotestesten gälla... tal från χ ( tal från χ ( Johan Koskinen, Department of Statistics 5-5-9 5 Johan Koskinen, Department of Statistics 5-5-9 6 Oberoende Om ε, ε,..., ε är oberoende borde vi ej se ngt mönster Antag att vi har följande data Beroende över tid relativt tiden relativt ordning relativt beroende variabel Regression Analysis: y versus x y 6.5 + 5.4 x relativt oberoende variabel relativt ngn annan variabel Constant 6.535.977 6.9. x 5.49.575 3.44. S.77 R-Sq 9.7% R-Sq(adj 7.% Johan Koskinen, Department of Statistics 5-5-9 7 Johan Koskinen, Department of Statistics 5-5-9 8
Vilket ger na Beroende över tid Inget märkligt tills trend över tid Johan Koskinen, Department of Statistics 5-5-9 9 Beroende av förklarande var. Regression Analysis: y versus x y.8 + 4.3 x Constant.774.4 9.44. x 4.3.3888.88. Johan Koskinen, Department of Statistics 5-5-9 S.544899 R-Sq 8.9% R-Sq(adj 8.% Beroende av ytterligare variabler Lika varians Om ε, ε,..., ε har samma varians σ ej se ngt mönster Lika varians: hoscedasicitet olika varians: heteroscedasicitet Regression Analysis: y versus x y 4.6 +.3 x Constant 4.69.7 9.66. x.37.34 5.95. Johan Koskinen, Department of Statistics 5-5-9 S.4787 R-Sq 55.8% R-Sq(adj 54.3% Johan Koskinen, Department of Statistics 5-5-9
Heteroscedasicitet Heteroscedasicitet Data Data $# Johan Koskinen, Department of Statistics tiden 5-5-9 3 Johan Koskinen, Department of Statistics 5-5-9 4 # tiden Heteroscedasicitet Andra exempel på fel modellantaganden Data olika varians beroende på tredje variabel Utöver ovan nämnda tekniska bitar Vad påverkar vad? vi antar linjär model och fix % % Johan Koskinen, Department of Statistics 5-5-9 5 Johan Koskinen, Department of Statistics 5-5-9 6
Multipel regression - dummyvariabler Antag att vin har typer av enheter i populationen A & B och vi tror på modellen ska vi då skatta en modell för A och en för B? Låt Multipel regression - dummyvariabler och skriv modellen så får vi Johan Koskinen, Department of Statistics 5-5-9 7 Johan Koskinen, Department of Statistics 5-5-9 8 Multipel regression - dummyvariabler Vilket vi kan tolka s alltså är de förväntade värdet på den oberoende variabeln när m.a.o. sambandet är likadant mellan och men linjerna ligger på olika nivåer Johan Koskinen, Department of Statistics 5-5-9 9 Multipel regression - dummyvariabler Om vi tror på en modell med olika lutning för A & B Johan Koskinen, Department of Statistics 5-5-9 och skriv modellen 3 + ( så får vi 3
Multipel regression - dummyvariabler Multipel regression - mer generellt Vilket vi kan tolka s 3 Antag att det t.ex. finns variabler och s förklarar den beroende variabeln Johan Koskinen, Department of Statistics 5-5-9 Johan Koskinen, Department of Statistics 5-5-9 Multipel regression - mer generellt Multipel regression - mer generellt Att anpassa en modell ε (, σ är då att anpassa en yta Precis s för enkel linjär regression ( MK-skattningen är s gör kvadratsumman ( ( Johan Koskinen, Department of Statistics 5-5-9 3 så liten s möjligt 5-5-9 Johan Koskinen, Department of Statistics 4
Multipel regression - mer generellt och den totala variationen kan delas upp Multipel regression - mer generellt Vi kan ha många, stycken förklarande variabler,,, s tillsammans förklarar den beroende variabeln + ε (, σ Johan Koskinen, Department of Statistics 5-5-9 5 Det förväntade värdet på givet,,, är alltså en lineär funktion av de oberoende variablerna Dock svårt att rita ytan i fler dimensioner fortfarande har vi däremot + ( + ( ( Johan Koskinen, Department of Statistics 5-5-9 6 Multipel regression - ANOVA För anpassad modell + Vi ställer upp hur variationen fördelar sig i en ANOVA-tabell Multipel regression - signifikant förklarande? För modell med stycken förklarande variabler,,, + För anpassad modell ε (, σ + variation i regression kvadratsumma frihetsgrader medelkvadratsumma ( / gäller att givet att förutsättningarna A-E är uppfyllda När totalt ( ( /( /( Johan Koskinen, Department of Statistics 5-5-9 7 regressionskvadratsumman/ residualkvadratsumman/( (, Johan Koskinen, Department of Statistics 5-5-9 8
Multipel regression - signifikant förklarande? För s.v.,,,, ( µ testa H : µ µ för alla, alltså ingen regression, alltså mot H : för minst ett, på signifikansnivån α + +, Multipel regression - signifikant förklarande? / /( S.9669 R-Sq 95.5% R-Sq(adj 95.4% Analysis of Variance Source DF SS MS F P Regression 5.5 5.57 6.4. Residual Error 57 46.85.8 Total 59 5. Förutsatt A-E är teststatistikan / (, /( Vi förkastar H : (ingen regression på signifikansnivån α då det observerade värdet på teststatistikan är större än,-- α vi då H är sann. Johan Koskinen, Department of Statistics 5-5-9 9 säger att regressionen är signifikant förklarande Regression Analysis: förs versus inköp; nederbörd förs 5.8 +.5 inköp - 9.9 nederbörd Constant 5.83.333 5.89. inköp.473.47 4.5. nederbörd -9.94.47-4.8. (, 57 Johan Koskinen, Department of Statistics 5-5-9 3 Multipel regression - test av individuella koefficienter Att vi förkastar H betyder alltså att vi tror på H : för minst ett, lite trubbigt testa: givet förutsättningarna A-E är uppfyllda: ( ( testa H : mot H : ( testa H : mot H :... ( testa H : mot H : då H : är sann. nederbörd -9.94.47-4.8. 5-5-9 Johan Koskinen, Department of Statistics 5-5-9 3 Multipel regression - test av individuella koefficienter Regression Analysis: förs versus inköp; nederbörd förs 5.8 +.5 inköp - 9.9 nederbörd Constant 5.83.333 5.89. inköp.473.47 4.5. ( testa H : inköp mot H : inköp inköp då H ( : inköp är sann., 47 4, 5, 47 (57 Johan Koskinen, Department of Statistics 3