Stat. teori gk, ht 006, JW F7 ENKEL LINJÄR REGRESSION, FORTS. (NCT.5-.7) Statistisk iferes rörade β Vi vet reda att b är e vätevärdesriktig skattig av modellparameter β. Vi vet också att skattige b har e varias, som skattas med s b. Uder förutsättig att modellatagadea gäller, ka ett kofidesitervall för β bildas såsom: b ± t s b där värdet på t bestäms frå tabell över t-fördelige med - frihetsgrader, så att vi får öskad kofidesivå. Vid mer ä 30 frihetsgrader approimeras t-fördelige med N(0; ). Kofidesitervallet blir då b ± z s b
Vi ka äve göra hypotesprövig rörade β. Säg att vi vill testa ollhypotese H 0 : β = β mot ågot av alterative H : β β *, H : β < β *, eller H : β > * * β (där β är ett givet umeriskt värde). Om fråga är: Fis det överhuvudtaget ågot lijärt sambad?, så testar vi H 0 : β =0 (vilket iebär att det ite fis ågot lijärt sambad) mot H : β 0. Som testvariabel aväds: * t = b β s b * Om H 0 är sa, så är testvariabel är t-fördelad med - frihetsgrader. Vid H 0 : β =0 blir testvariabel: b t =. s b Förkastelsegräser hämtas frå tabell över t-fördelige med - fg. Beror på val av sigifikasivå och på hur mothypotese ser ut (ekelsidig eller dubbelsidig).
Ett alterativt sätt att testa de speciella ollhypotese H 0 : β =0 mot de dubbelsidiga mothypotese H : β 0 är att aväda F-test med testvariabel MSR F = = MSE MSR s e (Vid ekel lijär regressio är MSR = SSR.) Testvariabel är F-fördelad med fg i täljare och - fg i ämare, om H 0 är sa. H 0 förkastas om (och edast om) vi får högt värde på testvariabel F. Förkastelsegräs hämtas frå Tabell 9 över F-fördelige med (; -) fg. Vid test av H 0 : β =0 mot H : β 0 är t-testet och F-testet likvärdiga. De leder alltid till eakt samma slutsats. I själva verket häger de båda testvariablera (i detta speciella fall) ihop på så sätt att F= t. (Eempel: Se Miitab-eemplet lägre fram) 3
Prediktio av y för ett ytt -värde Data: y y M M y Vi atar att data geererats eligt stadardmodelle för ekel lijär regressio. Modelle säger bl.a. att för givet i är E(y i ) = β 0 + β i Problemet är u att försöka predicera vilket y- värde vi kommer att få, är = +, där + är ett ytt, täkt, -värde som ite igår i våra tidigare data. Som prediktio av det kommade y-värdet för = + aväder vi: y = b 0 +b + ˆ+ (Vad är det för skillad mella skattig och prediktio?) 4
5 Ett prediktiositervall ka beräkas: ] ) ( ) ( [ ) ( ˆ 0 = + + + + ± + + i i e y s t b b 443 där värdet på kostate t hämtas frå tabell över t-fördelige med - fg, så att vi får öskad täckigsgrad hos prediktioe, och där = = i i Täckigsgrad = saolikhete att itervallet skall iehålla det kommade (äu icke iträffade) värdet på y, är vi låter = +. På vilket sätt beror kofidesitervallets lägd av hur vi väljer +?
Skattig av förvätat y-värde för ett ytt -värde Ett problem som likar prediktiosproblemet är följade: Vilket är det förvätade y-värdet för ett visst, ytt, -värde +, som ite igår i våra data? Dvs. vi vill skatta vätevärdet E(y = + ) = β 0 + β +. OBS Itresset är u ite riktat ite mot det eskilda y-värde som vi kommer att få (me äu ite har fått) ifall vi låter = +, uta i stället mot det geomsittliga y-värdet för = +. Som skattig av β 0 +β + aväder vi b 0 +b + (Är skattige vätevärdesriktig?) 6
Vi ka bilda kofidesitervall för β 0 +β + : ( 0 ) ( b0 + b + ) ± t se [ + ] ( i ) där värdet på kostate t hämtas frå tabell över t-fördelige med - fg, så att vi får öskad kofidesivå. På vilket sätt beror kofidesitervallets lägd av hur vi väljer 0? Hur förhåller sig kofidesitervallet till prediktiositervallet? Miitab-eempel Vi har följade data ( = ikomst, y = sparade): y 8 8 44 5 3 30 38 3 36 30 6 5 4 8 5 45 3 30 6 7
Regressioskörig ger: Regressio Aalysis: y versus The regressio equatio is y = - 0,9 +,43 Predictor Coef SE Coef T P Costat -0,86 7,7 -,7 0,07,469 0,304 6,9 0,000 S = 7,354 R-Sq = 8,7% R-Sq(adj) = 80,6% Aalysis of Variace Source DF SS MS F P Regressio 950,6 950,6 38,34 0,000 Residual Error 8 407,0 50,9 Total 9 357,6 8
Spridigsdiagram med regressioslije: Spridigsdiagram med regressioslije y = - 0,86 +,47 50 S 7,354 R-Sq 8,7% R-Sq(adj) 80,6% 40 y 30 0 0 0 0 5 30 35 40 45 50 55 På föreläsige visas: a) Test av H 0 : β = 0 mot H : β 0 (dels med t- test, dels med F-test). b) Test av H 0 : β = 0 mot H : β > 0 (med t-test). c) Beräkig av 95% kofidesitervall för β. 9
Studium av residualera: y e 8 8 4,8 3,778 44 5 4,96 0,0784 3 30 3,379 6,68 38 3 33,360 -,360 36 30 30,5064-0,5064 6 5 6,374 8,766 4 8 3,3836-5,3836 5 45 5,9099-6,9099 3 0,598-7,598 30 6,9450-5,9450 Plotta residualera mot : 0 Residualer mot ikomst 5 Residual 0-5 -0 0 5 30 35 Ikomst 40 45 50 55 Kommetar? 0
Säg att vi vill veta vad som häder är = 40. Dels vill vi skatta det förvätade y-värdet = β 0 + β 40, dels vill vi predicera det idividuella y- värde vi kommer att få, om vi låter = 40. Vi vill ha kofidesitervall med kofidesivå 95%, och prediktiositervall med täckigsgrad 95%. Båda erhålls med Miitab: Predicted Values for New Observatios New Obs Fit SE Fit 95% CI 95% PI 36,,9 (9,50; 4,93) (8,45; 53,98) Values of Predictors for New Observatios New Obs 40,0
Med Miitab ka vi rita ut gräsera för både kofidesitervall och prediktiositervall för alla värde på. Med 95% kofidesivå och 95% täckigsgrad får vi: 80 60 40 Kofides- och prediktiositervall, 95% y = - 0,86 +,47 Regressio 95% CI 95% PI S 7,354 R-Sq 8,7% R-Sq(adj) 80,6% y 0 0 0 5 30 35 40 45 50 55 Stämmer kurvoras utseede med vad som sagts tidigare?