Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

Relevanta dokument
F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

1. Test av anpassning.

F10 ESTIMATION (NCT )

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Föreläsning G70 Statistik A

Exempel 1 på multipelregression

Formelsamling. Enkel linjär regressionsananalys: Modell: y i = β 0 + β 1 x i + ε i. Anpassad regressionslinje: ŷ = b 0 + b 1 x. (x i x) (y i ȳ) ( x)2

Regressions- och Tidsserieanalys - F3

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Introduktion till statistik för statsvetare

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

STATISTIK B, 8 HP TENTAMEN FREDAGEN DEN 4 DECEMBER

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

θx θ 1 om 0 x 1 f(x) = 0 annars

2. Konfidensintervall för skillnaden mellan två proportioner.

Regressions- och Tidsserieanalys - F7

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Föreläsning G04: Surveymetodik

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

TMS136: Dataanalys och statistik Tentamen med lösningar

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Föreläsning 2: Punktskattningar

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

S0005M V18, Föreläsning 10

95%-igt konfidensintervall för andel kalsongbärare i populationen: Slutsats: Med 95% säkerhet finns andelen kalsongbärare i intervallet 38-48%

Skrivning i ekonometri lördagen den 29 mars 2008

a) Beräkna E (W ). (2 p)

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Lycka till! I(X i t) 1 om A 0 annars I(A) =

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 5

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

Föreläsning G70 Statistik A

Exempel 1 på multipelregression

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Regressions- och Tidsserieanalys - F3

Skrivning i ekonometri torsdagen den 8 februari 2007

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Multipel Regressionsmodellen

Regressions- och Tidsserieanalys - F3

Borel-Cantellis sats och stora talens lag

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

10.1 Enkel linjär regression

================================================

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Föreläsning G60 Statistiska metoder

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

STATISTIK FÖR LÄKARSTUDENTER

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00. Kap 2: Sannolikhetsteorins grunder

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

Grundläggande matematisk statistik

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

TENTAMEN I STATISTIK B,

Matematisk statistik TMS063 Tentamen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

vara ett polynom där a 0, då kallas n för polynomets grad och ibland betecknas n grad( P(

Regressions- och Tidsserieanalys - F4

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

Tentamen Metod C vid Uppsala universitet, , kl

Examinationsuppgifter del 2

Skrivning i ekonometri lördagen den 15 januari 2005

H1009, Introduktionskurs i matematik Armin Halilovic POLYNOM, POLYNOMDIVISION, ALGEBRAISKA EKVATIONER, PARTIALBRÅKSUPPDELNING. vara ett polynom där a

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

ANOVA I: Kap 14. Åldersgrupper -30 år år 51- år. Totalt n k N = 9 X k X = s k s = 8.

Formelsamling Tillämpad statistik, A5

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1

F15 ENKEL LINJÄR REGRESSION (NCT )

Regressions- och Tidsserieanalys - F5

Transkript:

Stat. teori gk, ht 006, JW F7 ENKEL LINJÄR REGRESSION, FORTS. (NCT.5-.7) Statistisk iferes rörade β Vi vet reda att b är e vätevärdesriktig skattig av modellparameter β. Vi vet också att skattige b har e varias, som skattas med s b. Uder förutsättig att modellatagadea gäller, ka ett kofidesitervall för β bildas såsom: b ± t s b där värdet på t bestäms frå tabell över t-fördelige med - frihetsgrader, så att vi får öskad kofidesivå. Vid mer ä 30 frihetsgrader approimeras t-fördelige med N(0; ). Kofidesitervallet blir då b ± z s b

Vi ka äve göra hypotesprövig rörade β. Säg att vi vill testa ollhypotese H 0 : β = β mot ågot av alterative H : β β *, H : β < β *, eller H : β > * * β (där β är ett givet umeriskt värde). Om fråga är: Fis det överhuvudtaget ågot lijärt sambad?, så testar vi H 0 : β =0 (vilket iebär att det ite fis ågot lijärt sambad) mot H : β 0. Som testvariabel aväds: * t = b β s b * Om H 0 är sa, så är testvariabel är t-fördelad med - frihetsgrader. Vid H 0 : β =0 blir testvariabel: b t =. s b Förkastelsegräser hämtas frå tabell över t-fördelige med - fg. Beror på val av sigifikasivå och på hur mothypotese ser ut (ekelsidig eller dubbelsidig).

Ett alterativt sätt att testa de speciella ollhypotese H 0 : β =0 mot de dubbelsidiga mothypotese H : β 0 är att aväda F-test med testvariabel MSR F = = MSE MSR s e (Vid ekel lijär regressio är MSR = SSR.) Testvariabel är F-fördelad med fg i täljare och - fg i ämare, om H 0 är sa. H 0 förkastas om (och edast om) vi får högt värde på testvariabel F. Förkastelsegräs hämtas frå Tabell 9 över F-fördelige med (; -) fg. Vid test av H 0 : β =0 mot H : β 0 är t-testet och F-testet likvärdiga. De leder alltid till eakt samma slutsats. I själva verket häger de båda testvariablera (i detta speciella fall) ihop på så sätt att F= t. (Eempel: Se Miitab-eemplet lägre fram) 3

Prediktio av y för ett ytt -värde Data: y y M M y Vi atar att data geererats eligt stadardmodelle för ekel lijär regressio. Modelle säger bl.a. att för givet i är E(y i ) = β 0 + β i Problemet är u att försöka predicera vilket y- värde vi kommer att få, är = +, där + är ett ytt, täkt, -värde som ite igår i våra tidigare data. Som prediktio av det kommade y-värdet för = + aväder vi: y = b 0 +b + ˆ+ (Vad är det för skillad mella skattig och prediktio?) 4

5 Ett prediktiositervall ka beräkas: ] ) ( ) ( [ ) ( ˆ 0 = + + + + ± + + i i e y s t b b 443 där värdet på kostate t hämtas frå tabell över t-fördelige med - fg, så att vi får öskad täckigsgrad hos prediktioe, och där = = i i Täckigsgrad = saolikhete att itervallet skall iehålla det kommade (äu icke iträffade) värdet på y, är vi låter = +. På vilket sätt beror kofidesitervallets lägd av hur vi väljer +?

Skattig av förvätat y-värde för ett ytt -värde Ett problem som likar prediktiosproblemet är följade: Vilket är det förvätade y-värdet för ett visst, ytt, -värde +, som ite igår i våra data? Dvs. vi vill skatta vätevärdet E(y = + ) = β 0 + β +. OBS Itresset är u ite riktat ite mot det eskilda y-värde som vi kommer att få (me äu ite har fått) ifall vi låter = +, uta i stället mot det geomsittliga y-värdet för = +. Som skattig av β 0 +β + aväder vi b 0 +b + (Är skattige vätevärdesriktig?) 6

Vi ka bilda kofidesitervall för β 0 +β + : ( 0 ) ( b0 + b + ) ± t se [ + ] ( i ) där värdet på kostate t hämtas frå tabell över t-fördelige med - fg, så att vi får öskad kofidesivå. På vilket sätt beror kofidesitervallets lägd av hur vi väljer 0? Hur förhåller sig kofidesitervallet till prediktiositervallet? Miitab-eempel Vi har följade data ( = ikomst, y = sparade): y 8 8 44 5 3 30 38 3 36 30 6 5 4 8 5 45 3 30 6 7

Regressioskörig ger: Regressio Aalysis: y versus The regressio equatio is y = - 0,9 +,43 Predictor Coef SE Coef T P Costat -0,86 7,7 -,7 0,07,469 0,304 6,9 0,000 S = 7,354 R-Sq = 8,7% R-Sq(adj) = 80,6% Aalysis of Variace Source DF SS MS F P Regressio 950,6 950,6 38,34 0,000 Residual Error 8 407,0 50,9 Total 9 357,6 8

Spridigsdiagram med regressioslije: Spridigsdiagram med regressioslije y = - 0,86 +,47 50 S 7,354 R-Sq 8,7% R-Sq(adj) 80,6% 40 y 30 0 0 0 0 5 30 35 40 45 50 55 På föreläsige visas: a) Test av H 0 : β = 0 mot H : β 0 (dels med t- test, dels med F-test). b) Test av H 0 : β = 0 mot H : β > 0 (med t-test). c) Beräkig av 95% kofidesitervall för β. 9

Studium av residualera: y e 8 8 4,8 3,778 44 5 4,96 0,0784 3 30 3,379 6,68 38 3 33,360 -,360 36 30 30,5064-0,5064 6 5 6,374 8,766 4 8 3,3836-5,3836 5 45 5,9099-6,9099 3 0,598-7,598 30 6,9450-5,9450 Plotta residualera mot : 0 Residualer mot ikomst 5 Residual 0-5 -0 0 5 30 35 Ikomst 40 45 50 55 Kommetar? 0

Säg att vi vill veta vad som häder är = 40. Dels vill vi skatta det förvätade y-värdet = β 0 + β 40, dels vill vi predicera det idividuella y- värde vi kommer att få, om vi låter = 40. Vi vill ha kofidesitervall med kofidesivå 95%, och prediktiositervall med täckigsgrad 95%. Båda erhålls med Miitab: Predicted Values for New Observatios New Obs Fit SE Fit 95% CI 95% PI 36,,9 (9,50; 4,93) (8,45; 53,98) Values of Predictors for New Observatios New Obs 40,0

Med Miitab ka vi rita ut gräsera för både kofidesitervall och prediktiositervall för alla värde på. Med 95% kofidesivå och 95% täckigsgrad får vi: 80 60 40 Kofides- och prediktiositervall, 95% y = - 0,86 +,47 Regressio 95% CI 95% PI S 7,354 R-Sq 8,7% R-Sq(adj) 80,6% y 0 0 0 5 30 35 40 45 50 55 Stämmer kurvoras utseede med vad som sagts tidigare?