STATISTIK B, 8 HP TENTAMEN FREDAGEN DEN 4 DECEMBER

Relevanta dokument
Formelsamling. Enkel linjär regressionsananalys: Modell: y i = β 0 + β 1 x i + ε i. Anpassad regressionslinje: ŷ = b 0 + b 1 x. (x i x) (y i ȳ) ( x)2

732G71 STATISTIK B, 8 HP Civilekonomprogrammet, år 2 Tentamen

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS, 5p Ekonomprogrammet, t2, Vt 06 Tentamen

F4 Enkel linjär regression.

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Formelsamling Tillämpad statistik, A5

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

Facit till Extra övningsuppgifter

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Tentamen i Matematisk statistik för V2 den 28 maj 2010

Jag läser kursen på. Halvfart Helfart

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Regressions- och Tidsserieanalys - F3

1. Test av anpassning.

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

a) Beräkna E (W ). (2 p)

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Regressions- och Tidsserieanalys - F7

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Lösningsförslag till tentamen i 732G71 Statistik B,

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

Tentamen Metod C vid Uppsala universitet, , kl

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

TMS136: Dataanalys och statistik Tentamen med lösningar

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Jag läser kursen på. Halvfart Helfart

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

S0005M V18, Föreläsning 10

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

Genomsnittligt sökdjup i binära sökträd

Regressions- och Tidsserieanalys - F5

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Tentamen Metod C vid Uppsala universitet, , kl

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Föreläsning G04: Surveymetodik

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Föreläsning 2: Punktskattningar

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Matematisk statistik TMS063 Tentamen

Efter tentamen För kurser med fler än 60 examinerande meddelas resultatet SENAST 20 arbetsdagar efter examinationen annars 15 arbetsdagar.

θx θ 1 om 0 x 1 f(x) = 0 annars

TENTAMEN I STATISTIK B,

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

2. Konfidensintervall för skillnaden mellan två proportioner.

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Exempel 1 på multipelregression

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

Tillämpad biomekanik, 5 poäng Plan rörelse, kinematik och kinetik

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Tentamen i Elektronik, ESS010, del 2 den 14 dec 2009 klockan 14:00 19:00.

Tentamen 19 mars, 8:00 12:00, Q22, Q26

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00. Kap 2: Sannolikhetsteorins grunder

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Regressions- och Tidsserieanalys - F3

TENTAMEN I MATEMATISK STATISTIK

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Datorövning 2 Fördelningar inom säkerhetsanalys

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

101. och sista termen 1

Avd. Matematisk statistik

Regressions- och Tidsserieanalys - F3

STATISTIK FÖR LÄKARSTUDENTER

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Statistik B Regressions- och tidsserieanalys Föreläsning 1

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

Föreläsning G70 Statistik A

Kvadratisk regression, forts.

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Regressions- och Tidsserieanalys - F4

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

Anteckna ditt svarsblankettsnummer, dvs. det nummer som står i övre högra hörnet på svarsblanketterna.

F15 ENKEL LINJÄR REGRESSION (NCT )

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

Transkript:

LINKÖPINGS UNIVERSITET Istitutioe för dataveteskap Statistik, ANd 732G71 STATISTIK B, 8 HP Civilekoomprogrammet, år 2 Tetame STATISTIK B, 8 HP TENTAMEN FREDAGEN DEN 4 DECEMBER 2009 08.00-12.00 PROVKOD TENT Hjälpmedel: Räkedosa. Lexiko Jourhavade lärare: Aders Nordgaard Poäggräser m m: Skrivige ger maximalt 15 skrivigspoäg. För betyget Godkäd krävs ormalt 9 poäg. För betyget Väl Godkäd krävs ormalt 12 poäg. Formelsamlig och tabeller följer efter uppgiftera, Svarsformulär till uppgiftera 2-5 fis i slutet. Lycka till! Obs! Till uppgift 1 skall fullstädig lösig ilämas. Till uppgiftera 2-5 lämas edast svar på svarsblakett, som fis lägst bak i detta formulär. 1. Nedaståede datamaterial visar resultat få e udersökig gjord blad 10 slumpmässigt valda restaurager i e stad. Till varje restaurag har ställts fråga: Vad är priset på er billigaste varmrätt (huvudrätt) med oxfilé som huvudigredies? För varje restaurag har också mätts avstådet i 100-tals meter till stades defiierade cetrumpukt (e staty på det cetrala torget). Restaurag Pris i kroor (y) Avståd till cetrumpukte i 100-tals meter (x) 1 230 1.85 2 280 3.30 3 315 0.55 4 265 0.70 5 340 2.40 6 270 1.60 7 270 3.10 8 295 1.80 9 310 0.90 10 255 1.50 Ma ställer sig fråga om ma ka förklara priset åtmistoe till e del geom de ekla lijära regressiosmodelle: y = β 0 + β 1 x + ε, där feltermera ε atas vara oberoede och N(0, σ) fördelade. Följade har beräkats: x = 17.7, y = 2830, x 2 = 39.335, y 2 = 810300, x y = 4985.75. 1 v g v

a) Plotta priset mot avståd till cetrumpukte för de 10 restauragera. Age om du tycker det verkar fias ett lijärt sambad och motivera ditt svar. (1p) b) Visa med beräkigar att korrelatioskoefficiete mella pris och avståd blir c:a 0.085. (0.5p) c) Beräka skattigar av parametrara β 0 och β 1, dvs beräka b 0 och b 1. (1p) d) Hur stor del av variatioe i pris förklaras av avståd till cetrumpukte? (0.5p) e) Beräka ett 99% kofidesitervall för det geomsittliga priset på de billigaste huvudrätte med oxfilé som huvudigredies på e restaurag som ligger 100 meter frå cetrumpukte. (1p) f) Beräka e progos och ett 99% progositervall för priset på de billigaste huvudrätte med oxfilé som huvudigredies på e restaurag som ligger 100 meter frå cetrumpukte. (1.5p) g) Age mist tre olika sätt att med residualaalys bedöma om de aväda modelle verkar vara bra. Age för varje sätt vad det är ma bedömer. (Obs! Iga beräkigar eller diagram skall göras) (1.5p) 2. Ett amerikaskt markadsudersökigsföretag har udersökt hur försäljige av receptbelagda läkemedel ka täkas bero av ett atal olika variabler. Studie har gjorts för 20 slumpmässsigt valda apotek uder ett år och de variabler som studerats är: Sales (y) Årsgeomsittet av veckoförsäljige av receptbelagda läkemedel (1000-tals dollar) FloorSp (x 1 ) Butiksyta (kvadratfot) PresPct (x 2 ) Procetadel av butiksyta som aväds till försäljig av receptbelagda läkemedel Parkig (x 3 ) Atalet parkerigsplatser som är avsedda för apotekskuder Icome (x 4 ) Geomsittlig veckoikomst per capita i apotekets upptagigsområde (100-tals dollar) ShopCtr (x 5 ) = 1 om apoteket ligger i ett shoppigcetrum och aars 0. På ästa sida visas hela datamaterialet 2 v g v

Apotek Sales FloorSp PresPct Parkig Icome ShopCtr 1 22 4900 9 40 18 1 2 19 5800 10 50 20 1 3 24 5000 11 55 17 1 4 28 4400 12 30 19 0 5 18 3850 13 42 10 0 6 21 5300 15 20 22 1 7 29 4100 20 25 8 0 8 15 4700 22 60 15 1 9 12 5600 24 45 16 1 10 14 4900 27 82 14 1 11 18 3700 28 56 12 0 12 19 3800 31 38 8 0 13 15 2400 36 35 6 0 14 22 1800 37 28 4 0 15 13 3100 40 43 6 0 16 16 2300 41 20 5 0 17 8 4400 42 46 7 1 18 6 3300 42 15 4 0 19 7 2900 45 30 9 1 20 17 2400 46 16 3 0 Ma prövar e regressiosmodell där variabel Sales (y) förklaras av variablera FloorSp (x 1 ) och PresPct (x 2 ) y = β 0 + β 1 x 1 + β 2 x 2 + ε E cesurerad utskrift frå e aalys med Miitab är följade: Aalys 1 Regressio Aalysis: Sales versus FloorSp; PresPct The regressio equatio is Sales = 48.3-0.00384 FloorSp - 0.582 PresPct Predictor Coef SE Coef Costat 48.291 6.890 FloorSp -0.003842 0.001133 PresPct -0.5819 0.1026 v g v 3

Aalysis of Variace Source DF SS Regressio 2 499.61 Residual Error 17 250.94 Total 19 750.55 Source DF Seq SS FloorSp 1 25.17 PresPct 1 474.45 Predicted Values for New Observatios New Obs Fit SE Fit 95% CI 95% PI 1 15.465 0.914 (13.536; 17.394) (7.133; 23.797) Values of Predictors for New Observatios New Obs FloorSp PresPct 1 4000 30.0 a) Vilket av följade påståede stämmer bäst om aalyse? (i) Förklarigsgrade är c:a 63%. (ii) Det förvätade årsgeomsittet av veckoförsäljige miskar i geomsitt med 58% är procetadele yta som aväds för försäljig av receptbelagda läkemedel ökar med e proceteehet. (iii) Det faktiska årsgeomsittet av veckoförsäljige för ett apotek med 4000 kvadratfots yta och 30% av yta aväd för försäljig av receptbelagda läkemedel ligger med 95% säkerhet mella 13526 och 17394 dollar. (iv) Slumpstadardavvikelse (σ) skattas till ugefär 3840 dollar. (v) Ett apotek med butiksyta 0 kvadratfot säljer receptbelagda läkemedel för i geomsitt 48291 dollar per vecka. (vi) Om butiksyta ökar med 100 kvadratfot så ökar det förvätade årsgeomsittet av veckoförsäljige med c:a 384 dollar. (0.5p) 4 v g v

b) Avgör med ett lämpligt test på 5% ivå om mist e av variablera FloorSp (x 1 ) och PresPct (x 2 ) skall vara med i modelle. Svara med teststorhetes värde och om testet är sigifikat eller ej. (1p) c) Beräka ett 99% progositervall för årsgeomsittet av veckoförsäljige hos ett apotek med 4000 kvadratfots yta och 30% av yta aväd för försäljig av receptbelagda läkemedel. (1p) E aa aalys är följade: Aalys 2 Regressio Aalysis: Sales versus PresPct; ShopCtr; PresPct*ShopCtr The regressio equatio is Sales = 29.8-0.368 PresPct - 4.22 ShopCtr - 0.064 PresPct*ShopCtr Predictor Coef SE Coef Costat 29.846 3.613 PresPct -0.3679 0.1081 ShopCtr -4.223 4.560 PresPct*ShopCtr -0.0643 0.1520 Aalysis of Variace Source DF SS Regressio 3 488.58 Residual Error 16 261.97 Total 19 750.55 Source DF Seq SS PresPct 1 329.74 ShopCtr 1 155.91 PresPct*ShopCtr 1 2.93 där ma har skapat de ya variable PresPct*ShopCtr (x 6 ) som alltså är produkte av variablera x 2 och x 5. d) De modell som ligger till grud för dea aalys ka tolkas som två olika ekla regressioslijer för sambadet mella Sales och PresPct, de ea för apotek som ligger i ett shoppigcetrum och de adra för apotek som ite gör det. Vilka är de skattade lutigskoefficietera för dessa två lijer? (1p) e) Testa på 5% ivå om de två lijera i deluppgift d) sammafaller. Svara med teststorhetes värde samt om lijera sammafaller eller ej. (1p) 5 v g v

Ytterligare e aalys görs eligt: Aalys 3 MTB > breg c2 c3-c7 Best Subsets Regressio: Sales versus FloorSp; PresPct;... Respose is Sales F P P S l r a I h o e r o o s k c p r P i o C Mallows S c m t Vars R-Sq R-Sq(adj) Cp S p t g e r 1 43.9 40.8 10.2 4.8351 X 1 14.8 10.1 23.8 5.9604 X 2 66.6 62.6 1.6 3.8420 X X 2 64.7 60.6 2.5 3.9474 X X 3 69.1 63.3 2.4 3.8089 X X X 3 67.9 61.9 3.0 3.8778 X X X 4 69.9 61.8 4.1 3.8825 X X X X 4 69.3 61.1 4.3 3.9176 X X X X 5 70.0 59.3 6.0 4.0099 X X X X X f) Vilket av följade påståede stämmer bäst om dea aalys? (i) De höga iledade värdea på måttet C p tyder på allvarliga problem med multikolijäritet. (ii) De bästa modelle är de med samtliga förklarigsvariabler då de har högst förklarigsgrad. (iii) Orsake till att variabel Parkig ite kommer med i ågo modell med två variabler är att de är de variabel som har högst korrelatio med var och e av övriga förklarigsvariabler. (iv) Om måttet C p aväds för att välja bästa modell skall modelle med FloorSp och PresPct väljas. (v) Om justerad förklarigsgrad aväds för att välja bästa modell skall modelle med samtliga förklarigsvariabler väljas. (vi) Aalyse ka ite avädas för att välja e bästa modell eftersom måttet C p talar för e modell med färre förklarigsvariabler ä vad måttet R 2 adj gör. (0.5p) 6 v g v

3. För att udersöka prisutvecklige på sabbmat i Hammarhytta har ma studerat priser och försäljig hos ortes två grillkiosker: Fikokvists korv och Rävluds hamburgeri. Nedaståede tabell sammafattar vad ma kommit fram till (alla priser är exklusive moms). År Fikokvists korv Rävluds hamburgeri Pris Grillad med Total försäljig Pris 150- Total försäljig mos (kr) (Mkr) grammare med (Mkr) strips (kr) 2006 30 0.41 36 0.38 2007 31 0.40 36 0.37 2008 31 0.39 38 0.40 Aväd data för att på lämpligt sätt beräka ett sammasatt kedjeprisidex av Laspeyretyp för sabbmat i Hammarhytta. Låt basåret vara 2006 och age idexets värde för åre 2006, 2007 och 2008. (1p) 4. I Figur 1 eda visas dagskurser för rätefode Absolutavkastig Plus i Roburs fodutbud. Figur 1: Kurs Absolutavkastig Plus 2004-10-01 2009-10-30 (Källa: Robur) För att udersöka tillväxte hos fode görs följade aalys i Miitab, där lg(kurs) står för 10-logaritme av kurse. 7 v g v

Regressio Aalysis: lg(kurs) versus Dag The regressio equatio is lg(kurs) = 0.664 + 0.000035 Dag Predictor Coef SE Coef T P Costat 0.664008 0.008037 82.62 0.000 Dag 0.00003475 0.00000021 169.46 0.000 S = 0.00473350 R-Sq = 93.9% R-Sq(adj) = 93.9% Aalysis of Variace Source DF SS MS F P Regressio 1 0.64345 0.64345 28717.59 0.000 Residual Error 1854 0.04154 0.00002 Total 1855 0.68499 Uppskatta med hjälp av aalyse de geomsittliga tillväxte per år hos fode uder periode 2004-10-01 2009-10-30. (1p) 5. I Figur 2 visas atalet flygkilometer per måad med sloveskt flyg uder periode jauari 1998 - september 2009. Figur 2: Atalet flygkilometer med sloveska pla ja 1998 sep 2009 8 v g v

a) Vilket av följade påståede stämmer ite för tidsserie i figure? (i) Tidsserie är ite statioär. (ii) Säsogsvariatioe verkar multiplikativt på ivå hos serie. (iii) Effekter av 11 september ka ses i tidsserie. (iv) Progoser för serie ka ite göras p.g.a. de tydliga cykliska variatioe. (v) Lämplig progosmetod för serie ka vara Witer s metod. (vi) Om tidsserieregressio aväds för att modellera serie skall (högst) 11 säsogsidikatorer (säsogdummies) avädas. Figur 3 eda är frå e aalys med Miitab av tidsserie. (0.5p) Figur 3: Aalys av atalet flygkilometer b) Vilket av följade påståede stämmer bäst om aalyse? (i) Aalyse har gjorts med e additiv modell för kompoetuppdelig. (ii) Aalyse har gjorts med Witers additiva metod. (iii) Aalyse har gjorts med e autoregressiv modell av ordig 2. (iv) Säsogresade data visar på e expoetiellt avtagade tred. (v) Aalyse har ite tagit häsy till cyklisk variatio i tidsserie. (vi) Tred- och säsogresade data visar ite på förekomst av ågo cyklisk kompoet. (0.5p) 9

10

Ekel lijär regressiosaalys: Modell: y i = β 0 + β 1 x i + ε i (= α + β x i + ε i ) där ε N(0, σ). Apassad regressioslije: Formelsamlig 2009-12-01 ŷ = b 0 + b 1 x (= a + b x i ) där (xi x) (y b 1 (= b) = i ȳ) xi y (xi x) 2 = i x ȳ x 2 i ( x) 2 = = xi y i ( x i) ( y i) x 2 i ( x i) 2 b 0 (= a) = ȳ b 1 x Kvadratsummor: = x i y i ( x i ) ( y i ) x 2 i ( x i ) 2 Total: SST = SS yy = ( 1) s 2 y = (y i ȳ) 2 = y 2 i (ȳ)2 = y 2 i ( y i) 2 SS xx = ( 1) s 2 x = (x i x) 2 = x 2 i ( x)2 = x 2 i ( x i) 2 SS xy = (x i x) (y i ȳ) = x i y i ( x) (ȳ) = x i y i ( x i) ( y i) Residual: SSE = (y i ŷ i ) 2 = SS yy b 1 SS xy = (y i ȳ) 2 b 1 (x i x) (y i ȳ) = yi 2 b 0 y i b 1 x i y i Regressio: SSR = (ŷ i ȳ) 2 = SST SSE Variasskattig σ 2 = s 2 = s 2 e = MSE = SSE 2 = (yi ŷ i ) 2 2 s = s e = (yi MSE = SSE 2 = ŷ i ) 2 2 Förklarigsgrad: r 2 = SSR SST = (ŷi ȳ) 2 (yi ȳ) 2 = 1 SSE SST Korrelatioskoefficiet: (xi x) (y r = i ȳ) (xi x) 2 (y i ȳ) = xi y i x ȳ 2 ( x 2 i ( x) 2 ) ( yi 2 (ȳ)2 ) = = xi y i ( x i) ( y i) ( x 2 i ( x i) 2 ) ( yi 2 ( y i) 2 ) Kofidesitervall, progositervall och hypotesprövig Stickprovsfördeligar: ( ) b 1 N β 1, σ (xi x) 2 b 0 N ( 1 β 0, σ b 0 + b 1 x 0 N + ) ( x)2 (xi x) 2 ( β 0 + β 1 x 0, σ = ) 1 + (x0 x)2 (xi x) 2 x i y i ( x i ) ( y i ) ( x 2 i ( x i ) 2 ) ( y 2 i ( y i ) 2 ) I

Kofidesitervall för β 1 : ( b 1 ± t [α/2] ( 2) s (xi x) 2 = x 2 (xi x) 2 i ( x)2 = ) x 2 i ( x i) 2 Kofidesitervall för β 0 : b 0 ± t [α/2] ( 2) s ( 1 + ) ( (xi ( x)2 (xi x) x) 2 = x 2 2 i ( x)2 = x 2 i ( x i) 2 Kofidesitervall för µ y x0 = β 0 + β 1 x 0 : ( ) ( 1 b 0 + b 1 x 0 ± t [α/2] ( 2) s + (xi (x0 x)2 (xi x) x) 2 = x 2 2 i ( x)2 = ) x 2 i ( x i) 2 Progositervall för y 0 = β 0 + β 1 x 0 + ε 0 : ( ) ( b 0 + b 1 x 0 ± t [α/2] ( 2) s 1 + 1 + (xi (x0 x)2 (xi x) x) 2 = x 2 2 i ( x)2 = ) x 2 i ( x i) 2 Formellt t-test av H 0 : β 0 = 0: Testfuktio: t = b 0 s b0 = Jämför med ±t [α/2] ( 2) b 0 s ( 1 + ) ( x)2 (xi x) 2 Formellt t-test av H 0 : β 1 = 0 dvs iget sambad mella y och x: Testfuktio: t = b 1 s b1 = Jämför med ±t [α/2] ( 2) ( (xi x) 2 = x 2 i ( x)2 = ) x 2 i ( x i) 2 b 1s (xi x) 2 ( (xi x) 2 = x 2 i ( x)2 = x 2 i ( Formellt t-test av H 0 : β 1 = B (där B är ågot aat ä 0): Testfuktio: t = b 1 B s b1 = b ( 1 B (xi s x) 2 = x 2 i ( x)2 = x 2 i ( (xi x) 2 Jämför med ±t [α/2] ( 2) xi) 2 ) xi) 2 Vid ekelsidiga mothypotseser jämförs t med t [α] ( 2) (eller med -t [α] ( 2) beroede på mothypoteses riktig). Formellt F -test av H 0 : β 1 = 0: Testfuktio: F = MSE MSR = SSR/1 SSE/( 2) Jämför med F [α] (1, 2) Multipel lijär regressiosaalys: Modell: y i = β 0 + β 1 x i1 + β 2 x i2 +... + β k x ik + ε i där ε i N(0, σ). Apassad modell: ŷ = b 0 + b 1 x 1 + b 2 x 2 +... b k x k ) ) II

Kvadratsummor: SST =SSE +SSR Total: SST = ( 1) s 2 y = (y i ȳ) 2 = y 2 i (ȳ)2 = y 2 i ( y i) 2 Residual: SSE = (y i ŷ i ) 2 Regressio: SSR = (ŷ i ȳ) 2 = SST SSE SSE har k 1 frihetsgrader, SSR har k frihetsgrader. Variasskattig: σ 2 = s 2 = s 2 e = MSE = Förklarigsgrad: R 2 = SST SSR = 1 SST SSE Justerad förklarigsgrad: R 2 adj = R2 = 1 SSE k 1 SSE/( k 1) SST /( 1) = 1 Kofidesitervall och hypotesprövig Stickprovsfördeligar: b j N(β j, σ bj ) Formellt F -test av H 0 : β 1 = β 2 =... = β k = 0: Testfuktio: F = MSE MSR = SSR/k SSE/( k 1 ) Jämför med F [α] (k, k 1) Kofidesitervall för β j : b j ± t [α/2] ( k 1) s bj där s bj hämtas frå datorutskrift. Formellt t-test av H 0 : β j = 0: Testfuktio: t = b j s bj Jämför med t [α/2] ( k 1) Kofidesitervall för µ y x01,...,x 0k : ŷ 0 ± t [α/2] ( k 1) s Distace value (yi ŷ i ) 2 /( k 1) (yi ȳ i ) 2 /( 1) = 1 s2 e s 2 y där s = MSE och Distace value (eller s Distace value) bestäms frå datorutskrift. Progositervall för y 0 : ŷ 0 ± t [α/2] ( k 1) s 1 + Distace value där s = MSE och Distace value (eller s 1 + Distace value) bestäms frå datorutskrift. III

Partiellt F -test av H 0 : β g+1 =... = β k = 0: Testfuktio: F = (SSE R SSE C )/(k g) = (SSR C SSR R )/(k g) SSE C /( k 1) SSE C /( k 1 ) där SSE R =Residualkvadratsumma i de midre (reducerade) modelle, SSE C =Residualkvadratsumma i de större (kompletta) modelle, SSR R =Regressioskvadratsumma i de midre (reducerade) modelle, SSR C =Regressioskvadratsumma i de större (kompletta) modelle, och k g=skillade i atal förklarigsvariabler mella modellera. Jämför med F [α] (k g, k 1). (R Alterativ formel: F = UR 2 R2 R )/r (1 RUR 2 )/( k 1) där RUR 2 =Förklarigsgrade i de större (kompletta, urestricted ) modelle och R2 R =Förklarigsgrade i de midre (reducerade, restricted ) modelle och r = k g Jämför med F [α] (r, k 1) = F [α] (k g, k 1). Variace Iflatio Factor (VIF): VIF = 1 1 R 2 j där R 2 j =Förklarigsgrade i modell där x j är y-variabel och övriga x-variabler är förklarigsvariabler. Sekvetiella kvadratsummor: SSR = SSR(x 1 ) + SSR(x 2 x 1 ) +... + SSR(x k x 1,..., x k 1 ) där SSR(x j x 1,..., x j 1 ) är tillskottet till SSR då variabel x j läggs till e modell med variablera x 1, x 2,..., x j 1. Ett partiellt F -test av H 0 : β g+1 =... = β k = 0 ka då göras med testfuktioe F = (SSR(x g+1 x 1,..., x g ) + SSR(x g+2 x 1,..., x g+1 ) +... + SSR(x k x 1,..., x k 1 )) /(k g) MSE, Jämför med F [α] (k g, k 1) förutsatt att variablera matas i i ordige x 1, x 2,..., x k i modelle. Expoetiella sambad och elasticitetsmodeller: Logaritmbeteckigar: lg x betyder 10-logaritme av x, log x står för logaritm och ma ka välja om ma vill aväda lg x eller l x (de aturliga logaritme). Samma sorts logaritm måste avädas geomgåede i e och samma aalys. Expoetiell modell: y = β 0 (β 1 ) x δ där log δ N(0, σ) log y = log β 0 + (log β 1 ) x + log δ Apassad modell: ŷ = b 0 (b 1 ) x där (xi x) (log y log b 1 = i log y) xi log y (xi x) 2 = i x log y x 2 i ( x) 2 = = xi log y i ( x i) ( log y i) x 2 i ( x i) 2 och log b 0 = log y (log b 1 ) x Kvadratsummor, variasskattig och test: [ ] log y = 1 log yi SST = (log y i log y) 2 = (log y i ) 2 (log y) 2 SSE = SST (log b 1 ) (x i x) (log y i log y) = SST (log b 1 ) ( x i log y i x log y) = (log yi ) 2 (log b 0 ) log y i (log b 1 ) x i log y i IV

σ 2 = SSE 2 Test av H 0 : β 1 = 1 dvs iget sambad mella y och x log β 1 = 0: log b Testfuktio t = 1, jämför med t [α/2] ( 2) SSE/( 2) (xi x) 2 Elasticitetsmodeller: Formler eligt AJÅ: x 1 =Pris, x 2 =Ikomst Modeller: ŷ = a x e 1, ŷ = a x E 2, ŷ = a x e 1 x E 2 e =priselasticitet, E =ikomstelasticitet Apassig av t.ex. ŷ = a x e 1: lg ŷ = a + e lg x 1, a = lg a e = (lg y) (lg x 1 ) ( lg y) ( lg x 1 ) (lg x 1 ) 2 ( lg x 1 ) 2 SST = (lg y lg y) 2 = (lg y) 2 ( lg y) 2 SSE = SST e (lg x 1 lg x) (lg y lg y) = (lg y) 2 a lg y e (lg x 1 ) (lg y) σ 2 = SSE [ 2 lg x = 1 lg xi och lg y = 1 ] lg yi Test av H 0 : priselasticitete = B där B är ett ifrågasatt värde på priselasticitete: Testfuktio t = e B SSE/( 2), jämför med t [α/2] ( 2) och vid ekelsidig mothypotes med t ( 2) [α] eller (lg x1 lg x 1) 2 t ( 2) [α]. Formler eligt Mikroekoomi, Fö-ateckigar och datorövigar: Q = C (P ) EP δ, Q = α (I) EI δ Q = C (P ) EP (I) EI δ log Q = log C + E P log P + log δ log Q = log C + E I log I + log δ log Q = log C + E P log P + E I log I + log δ där log δ N(0, σ) Exempel på apassad modell: Q = c (P ) Ê P, där ÊP = (log Pi log P ) (log Q i log Q) (log Pi log P ) 2 = (log Pi ) (log Q = i ) log P log Q (log Pi ) 2 (log P ) 2 och [ log c = log Q ÊP log P log P = 1 log Pi och log Q = 1 ] log Qi Kvadratsummor, variasskattig och test: SST = (log Q i log Q) 2 = (log Q i ) 2 (log Q) 2 SSE = SST ÊP (log P i log P ) (log Q i log Q) = SST ÊP [ (log P i ) (log Q i ) log P log Q ] = = (log Q i ) 2 (log c) log Q i ÊP (log P i ) (log Q i ) σ 2 = SSE 2 V

Test av H 0 : E P = B där B är ett ifrågasatt värde på E P : Testfuktio t = Ê P B SSE/( 2), jämför med t [α/2] ( 2) och vid ekelsidig mothypotes med t ( 2) [α] eller (log Pi log P ) 2 t ( 2) [α]. Idex Sammasatta fastbasidex: I t = i 1,t w 1 + i 2,t w 2 +... + i,t w där är atalet igåede varor/tjäster, i 1,t,..., i,t är ekla prisidex för igåede varor, alla med basår t 0 och w 1,..., w väljs eligt ett viktsystem: Laspeyre: w i = Paasche: w i = Kedjeprisidex: p i,t 0 q i,t0 j p j,t 0 q j,t0 p i,t 0 q i,t j p j,t 0 q j,t I t = L 0,1 L 1,2... L t 1,t 100 där L t 1,t = i=1 p i,t p i,t 1 w i,t 1,t är årsläke frå år t 1 till t för igåede varor/tjäster. w i,t 1,t väljs eligt ett viktsystem: Laspeyre: wi,t 1,t L Försäljigsvärdet för vara i år t 1 = Totala försäljigsvärdet år t 1 Paasche: wi,t 1,t P Försäljigsvärdet för vara i år t i priser för år t 1 = Totala försäljigsvärdet år t i priser för år t 1 Med represetatvaror byts Försäljigsvärdet för vara i mot Försäljigsvärdet för varugrupp i i viktera. Implicitprisidex: I t = Försäljigsvärdet av vara/tjäste/gruppe år t i löpade priser Försäljigsvärdet av vara/tjäste/gruppe år t i basårets priser 100 Relativprisidex: It R = Iv t It 0 100 där It v =Prisidex för aktuell vara/tjäst/grupp och It 0 =Prisidex för de större jämförelsegruppe, t ex KPI. VI

Tidsserieaalys Tidsserieregressio: Modell: y t = TR t + SN t + ε t där TR t = β 0 + β 1 t eller TR t = β 0 + β 1 t + β 2 t 2 och SN t = L 1 i=1 β si x si,t med L =Atal säsoger och x si,t = 1 om t tillhör säsog i och = 0 aars. Durbi-Watso s test: Test av H 0 : Residualera är okorrelerade. Testfuktio d = t=2 (e t e t 1 ) 2 t=1 e2 t där e t = y t ŷ t. Jämförelser: Om d < 1 Förkasta H 0, positiv seriell korrelatio Om d > 3 Förkasta H 0, positiv seriell korrelatio Om 1 d 3 H 0 ka ej förkastas. Kompoetuppdelig: Modeller: Multiplikativ modell: y t = TR t SN t CL t IR t Additiv modell: y t = TR t + SN t + CL t + IR t Ekel expoetiell utjämig: Modell: y t = µ + ε t Uppdaterigsschema för skattig av µ : S t = α y t + (1 α) S t 1 0 < α < 1 Progos: ŷ t+τ = S t Progositervall: S t ± z s 1 + α 2 där z =1.96 för 95% itervall, 2.576 för 99% itervall och s = 1 1 t=1 (y t ȳ) 2 VII

VIII

LINKÖPINGS UNIVERSTET Istitutioe för dataveteskap Statistik, ANd 732G71 STATISTIK B, 8 hp Civilekoomprogrammet, år 2 Tetame, svarsblakett 732G71 PROVKOD STATISTIK B TENT SVARSBLANKETT AID: Markera ditt svarsalterativ geom att riga i det. Edast ett svarsalterativ per deluppgift får markeras. Kotrollera att du har markerat i alla deluppgifter du har besvarat! Uppgift 2 (a) (i) (ii) (iii) (iv) (v) (vi) (b) 1 Teststorhetes värde är 16.9. Testet är sigifikat! 2 Teststorhetes värde är 1.99. Testet är ite sigifikat! 3 Teststorhetes värde är 1.99. Testet är sigifikat! 4 Teststorhetes värde är 0.45. Testet är ite sigifikat! 5 Teststorhetes värde är 32.1. Testet är ite sigifikat! 6 Teststorhetes värde är 32.1. Testet är sigifikat! (c) 1 (7, 24) 2 (14, 17) 3 (4, 27) 4 (13, 18) 5 ( 10, 40) 6 (6, 26) (d) 1 Apotek i shoppigcetrum: 0.0643; Apotek ej i shoppigcetrum: 0.3679 2 Apotek i shoppigcetrum: 0.4322; Apotek ej i shoppigcetrum: 25.623 3 Apotek i shoppigcetrum: 0.4322; Apotek ej i shoppigcetrum: 0.3679 4 Apotek i shoppigcetrum: 4.5906; Apotek ej i shoppigcetrum: 0.0643 5 Apotek i shoppigcetrum: 0.3679; Apotek ej i shoppigcetrum: 0.4322 6 Apotek i shoppigcetrum: 0.3679; Apotek ej i shoppigcetrum: 0.3679 v g v i

(e) 1 Teststorhetes värde är 0.42. Lijera sammafaller! 2 Teststorhetes värde är 0.42. Lijera sammafaller ej! 3 Teststorhetes värde är 9.95. Lijera sammafaller! 4 Teststorhetes värde är 0.93. Lijera sammafaller ej! 5 Teststorhetes värde är 4.85. Lijera sammafaller! 6 Teststorhetes värde är 4.85. Lijera sammafaller ej! (f) (i) (ii) (iii) (iv) (v) (vi) Uppgift 3 1 100.0, 101.7, 102.7 2 100.0, 101.7, 104.4 3 100.0, 101.7, 100.9 4 95.7, 97.4, 100.0 5 100.0, 101.7, 102.8 6 98.6, 101.7, 102.7 Uppgift 4 1 0.0080% 2 4.45% 3 1.27% 4 2.96% 5 1.03% 6 3.15% Uppgift 5 (a) (i) (ii) (iii) (iv) (v) (vi) (b) (i) (ii) (iii) (iv) (v) (vi) ii