732G71 STATISTIK B, 8 HP Civilekonomprogrammet, år 2 Tentamen

Relevanta dokument
Formelsamling. Enkel linjär regressionsananalys: Modell: y i = β 0 + β 1 x i + ε i. Anpassad regressionslinje: ŷ = b 0 + b 1 x. (x i x) (y i ȳ) ( x)2

STATISTIK B, 8 HP TENTAMEN FREDAGEN DEN 4 DECEMBER

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS, 5p Ekonomprogrammet, t2, Vt 06 Tentamen

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Facit till Extra övningsuppgifter

Formelsamling Tillämpad statistik, A5

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Jag läser kursen på. Halvfart Helfart

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Tentamen i Matematisk statistik för V2 den 28 maj 2010

a) Beräkna E (W ). (2 p)

Efter tentamen För kurser med fler än 60 examinerande meddelas resultatet SENAST 20 arbetsdagar efter examinationen annars 15 arbetsdagar.

S0005M V18, Föreläsning 10

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

2. Konfidensintervall för skillnaden mellan två proportioner.

F4 Enkel linjär regression.

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

1. Test av anpassning.

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Föreläsning G04: Surveymetodik

Tentamen i Elektronik, ESS010, del 2 den 14 dec 2009 klockan 14:00 19:00.

Genomsnittligt sökdjup i binära sökträd

Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Jag läser kursen på. Halvfart Helfart

TMS136: Dataanalys och statistik Tentamen med lösningar

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Tentamen Metod C vid Uppsala universitet, , kl

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Datorövning 2 Fördelningar inom säkerhetsanalys

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Tentamen Metod C vid Uppsala universitet, , kl

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Regressions- och Tidsserieanalys - F1

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Matematisk statistik TMS063 Tentamen

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Tentamen i matematisk statistik

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

Datorövning 2 Fördelningar inom säkerhetsanalys

Regressions- och Tidsserieanalys - F1

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

Föreläsning G70 Statistik A

θx θ 1 om 0 x 1 f(x) = 0 annars

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Regressions- och Tidsserieanalys - F7

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Föreläsning 2: Punktskattningar

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

Tentamenskrivning, , kl SF1625, Envariabelanalys för CINTE1(IT) och CMIEL1(ME ) (7,5hp)

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

Induktion LCB Rekursion och induktion; enkla fall. Ersätter Grimaldi 4.1

Regressions- och Tidsserieanalys - F3

Digital signalbehandling Fönsterfunktioner

Tentamen 19 mars, 8:00 12:00, Q22, Q26

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Avd. Matematisk statistik

Föreläsning G70 Statistik A

Regressions- och Tidsserieanalys - F5

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Skrivning i ekonometri lördagen den 25 augusti 2007

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Introduktion till statistik för statsvetare

Konsoliderad version av. Styrelsens för ackreditering och teknisk kontroll föreskrifter (STAFS 1993:18) om EEG-märkning av färdigförpackade varor

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

Biostatistik II - Hypotesprövning i teori och praktik. Frida Eek

Tentamen i matematisk statistik, Statistisk Kvalitetsstyrning, MSN320/TMS070 Lördag , klockan Lärare: Jan Rohlén

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

Lösningsförslag till tentamen i 732G71 Statistik B,

Transkript:

LINKÖPINGS UNIVERSITET Istitutioe för dataveteskap Statistik, ANd 732G71 STATISTIK B, 8 HP Civilekoomprogrammet, år 2 Tetame STATISTIK B, 8 HP TENTAMEN LÖRDAGEN DEN 31 JANUARI 2009 08.00-12.00 PROVKOD TENT Hjälpmedel: Räkedosa. Lexiko Jourhavade lärare: Aders Nordgaard Poäggräser m m: Skrivige ger maximalt 15 skrivigspoäg. För betyget Godkäd krävs ormalt 9 poäg. För betyget Väl Godkäd krävs ormalt 12 poäg. Formelsamlig och tabeller följer efter uppgiftera, Svarsformulär till uppgiftera 2-5 fis i slutet. Lycka till! Obs! Till uppgift 1 skall fullstädig lösig ilämas. Till uppgiftera 2-5 lämas edast svar på svarsblakett, som fis lägst bak i detta formulär. 1. Nedaståede tabell visar FoU-itäktera för de tio största lärosätea i Sverige år 2005 och år 2007 (Källa: SCB). Ehete är miljarder kroor uttryckta i 2007 års prisivå. Lärosäte FoU-itäkt 2005 (x) FoU-itäkt 2007 (y) Luds uiversitet 2.930 3.000 Karoliska istitutet 2.840 2.990 Uppsala uiversitet 2.480 2.570 Göteborgs uiversitet 2.220 2.270 Stockholms uiversitet 1.510 1.620 Sveriges latbruksuiversitet 1.540 1.580 Kugliga tekiska högskola 1.510 1.550 Umeå uiversitet 1.460 1.480 Chalmers tekiska högskola 1.210 1.240 Liköpigs uiversitet 1.100 1.100 Vi vill udersöka om det fis ett geerellt lijärt sambad mella FoU-itäkte 2007 (y) och FoU-itäkte 2005 (x). E ekel lijär regressiosmodell skall därför apassas eligt y = β 0 + β 1 x + ε. För detta har följade beräkats: x = 18.8, y = 19.4, x 2 = 39.4668, y 2 = 42.1592, x y = 40.7857 v g v 1

a) Beräka skattigar av parametrara β 0 och β 1, dvs beräka b 0 och b 1. (1p) b) Avgör med hjälp av ett 95%-igt kofidesitervall om sigifikat regressio föreligger. Glöm ite slutsatse. (1.5p) c) Beräka och tolka värdet hos förklarigsgrade hos de skattade modelle (1p) d) Vad blir de förvätade FoU-itäktera (µ y x) 2007 för ett lärosäte som år 2005 har FoU-itäktera 1500 miljoer kroor? Beräka också ett 99% kofidesitervall för dessa förvätade itäkter. (1.5p) e) Vad blir de förvätade förädrige (i %) i FoU-itäkter mella 2005 och 2007 för ett lärosäte som år 2005 har FoU-itäktera 1500 miljoer kroor? Beräka också ett 99% kofidesitervall för dea förvätade förädrig. (1p). 2. Vi skall i dea uppgift aväda ett datamaterial omfattade 50 företag. I detta material fis ett atal variabler som var och e ges e kortfattad förklarig eda: sales (y) adv (x 1 ) empl (x 2 ) TV (x 3 ) area (x 4 ) exp (x 5 ) Försäljigsökig seda föregåede år Faktiska reklamkostader ievarade år Atalet aställda som arbetar mist 50% med reklam E variabel som är 1 om företaget aväder TV-reklam och 0 aars Brasch för företaget (0=Dagligvarubrasche, 1=IT-brasche, 2=Nöjesbrasche) Atal år som företaget fuits Neda visas ett utdrag ur datamaterialet för att illustrera vilka värde variablera (ugefär atar) företag sales adv empl TV area exp 1 524 198 11 1 1 9 2 522 203 17 0 0 4 3 517 190 11 1 1 6 4 679 186 13 1 0 3 5 496 210 15 1 1 8 6 553 192 16 1 1 9 7 532 205 15 0 0 5 8 331 181 20 0 1 11.............. 50 735 199 11 1 0 2 Frå variabel area (x 4 ) kostrueras tre ya variabler: area 0 som är 1 om brasche är dagligvaru och 0 aars area 1 som är 1 om brasche är IT och 0 aars area 2 som är 1 om brasche är öje och 0 aars 2 v g v

a) Vilket av följade påståede är korrekt? (i) De optimala multipla regressiosmodelle är alltid de som iehåller alla tillgägliga förklarigsvariabler, dvs. variablera x 1 t.o.m. x 5 ova. (ii) För att udersöka ev. samspel (iteraktio) i effekt på försäljigsökige mella det atal år som företaget fuits och vilke brasch företaget tillhör skall varibel x 4 x 5 bildas och avädas i e regressiosmodell. (iii) Det går ite att aväda variablera area 0, area 1 och area 2 samtidigt i e regressiosmodell. (iv) Förklarigsgrade i e regressiosmodell påverkas bara av de förklarigsvariabler som mäts på itervallskala, dvs. som x 1, x 2 och x 5 ova. (v) Korrelatioskoefficiete mella två s.k. dummy-varabler blir alltid 0 eller 1. (0.5p) Ma prövar e regressiosmodell där variabel sales förklaras av variablera adv och exp, samt de kostruerade variablera adv sq som är = (adv) 2, exp sq som är (exp) 2 och adv*exp som är produkte av adv och exp. Modelle blir y = β 0 + β 1 x 1 + β 5 x 5 + β 11 x 2 1 + β 55 x 2 5 + β 15 x 1 x 5 + ε där förstås x 1 =adv och x 5 =exp. E cesurerad utskrift frå e aalys med Miitab är följade: Aalys 1 Regressio Aalysis: sales versus adv; exp; exp_sq; adv_sq; adv*exp The regressio equatio is sales = 2446-16.49 adv - 57.38 exp + 2.81 exp_sq + 0.04113 adv_sq + 0.0068 adv*exp Predictor Coef SE Coef Costat 2446 1150 adv -16.49 12.12 exp -57.38 84.18 exp_sq 2.810 2.136 adv_sq 0.04113 0.03297 adv*exp 0.0068 0.3826 Aalysis of Variace Source DF SS Regressio 5 249612 Residual Error 44 443244 Total 49 692856 3 v g v

b) Avgör med ett lämpligt test på 5% ivå om mist e av de fem förklarigsvariablera skall vara med. Svara med teststorhetes värde och om testet är sigifikat eller ej. (1p) c) Beräka de apassade modelles justerade förklarigsgrad (Radj 2 ) och skattade stadardavvikelse (s). (1p) d) Geomför lämpliga test, vardera på 5% ivå av hypotesera H 01 : β 1 = 0 och H 02 : β 5 = 0 där mothypotesera i bägge falle är 0. Svara med teststorhetera och huruvida respektive test är sigifikat eller ej. (1p) e) Utgåede frå de skattade modelle, vad blir de geomsittliga förädrige av sales om reklamkostadera (adv) skulle öka frå 200 till 201 eheter (dvs. med e ehet) i ett företag som fuits fem år brasche? (0.5p) Ma gör vidare följade aalys med Miitab: Aalys 2 Regressio Aalysis: sales versus adv; exp; adv*exp The regressio equatio is sales = 909-0.89 adv - 31.3 exp + 0.036 adv*exp Predictor Coef SE Coef Costat 909.1 412.4 adv -0.887 2.100 exp -31.28 69.93 adv*exp 0.0363 0.3570 Aalysis of Variace Source DF SS Regressio 3 217328 Residual Error 46 475528 Total 49 692856 f) Avgör med ett lämpligt test på 1% ivå om modelle i Aalys 1 är bättre ä modelle i Aalys 2, dvs. om mist e av variablera adv sq och exp sq bör fias med. Svara med teststorhetes värde och om testet är sigifikat eller ej. (0.5p) 4 v g v

Ytterligare e aalys görs med följade utskrift Aalys 3 Stepwise Regressio: sales versus adv; empl;... Forward selectio. Alpha-to-Eter: 0.05 Respose is sales o 11 predictors, with N = 50 Step 1 2 3 4 5 Costat 485.7 623.3 643.0 715.1 566.8 TV 158 164 152 138 150 T-Value 5.24 7.72 9.66 10.12 12.91 P-Value 0.000 0.000 0.000 0.000 0.000 exp -25.0-20.0-19.5-19.3 T-Value -7.10-7.35-8.55-10.17 P-Value 0.000 0.000 0.000 0.000 area_1-95 -160-159 T-Value -6.37-8.34-9.97 P-Value 0.000 0.000 0.000 area_0-83 -82 T-Value -4.48-5.29 P-Value 0.000 0.000 empl 8.8 T-Value 4.61 P-Value 0.000 S 95.8 67.3 49.6 41.7 34.6 R-Sq 36.36 69.28 83.67 88.72 92.39 R-Sq(adj) 35.03 67.97 82.61 87.71 91.52 More? (Yes, No, Subcommad, or Help) SUBC> Yes No variables etered or removed g) Vilke av variablera TV, exp, area 0, area 1 och empl har högst korrelatio med sales? (0.5p) 5 v g v

h) Vilket av följade påståede stämmer om aalyse? (i) Aalyse är e stegvis regressio eligt bakåtelimierigspricipe. (ii) Om variabel area 2 läggs till modelle där sales förklaras av TV, exp, area 0, area 1 och empl, så blir förklargsgrade 100%. (iii) Blad de förklarigsvariabler som aväts för att söka efter de bästa modelle i aalyse, ka ige ytterligare sigifikat variabel läggas till modelle där sales förklaras av TV, exp, area 0, area 1 och empl. (iv) Modelle där sales förklaras av TV, exp, area 0, area 1 och empl är slutlig modell därför att de har högst förklarigsgrad, (v) Modelle där sales förklaras av TV, exp, area 0, area 1 och empl är slutlig modell därför att de har högst justerad förklarigsgrad, (0.5p) 3. Atag att ett företag tillhadahåller två tjäster, som faktureras på timbasis. År 2006 fakturerade ma för de ea tjäste 900 kroor per timme och för de adra tjäste 1200 kroor per timme. Timkostadera har seda för de bägge tjästera ökat med 10% per år. Fördelige mella försäljigsvärde för de två tjästera har för de seaste tre åre varit 50%/50%, 60%/40% resp. 75%/25%. Beräka ett kedjeidex av Laspeyre-typ för företagets timkostader med basår 2006. Age idexvärdea för åre 2006, 2007 och 2008. (1p) 4. Ett detaljistföretag har uder e lägre tid studerat försäljigsutvecklige i e av sia varugrupper och oterat hur efterfrågad volym har påverkats av prisförädrigara. Geom att beräka relativprisidex (med KPI som deflator) för företagets priser har följade Miitab-aalys gjorts av data uder åre 2002-2007 (logaritmer i aalyse är 10-logaritmer): Regressio Aalysis: log(volym) versus log(rpi) The regressio equatio is log(volym) = 4.75-1.15 log(rpi) Predictor Coef SE Coef Costat 4.7489 0.2123 log(rpi) -1.1513 0.1061 Aalysis of Variace Source DF SS Regressio 1 0.00093838 Residual Error 14 0.00011153 Total 15 0.00104991 6 v g v

a) Vilke av följade tolkigar av de apassade modelle är korrekt? (i) Efterfrågad volym varierar i huvudsak rut 47500 eheter. (ii) Efterfrågad volym miskar i geomsitt med c:a 1.15 eheter då relativprisidex ökar med 1 ehet. (iii) Efterfrågad volym miskar i geomsitt med c:a 1.15% då relativprisidex miskar med 1%. (iv) Logaritmerad efterfrågad volym ökar i geomsitt med c:a 1.15 eheter då relativprisidex ökar med 1%. (v) Efterfrågad volym miskar i geomsitt med c:a 1.15% då relativprisidex ökar med 1%. (vi) Logaritmerad efterfrågad volym miskar i geomsitt med c:a 1.15% då logaritmerad relativprisidex ökar med 1% (0.5p) b) Uttryck de apassade modelle i origialskala och avgör med ett test på 1% ivå om varupgruppe är priskäslig (dvs mer ä ehetselastisk). Svara med teststorhetes värde och om varugruppe är priskäslig eller ej. (1p) 5. I figur 1 eda visas måadsmedelvärde av växelkurse mella svesk kroa (SEK) och amerikask dollar (USD) frå jauari 2004 till ovember 2008. Figur 1: Måadsmedelvärde för växelkurs SEK/USD ja 2004 - ov 2005 7 v g v

a) Vilket av följade påståede stämmer bäst för tidsserie i figur 1? (i) Tidsserie visar e tydlig uppåtgåede tred. (ii) Säsogsvariatio i tidsserie ka ite fias. (iii) Tidsserie är ett typsikt exempel på utvecklig med expoetiellt ökade tred. (iv) Tidsserie uppvisar cyklisk variatio. (v) Tidsserie ka edast progosticeras med hjälp av tidsserieregressio eftersom de cykliska kompoete ite ka skattas. (vi) Progoser med ekel expoetiell utjämig för tidpuktera jauari, februari och mars 2009, med utgågspukt frå detta datamaterial att bli successivt avtagade. I Miitabutskrifte eda redovisas e kompoetuppdelig av tidsserie. (0.5p) Time Series Decompositio for SEK/USD Data SEK/USD Legth 59 NMissig 0 Fitted Tred Equatio Yt = 7.68623-0.0196776*t SeasoalIdices Period Idex 1 0.99724 2 1.00826 3 0.99044 4 0.98521 5 0.98040 6 1.02485 7 1.00770 8 1.01237 9 1.00828 10 1.00910 11 0.98645 12 0.98971 8 v g v

b) Vilket av följade påståede stämmer bäst om aalyse? (i) Aalyse har gjorts med Witers multiplikativa metod. (ii) Aalyse har gjorts med additiva kompoeter. (iii) För april måad upskattas ivå hos växelkurse ligga c:a 1.5% uder tredivå. (iv) För oktober måad uppskattas ivå hos växelkurse ligga c:a 0.9 öre över tredivå. (v) E progos för december 2008 blir SEK 6.5056. (vi) E progos för december 2008 blir SEK 7.4953. (0.5p) 9

10

Ekel lijär regressiosaalys: Modell: y i = β 0 + β 1 x i + ε i där ε N(0, σ). Apassad regressioslije: ŷ = b 0 + b 1 x där (xi x) (y b 1 = i ȳ) xi y (xi x) 2 = i x ȳ x 2 i ( x) 2 = = xi y i (P x i) ( P y i) x 2 i (P x i) 2 b 0 = ȳ b 1 x Kvadratsummor: Formelsamlig = x i y i ( x i ) ( y i ) x 2 i ( x i ) 2 Total: SST = (y i ȳ) 2 = y 2 i (ȳ)2 = y 2 i (P y i) 2 Residual: SSE = (y i ŷ i ) 2 = (y i ȳ) 2 b 1 (x i x) (y i ȳ) = y 2 i b 0 y i b 1 x i y i Regressio: SSR = (ŷ i ȳ) 2 = SST SSE Förekligsformler: Se ova för (y i ȳ) 2 och samma ka avädas på (x i x) 2 (xi x) (y i ȳ) = x i y i x ȳ = x i y i (P x P i) ( y i) Variasskattig σ 2 = s 2 = MSE = SSE 2 s = MSE = SSE 2 Förklarigsgrad: r 2 = SST SSR Korrelatioskoefficiet: r = r 2 = = (xi x) (y i ȳ) (xi x) 2 (y i ȳ) 2 = xi y i (P x P i) ( y i) ( x 2 i (P x i) 2 ) ( yi 2 (P y i) 2 ) Kofidesitervall, progositervall och hypotesprövig Stickprovsfördeligar: ( ) b 1 N β 1, σ (xi x) 2 b 0 N ( 1 β 0, σ b 0 + b 1 x 0 N + ) P ( x)2 (xi x) 2 ( β 0 + β 1 x 0, σ xi y i x ȳ ( x 2 i ( x) 2 ) ( y 2 i (ȳ)2 ) = = ) 1 + P (x0 x)2 (xi x) 2 x i y i ( x i ) ( y i ) ( x 2 i ( x i ) 2 ) ( y 2 i ( y i ) 2 ) I

Kofidesitervall för β 1 : ( b 1 ± t [α/2] ( 2) s (xi x) 2 = x 2 (xi x) 2 i ( x)2 = ) x 2 i (P x i) 2 Kofidesitervall för β 0 : b 0 ± t [α/2] ( 2) s ( 1 + ) ( (xi P ( x)2 (xi x) x) 2 = x 2 2 i ( x)2 = x 2 i (P x i) 2 Kofidesitervall för µ y0 x 0 = β 0 + β 1 x 0 : ( ) ( 1 b 0 + b 1 x 0 ± t [α/2] ( 2) s + (xi P (x0 x)2 (xi x) x) 2 = x 2 2 i ( x)2 = ) x 2 i (P x i) 2 Progositervall för y 0 = β 0 + β 1 x 0 + ε 0 : ( ) ( b 0 + b 1 x 0 ± t [α/2] ( 2) s 1 + 1 + (xi P (x0 x)2 (xi x) x) 2 = x 2 2 i ( x)2 = ) x 2 i (P x i) 2 Formellt t-test av H 0 : β 0 = 0: Testfuktio: t = b 0 s b0 = Jämför med ±t [α/2] ( 2) Formellt t-test av H 0 : β 1 = 0: Testfuktio: t = b 1 s b1 = Jämför med ±t [α/2] ( 2) b 0 s ( 1 + ) P ( x)2 (xi x) 2 ( (xi x) 2 = x 2 i ( x)2 = ) x 2 i (P x i) 2 b 1s P(xi x) 2 ( (xi x) 2 = x 2 i ( x)2 = x 2 i ( Formellt t-test av H 0 : β 1 = B (där B är ågot aat ä 0): Testfuktio: t = b 1 B s b1 = b ( 1 B (xi s x) 2 = x 2 i ( x)2 = x 2 i ( P(xi x) 2 Jämför med ±t [α/2] ( 2) P xi) 2 ) P xi) 2 Vid ekelsidiga mothypotseser jämförs t med t [α] ( 2) (eller med -t [α] ( 2) beroede på mothypoteses riktig). Formellt F -test av H 0 : β 1 = 0: Testfuktio: F = MSE MSR = SSR/1 SSE/( 2) Jämför med F [α] (1, 2) Multipel lijär regressiosaalys: Modell: y i = β 0 + β 1 x i1 + β 2 x i2 +... + β k x ik + ε i där ε i N(0, σ). Apassad modell: ŷ = b 0 + b 1 x 1 + b 2 x 2 +... b k x k ) ) II

Kvadratsummor: SST =SSE +SSR Total: SST = (y i ȳ) 2 = y 2 i (ȳ)2 = y 2 i (P y i) 2 Residual: SSE = (y i ŷ i ) 2 Regressio: SSR = (ŷ i ȳ) 2 = SST SSE SSE har k 1 frihetsgrader, SSR har k frihetsgrader. Variasskattig: σ 2 = s 2 = MSE = Förklarigsgrad: SSE k 1 R 2 = SSR SST Justerad förklarigsgrad: R 2 adj = R2 = 1 SSE/( k 1) SST /( 1) Kofidesitervall och hypotesprövig Stickprovsfördeligar: b j N(β j, σ bj ) Formellt F -test av H 0 : β 1 = β 2 =... = β k = 0: Testfuktio: F = MSE MSR = SSR/k SSE/( k 1 ) Jämför med F [α] (k, k 1) Kofidesitervall för β j : b j ± t [α/2] ( k 1) s bj där s bj hämtas frå datorutskrift. Formellt t-test av H 0 : β j = 0: Testfuktio: t = b j s bj Jämför med t [α/2] ( k 1) Kofidesitervall för µ y0 x 01,...,x 0k : ŷ 0 ± t [α/2] ( k 1) s Distace value där s = MSE och Distace value (eller s Distace value) bestäms frå datorutskrift. Progositervall för y 0 : ŷ 0 ± t [α/2] ( k 1) s 1 + Distace value där s = MSE och Distace value (eller s 1 + Distace value) bestäms frå datorutskrift. III

Partiellt F -test av H 0 : β g+1 =... = β k = 0: Testfuktio: F = (SSE R SSE C )/(k g) = (SSR C SSR R )/(k g) SSE C /( k 1) SSE C /( k 1 ) där SSE R =Residualkvadratsumma i de midre (reducerade) modelle och SSE C =Residualkvadratsumma i de större (kompletta) modelle. Jämför med F [α] (k g, k 1). Variace Iflatio Factor (VIF): VIF = 1 1 R 2 j där R 2 j =Förklarigsgrade i modell där x j är y-variabel och övriga x-variabler är förklarigsvariabler. Sekvetiella kvadratsummor: SSR = SSR(x 1 ) + SSR(x 2 x 1 ) +... + SSR(x k x 1,..., x k 1 ) där SSR(x j x 1,..., x j 1 ) är tillskottet till SSR då variabel x j läggs till e modell med variablera x 1, x 2,..., x j 1. Ett partiellt F -test av H 0 : β g+1 =... = β k = 0 ka då göras med testfuktioe F = (SSR(x g+1 x 1,..., x g ) + SSR(x g+2 x 1,..., x g+1 ) +... + SSR(x k x 1,..., x k 1 )) /(k g) MSE, Jämför med F [α] (k g, k 1) förutsatt att variablera matas i i ordige x 1, x 2,..., x k i modelle. Expoetiella sambad och elasticitetsmodeller: Expoetiell modell: y = β 0 (β 1 ) x δ där log δ N(0, σ) log y = log β 0 + (log β 1 ) x + log δ Apassad modell: ŷ = b 0 (b 1 ) x där (xi x) (log y log b 1 = i log y) xi log y (xi x) 2 = i x log y x 2 i ( x) 2 = = xi log y i (P x i) ( P log y i) x 2 i (P x i) 2 och log b 0 = log y (log b 1 ) x Kvadratsummor, variasskattig och test: SST = (log y i log y) 2 = (log y i ) 2 (log y) 2 SSE = SST (log b 1 ) (x i x) (log y i log y) = SST (log b 1 ) ( x i log y i x log y) = (log yi ) 2 (log b 0 ) log y i (log b 1 ) x i log y i σ 2 = SSE 2 Test av H 0 : β 1 = 1 dvs iget sambad mella y och x log β 1 = 0: log b Testfuktio t = 1, jämför med t [α/2] ( 2) SSE/( 2) P (xi x) 2 IV

Elasticitetsmodeller: Formler eligt AJÅ: x 1 =Pris, x 2 =Ikomst Modeller: ŷ = a x e 1, ŷ = a x E 2, ŷ = a x e 1 x E 2 e =priselasticitet, E =ikomstelasticitet Apassig av t.ex. ŷ = a x e 1: lg ŷ = a + e lg x 1, a = lg a e = (lg y) (lg x 1 ) ( lg y) ( lg x 1 ) (lg x 1 ) 2 ( lg x 1 ) 2 SST = (lg y lg y) 2 = (lg y) 2 (P lg y) 2 SSE = SST e (lg x 1 lg x) (lg y lg y) = (lg y) 2 a lg y e (lg x 1 ) (lg y) σ 2 = SSE 2 Test av H 0 : priselasticitete = B där B är ett ifrågasatt värde på priselasticitete: Testfuktio t = e B SSE/( 2), jämför med t [α/2] ( 2) och vid ekelsidig mothypotes med t ( 2) [α] eller P (lg x1 lg x 1) 2 t ( 2) [α]. Formler eligt Mikroekoomi, Fö-ateckigar och datorövigar: Q = A (P ) EP δ, Q = α (I) EI δ Q = A (P ) EP (I) EI δ log Q = log A + E P log P + log δ log Q = log A + E I log I + log δ log Q = log A + E P log P + E I log I + log δ där log δ N(0, σ) Exempel på apassad modell: Q = a (P ) d EP, där ÊP = (log Pi log P ) (log Q i log Q) (log Pi log P ) 2 = (log Pi ) (log Q = i ) log P log Q (log Pi ) 2 (log P ) 2 och [ log a = log Q ÊP log P log P = 1 log Pi och log Q = 1 ] log Qi Kvadratsummor, variasskattig och test: SST = (log Q i log Q) 2 = (log Q i ) 2 (log Q) 2 SSE = SST ÊP (log P i log P ) (log Q i log Q) = SST ÊP [ (log P i ) (log Q i ) log P log Q ] = = (log Q i ) 2 (log a) log Q i ÊP (log P i ) (log Q i ) σ 2 = SSE 2 Test av H 0 : E P = B där B är ett ifrågasatt värde på E P : Testfuktio t = Ê P B SSE/( 2), jämför med t [α/2] ( 2) och vid ekelsidig mothypotes med t ( 2) [α] eller P (log Pi log P ) 2 t ( 2) [α]. V

Idex Sammasatta fastbasidex: I t = i 1,t w 1 + i 2,t w 2 +... + i,t w där är atalet igåede varor/tjäster, i 1,t,..., i,t är ekla prisidex för igåede varor, alla med basår t 0 och w 1,..., w väljs eligt ett viktsystem: Laspeyre: w i = Paasche: w i = Kedjeprisidex: p i,t 0 q i,t0 j p j,t 0 q j,t0 p i,t 0 q i,t j p j,t 0 q j,t I t = L 0,1 L 1,2... L t 1,t 100 där L t 1,t = i=1 p i,t p i,t 1 w i,t 1,t är årsläke frå år t 1 till t för igåede varor/tjäster. w i,t 1,t väljs eligt ett viktsystem: Laspeyre: wi,t 1,t L Försäljigsvärdet för vara i år t 1 = Totala försäljigsvärdet år t 1 Paasche: wi,t 1,t P Försäljigsvärdet för vara i år t i priser för år t 1 = Totala försäljigsvärdet år t i priser för år t 1 Med represetatvaror byts Försäljigsvärdet för vara i mot Försäljigsvärdet för varugrupp i i viktera. Implicitprisidex: I t = Försäljigsvärdet av vara/tjäste/gruppe år t i löpade priser Försäljigsvärdet av vara/tj aste/gruppe år t i basårets priser 100 Relativprisidex: It R = Iv t It 0 100 där It v =Prisidex för aktuell vara/tjäst/grupp och It 0 =Prisidex för de större jämförelsegruppe, t ex KPI. Tidsserieaalys Tidsserieregressio: Modell: y t = TR t + SN t + ε t där TR t = β 0 + β 1 t eller TR t = β 0 + β 1 t + β 2 t 2 och SN t = L 1 i=1 β si x si,t med L =Atal säsoger och x si,t = 1 om t tillhör säsog i och = 0 aars. Durbi-Watso s test: Test av H 0 : Residualera är okorrelerade. Testfuktio d = t=2 (e t e t 1 ) 2 t=1 e2 t där e t = y t ŷ t. VI

Jämförelser: Om d < 1 Förkasta H 0, positiv seriell korrelatio Om d > 3 Förkasta H 0, positiv seriell korrelatio Om 1 d 3 H 0 ka ej förkastas. Kompoetuppdelig: Modeller: Multiplikativ modell: y t = TR t SN t CL t IR t Additiv modell: y t = TR t + SN t + CL t + IR t Ekel expoetiell utjämig: Modell: y t = β 0 + ε t Uppdaterigsschema för skattig av β 0 : l T = α y T + (1 α) l T 1 0 < α < 1 Progos: ŷ T +τ (T ) = l T Progositervall: l t ± z s 1 + α 2 där z =1.96 för 95% itervall, 2.576 för 99% itervall och s = 1 T 1 T t=1 (y t ȳ) 2 VII

VIII

LINKÖPINGS UNIVERSTET Istitutioe för dataveteskap Statistik, ANd 732G71 STATISTIK B, 8 hp Civilekoomprogrammet, år 2 Tetame, svarsblakett 732G71 PROVKOD STATISTIK B TENT SVARSBLANKETT AID: Markera ditt svarsalterativ geom att riga i det. Edast ett svarsalterativ per deluppgift får markeras. Kotrollera att du har markerat i alla deluppgifter du har besvarat! Uppgift 2 (a) (i) (ii) (iii) (iv) (v) (b) 1 Teststorhetes värde är 4.96. Testet är ite sigifikat! 2 Teststorhetes värde är 4.96. Testet är sigifikat! 3 Teststorhetes värde är 0.56. Testet är ite sigifikat! 4 Teststorhetes värde är 0.56. Testet är sigifikat! 5 Teststorhetes värde är 0.71. Testet är ite sigifikat! 6 Teststorhetes värde är 0.71. Testet är sigifikat! (c) 1 R 2 adj 2 R 2 adj 3 R 2 adj 4 R 2 adj 5 R 2 adj 6 R 2 adj = 0.288 s = 100.4 = 95.0% s = 665.8 = 0.360 s = 665.8 = 0.29 s = 665.8 = 95.%0 s = 100.4 = 0.29% s = 100.4 (d) 1 För H 01 : Teststorhete=( )1.16 Testet är ej sigifikat För H 02 : Teststorhete=( )4.04 Testet är sigifikat 2 För H 01 : Teststorhete=( )1.16 Testet är sigifikat För H 02 : Teststorhete=( )4.04 Testet är ej sigifikat 3 För H 01 : Teststorhete=( )9.62 Testet är sigifikat För H 02 : Teststorhete=( )4.82 Testet är sigifikat 4 För H 01 : Teststorhete=( )1.36 Testet är ej sigifikat För H 02 : Teststorhete=( )0.68 Testet är ej sigifikat 5 För H 01 : Teststorhete=( )9.62 Testet är sigifikat För H 02 : Teststorhete=( )4.82 Testet är ej sigifikat 6 För H 01 : Teststorhete=( )1.36 Testet är sigifikat För H 02 : Teststorhete=( )0.68 Testet är ej sigifikat v g v i

(e) (f) (g) 1 Miskig med 16.49 eheter 2 Ökig med 16.49 eheter 3 Miskig med 16.11 eheter 4 Ökig med 0.037 eheter 5 Ökig med 0.0017 eheter 6 Ökig med 0.0034 eheter 1 Teststorhetes värde är 7.01. Testet är ite sigifikat! 2 Teststorhetes värde är 7.01. Testet är sigifikat! 3 Teststorhetes värde är 2.05. Testet är ite sigifikat! 4 Teststorhetes värde är 2.05. Testet är sigifikat! 5 Teststorhetes värde är 1.60. Testet är ite sigifikat! 6 Teststorhetes värde är 1.60. Testet är sigifikat! 1 empl 2 TV 3 area 0 4 area 1 5 exp (h) (i) (ii) (iii) (iv) (v) Uppgift 3 1 2006: 100.0, 2007: 100.0, 2008: 100.0 2 2006: 100.0, 2007: 110.0, 2008: 121.0 3 2006: 100.0, 2007: 90.9, 2008: 81.8 4 2006: 100.0, 2007: 115.0, 2008: 118.8 5 2006: 100.0, 2007: 110.0, 2008: 110.0 Uppgift 4 (a) (i) (ii) (iii) (iv) (v) (vi) (b) 1 Teststorhetes värde är 117.8. Varugruppe är ite priskäslig 2 Teststorhetes värde är 20.28. Varugruppe är priskäslig 3 Teststorhetes värde är 1.43. Varugruppe är priskäslig 4 Teststorhetes värde är 10.84. Varugruppe är priskäslig 5 Teststorhetes värde är 1.43. Varugruppe är ite priskäslig 6 Teststorhetes värde är 117.8. Varugruppe är priskäslig Uppgift 5 (a) (i) (ii) (iii) (iv) (v) (vi) (b) (i) (ii) (iii) (iv) (v) (vi) ii