732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Storlek: px
Starta visningen från sidan:

Download "732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet"

Transkript

1 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

2 Kap. 5.1, korrelationsmatris En korrelationsmatris är en matris med parvisa korrelationer, r, mellan alla kvantitativa variabler i modellen. Minitab ger även p-värdet för alla korrelationer från ett hypotestest med den sanna korrelationen, ρ, lika med noll under nollhypotesen. I tabellen nedan ges korrelationsmatrisen för variablerna försäljningspris (pris) i tusentals kronor (tkr), antal kvadratmeter (area), antal rum (rum), bostadsavgift (avgift) i tusentals kronor (tkr) och våningsplan för 58 slumpmässigt valda lägenhetspriser i Stockholms kommun. Correlation: Pris; area; rum; avgift; våningsplan Pris area rum avgift 0,618 area 0,000 rum 0,513 0,916 0,000 0,000 avgift 0,275 0,862 0,830 0,036 0,000 0,000 våningsplan 0,129-0,027 0,020-0,095 0,334 0,840 0,883 0,476 Cell Contents: Pearson correlation P-Value Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

3 Kap. 5.1, multikolinjäritet Perfekt multikolinjäritet existerar om en eller era förklaringsvarabler är en linjärkombination av en eller era andra förklaringsvariabler, d.v.s. om det gäller för minst en förklaringsvariabel x j bland k stycken förklaringsvariabler att x j = a 1 x 1 + a 2 x a j 1 x j 1 + a j+1 x j a k x k för konstanterna a 1, a 2,..., a j 1, a j+1,..., a k. I ett sådant fall går det inte att skatta en regressionsmodell. I praktiken är det mer vanligt att man får problem med multikolinjäritet för att att en eller era förklaringsvariabler är högt korrelerade med en eller era andra förklaringsvariabler. Då går det att skatta regressionsmodellen men man får stor osäkerhet i skattningarna för parameterarna, d.v.s. höga värden på s b1, s b2,.... Som tumregel brukar man anse att det är allvarliga problem med multikolinjäriet om minst en korrelationskoecient r är minst 0.9. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

4 Kap. 5.1, multikolinjäritet Ett annat sätt att mäta multikolinjäritet på är att använda Variance Ination Factors (VIF). VIF för varje förklaringsvariabel x j beräknas som VIF j = 1, 1 Rj 2 där Rj 2 är förklaringsgraden från en multipel linjär regressionsmodell med x j som beroende variabel och övriga förklaringsvariabler som förklaringsvariabler. Multikolinjäritet anses vara ett stort problem om 1. Någon VIF > Medelvärdet av alla VIF är mycket större än 1. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

5 Exempel, skattad regressionsmodell från Minitab Regression Analysis: Pris versus area; rum; avgift; innerstan; söderort Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression ,56 0,000 area ,70 0,000 rum ,12 0,726 avgift ,07 0,000 innerstan ,96 0,000 söderort ,68 0,061 Error Total Model Summary S R-sq R-sq(adj) R-sq(pred) 1003,41 75,22% 72,83% 55,71% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant ,69 0,492 area 100,1 13,8 7,26 0,000 7,96 rum ,35 0,726 6,81 avgift ,25 0,000 5,31 innerstan ,47 0,000 3,17 söderort ,92 0,061 2,73 Regression Equation Pris = ,1 area rum avgift innerstan söderort Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

6 Exempel, skattad regressionsmodell från Minitab Regression Analysis: Pris versus area; avgift; innerstan; söderort Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression ,08 0,000 area ,18 0,000 avgift ,08 0,000 innerstan ,85 0,000 söderort ,21 0,045 Error Total Model Summary S R-sq R-sq(adj) R-sq(pred) 995,085 75,16% 73,28% 59,78% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant ,73 0,471 area 96,71 9,86 9,81 0,000 4,14 avgift ,48 0,000 5,04 innerstan ,57 0,000 3,13 söderort ,05 0,045 2,61 Regression Equation Pris = ,71 area avgift innerstan söderort Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

7 Val av den bästa modellen Målet är att hitta en modell som beskriver datamaterialet så bra som möjligt och som kan göra bra prognoser för nya observationer. Vi kan jämföra regressionsmodeller med olika uppsättningar av förklaringsvariabler med avseende på förklaringsgrad R 2 justerad förklaringsgrad R 2 den skattade standardavvikelsen för feltermen ɛ: s längd på prediktionsintervall/prognosintervall Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

8 Best subsets regression från Minitab Best Subsets Regression: Pris versus area; rum;... Response is Pris v å n i i n s n n ö a g e d v s r e a g p s r r r i l t o R-Sq R-Sq Mallows e u f a a r Vars R-Sq (adj) (pred) Cp S a m t n n t 1 38,2 37,1 25,7 73,4 1526,8 X 1 26,3 25,0 19,1 97,9 1667,3 X 2 64,2 62,9 51,7 21,8 1172,6 X X 2 63,9 62,6 47,2 22,4 1177,8 X X 3 73,2 71,7 58,2 5,3 1024,2 X X X 3 65,7 63,8 52,3 20,6 1157,6 X X X 4 75,2 73,3 59,8 3,2 995,08 X X X X 4 73,5 71,5 54,5 6,7 1028,4 X X X X 5 75,2 72,8 56,5 5,1 1003,4 X X X X X 5 75,2 72,8 55,7 5,1 1003,4 X X X X X 6 75,3 72,3 52,9 7,0 1012,4 X X X X X X Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

9 Kapitel 5.1, stegvis regression Procedur för att välja vilka förklaringsvariabler som ska ingå i regressionsmodellen. Börja med att sätta signikansnivåer på att en variabel ska läggas till i modellen, α entry, och att en variabel ska stanna kvar i modellen, α stay. Antag att alla möjliga förklaringsvariabler i modellen är k stycken: 1) k stycken enkla linjära regressionsmodeller skattas och den variabel som ger högst förklaringsgrad R 2 läggs till i modellen (givet att p värdet < α entry ). Om ingen variabel ger en signikant skattning av lutningen så slutar proceduren här. 2) Den variabel av de återstående k 1 variablerna som är mest signikant relaterad till y, givet att den 1 :a variabeln är med i modellen, läggs till i modellen (givet att p värdet < α entry ). Den 1:a variabeln stannar i modellen om p värdet < α stay gäller. Om inte tas den bort från modellen och proceduren fortsätter. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

10 Kapitel 5.1, stegvis regression Proceduren fortsätter med att lägga till variabler en och en samtidigt som gamla variabler kontrolleras, och de som inte längre är signikanta i modellen tas bort. Proceduren är klar när alla variabler i modellen är signikanta och ingen signikant variabel kan läggas till. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

11 Exempel, stegvis regression i Minitab Regression Analysis: Pris versus area; rum; avgift; våningsplan; innerstan; söderort Stepwise Selection of Terms Candidate terms: area; rum; avgift; våningsplan; innerstan; söderort ----Step Step Step Step Coef P Coef P Coef P Coef P Constant area 43,75 0,000 58,28 0,000 94,6 0,000 96,71 0,000 innerstan , , ,000 avgift , ,000 söderort 893 0,045 S 1526, , ,22 995,085 R-sq 38,20% 64,20% 73,18% 75,16% R-sq(adj) 37,10% 62,90% 71,69% 73,28% R-sq(pred) 25,66% 51,70% 58,17% 59,78% Mallows Cp 73,37 21,79 5,27 3,21 α to enter = 0,05; α to remove = 0,05 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

12 Kapitel 5.2, bakåteliminering Välj signikansnivå för att en variabel ska stanna kvar i modellen, α stay. Antag att alla möjliga förklaringsvariabler i modellen är k stycken: 1) Regressionsmodellen med alla k stycken variabler skattas. Den förklaringsvariabel vars parameter har högst p v ärde, givet att p värdet > α stay, tas bort från modellen. 2) Den nya regressionsmodellen skattas. Den förklaringsvariabel vars parameter har högst p värde, givet att p värdet > α stay, tas bort från modellen. Proceduren fortsätter tills alla variabler är signikanta. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

13 Exempel, stegvis regression med bakåteliminering i Minitab Regression Analysis: Pris versus area; rum; avgift; våningsplan; innerstan; söderort Backward Elimination of Terms Candidate terms: area; rum; avgift; våningsplan; innerstan; söderort ----Step Step Step Coef P Coef P Coef P Constant area 99,8 0,000 97,01 0,000 96,71 0,000 rum -91 0,775 avgift , , ,000 våningsplan -19,6 0,773-23,3 0,725 innerstan , , ,000 söderort 896 0, , ,045 S 1012, ,40 995,085 R-sq 75,26% 75,22% 75,16% R-sq(adj) 72,34% 72,83% 73,28% R-sq(pred) 52,93% 56,46% 59,78% Mallows Cp 7,00 5,08 3,21 α to remove = 0,05 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

14 Den bästa modellen från metoderna Regression Analysis: Pris versus area; avgift; innerstan; söderort Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression ,08 0,000 area ,18 0,000 avgift ,08 0,000 innerstan ,85 0,000 söderort ,21 0,045 Error Total Model Summary S R-sq R-sq(adj) R-sq(pred) 995,085 75,16% 73,28% 59,78% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant ,73 0,471 area 96,71 9,86 9,81 0,000 4,14 avgift ,48 0,000 5,04 innerstan ,57 0,000 3,13 söderort ,05 0,045 2,61 Regression Equation Pris = ,71 area avgift innerstan söderort Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

15 Kapitel , residualanalys Efter att ha valt den bästa regressionsmodellen med förklaringsvariabler så kan vi utvärdera modellen. Kom ihåg, enligt modellantagandena för den multipla linjära regressionsmodellen ska följande egenskaper vara uppfyllda: 1. För varje kombination av värden x 1, x 2,..., x k är medelvärdet för värdena på feltermen noll. 2. Konstant varians. För varje kombination av värden x 1, x 2,..., x k har värdena på feltermen konstant varians. Denna varians kallas för σ Normalf ördelning. För varje kombination av värden x 1, x 2,..., x k följer värdena på feltermen en normalfördelning. 4. Oberoende. Alla värden på feltermen är statistiskt oberoende av alla andra värden på feltermen. ɛ N (0, σ) Vi kan inte undersöka feltermerna direkt, utan undersöker i stället utseendet på residualerna e (de skattade feltermerna) residual = e = y ŷ Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

16 Kapitel , residualanalys Vi plottar residualerna e mot de skattade värdena ŷ för att undersöka om variansen runt regressionslinjen verkar vara konstant (om den ser ut som en strut så tyder det på ökande/minskande varians för ökande värden på ŷ) (antagande 1. och 2.). I samma plot kan vi undersöka om det linjära antagandet i den linjära regressionsmodellen är uppfylld genom att undersöka om det nns något mönster i plotten. I ett histogram för residualerna och i diagrammet normal probability plot kan vi undersöka om residualerna ser normalfördelade ut (antagande 3.). Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

17 Exempel, enkel linjär regressionsanalys med pris och area Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

18 Exempel, residualplottar Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

19 Kapitel 5.4, ovanliga observationer I föregående plottar upptäckte vi en observation som avviker väldigt mycket från de övriga observationerna i data. Allmänt gäller att en observation som skiljer sig från resten av data kallas outlier. Den kan vara extrem i förhållande till förklaringsvariablerna: stort "leverage" (distance value) extrem i förhållande till regressionslinjen: stor residual (inytelserik) I vårt exempel är observationen extrem i förhållande till regressionslinjen, eftersom den ger en väldigt stor residual. Om vi upptäcker en misstänkt outlier bör vi undersöka om det kan bero på felmätning/inmatning. Gör det inte det kan vi fundera över om observationen tillhör populationen vi vill dra slutsatser om. Gör den det och observationen är misstänkt inytelserik kan vi prova att göra en ny analys utan observationen och se hur resultaten förändras. I en resultatrapport bör vi då redovisa resultaten både med och utan observationen/rna. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

20 Exempel, borttagning av outlier På grund av att observationen är så pass extrem i förhållande till övriga observationer i datamaterialet, så prövar vi att göra om analysen utan denna observation och generaliserar våra resultat till ordinära lägenheter i Stockholms kommun. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

21 Exempel, enkel linjär regressionsanalys med pris och area Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

22 Exempel, residualplottar Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

23 Ökande varians? Vi kan prova att transformera y y = y Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

24 Exempel, residualplottar Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

25 Något annat som kan vara fel? Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

26 Exempel, skattad regressionsmodell från Minitab Regression Analysis: Pris versus area; innerstan; söderort; area*innerstan; area*söderort Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression ,25 0,000 area ,39 0,000 innerstan ,29 0,043 söderort ,39 0,041 area*innerstan ,00 0,966 area*söderort ,83 0,098 Error Lack-of-Fit ,02 0,039 Pure Error Total Model Summary S R-sq R-sq(adj) R-sq(pred) 710,257 70,39% 67,49% 59,00% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant ,11 0,272 area 57,9 14,3 4,05 0,000 14,97 innerstan ,07 0,043 41,28 söderort ,10 0,041 39,72 area*innerstan -0,7 16,1-0,04 0,966 21,69 area*söderort -25,8 15,3-1,68 0,098 37,74 Regression Equation Pris = ,9 area innerstan söderort - 0,7 area*innerstan - 25,8 area*söderort När man lägger till en interaktionsterm eller en kvadratisk term får man ofta problem med multikolinjäritet. Ett sätt att minska detta på är att centrera förklaringsvariablerna som ingår i interaktionstermen (dummyvariabeln behöver inte centreras) som x centrerad = x x. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

27 Exempel, skattad regressionsmodell från Minitab Regression Analysis: Pris versus CenterArea; innerstan; söderort; CenterArea*i; CenterArea*s Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression ,25 0,000 CenterArea ,39 0,000 innerstan ,62 0,000 söderort ,18 0,016 CenterArea*innerstan ,00 0,966 CenterArea*söderort ,83 0,098 Error Lack-of-Fit ,02 0,039 Pure Error Total Model Summary S R-sq R-sq(adj) R-sq(pred) 710,257 70,39% 67,49% 59,00% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant ,85 0,000 CenterArea 57,9 14,3 4,05 0,000 14,97 innerstan ,05 0,000 4,68 söderort ,49 0,016 4,43 CenterArea*innerstan -0,7 16,1-0,04 0,966 5,81 CenterArea*söderort -25,8 15,3-1,68 0,098 8,43 Regression Equation Pris = ,9 CenterArea innerstan söderort - 0,7 CenterArea*innerstan - 25,8 CenterArea*söderort Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

28 Exempel, residualplottar Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

29 Exempel, stegvis regression i Minitab Regression Analysis: Pris versus CenterArea; rum; avgift; våningsplan; innerstan; söderort Stepwise Selection of Terms Candidate terms: CenterArea; rum; avgift; våningsplan; innerstan; söderort ----Step Step Step Step Coef P Coef P Coef P Coef P Constant CenterArea 28,07 0,000 41,44 0,000 58,30 0,000 60,92 0,000 innerstan , , ,000 avgift , ,021 söderort 701 0,032 S 1025,29 773, , ,196 R-sq 33,47% 62,85% 65,77% 68,70% R-sq(adj) 32,26% 61,47% 63,83% 66,30% R-sq(pred) 29,60% 59,02% 60,92% 61,73% Mallows Cp 61,03 12,67 9,67 6,64 α to enter = 0,05; α to remove = 0,05 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

30 Exempel, stegvis regression i Minitab Regression Analysis: Pris versus CenterArea; avgift; innerstan; söderort Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression ,54 0,000 CenterArea ,67 0,000 avgift ,69 0,021 innerstan ,58 0,000 söderort ,88 0,032 Error Total Model Summary S R-sq R-sq(adj) R-sq(pred) 723,196 68,70% 66,30% 61,73% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant ,05 0,000 CenterArea 60,92 8,82 6,90 0,000 5,49 avgift ,38 0,021 6,29 innerstan ,44 0,000 3,12 söderort ,21 0,032 2,60 Regression Equation Pris = ,92 CenterArea avgift innerstan söderort Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

31 Residualplott för modell utan interaktionstermer Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

32 Inkluderar den bästa modellen interaktionstermer? Ett partiellt F-test för interaktionstermerna CenterArea innerstan och CenterArea söderort ger. F = > F [0.05],6 4,40 = 3.23 > F [0.05],6 4, Alltså är minst en av interaktionstermerna från F-testet signikant, d.v.s. vi kan behålla båda interaktionstermerna i modellen. Obs! Variance Ination Factor (VIF) har dock ett väldigt högt värde för förklaringsvariabeln CenterArea. Därför kan det vara bättre att inte inkludera interaktionstermerna. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

33 Modell med interaktionstermer Regression Analysis: Pris versus CenterArea; avgift; innerstan; söderort; CenterArea*i;... Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression ,24 0,000 CenterArea ,67 0,000 avgift ,31 0,043 innerstan ,44 0,000 söderort ,43 0,009 CenterArea*innerstan ,07 0,789 CenterArea*söderort ,04 0,087 Error Total Model Summary S R-sq R-sq(adj) R-sq(pred) 688,257 72,74% 69,47% 61,05% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant ,11 0,000 CenterArea 74,7 16,0 4,66 0,000 20,05 avgift ,08 0,043 6,52 innerstan ,78 0,000 4,82 söderort ,73 0,009 4,46 CenterArea*innerstan -4,2 15,7-0,27 0,789 5,88 CenterArea*söderort -25,9 14,8-1,74 0,087 8,43 Regression Equation Pris = ,7 CenterArea avgift innerstan söderort - 4,2 CenterArea*innerstan - 25,9 CenterArea*söderort Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

34 Residualplott för modell med interaktionstermer Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 3 Bertil Wegmann IDA, Linköpings universitet November 4, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 4, 2015 1 / 22 Kap. 4.8, interaktionsvariabler Ibland

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

Regressions- och Tidsserieanalys - F5

Regressions- och Tidsserieanalys - F5 Regressions- och Tidsserieanalys - F5 Linda Wänström Linköpings universitet November 20 Wänström (Linköpings universitet) F5 November 20 1 / 24 Modellbygge - vilka oberoende variabler ska vara med i modellen?

Läs mer

Skrivning i ekonometri lördagen den 29 mars 2008

Skrivning i ekonometri lördagen den 29 mars 2008 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan

Läs mer

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1! LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal

Läs mer

Föreläsning 4. Kap 5,1-5,3

Föreläsning 4. Kap 5,1-5,3 Föreläsning 4 Kap 5,1-5,3 Multikolinjäritetsproblem De förklarande variablerna kan vara oberoende (korrelerade) av varann men det är inte så vanligt. Ofta är de korrelerade, och det är helt ok men beroendet

Läs mer

10.1 Enkel linjär regression

10.1 Enkel linjär regression Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot

Läs mer

Skrivning i ekonometri torsdagen den 8 februari 2007

Skrivning i ekonometri torsdagen den 8 februari 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2015-12-09, 8-12 Bertil Wegmann

Läs mer

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB2 Skrivning i ekonometri onsdagen den 1 juni 211 1. Vi vill undersöka hur variationen i försäljningspriset för ett hus (i en liten stad i USA

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet November 6, 2013 Wänström (Linköpings universitet) F3 November 6, 2013 1 / 22 Interaktion

Läs mer

Skrivning i ekonometri lördagen den 15 januari 2005

Skrivning i ekonometri lördagen den 15 januari 2005 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA102:3 Skrivning i ekonometri lördagen den 15 januari 5 1. Vi vill undersöka hur variationen i försäljningspris = price för hus i en liten stad

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2015-02-06, 8-12 Bertil Wegmann

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B Föreläsning 4 Kap 3.5, 3.8 Material om index 732G71 Statistik B Skötsel (y) Transformationer Ett av kraven för regressionsmodellens giltighet är att residualernas varians är konstant. Vad gör vi om så

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F3 1 / 21 Interaktion Ibland ser sambandet mellan en

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2017-12-08, 8-12 Bertil Wegmann

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression Enkel linjär regression Exempel.7 i boken (sida 31). Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben och höjder på sockeln. De halvledare

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15 732G71 Statistik B Föreläsning 6 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15 Efterfrågeanalys Metoder för att studera sambandet mellan efterfrågan på

Läs mer

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data Stat. teori gk, ht 006, JW F16 MULTIPEL LINJÄR REGRESSION (NCT 13.1-13.3, 13.9) Anpassning av linjär funktion till givna data Data med en beroende variabel (y) och K stycken (potentiellt) förklarande variabler

Läs mer

Bayesiansk statistik, 732g43, 7.5 hp

Bayesiansk statistik, 732g43, 7.5 hp Bayesiansk statistik, 732g43, 7.5 hp Moment 2 - Linjär regressionsanalys Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA, LiU) Bayesiansk statistik 1 / 29 Översikt moment 2: linjär

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: Betygsgränser: 732G21 Sambandsmodeller 2009-01-14,

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

Skrivning i ekonometri lördagen den 25 augusti 2007

Skrivning i ekonometri lördagen den 25 augusti 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA10:3 Skrivning i ekonometri lördagen den 5 augusti 007 1. Vi vill undersöka hur variationen i ölförsäljningen i ett bryggeri i en stad i USA

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2016-12-13, 8-12 Bertil Wegmann

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

Laboration 2 multipel linjär regression

Laboration 2 multipel linjär regression Laboration 2 multipel linjär regression I denna datorövning skall ni 1. analysera data enligt en multipel regressionsmodell, dvs. inkludera flera förklarande variabler i en regressionsmodell 2. studera

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels 7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan

Läs mer

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, 2015. IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, 2015. IDA, Linköpings universitet 732G71 Statistik B Föreläsning 2 Bertil Wegmann IDA, Linköpings universitet November 13, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 13, 2015 1 / 26 Kap. 4.1-4.5, multipel linjär regressionsanalys

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2018-01-12 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Mykola Shykula, Niklas

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Uppsala universitet Statistiska institutionen A5 2015-01-13 Tentamen Tillämpad statistik A5 (15hp) 2015-01-13 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling

Läs mer

TENTAMEN I MATEMATISK STATISTIK

TENTAMEN I MATEMATISK STATISTIK UMEÅ UNIVERSITET Institutionen för matematisk statistik Regressions- och variansanalys, 5 poäng MSTA35 Leif Nilsson TENTAMEN 2003-01-10 TENTAMEN I MATEMATISK STATISTIK Regressions- och variansanalys, 5

Läs mer

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Sid 1 (10) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift 1 Betrakta nedanstående täthetsfunktion för en normalfördelad slumpvariabel X med väntevärde

Läs mer

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Sid 1 (9) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift 1 a) Nämn en kontinuerlig och en diskret fördelning. Exempelvis normalfördelningen respektive

Läs mer

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet: LINKÖPINGS UNIVERSITET Institutionen för datavetenskap Statistik, ANd 732G71 STATISTIK B, 8hp Civilekonomprogrammet, t3, Ht 09 Extra övningsuppgifter Extra övningsuppgifter 1. Man tror sig veta att en

Läs mer

Examinationsuppgifter del 2

Examinationsuppgifter del 2 UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).

Läs mer

Exempel 1 på multipelregression

Exempel 1 på multipelregression Exempel på multipelregression Hastighet = högsta hastighet som uppnåtts fram till givna år (årtal) Årtal Hastighet 83 3 (tåg) 9 3 (tåg) 93 (flyg) 97 7 (flyg) 9 (flyg) 99 (raket) Fitted Line Plot Hastighet

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2018-01-12 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Mykola Shykula, Niklas

Läs mer

TENTAMEN I STATISTIK B,

TENTAMEN I STATISTIK B, 732G7 Tentamen. hp TENTAMEN I STATISTIK B, 24-2- Skrivtid: kl: -2 Tillåtna hjälpmedel: Ett A4-blad med egna handskrivna anteckningar samt räknedosa Jourhavande lärare: Lotta Hallberg Betygsgränser: Tentamen

Läs mer

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar: Flerfaktorförsök Blockförsök, randomiserade block Modell: yij i bj eij i 1,,, a j 1,,, b y ij vara en observation för den i:te behandlingen och det j:e blocket gemensamma medelvärdet ( grand mean ) effekt

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (9) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper.

Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Multikolinjäritet: Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Trots att COST verkade ha ett tydligt positivt samband med var och en av variablerna PAPER, MACHINE, OVERHEAD

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

8.1 General factorial experiments

8.1 General factorial experiments Exempel: Vid ett tillfälle ville man på ett laboratorium jämföra fyra olika metoder att bestämma kopparhalten i malmprover. Man är även intresserad av hur laboratoriets tre laboranter genomför sina uppgifter.

Läs mer

Linjär regressionsanalys. Wieland Wermke

Linjär regressionsanalys. Wieland Wermke + Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån

Läs mer

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23 732G71 Statistik B Föreläsning 8 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23 Klassisk komponentuppdelning Klassisk komponentuppdelning bygger på en intuitiv

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt Introduktion Vi har fått ta del av 13 mätningar av kroppstemperatur och hjärtfrekvens, varav på hälften män, hälften kvinnor, samt en studie på 77 olika flingsorters hyllplaceringar och sockerhalter. Vi

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Räkneövning 3 Variansanalys

Räkneövning 3 Variansanalys Räkneövning 3 Variansanalys Uppgift 1 Fyra sorter av majshybrider har utvecklats för att bli resistenta mot en svampinfektion. Nu vill man också studera deras produktionsegenskaper. Varje hybrid planteras

Läs mer

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab. Räkneövning 5 Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari 016 1 Om uppgifterna För Uppgift kan man med fördel ta hjälp av Minitab. I de fall en figur för tidsserien efterfrågas

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel

Läs mer

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet

Läs mer

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts. Syfte: Bestämma normal kroppstemperatur med tillgång till data från försök. Avgöra eventuell skillnad mellan män och kvinnor. Utforska ett eventuellt samband mellan kroppstemperatur och hjärtfrekvens.

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (9 uppgifter) Tentamensdatum 2013-08-27 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson och

Läs mer

F7 Polynomregression och Dummyvariabler

F7 Polynomregression och Dummyvariabler F7 Polnomregression och Dummvariabler Antag att man börjar med enkel linjär regression. Kap Polnomregression Emellanåt upptäcker man samband som är kvadratiska, kubiska osv. Allmänt: polnom av k:te ordningen

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Uppsala universitet Statistiska institutionen A5 2014-08-26 Tentamen Tillämpad statistik A5 (15hp) 2014-08-26 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (8 uppgifter) Tentamensdatum 2011-03-25 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Erland

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik, LP1, HT 2015, Adam Jonsson LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i enkel regressionsanalys

Läs mer

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng. 1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2014-10-28 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: A. Jonsson, M. Shykula,

Läs mer

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Sid (7) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift Nedanstående beräkningar från Minitab är gjorda för en Poissonfördelning med väntevärde λ = 4.

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

Matematisk statistik, Föreläsning 5

Matematisk statistik, Föreläsning 5 Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Multikolinjäritet: Vi kan också beräkna parvisa korrelationskoefficienter mellan förklaringsvariabler:

Multikolinjäritet: Vi kan också beräkna parvisa korrelationskoefficienter mellan förklaringsvariabler: Multikolinjäritet: Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Vi plottar förklaringsvariablerna mot varandra: Graph Matrix Plot Trots att COST verkade ha ett tydligt

Läs mer

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka. y Uppgift 1 (18p) I syfte för att se om antalet månader som man ägt en viss träningsutrustning påverkar träningsintensiteten har tio personer som har köpt träningsutrustningen fått ange hur många månader

Läs mer

För betyget GODKÄND krävs preliminärt minst 28 poäng. För betyget VÄL GOD- KÄND krävs preliminärt minst 43 poäng.

För betyget GODKÄND krävs preliminärt minst 28 poäng. För betyget VÄL GOD- KÄND krävs preliminärt minst 43 poäng. STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson Skriftlig hemtentamen i Fortsättningskurs i statistik, moment 1, Statistisk Teori, poäng. Deltentamen 2: Regressionsanalys Måndagen den

Läs mer

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4. Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student)

Läs mer

Följande resultat erhålls (enhet: 1000psi):

Följande resultat erhålls (enhet: 1000psi): Variansanalys Exempel Aluminiumstavar utsätts för uppvärmningsbehandlingar enligt fyra olika standardmetoder. Efter behandlingen uppmäts dragstyrkan hos varje stav. Fem upprepningar görs för varje behandling.

Läs mer

Föreläsning 3 Kap 3.4, 3.6, 4.2. 732G71 Statistik B

Föreläsning 3 Kap 3.4, 3.6, 4.2. 732G71 Statistik B Föreläsning 3 Kap 3.4, 3.6, 4.2 732G71 Statistik B Exempel 150 slumpmässigt utvalda fastigheter till salu i USA Pris (y) Bostadsyta Tomtyta Antal rum Antal badrum 179000 3060 0.75 8 2 285000 2516 8.1 7

Läs mer

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2014-03-26

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS, TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS, 204-0-3 Skrivtid: kl 8-2 Hjälpmedel: Räknedosa. Bowerman, B.J., O'Connell, R, Koehler, A.: Forecasting, Time Series and Regression. 4th ed. Duxbury, 2005 som

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2013-03-28 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson Jourhavande

Läs mer

Standard Normal Quantiles. Vilken av följande slutsatser kan man dra från qq-plotten?

Standard Normal Quantiles. Vilken av följande slutsatser kan man dra från qq-plotten? -2.5cm TENTAMEN: Statistisk modellering för I3, TMS160, lördagen den 11 december 2004 kl 8:30-11:30 på M. Jour: John Gustavsson, mob 0705-330375 Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på

Läs mer

Exempel 1 på multipelregression

Exempel 1 på multipelregression Exempel på multipelregression Hastighet = högsta hastighet som uppnåtts fram till givna år (årtal) Årtal Hastighet 8 (tåg) 95 (tåg) 9 (flyg) 97 7 (flyg) 95 5 (flyg) 99 5 (raket) Regression Plot Hastighet

Läs mer

Uppgift a b c d e f (vet ej) Poäng

Uppgift a b c d e f (vet ej) Poäng TENTAMEN: Statistisk modellering för I3, TMS161, lördagen den 22 Oktober kl 8.30-11.30 på V. Jour: John Gustafsson, ankn. 5316. Hjälpmedel: På hemsidan tillgänglig ordlista och formelsamling med tabeller,

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 4.00-7.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan och att en inblandning mellan 10% och 40% är bra. För att

Läs mer

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta? Tentamen i Matematisk statistik, S0001M, del 1, 2008-01-18 1. Ett företag som köper enheter från en underleverantör vet av erfarenhet att en viss andel av enheterna kommer att vara felaktiga. Sannolikheten

Läs mer

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

Instruktioner till Inlämningsuppgift 1 och Datorövning 1 STOCKHOLMS UNIVERSITET HT 2005 Statistiska institutionen 2005-10-14 MC Instruktioner till Inlämningsuppgift 1 och Datorövning 1 Kurs i Ekonometri, 5 poäng. Uppgiften ingår i examinationen för kursen och

Läs mer

732G71 Statistik B. Föreläsning 9. Bertil Wegmann. December 1, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 9. Bertil Wegmann. December 1, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 9 Bertil Wegmann IDA, Linköpings universitet December 1, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B December 1, 2016 1 / 20 Metoder för att analysera tidsserier Tidsserieregression

Läs mer

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval

Läs mer