732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Storlek: px
Starta visningen från sidan:

Download "732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet"

Transkript

1 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

2 Kap. 5.1, korrelationsmatris En korrelationsmatris är en matris med parvisa korrelationer, r, mellan alla kvantitativa variabler i modellen. Minitab ger även p-värdet för alla korrelationer från ett hypotestest med den sanna korrelationen, ρ, lika med noll under nollhypotesen. I tabellen nedan ges korrelationsmatrisen för variablerna försäljningspris (pris) i tusentals kronor (tkr), antal kvadratmeter (area), antal rum (rum), bostadsavgift (avgift) i tusentals kronor (tkr) och våningsplan för 58 slumpmässigt valda lägenhetspriser i Stockholms kommun. Correlation: Pris; area; rum; avgift; våningsplan Pris area rum avgift 0,618 area 0,000 rum 0,513 0,916 0,000 0,000 avgift 0,275 0,862 0,830 0,036 0,000 0,000 våningsplan 0,129-0,027 0,020-0,095 0,334 0,840 0,883 0,476 Cell Contents: Pearson correlation P-Value Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

3 Kap. 5.1, multikolinjäritet Perfekt multikolinjäritet existerar om en eller era förklaringsvarabler är en linjärkombination av en eller era andra förklaringsvariabler, d.v.s. om det gäller för minst en förklaringsvariabel x j bland k stycken förklaringsvariabler att x j = a 1 x 1 + a 2 x a j 1 x j 1 + a j+1 x j a k x k för konstanterna a 1, a 2,..., a j 1, a j+1,..., a k. I ett sådant fall går det inte att skatta en regressionsmodell. I praktiken är det mer vanligt att man får problem med multikolinjäritet för att att en eller era förklaringsvariabler är högt korrelerade med en eller era andra förklaringsvariabler. Då går det att skatta regressionsmodellen men man får stor osäkerhet i skattningarna för parameterarna, d.v.s. höga värden på s b1, s b2,.... Som tumregel brukar man anse att det är allvarliga problem med multikolinjäriet om minst en korrelationskoecient r är minst 0.9. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

4 Kap. 5.1, multikolinjäritet Ett annat sätt att mäta multikolinjäritet på är att använda Variance Ination Factors (VIF). VIF för varje förklaringsvariabel x j beräknas som VIF j = 1, 1 Rj 2 där Rj 2 är förklaringsgraden från en multipel linjär regressionsmodell med x j som beroende variabel och övriga förklaringsvariabler som förklaringsvariabler. Multikolinjäritet anses vara ett stort problem om 1. Någon VIF > Medelvärdet av alla VIF är mycket större än 1. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

5 Exempel, skattad regressionsmodell från Minitab Regression Analysis: Pris versus area; rum; avgift; innerstan; söderort Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression ,56 0,000 area ,70 0,000 rum ,12 0,726 avgift ,07 0,000 innerstan ,96 0,000 söderort ,68 0,061 Error Total Model Summary S R-sq R-sq(adj) R-sq(pred) 1003,41 75,22% 72,83% 55,71% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant ,69 0,492 area 100,1 13,8 7,26 0,000 7,96 rum ,35 0,726 6,81 avgift ,25 0,000 5,31 innerstan ,47 0,000 3,17 söderort ,92 0,061 2,73 Regression Equation Pris = ,1 area rum avgift innerstan söderort Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

6 Exempel, skattad regressionsmodell från Minitab Regression Analysis: Pris versus area; avgift; innerstan; söderort Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression ,08 0,000 area ,18 0,000 avgift ,08 0,000 innerstan ,85 0,000 söderort ,21 0,045 Error Total Model Summary S R-sq R-sq(adj) R-sq(pred) 995,085 75,16% 73,28% 59,78% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant ,73 0,471 area 96,71 9,86 9,81 0,000 4,14 avgift ,48 0,000 5,04 innerstan ,57 0,000 3,13 söderort ,05 0,045 2,61 Regression Equation Pris = ,71 area avgift innerstan söderort Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

7 Val av den bästa modellen Målet är att hitta en modell som beskriver datamaterialet så bra som möjligt och som kan göra bra prognoser för nya observationer. Vi kan jämföra regressionsmodeller med olika uppsättningar av förklaringsvariabler med avseende på förklaringsgrad R 2 justerad förklaringsgrad R 2 den skattade standardavvikelsen för feltermen ɛ: s längd på prediktionsintervall/prognosintervall Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

8 Best subsets regression från Minitab Best Subsets Regression: Pris versus area; rum;... Response is Pris v å n i i n s n n ö a g e d v s r e a g p s r r r i l t o R-Sq R-Sq Mallows e u f a a r Vars R-Sq (adj) (pred) Cp S a m t n n t 1 38,2 37,1 25,7 73,4 1526,8 X 1 26,3 25,0 19,1 97,9 1667,3 X 2 64,2 62,9 51,7 21,8 1172,6 X X 2 63,9 62,6 47,2 22,4 1177,8 X X 3 73,2 71,7 58,2 5,3 1024,2 X X X 3 65,7 63,8 52,3 20,6 1157,6 X X X 4 75,2 73,3 59,8 3,2 995,08 X X X X 4 73,5 71,5 54,5 6,7 1028,4 X X X X 5 75,2 72,8 56,5 5,1 1003,4 X X X X X 5 75,2 72,8 55,7 5,1 1003,4 X X X X X 6 75,3 72,3 52,9 7,0 1012,4 X X X X X X Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

9 Kapitel 5.1, stegvis regression Procedur för att välja vilka förklaringsvariabler som ska ingå i regressionsmodellen. Börja med att sätta signikansnivåer på att en variabel ska läggas till i modellen, α entry, och att en variabel ska stanna kvar i modellen, α stay. Antag att alla möjliga förklaringsvariabler i modellen är k stycken: 1) k stycken enkla linjära regressionsmodeller skattas och den variabel som ger högst förklaringsgrad R 2 läggs till i modellen (givet att p värdet < α entry ). Om ingen variabel ger en signikant skattning av lutningen så slutar proceduren här. 2) Den variabel av de återstående k 1 variablerna som är mest signikant relaterad till y, givet att den 1 :a variabeln är med i modellen, läggs till i modellen (givet att p värdet < α entry ). Den 1:a variabeln stannar i modellen om p värdet < α stay gäller. Om inte tas den bort från modellen och proceduren fortsätter. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

10 Kapitel 5.1, stegvis regression Proceduren fortsätter med att lägga till variabler en och en samtidigt som gamla variabler kontrolleras, och de som inte längre är signikanta i modellen tas bort. Proceduren är klar när alla variabler i modellen är signikanta och ingen signikant variabel kan läggas till. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

11 Exempel, stegvis regression i Minitab Regression Analysis: Pris versus area; rum; avgift; våningsplan; innerstan; söderort Stepwise Selection of Terms Candidate terms: area; rum; avgift; våningsplan; innerstan; söderort ----Step Step Step Step Coef P Coef P Coef P Coef P Constant area 43,75 0,000 58,28 0,000 94,6 0,000 96,71 0,000 innerstan , , ,000 avgift , ,000 söderort 893 0,045 S 1526, , ,22 995,085 R-sq 38,20% 64,20% 73,18% 75,16% R-sq(adj) 37,10% 62,90% 71,69% 73,28% R-sq(pred) 25,66% 51,70% 58,17% 59,78% Mallows Cp 73,37 21,79 5,27 3,21 α to enter = 0,05; α to remove = 0,05 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

12 Kapitel 5.2, bakåteliminering Välj signikansnivå för att en variabel ska stanna kvar i modellen, α stay. Antag att alla möjliga förklaringsvariabler i modellen är k stycken: 1) Regressionsmodellen med alla k stycken variabler skattas. Den förklaringsvariabel vars parameter har högst p v ärde, givet att p värdet > α stay, tas bort från modellen. 2) Den nya regressionsmodellen skattas. Den förklaringsvariabel vars parameter har högst p värde, givet att p värdet > α stay, tas bort från modellen. Proceduren fortsätter tills alla variabler är signikanta. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

13 Exempel, stegvis regression med bakåteliminering i Minitab Regression Analysis: Pris versus area; rum; avgift; våningsplan; innerstan; söderort Backward Elimination of Terms Candidate terms: area; rum; avgift; våningsplan; innerstan; söderort ----Step Step Step Coef P Coef P Coef P Constant area 99,8 0,000 97,01 0,000 96,71 0,000 rum -91 0,775 avgift , , ,000 våningsplan -19,6 0,773-23,3 0,725 innerstan , , ,000 söderort 896 0, , ,045 S 1012, ,40 995,085 R-sq 75,26% 75,22% 75,16% R-sq(adj) 72,34% 72,83% 73,28% R-sq(pred) 52,93% 56,46% 59,78% Mallows Cp 7,00 5,08 3,21 α to remove = 0,05 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

14 Den bästa modellen från metoderna Regression Analysis: Pris versus area; avgift; innerstan; söderort Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression ,08 0,000 area ,18 0,000 avgift ,08 0,000 innerstan ,85 0,000 söderort ,21 0,045 Error Total Model Summary S R-sq R-sq(adj) R-sq(pred) 995,085 75,16% 73,28% 59,78% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant ,73 0,471 area 96,71 9,86 9,81 0,000 4,14 avgift ,48 0,000 5,04 innerstan ,57 0,000 3,13 söderort ,05 0,045 2,61 Regression Equation Pris = ,71 area avgift innerstan söderort Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

15 Kapitel , residualanalys Efter att ha valt den bästa regressionsmodellen med förklaringsvariabler så kan vi utvärdera modellen. Kom ihåg, enligt modellantagandena för den multipla linjära regressionsmodellen ska följande egenskaper vara uppfyllda: 1. För varje kombination av värden x 1, x 2,..., x k är medelvärdet för värdena på feltermen noll. 2. Konstant varians. För varje kombination av värden x 1, x 2,..., x k har värdena på feltermen konstant varians. Denna varians kallas för σ Normalf ördelning. För varje kombination av värden x 1, x 2,..., x k följer värdena på feltermen en normalfördelning. 4. Oberoende. Alla värden på feltermen är statistiskt oberoende av alla andra värden på feltermen. ɛ N (0, σ) Vi kan inte undersöka feltermerna direkt, utan undersöker i stället utseendet på residualerna e (de skattade feltermerna) residual = e = y ŷ Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

16 Kapitel , residualanalys Vi plottar residualerna e mot de skattade värdena ŷ för att undersöka om variansen runt regressionslinjen verkar vara konstant (om den ser ut som en strut så tyder det på ökande/minskande varians för ökande värden på ŷ) (antagande 1. och 2.). I samma plot kan vi undersöka om det linjära antagandet i den linjära regressionsmodellen är uppfylld genom att undersöka om det nns något mönster i plotten. I ett histogram för residualerna och i diagrammet normal probability plot kan vi undersöka om residualerna ser normalfördelade ut (antagande 3.). Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

17 Exempel, enkel linjär regressionsanalys med pris och area Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

18 Exempel, residualplottar Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

19 Kapitel 5.4, ovanliga observationer I föregående plottar upptäckte vi en observation som avviker väldigt mycket från de övriga observationerna i data. Allmänt gäller att en observation som skiljer sig från resten av data kallas outlier. Den kan vara extrem i förhållande till förklaringsvariablerna: stort "leverage" (distance value) extrem i förhållande till regressionslinjen: stor residual (inytelserik) I vårt exempel är observationen extrem i förhållande till regressionslinjen, eftersom den ger en väldigt stor residual. Om vi upptäcker en misstänkt outlier bör vi undersöka om det kan bero på felmätning/inmatning. Gör det inte det kan vi fundera över om observationen tillhör populationen vi vill dra slutsatser om. Gör den det och observationen är misstänkt inytelserik kan vi prova att göra en ny analys utan observationen och se hur resultaten förändras. I en resultatrapport bör vi då redovisa resultaten både med och utan observationen/rna. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

20 Exempel, borttagning av outlier På grund av att observationen är så pass extrem i förhållande till övriga observationer i datamaterialet, så prövar vi att göra om analysen utan denna observation och generaliserar våra resultat till ordinära lägenheter i Stockholms kommun. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

21 Exempel, enkel linjär regressionsanalys med pris och area Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

22 Exempel, residualplottar Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

23 Ökande varians? Vi kan prova att transformera y y = y Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

24 Exempel, residualplottar Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

25 Något annat som kan vara fel? Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

26 Exempel, skattad regressionsmodell från Minitab Regression Analysis: Pris versus area; innerstan; söderort; area*innerstan; area*söderort Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression ,25 0,000 area ,39 0,000 innerstan ,29 0,043 söderort ,39 0,041 area*innerstan ,00 0,966 area*söderort ,83 0,098 Error Lack-of-Fit ,02 0,039 Pure Error Total Model Summary S R-sq R-sq(adj) R-sq(pred) 710,257 70,39% 67,49% 59,00% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant ,11 0,272 area 57,9 14,3 4,05 0,000 14,97 innerstan ,07 0,043 41,28 söderort ,10 0,041 39,72 area*innerstan -0,7 16,1-0,04 0,966 21,69 area*söderort -25,8 15,3-1,68 0,098 37,74 Regression Equation Pris = ,9 area innerstan söderort - 0,7 area*innerstan - 25,8 area*söderort När man lägger till en interaktionsterm eller en kvadratisk term får man ofta problem med multikolinjäritet. Ett sätt att minska detta på är att centrera förklaringsvariablerna som ingår i interaktionstermen (dummyvariabeln behöver inte centreras) som x centrerad = x x. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

27 Exempel, skattad regressionsmodell från Minitab Regression Analysis: Pris versus CenterArea; innerstan; söderort; CenterArea*i; CenterArea*s Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression ,25 0,000 CenterArea ,39 0,000 innerstan ,62 0,000 söderort ,18 0,016 CenterArea*innerstan ,00 0,966 CenterArea*söderort ,83 0,098 Error Lack-of-Fit ,02 0,039 Pure Error Total Model Summary S R-sq R-sq(adj) R-sq(pred) 710,257 70,39% 67,49% 59,00% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant ,85 0,000 CenterArea 57,9 14,3 4,05 0,000 14,97 innerstan ,05 0,000 4,68 söderort ,49 0,016 4,43 CenterArea*innerstan -0,7 16,1-0,04 0,966 5,81 CenterArea*söderort -25,8 15,3-1,68 0,098 8,43 Regression Equation Pris = ,9 CenterArea innerstan söderort - 0,7 CenterArea*innerstan - 25,8 CenterArea*söderort Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

28 Exempel, residualplottar Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

29 Exempel, stegvis regression i Minitab Regression Analysis: Pris versus CenterArea; rum; avgift; våningsplan; innerstan; söderort Stepwise Selection of Terms Candidate terms: CenterArea; rum; avgift; våningsplan; innerstan; söderort ----Step Step Step Step Coef P Coef P Coef P Coef P Constant CenterArea 28,07 0,000 41,44 0,000 58,30 0,000 60,92 0,000 innerstan , , ,000 avgift , ,021 söderort 701 0,032 S 1025,29 773, , ,196 R-sq 33,47% 62,85% 65,77% 68,70% R-sq(adj) 32,26% 61,47% 63,83% 66,30% R-sq(pred) 29,60% 59,02% 60,92% 61,73% Mallows Cp 61,03 12,67 9,67 6,64 α to enter = 0,05; α to remove = 0,05 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

30 Exempel, stegvis regression i Minitab Regression Analysis: Pris versus CenterArea; avgift; innerstan; söderort Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression ,54 0,000 CenterArea ,67 0,000 avgift ,69 0,021 innerstan ,58 0,000 söderort ,88 0,032 Error Total Model Summary S R-sq R-sq(adj) R-sq(pred) 723,196 68,70% 66,30% 61,73% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant ,05 0,000 CenterArea 60,92 8,82 6,90 0,000 5,49 avgift ,38 0,021 6,29 innerstan ,44 0,000 3,12 söderort ,21 0,032 2,60 Regression Equation Pris = ,92 CenterArea avgift innerstan söderort Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

31 Residualplott för modell utan interaktionstermer Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

32 Inkluderar den bästa modellen interaktionstermer? Ett partiellt F-test för interaktionstermerna CenterArea innerstan och CenterArea söderort ger. F = > F [0.05],6 4,40 = 3.23 > F [0.05],6 4, Alltså är minst en av interaktionstermerna från F-testet signikant, d.v.s. vi kan behålla båda interaktionstermerna i modellen. Obs! Variance Ination Factor (VIF) har dock ett väldigt högt värde för förklaringsvariabeln CenterArea. Därför kan det vara bättre att inte inkludera interaktionstermerna. Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

33 Modell med interaktionstermer Regression Analysis: Pris versus CenterArea; avgift; innerstan; söderort; CenterArea*i;... Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression ,24 0,000 CenterArea ,67 0,000 avgift ,31 0,043 innerstan ,44 0,000 söderort ,43 0,009 CenterArea*innerstan ,07 0,789 CenterArea*söderort ,04 0,087 Error Total Model Summary S R-sq R-sq(adj) R-sq(pred) 688,257 72,74% 69,47% 61,05% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant ,11 0,000 CenterArea 74,7 16,0 4,66 0,000 20,05 avgift ,08 0,043 6,52 innerstan ,78 0,000 4,82 söderort ,73 0,009 4,46 CenterArea*innerstan -4,2 15,7-0,27 0,789 5,88 CenterArea*söderort -25,9 14,8-1,74 0,087 8,43 Regression Equation Pris = ,7 CenterArea avgift innerstan söderort - 4,2 CenterArea*innerstan - 25,9 CenterArea*söderort Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

34 Residualplott för modell med interaktionstermer Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, / 34

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 3 Bertil Wegmann IDA, Linköpings universitet November 4, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 4, 2015 1 / 22 Kap. 4.8, interaktionsvariabler Ibland

Läs mer

Regressions- och Tidsserieanalys - F5

Regressions- och Tidsserieanalys - F5 Regressions- och Tidsserieanalys - F5 Linda Wänström Linköpings universitet November 20 Wänström (Linköpings universitet) F5 November 20 1 / 24 Modellbygge - vilka oberoende variabler ska vara med i modellen?

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när

Läs mer

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB2 Skrivning i ekonometri onsdagen den 1 juni 211 1. Vi vill undersöka hur variationen i försäljningspriset för ett hus (i en liten stad i USA

Läs mer

Skrivning i ekonometri lördagen den 15 januari 2005

Skrivning i ekonometri lördagen den 15 januari 2005 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA102:3 Skrivning i ekonometri lördagen den 15 januari 5 1. Vi vill undersöka hur variationen i försäljningspris = price för hus i en liten stad

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet November 6, 2013 Wänström (Linköpings universitet) F3 November 6, 2013 1 / 22 Interaktion

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2015-02-06, 8-12 Bertil Wegmann

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B Föreläsning 4 Kap 3.5, 3.8 Material om index 732G71 Statistik B Skötsel (y) Transformationer Ett av kraven för regressionsmodellens giltighet är att residualernas varians är konstant. Vad gör vi om så

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F3 1 / 21 Interaktion Ibland ser sambandet mellan en

Läs mer

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression Enkel linjär regression Exempel.7 i boken (sida 31). Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben och höjder på sockeln. De halvledare

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: Betygsgränser: 732G21 Sambandsmodeller 2009-01-14,

Läs mer

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, 2015. IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, 2015. IDA, Linköpings universitet 732G71 Statistik B Föreläsning 2 Bertil Wegmann IDA, Linköpings universitet November 13, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 13, 2015 1 / 26 Kap. 4.1-4.5, multipel linjär regressionsanalys

Läs mer

Skrivning i ekonometri lördagen den 25 augusti 2007

Skrivning i ekonometri lördagen den 25 augusti 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA10:3 Skrivning i ekonometri lördagen den 5 augusti 007 1. Vi vill undersöka hur variationen i ölförsäljningen i ett bryggeri i en stad i USA

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2016-12-13, 8-12 Bertil Wegmann

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

TENTAMEN I MATEMATISK STATISTIK

TENTAMEN I MATEMATISK STATISTIK UMEÅ UNIVERSITET Institutionen för matematisk statistik Regressions- och variansanalys, 5 poäng MSTA35 Leif Nilsson TENTAMEN 2003-01-10 TENTAMEN I MATEMATISK STATISTIK Regressions- och variansanalys, 5

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Sid 1 (10) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift 1 Betrakta nedanstående täthetsfunktion för en normalfördelad slumpvariabel X med väntevärde

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (9) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Exempel 1 på multipelregression

Exempel 1 på multipelregression Exempel på multipelregression Hastighet = högsta hastighet som uppnåtts fram till givna år (årtal) Årtal Hastighet 83 3 (tåg) 9 3 (tåg) 93 (flyg) 97 7 (flyg) 9 (flyg) 99 (raket) Fitted Line Plot Hastighet

Läs mer

Examinationsuppgifter del 2

Examinationsuppgifter del 2 UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).

Läs mer

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar: Flerfaktorförsök Blockförsök, randomiserade block Modell: yij i bj eij i 1,,, a j 1,,, b y ij vara en observation för den i:te behandlingen och det j:e blocket gemensamma medelvärdet ( grand mean ) effekt

Läs mer

Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper.

Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Multikolinjäritet: Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Trots att COST verkade ha ett tydligt positivt samband med var och en av variablerna PAPER, MACHINE, OVERHEAD

Läs mer

TENTAMEN I STATISTIK B,

TENTAMEN I STATISTIK B, 732G7 Tentamen. hp TENTAMEN I STATISTIK B, 24-2- Skrivtid: kl: -2 Tillåtna hjälpmedel: Ett A4-blad med egna handskrivna anteckningar samt räknedosa Jourhavande lärare: Lotta Hallberg Betygsgränser: Tentamen

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt Introduktion Vi har fått ta del av 13 mätningar av kroppstemperatur och hjärtfrekvens, varav på hälften män, hälften kvinnor, samt en studie på 77 olika flingsorters hyllplaceringar och sockerhalter. Vi

Läs mer

Räkneövning 3 Variansanalys

Räkneövning 3 Variansanalys Räkneövning 3 Variansanalys Uppgift 1 Fyra sorter av majshybrider har utvecklats för att bli resistenta mot en svampinfektion. Nu vill man också studera deras produktionsegenskaper. Varje hybrid planteras

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Linjär regressionsanalys. Wieland Wermke

Linjär regressionsanalys. Wieland Wermke + Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel

Läs mer

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab. Räkneövning 5 Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari 016 1 Om uppgifterna För Uppgift kan man med fördel ta hjälp av Minitab. I de fall en figur för tidsserien efterfrågas

Läs mer

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen

Läs mer

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts. Syfte: Bestämma normal kroppstemperatur med tillgång till data från försök. Avgöra eventuell skillnad mellan män och kvinnor. Utforska ett eventuellt samband mellan kroppstemperatur och hjärtfrekvens.

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (8 uppgifter) Tentamensdatum 2011-03-25 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Erland

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Uppsala universitet Statistiska institutionen A5 2014-08-26 Tentamen Tillämpad statistik A5 (15hp) 2014-08-26 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng. 1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga

Läs mer

Multikolinjäritet: Vi kan också beräkna parvisa korrelationskoefficienter mellan förklaringsvariabler:

Multikolinjäritet: Vi kan också beräkna parvisa korrelationskoefficienter mellan förklaringsvariabler: Multikolinjäritet: Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Vi plottar förklaringsvariablerna mot varandra: Graph Matrix Plot Trots att COST verkade ha ett tydligt

Läs mer

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka. y Uppgift 1 (18p) I syfte för att se om antalet månader som man ägt en viss träningsutrustning påverkar träningsintensiteten har tio personer som har köpt träningsutrustningen fått ange hur många månader

Läs mer

Föreläsning 3 Kap 3.4, 3.6, 4.2. 732G71 Statistik B

Föreläsning 3 Kap 3.4, 3.6, 4.2. 732G71 Statistik B Föreläsning 3 Kap 3.4, 3.6, 4.2 732G71 Statistik B Exempel 150 slumpmässigt utvalda fastigheter till salu i USA Pris (y) Bostadsyta Tomtyta Antal rum Antal badrum 179000 3060 0.75 8 2 285000 2516 8.1 7

Läs mer

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4. Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student)

Läs mer

Följande resultat erhålls (enhet: 1000psi):

Följande resultat erhålls (enhet: 1000psi): Variansanalys Exempel Aluminiumstavar utsätts för uppvärmningsbehandlingar enligt fyra olika standardmetoder. Efter behandlingen uppmäts dragstyrkan hos varje stav. Fem upprepningar görs för varje behandling.

Läs mer

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS, TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS, 204-0-3 Skrivtid: kl 8-2 Hjälpmedel: Räknedosa. Bowerman, B.J., O'Connell, R, Koehler, A.: Forecasting, Time Series and Regression. 4th ed. Duxbury, 2005 som

Läs mer

Standard Normal Quantiles. Vilken av följande slutsatser kan man dra från qq-plotten?

Standard Normal Quantiles. Vilken av följande slutsatser kan man dra från qq-plotten? -2.5cm TENTAMEN: Statistisk modellering för I3, TMS160, lördagen den 11 december 2004 kl 8:30-11:30 på M. Jour: John Gustavsson, mob 0705-330375 Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på

Läs mer

Exempel 1 på multipelregression

Exempel 1 på multipelregression Exempel på multipelregression Hastighet = högsta hastighet som uppnåtts fram till givna år (årtal) Årtal Hastighet 8 (tåg) 95 (tåg) 9 (flyg) 97 7 (flyg) 95 5 (flyg) 99 5 (raket) Regression Plot Hastighet

Läs mer

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2014-03-26

Läs mer

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

Instruktioner till Inlämningsuppgift 1 och Datorövning 1 STOCKHOLMS UNIVERSITET HT 2005 Statistiska institutionen 2005-10-14 MC Instruktioner till Inlämningsuppgift 1 och Datorövning 1 Kurs i Ekonometri, 5 poäng. Uppgiften ingår i examinationen för kursen och

Läs mer

Uppgift a b c d e f (vet ej) Poäng

Uppgift a b c d e f (vet ej) Poäng TENTAMEN: Statistisk modellering för I3, TMS161, lördagen den 22 Oktober kl 8.30-11.30 på V. Jour: John Gustafsson, ankn. 5316. Hjälpmedel: På hemsidan tillgänglig ordlista och formelsamling med tabeller,

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2013-03-28 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson Jourhavande

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2012-10-30 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson och

Läs mer

tentaplugg.nu av studenter för studenter

tentaplugg.nu av studenter för studenter tentaplugg.nu av studenter för studenter Kurskod Kursnamn SM Matematisk statistik Datum LP - Material Laboration 4 Kursexaminator Adam Betygsgränser Tentamenspoäng Övrig kommentar Försättsblad inlämningsuppgift

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan och att en inblandning mellan 10% och 40% är bra. För att

Läs mer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat

Läs mer

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta? Tentamen i Matematisk statistik, S0001M, del 1, 2008-01-18 1. Ett företag som köper enheter från en underleverantör vet av erfarenhet att en viss andel av enheterna kommer att vara felaktiga. Sannolikheten

Läs mer

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:.. TENTAMEN Tentamensdatum 8-3-7 Statistik för ekonomer, Statistik A, Statistik A (Moment ) : (7.5 hp) Namn:.. Personnr:.. Tentakod: A3 Var noga med att fylla i din kod samt uppgiftsnummer på alla lösningsblad

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod SM Poäng totalt för del : 5 (9 uppgifter) Tentamensdatum -3-3 Poäng totalt för del : 3 (3 uppgifter) Skrivtid 9. 4. Lärare: Adam Jonsson och Inge Söderkvist Jourhavande

Läs mer

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Christian Aguirre Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:17 Matematisk

Läs mer

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden

Läs mer

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys. Tentamen i Matematisk statistik Ämneskod-linje S0001M Poäng totalt för del 1 5 (8 uppgifter) Poäng totalt för del 0 ( uppgifter) Tentamensdatum 009-10-6 Adam Jonsson Lärare: Lennart Karlberg Robert Lundqvist

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK UMEÅ UNIVERSITET Institutionen för matematisk statistik MSTA16, Statistik för tekniska fysiker A Peter Anton TENTAMEN 2004-08-23 LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK Statistik för tekniska

Läs mer

tentaplugg.nu av studenter för studenter

tentaplugg.nu av studenter för studenter tentaplugg.nu av studenter för studenter Kurskod Kursnamn SM Matematisk statistik Datum LP - Material Laboration Kursexaminator Adam Betygsgränser Tentamenspoäng Övrig kommentar Försättsblad inlämningsuppgift

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

Del A: Schema för ifyllande av svar nns på sista sidan

Del A: Schema för ifyllande av svar nns på sista sidan Del A: Schema för ifyllande av svar nns på sista sidan 1 1 Nedladdningstiden (i sekunder) för en bestämd l registrerades 16 gånger vid var och en av tre olika tidpunkter på dygnet. ANOVA-analys av dessa

Läs mer

Statistisk analys av komplexa data

Statistisk analys av komplexa data Statistisk analys av komplexa data Trunkerade data och Tobitregression Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 10, 2015 Bertil Wegmann (statistik, LiU) Trunkerade data

Läs mer

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys) Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,

Läs mer

Kvadratisk regression, forts.

Kvadratisk regression, forts. Kvadratisk regression, forts. Vi fortsätter med materialet om fastigheter. Tidigare föreslog vi som en tänkbar modell y 0 + 3 x 3 + 5 x 3 2 + Vari ligger tanken att just använda en kvadratisk term? Det

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Datorövning 1 Enkel linjär regressionsanalys

Datorövning 1 Enkel linjär regressionsanalys Datorövning 1 Enkel linjär regressionsanalys Datorövningen utförs i grupper om två personer. I denna datorövning skall ni använda Excel och Minitab för att 1. få en visuell uppfattning om vad ett regressionssamband

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström October 31, 2010 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik Grundläggande statistik Påbyggnadskurs T1 Odontologisk profylaktik FÖRELÄSNINGSMATERIAL : KORRELATION OCH HYPOTESTESTNING t diff SE x 1 diff SE x x 1 x. Analytisk statistik Regression & Korrelation Oberoende

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys). Tentamen i Matematisk statistik Ämneskod-linje S000M Poäng totalt för del 25 (8 uppgifter) Poäng totalt för del 2 0 ( uppgifter) Tentamensdatum 200-0-5 Ove Edlund Lärare: Adam Jonsson Robert Lundqvist

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Korrelation och regression Innehåll 1 Korrelation och regression Spridningsdiagram Då ett datamaterial består av två (eller era) variabler är man ofta intresserad av att veta om det nns ett

Läs mer

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm Kungliga Tekniska Högskolan Kandidatexamensarbete i Teknisk Fysik Institutionen för Matematisk Statistik Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm Författare:

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2014-06-05 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Jesper

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström April 8, 2011 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,

Läs mer

Obligatorisk uppgift, del 1

Obligatorisk uppgift, del 1 Obligatorisk uppgift, del 1 Uppgiften består av tre sannolikhetsproblem, som skall lösas med hjälp av miniräknare och tabellsamling. 1. Vid tillverkning av en produkt är felfrekvensen 0,02, dvs sannolikheten

Läs mer

Regressions- och Tidsserieanalys - F8

Regressions- och Tidsserieanalys - F8 Regressions- och Tidsserieanalys - F8 Klassisk komponentuppdelning, kap 7.1.-7.2. Linda Wänström Linköpings universitet November 26 Wänström (Linköpings universitet) F8 November 26 1 / 23 Klassisk komponentuppdelning

Läs mer

HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS, 5p Ekonomprogrammet, t2, Vt 06 Tentamen

HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS, 5p Ekonomprogrammet, t2, Vt 06 Tentamen LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik, ANd HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS, 5p Ekonomprogrammet, t2, Vt 06 Tentamen REGRESSIONS- OCH TIDSSERIEANALYS, 5 P TENTAMEN LÖRDAGEN

Läs mer

TENTAMEN I MATEMATISK STATISTIK

TENTAMEN I MATEMATISK STATISTIK UMEÅ UNIVERSITET Institutionen för matematisk statistik Statistik för Teknologer, 5 poäng MSTA33 Ingrid Svensson TENTAMEN 2004-01-13 TENTAMEN I MATEMATISK STATISTIK Statistik för Teknologer, 5 poäng Tillåtna

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (9 uppgifter) Tentamensdatum 2011-10-25 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Lennart

Läs mer

Tentamen i Statistik, STA A11/STA A14 (8 poäng) 25 augusti 2004, klockan 08.15-13.15

Tentamen i Statistik, STA A11/STA A14 (8 poäng) 25 augusti 2004, klockan 08.15-13.15 Karlstads universitet Institutionen för informationsteknologi Avdelningen för Statistik Tentamen i Statistik, STA A/STA A4 (8 poäng) 5 augusti 4, klokan 8.5-3.5 Tillåtna hjälpmedel: Bifogad formelsamling

Läs mer

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng. UMEÅ UNIVERSITET Institutionen för matematisk statistisk Statistiska metoder, poäng TENTAMEN -8 Per Arnqvist TENTAMEN I MATEMATISK STATISTIK Statistiska metoder, poäng Tillåtna hjälpmedel: Kursboken med

Läs mer

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska Innehåll I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser Univariata analyser Univariata analyser

Läs mer

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION. MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1 Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-19 Motivering Vi motiverade enkel linjär regression som ett

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 12 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 December 1 / 12 Explorativ Faktoranalys

Läs mer

Formler och tabeller till kursen MSG830

Formler och tabeller till kursen MSG830 Formler och tabeller till kursen MSG830 Deskriptiva mått För ett datamängd x 1,, x n denieras medelvärde standardavvikelse standardfelet (SEM) Sannolikheter x = 1 n n i=1 = x 1 + + x n n s = 1 n (x i x)

Läs mer

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2013-03-27

Läs mer