Multikolinjäritet: Vi kan också beräkna parvisa korrelationskoefficienter mellan förklaringsvariabler:

Storlek: px
Starta visningen från sidan:

Download "Multikolinjäritet: Vi kan också beräkna parvisa korrelationskoefficienter mellan förklaringsvariabler:"

Transkript

1 Multikolinjäritet: Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Vi plottar förklaringsvariablerna mot varandra: Graph Matrix Plot Trots att COST verkade ha ett tydligt positivt samband med var och en av variablerna PAPE, MACHINE, OVEHEAD och LABO blev endast de två första signifikanta.????? Kan det vara så att förklaringsvariablerna överlappar varandra när det gäller att förklara kostnaden? Vi kan också beräkna parvisa korrelationskoefficienter mellan förklaringsvariabler: MTB > corr c-c5 Correlations: PAPE; MACHINE; OVEHEAD; LABO MACHINE PAPE MACHINE OVEHEAD OVEHEAD LABO Tydligt samband mellan alla par av förklaringsvariabler. Cell Contents: Pearson correlation P-Value och vi ser att samtliga korrelationer ligger mycket nära 1. 1

2 Om korrelationen är hög (över 0.9) mellan två förklaringsvariabler blir modellen svår att analysera: konstiga värden på parameterskattningar ( t ex negativa lutningsparametrar där sambandet skall vara positivt) låga t-kvoter, dvs. svårt att påvisa signifikans för enskilda förklaringsvariabler. konstiga modeller ( självklara förklaringsvariabler blir inte av betydelse i modellen) Orsaken är att det är svårt i en anpassad modell att separera vad i varje förklaringsvariabel som främst förklarar variationen i y. Problemet har kommit att kallas multikolinjäritet Dock kan det räcka med namnet kolinjäritet, eller ännu hellre samlinjäritet. Vad det handlar om är att en förklaringsvariabel är nära linjärt beroende av en eller flera (därav multi) av de andra förklaringsvariablerna Hur upptäcker man och hur åtgärdar man detta? Metod 1: Beräkna korrelationskoefficienterna mellan samtliga par av variabler, dvs. även med y. Om två eller flera av förklaringsvariablerna har höga korrelationer med varandra, uteslut alla av dessa utom den som har högst korrelation med y. I exemplet beräknar vi MTB > corr c1-c5 Correlations: COST, PAPE, MACHINE, OVEHEAD, LABO PAPE COST PAPE MACHINE OVEHEAD MACHINE OVEHEAD LABO Alla korrelationer är högre än 0.9. MACHINE har högst korrelation med COST och bör då vara den variabel som väljs. (Dock är PAPE en mycket nära kandidat här.) Metod : Om det föreligger starka samband mellan en förklaringsvariabel och en eller flera av de övriga förklaringsvariablerna kan man tänka sig en modell där den första förklaras av de andra. T ex om x 1 har starka samband med variablerna x, x 3, x 4 blir en modell: x 1 = β 0 + β 1 x +β x 3 +β 3 x 4 +ε Om denna modell anpassas erhålls en förklaringsgrad 1, som anger hur stor del av den totala variationen i x 1 som förklaras av de övriga x- variablerna. Är 1 stor borde man kunna utesluta x 1 ur modellen för y Cell Contents: Pearson correlation P-Value

3 Den s k Variance Inflation Factor, VIF, för variabeln x 1 definieras som 1 VIF1 = 1 1 Och vi ser att för ett stort värde hos 1 blir också VIF 1 stor. VIF kan som lägst bli 1 vilket inträffar då 1 =0. Om 1 =1 blir VIF oändligt stor, men detta inträffar i princip inte. Vi anpassar modellen x 1 = β 0 + β 1 x +β x 3 +β 3 x 4 +ε med Minitab: MTB > regress c 3 c3-c5 egression Analysis: PAPE versus MACHINE, OVEHEAD, LABO PAPE = MACHINE OVEHEAD LABO Constant MACHINE OVEHEAD LABO S = Sq = 98.% -Sq(adj) = 98.0% Analysis of Variance 1 VIF = Source DF SS MS F P egression esidual Error Total = VIF finns förstås definierad för varje ingående x-variabel som 1 VIFj = 1 där j = förklaringsgraden i en anpassad modell där x j förklaras av övriga x-variabler. Om det största av dessa VIF-värden är större än 10 eller om medelvärdet av samtliga VIF-värden är betydligt större än 1 anser man att det föreligger problem med (multi)kolinjäritet. VIF-värden kan fås automatiskt i Minitab-utskriften: j MTB > regress c1 4 c-c5; SUBC> vif. egression Analysis: COST versus PAPE, MACHINE, OVEHEAD, LABO COST = PAPE +.47 MACHINE OVEHEAD LABO VIF Constant PAPE MACHINE OVEHEAD LABO S = Sq = 99.9% -Sq(adj) = 99.9% Vi ser att det råder stora problem med (multi)kolinjäritet här! 3

4 I Datorövning fick vi litet konstiga resultat när vi försökte undersöka totalvärdets beroende av tomtyta med uppdelning på fastigheter med och utan garage: Är (multi)kolinjäritet alltid ett bekymmer? egression Analysis: Total$ versus Acreage, Garage, Acr*Gar Total$ = Acreage Garage Acr*Gar 79 cases used cases contain missing values VIF Constant Acreage Garage Acr*Gar När den anpassade modellen skall användas för att förklara variation och samband skall kolinjäritet undvikas. Tolkningarna blir annars lätt missvisande. När den anpassade modellen skall användas för prognoser i nya punkter är bekymret mindre eftersom anpassningen görs så att ingående x-variabler kopplar till värdet hos y så bra som möjligt. Den enda term som blir signifikant är samspelstermen, vilket känns konstigt, men vi ser höga VIF-värden för Acreage och Acr*Gar. Förmodligen är det så att Garage finns i betydligt högre utsträckning på större tomter och då blir Acreage och Acr*Gar väl mycket korrelerade. Val mellan olika modeller Modellbygge: Vi illustrerar med följande datamaterial: Ett företag undersöker 5 säljdistrikt med avseende på försäljning. Man vill försöka förklara försäljningen (SALES) i volymenheter, dvs y med följande variabler: x 1 (TIME) = den tid (i månader) som säljaren (i distriktet) har varit anställd. x (POTENT) = total industriförsäljningens volym i distriktet x 3 (ADV) = annonskostnader (i dollar) x 4 (SHAE) = företagets genomsnittliga marknadsandel i distriktet (de senaste 4 åren) x 5 (SHAECHG) = förändringen i marknadsandel i distriktet jämfört med perioden innan de senaste fyra åren. x 6 (ACCTS) = antal kontrakt som säljaren arbetat med x 7 (WOKLOAD) = faktor för arbetsbelastningen hos säljaren x 8 (ATING) = bedömningsmått på säljaren satt av av försäljningsansvarig SALES TIME POTENT ADV SHAE SHAE- ACCTS WOK- ATING CHG LOAD

5 Hur väljer man vilken av ett antal anpassade modeller som är bäst? 1) Studera varje modell för sig: Är alla förklaringsvariabler av betydelse? Är residualerna bra? ) Förklaringsgrader: Eftersom ökar för varje ny variabel som läggs till blir inte detta mått rättvist när man jämför olika modeller. Justerad förklaringsgrad: SSE /( n k 1) n 1 SSE = 1 = 1 SST /( n 1) n k 1 SST Måttet tar hänsyn till antal variabler, som ingår i modellen. Notera att kan skrivas som 1 (SSE/SST ), så analogi finns med detta mått. Exempel: I materialet anpassar vi modellerna: y=β 0 + β 1 x 1 + β x + β 3 x 3 + β 4 x 4 + β 5 x 5 + β 6 x 6 + ε (1) y=β 0 + β 1 x 1 + β x + β 3 x 3 + β 4 x 4 + β 5 x 5 + β 6 x 6 + β 7 x 7 + β 8 x 8 + ε () MTB > regress c1 6 c-c7 y=β 0 + β 1 x 1 + β x + β 3 x 3 + β 4 x 4 + β 5 x 5 + β 6 x 6 + ε MTB > regress c1 8 c-c9 y=β 0 + β 1 x 1 + β x + β 3 x 3 + β 4 x 4 + β 5 x 5 + β 6 x 6 + β 7 x 7 + β 8 x 8 + ε egression Analysis: SALES versus TIME, POTENT,... egression Analysis: SALES versus TIME, POTENT,... SALES = TIME POTENT ADV + SHAE + 85 SHAECHG ACCTS SALES = TIME POTENT ADV SHAE + 91 SHAECHG ACCTS WOKLOAD + 8 ATING Constant Constant TIME TIME POTENT POTENT ADV ADV SHAE SHAE SHAECHG SHAECHG ACCTS = 0.90 ACCTS WOKLOAD = 0.9 S = Sq = 9.0% -Sq(adj) = 89.4% = ATING = S = Sq = 9.% -Sq(adj) = 88.3% 5

6 Enligt den justerade förklaringsgraden är alltså den första modellen bättre. 3) Variansskattning Modell y=β 0 + β 1 x 1 + β x + β 3 x 3 + β 4 x 4 + β 5 x 5 + β 6 x 6 + ε y=β 0 + β 1 x 1 + β x + β 3 x 3 + β 4 x 4 + β 5 x 5 + β 6 x 6 + β 7 x 7 + β 8 x 8 + ε Den modell som har lägst värde på MSE lyckas ju med att ha så litet slumpvariation som möjligt kvar. Dock gäller: MSE minskar om och endast om justerad förklaringsgrad ökar. Ł Jämförelse av MSE (alt. s ) blir ekvivalent med jämförelse av 4) Måttet C p C p (eller bara kort C) är en något kryptiskt formulerad storhet som relaterar slumpvariansen i en anpassad modell till slumpvariansen hos den maximala modellen samt till antalet ingående parametrar. SSE C p = ( n ( k + 1)) s p där s p är variansskattningen (dvs. MSE) hos den maximala modellen (den med samtliga tillgängliga x-variabler) C p skall helst bli så liten som möjligt, och samtidigt k+1 I annat fall har den anpassade modellen en för stor bias, dvs. ligger snett i förhållande till verkligheten. För att beräkna C p krävs tydligen att såväl den aktuella som den maximala modellen anpassas. Ł Typisk uppgift för en datorkörning. Minitab: Kommandot breg kan användas för att ta fram de två bästa modellerna i varje modellstorlek, baserat på de största - värdena. Alltså, man jämför alla modeller med en x-variabel och tar ut de två bästa, alla modeller med två x-variabler och tar ut de två bästa etc. I de maximala modellstorleken finns förstås bara en modell och i denna kan visas att C p alltid är p+1 Kommandot ger förutom -värdena även justerade förklaringsgrader, s och dessutom just C p MTB > breg c1 c-c9 Best Subsets egression: SALES versus TIME, POTENT,... esponse is SALES S W H O P A O S A K A T T H E C L T I E A A C C O I M N D H T A N Vars -Sq -Sq(adj) C-p S E T V E G S D G X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X C p k+1 6

7 I utskriften ser vi att i de 7 sista modellerna är C p k+1 (Lägg till en etta i kolumnen Vars ). Enligt reglerna skall vi välja modell så att C p blir så liten som möjligt. S W H O P A O S A K A T T H E C L T I E A A C C O I M N D H T A N Vars -Sq -Sq(adj) C-p S E T V E G S D G k X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X 9 Ł Modellen med TIME, POTENT, ADV, SHAE och SHAECHG skall väljas eftersom denna har lägst värde på C p med villkoret C p k+1 bibehållet. Observera dock: Denna modell har inte det högsta värdet på vare sig förklaringsgrad eller justerad förklaringsgrad (alt. det lägsta värdet på s ). 5) Mer algoritmiska modellvalsprocedurer: Framåtvalsprincipen (Forward selection): 1. Välj först den x-variabel som har högst absolut korrelation med y. (Blir också den variabel som i en enkel linjär regressionsmodell ger högst eller lägst SSE.. Testa med t- eller F-test om denna variabel blir signifikant 3. Om den blir det, fixera denna variabel i modellen, kalla den x (1). Om inte, stanna utan modell. 4. Anpassa alla modeller med x (1) och ytterligare en x-variabel, välj tillfälligt den modell som har högst (eller lägst SSE) 5. Testa med t-test eller partiellt F-test om den andra x-variabeln blir signifikant. 6. Om den blir det, fixera även denna, kalla den x (). Om inte, stanna vid modellen med x (1). 7. Fortsätt på motsvarande sätt tills inga nya signifikanta variabler kan läggas till. I vårt datamaterial: MTB > corr c1-c9 Correlations: SALES, TIME, POTENT, ADV, SHAE, SHAECHG, ACCTS, WOKLOAD, ATING SALES TIME POTENT ADV SHAE SHAECHG ACCTS WOKLOAD TIME POTENT ADV SHAE MTB > regress c1 1 c7 egression Analysis: SALES versus ACCTS SALES = ACCTS Constant ACCTS S = Sq = 56.8% -Sq(adj) = 55.0% ACCTS fixeras alltså i modellen signifikant SHAECHG ACCTS WOKLOAD Nästa steg? Använd breg med vilken man också kan tvinga in en variabel och begränsa modellstorleken enligt: ATING

8 MTB > breg c1 c-c9; SUBC> include c7; SUBC> best 1; SUBC> nvars 1 1. Tvingar in ACCTS Visar bara en modell per storleksklass Visar bara modeller med en variabel fler än de inkluderade (dvs här med max variabler) MTB > regr c1 c7 c4 egression Analysis: SALES versus ACCTS, ADV Best Subsets egression: SALES versus TIME, POTENT,... esponse is SALES The following variables are included in all models: ACCTS S W H O P A O S K A T T H E L T I E A A C O I M N D H A N Vars -Sq -Sq(adj) C-p S E T V E G D G X SALES = ACCTS ADV Constant ACCTS ADV S = Sq = 77.5% -Sq(adj) = 75.5% ADV blir signifikant och fixeras. Den bästa modellen med ACCTS och ytterligare en variabel är alltså den med ACCTS och ADV. MTB > breg c1 c-c9; SUBC> include c4 c7; SUBC> best 1; SUBC> nvars 1 1. Best Subsets egression: SALES versus TIME, POTENT,... esponse is SALES The following variables are included in all models: ADV ACCTS S W H O P A O S K A T T H E L T I E A C O I M N H A N Vars -Sq -Sq(adj) C-p S E T E G D G MTB > regress c1 3 c7 c4 c3 egression Analysis: SALES versus ACCTS, ADV, POTENT SALES = ACCTS ADV POTENT Constant ACCTS ADV POTENT S = Sq = 8.8% -Sq(adj) = 80.3% POTENT blir signifikant och fixeras X Den bästa modellen med ACCTS, ADV och ytterligare en variabel är alltså den med ACCTS, ADV och POTENT. 8

9 MTB > breg c1 c-c9; SUBC> include c3 c4 c7; SUBC> best 1; SUBC> nvars 1 1. Best Subsets egression: SALES versus TIME, POTENT,... esponse is SALES The following variables are included in all models: POTENT ADV ACCTS S W H O A S K A T H E L T I A C O I M H A N Vars -Sq -Sq(adj) C-p S E E G D G X MTB > regress c1 4 c7 c4 c3 c5 egression Analysis: SALES versus ACCTS, ADV, POTENT, SHAE SALES = ACCTS ADV POTENT SHAE Constant ACCTS ADV POTENT SHAE S = Sq = 90.0% -Sq(adj) = 88.1% SHAE blir signifikant och fixeras. Den bästa modellen med ACCTS, ADV, POTENT och ytterligare en variabel är alltså den med ACCTS, ADV, POTENT och SHAE. MTB > breg c1 c-c9; SUBC> include c3 c4 c5 c7; SUBC> best 1; SUBC> nvars 1 1. Best Subsets egression: SALES versus TIME, POTENT,... esponse is SALES The following variables are included in all models: POTENT ADV SHAE ACCTS S W H O A K A T E L T I C O I M H A N Vars -Sq -Sq(adj) C-p S E G D G X Den bästa modellen med ACCTS, ADV, POTENT, SHAE och ytterligare en variabel är alltså den med ACCTS, ADV, POTENT SHAE och SHAECHG. MTB > regress c1 5 c7 c4 c3 c5 c6 egression Analysis: SALES versus ACCTS, ADV, POTENT, SHAE, SHAECHG SALES = ACCTS ADV POTENT SHAE + 6 SHAECHG Constant ACCTS ADV POTENT SHAE SHAECHG S = Sq = 91.% -Sq(adj) = 88.9% SHAECHG blir inte signifikant och tas därför inte med. Ł Slutlig modell blir den med ACCTS, ADV, POTENT och SHAE Bra? 9

10 Bakåtelimineringsprincipen (Backward elimination ): 1. Anpassa modellen med samtliga tillgängliga förklaringsvariabler.. Om alla förklaringsvariabler är signifikanta blir detta den slutliga modellen. 3. Om en eller flera variabler ej är signifikanta (ses i deras t-kvoter) tas den variabel bort som har lägst absolut t-kvot. 4. Anpassa en ny modell med de variabler som är kvar. Om alla förklaringsvariabler i denna är signifikanta Ł Slutlig modell 5. Om en eller flera variabler ej är signifikanta, ta bort den med lägst absolut t-kvot. 6. Upprepa förfarandet till dess att samtliga ingående förklaringsvariabler är signifikanta. MTB > regress c1 8 c-c9 egression Analysis: SALES versus TIME, POTENT,... SALES = TIME POTENT ADV SHAE + 91 SHAECHG ACCTS WOKLOAD + 8 ATING Constant TIME POTENT ADV SHAE SHAECHG ACCTS WOKLOAD ATING S = Sq = 9.% -Sq(adj) = 88.3% TIME, SHAECHG, ACCTS, WOKLOAD och ATING är ickesignifikanta. Av dessa har ATING lägst absolut t-kvot MTB > regress c1 7 c-c8 egression Analysis: SALES versus TIME, POTENT,... MTB > regress c1 6 c-c7 egression Analysis: SALES versus TIME, POTENT,... SALES = TIME POTENT ADV SHAE + 96 SHAECHG ACCTS WOKLOAD Constant TIME POTENT ADV SHAE SHAECHG ACCTS WOKLOAD S = Sq = 9.% -Sq(adj) = 89.0% SALES = TIME POTENT ADV + SHAE + 85 SHAECHG ACCTS Constant TIME POTENT ADV SHAE SHAECHG ACCTS S = Sq = 9.0% -Sq(adj) = 89.4% TIME, SHAECHG, ACCTS och WOKLOAD är ickesignifikanta. WOKLOAD har lägst absolut t-kvot. TIME, SHAECHG och ACCTS är icke-signifikanta. ACCTS har lägst absolut t-kvot. 10

11 MTB > regress c1 5 c-c6 egression Analysis: SALES versus TIME, POTENT, ADV, SHAE, SHAECHG MTB > regress c1 4 c-c5 egression Analysis: SALES versus TIME, POTENT, ADV, SHAE SALES = TIME POTENT ADV + 57 SHAE + 35 SHAECHG Constant TIME POTENT ADV SHAE SHAECHG S = Sq = 91.5% -Sq(adj) = 89.3% SALES = TIME POTENT ADV + 59 SHAE Constant TIME POTENT ADV SHAE S = Sq = 89.6% -Sq(adj) = 87.5% Endast SHAECHG är icke-signifikant. På gränsen, men för illustrationen tar vi ändå bort den. Alla förklaringsvariabler är signifikanta Ł Slutlig modell enligt bakåtelimineringsprincipen. Bra? Stegvis regression: Genom att kombinera framåtval och bakåteliminering får vi det som ofta bara kallas stegvis regression : Välj först den variabel som har högst korrelation med y Minitab har kommandot stepwise: MTB > stepwise c1 c-c9 Stepwise egression: SALES versus TIME, POTENT,... F-to-Enter: 4 F-to-emove: 4 esponse is SALES on 8 predictors, with N = 5 Sätter kritiska gränser för signifikanstest Behåll variabeln om den är signifikant Lägg till en ny variabel om den blir signifikant, ta bort den gamla om den inte blir signifikant. Fortsätt att lägga till och ta bort variabler till dess att inga nya signifikanta kan hittas och inga gamla kan tas bort. Step Constant ACCTS T-Value P-Value ADV T-Value P-Value POTENT T-Value P-Value SHAE 190 T-Value 3.8 P-Value S Sq Sq(adj) C-p More? (Yes, No, Subcommand, or Help) SUBC> No Slutlig modell är alltså den med ACCTS, ADV, POTENT och SHAE, dvs samma som framåtvalsprincipen gav. 11

12 Kommandot stepwise har underkommandona forward och backward som just ger framåtval resp. bakåteliminering. Det är dock klokt att försöka förstå dessa principer genom att välja litet för hand Ingen av de tre algoritmerna är optimal i något avseende och olika modeller kan fås. Det är inte heller så att någon med nödvändighet ger den bästa modellen. Algoritmerna skall kombineras med förnuft och residualanalys. Index Uttrycker värdet av en storhet relativt värdet av en annan storhet. Serier av värden i tid (eller rum) uttrycks i en viss enhet Index anger alla värden i serien relativt ett av dem blir enhetsoberoende Exempel Priset på Hasses superstrumpa i kronor Priserna anges i kronor. Om Sverige under tiden haft en fast växelkurs i Euro, t ex 1 euro=8.70 kronor hade prisserien i euro blivit Gör nu istället så att varje pris delas med priset för 1996 År Kronpris Europris /35=1 4.0/4.0= /35= /4.0= /35= /4.0= /35= /4.0= /35= /4.0=1.14 Notera att vi får samma värdeserie oavsett vilken valuta vi använder. Observera dock att fast växelkurs är ett nödvändigt villkor för detta De erhållna värdena kallas relativtal. 1

13 Omräkning till index Multiplicera de erhållna relativtalen med 100. Ł Indexserie Lättare för en del att förstå Indexvärdet för 1996 är exakt 100 av naturliga orsaker kallas därför basår. Varje indexvärde innehåller den procentuella förändringen av priset jämfört med basåret. T ex index för 1998=107 Ł Priset har ökat med 7% mellan 1996 och För att uttrycka den procentuella förändringen från år t1 till år t beräknas [(Index år t -Index år t 1 )/Index år t 1 ] 100 t ex från 1998 till 000: [( )/107] 100=6.5 Ł 6.5% ökning Byte av basår Basåret kan bytas genom att dividera varje värde i indexserien med värdet för det nya basåret, samt multiplicera med 100 Index år t, basår t 1 = (Index år t, basår t 0 /Index år t 1, basår t 0 ) 100 = I t (t 1 ) = [I t (t 0 ) / I t1 (t 0 ) ] 100 Ex. Byte till basår 1998 År Basår 1996 Basår (100/107) 100= (103/107) 100= (111/107) 100= (114/107) 100=107 Notera att indextal < 100 förekommer Allmän formel: En enkel prisindexserie skapas genom I t = Pris år t / Pris basår t0 ) 100 = ( pt / pt ) 100 ( 0 Kvantiteter och försäljningsvärden Låt q t =försäljningskvantiteten och v t =försäljningsvärdet av en vara år t Ł v t =p t q t Ex. Priser, kvantiteter och försäljningsvärden för Hasses superstrumpa: År Pris Kvantitet Försäljn.värde

14 Deflatering Försäljningsvärdena är uttryckta i s k löpande priser Ibland vill man uttrycka dem i priser för ett visst år (i s k fasta priser) Detta åstadkoms genom s k deflatering En värdeserie i löpande priser divideras värde för värde med en prisindexserie. Värden i fast pris erhålls genom att multiplicera samtliga deflaterade värden med prisindex för det år, vars priser skall användas Hasses superstrumpa, forts År Värden i Index Värden i 1997 års löpande priser priser (550/100) 103= ( /107) 103= (640/111) 103= (600/114) 103=560 Implicitprisindex Man kan också räkna baklänges Givet en värdeserie i löpande pris och motsvarande serie uttryckt i priser för år t Ett s k implicitprisindex erhålls genom att dividera löpande pris-serien värde för värde med fastpris-serien och sedan multiplicera med 100. Basåret blir t Hasses superstrumpa, forts År Värden i Värden i Implicitprisindex löpande 1998 års (Basår=1998) priser priser (550/ ) 100 = (50/543) 100 = (640/6015) 100= (600/5819) 100=107 Avvikelser från tidigare framräknad indexserie beror på avrundningsfel Deflaterad värdeserie och fast pris-serie uttrycker kvantitet Förutom prisindex kan kvantitetsindex och/eller värdeindex konstrueras Överhuvudtaget kan alla serier av värden omräknas till index, dvs indexbegreppet är inte knutet till ekonomi 14

15 Sammansatta prisindex Olika viktsystem Om ett företag (eller en bransch) säljer mer än en vara skall som regel prisindex baseras på flera (ev. samtliga) varor. Generell konstruktion: där = I I t i t, i wt, i I t,i =prisindex år t för vara i w t,i =vikt år t för vara i och summationen görs över alla ingående varor Laspeyre s viktsystem: w t,i =(p i,0 q i,0 )/Σ j (p j,0 q j,0 ) dvs vikten för vara i utgörs av varans andel av totalförsäljningen (av ingående varor) för basåret. Paasche s viktsystem: w t,i =(p i,0 q i,t )/Σ j (p j,0 q j,t ) dvs vikten för vara i utgörs av varans andel av totalförsäljningen för år t i basårspriser. Laspeyre s system är vanligast.vikterna baseras på försäljningsfördelningen under basåret. Dock problematiskt då försäljningen varierar starkt mellan varugrupper från år till år Paasche s system används i det senare fallet och är mindre stabilt. Exempel forts. Hasses kläder Priser och försäljningskvantiteter på Hasses superstrumpa och Hasses boxershorts Strumpor Boxershorts Pris Kvantitet Pris Kvantitet Sammansatt prisindex med Laspeyre s viksystem (Basår 1998): År Index = = = 15

Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper.

Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Multikolinjäritet: Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Trots att COST verkade ha ett tydligt positivt samband med var och en av variablerna PAPER, MACHINE, OVERHEAD

Läs mer

Föreläsning 4. Kap 5,1-5,3

Föreläsning 4. Kap 5,1-5,3 Föreläsning 4 Kap 5,1-5,3 Multikolinjäritetsproblem De förklarande variablerna kan vara oberoende (korrelerade) av varann men det är inte så vanligt. Ofta är de korrelerade, och det är helt ok men beroendet

Läs mer

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B Föreläsning 4 Kap 3.5, 3.8 Material om index 732G71 Statistik B Skötsel (y) Transformationer Ett av kraven för regressionsmodellens giltighet är att residualernas varians är konstant. Vad gör vi om så

Läs mer

Regressions- och Tidsserieanalys - F5

Regressions- och Tidsserieanalys - F5 Regressions- och Tidsserieanalys - F5 Linda Wänström Linköpings universitet November 20 Wänström (Linköpings universitet) F5 November 20 1 / 24 Modellbygge - vilka oberoende variabler ska vara med i modellen?

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Skrivning i ekonometri lördagen den 29 mars 2008

Skrivning i ekonometri lördagen den 29 mars 2008 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 2 Statistiska metoder 1 Dagens föreläsning o Vägda medeltal o Standardvägning o Index Angående projektet: Senast onsdagen 6 mars 17:00 ska ni ha lämnat in gruppindelning och definition av problemområde!

Läs mer

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data Stat. teori gk, ht 006, JW F16 MULTIPEL LINJÄR REGRESSION (NCT 13.1-13.3, 13.9) Anpassning av linjär funktion till givna data Data med en beroende variabel (y) och K stycken (potentiellt) förklarande variabler

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2015-02-06, 8-12 Bertil Wegmann

Läs mer

Kvadratisk regression, forts.

Kvadratisk regression, forts. Kvadratisk regression, forts. Vi fortsätter med materialet om fastigheter. Tidigare föreslog vi som en tänkbar modell y 0 + 3 x 3 + 5 x 3 2 + Vari ligger tanken att just använda en kvadratisk term? Det

Läs mer

Skrivning i ekonometri torsdagen den 8 februari 2007

Skrivning i ekonometri torsdagen den 8 februari 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)

Läs mer

Laboration 2 multipel linjär regression

Laboration 2 multipel linjär regression Laboration 2 multipel linjär regression I denna datorövning skall ni 1. analysera data enligt en multipel regressionsmodell, dvs. inkludera flera förklarande variabler i en regressionsmodell 2. studera

Läs mer

10.1 Enkel linjär regression

10.1 Enkel linjär regression Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot

Läs mer

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1! LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal

Läs mer

Regressions- och Tidsserieanalys - F5

Regressions- och Tidsserieanalys - F5 Regressions- och Tidsserieanalys - F5 Index (Extra material) Linda Wänström Linköpings universitet November 19 Wänström (Linköpings universitet) F5 November 19 1 / 17 Index Ett index beskriver en eller

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet November 6, 2013 Wänström (Linköpings universitet) F3 November 6, 2013 1 / 22 Interaktion

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2017-12-08, 8-12 Bertil Wegmann

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när

Läs mer

Något om index. 1 Enkla och sammansatta index. LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik Anders Nordgaard

Något om index. 1 Enkla och sammansatta index. LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik Anders Nordgaard LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik Anders Nordgaard Något om index 1 Enkla och sammansatta index Om man har tillgång till prisuppgifter över en tidsperiod på alla varor och/eller

Läs mer

Skrivning i ekonometri lördagen den 15 januari 2005

Skrivning i ekonometri lördagen den 15 januari 2005 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA102:3 Skrivning i ekonometri lördagen den 15 januari 5 1. Vi vill undersöka hur variationen i försäljningspris = price för hus i en liten stad

Läs mer

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB2 Skrivning i ekonometri onsdagen den 1 juni 211 1. Vi vill undersöka hur variationen i försäljningspriset för ett hus (i en liten stad i USA

Läs mer

732G71 Statistik B. Föreläsning 5. Bertil Wegmann. November 12, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 5. Bertil Wegmann. November 12, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 5 Bertil Wegmann IDA, Linköpings universitet November 12, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 12, 2015 1 / 16 Index Ett index beskriver en eller era

Läs mer

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet: LINKÖPINGS UNIVERSITET Institutionen för datavetenskap Statistik, ANd 732G71 STATISTIK B, 8hp Civilekonomprogrammet, t3, Ht 09 Extra övningsuppgifter Extra övningsuppgifter 1. Man tror sig veta att en

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2015-12-09, 8-12 Bertil Wegmann

Läs mer

Datorövning 1 Enkel linjär regressionsanalys

Datorövning 1 Enkel linjär regressionsanalys Datorövning 1 Enkel linjär regressionsanalys Datorövningen utförs i grupper om två personer. I denna datorövning skall ni använda Excel och Minitab för att 1. få en visuell uppfattning om vad ett regressionssamband

Läs mer

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 3 Bertil Wegmann IDA, Linköpings universitet November 4, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 4, 2015 1 / 22 Kap. 4.8, interaktionsvariabler Ibland

Läs mer

Facit till Extra övningsuppgifter

Facit till Extra övningsuppgifter LINKÖPINGS UNIVERSITET Institutionen för datavetenskap Statistik, ANd 732G71 STATISTIK B, 8hp Civilekonomprogrammet, t3, Ht 09 Extra övningsuppgifter Facit till Extra övningsuppgifter 1. Modellen är en

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F3 1 / 21 Interaktion Ibland ser sambandet mellan en

Läs mer

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression Enkel linjär regression Exempel.7 i boken (sida 31). Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben och höjder på sockeln. De halvledare

Läs mer

Datorövning 5 Exponentiella modeller och elasticitetssamband

Datorövning 5 Exponentiella modeller och elasticitetssamband Datorövning 5 Exponentiella modeller och elasticitetssamband Datorövningen utförs i grupper om två personer. I denna datorövning skall ni använda Minitab för att 1. anpassa och tolka analysen av en exponentiell

Läs mer

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson 1 STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III, statistiska metoder) 3 högskolepoäng, ingående i kursen Undersökningsmetodik

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2016-12-13, 8-12 Bertil Wegmann

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

Skrivning i ekonometri lördagen den 25 augusti 2007

Skrivning i ekonometri lördagen den 25 augusti 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA10:3 Skrivning i ekonometri lördagen den 5 augusti 007 1. Vi vill undersöka hur variationen i ölförsäljningen i ett bryggeri i en stad i USA

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: Betygsgränser: 732G21 Sambandsmodeller 2009-01-14,

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel

Läs mer

F7 Polynomregression och Dummyvariabler

F7 Polynomregression och Dummyvariabler F7 Polnomregression och Dummvariabler Antag att man börjar med enkel linjär regression. Kap Polnomregression Emellanåt upptäcker man samband som är kvadratiska, kubiska osv. Allmänt: polnom av k:te ordningen

Läs mer

TENTAMEN I STATISTIK B,

TENTAMEN I STATISTIK B, 732G7 Tentamen. hp TENTAMEN I STATISTIK B, 24-2- Skrivtid: kl: -2 Tillåtna hjälpmedel: Ett A4-blad med egna handskrivna anteckningar samt räknedosa Jourhavande lärare: Lotta Hallberg Betygsgränser: Tentamen

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson 1 STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik och

Läs mer

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013 Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS, 5p Ekonomprogrammet, t2, Vt 06 Tentamen

HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS, 5p Ekonomprogrammet, t2, Vt 06 Tentamen LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik, ANd HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS, 5p Ekonomprogrammet, t2, Vt 06 Tentamen REGRESSIONS- OCH TIDSSERIEANALYS, 5 P TENTAMEN LÖRDAGEN

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

F11. Kvantitativa prognostekniker

F11. Kvantitativa prognostekniker F11 Kvantitativa prognostekniker samt repetition av kursen Kvantitativa prognostekniker Vi har gjort flera prognoser under kursen Prognoser baseras på antagandet att historien upprepar sig Trenden följer

Läs mer

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS, TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS, 204-0-3 Skrivtid: kl 8-2 Hjälpmedel: Räknedosa. Bowerman, B.J., O'Connell, R, Koehler, A.: Forecasting, Time Series and Regression. 4th ed. Duxbury, 2005 som

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen

Läs mer

Föreläsning 3 Kap 3.4, 3.6, 4.2. 732G71 Statistik B

Föreläsning 3 Kap 3.4, 3.6, 4.2. 732G71 Statistik B Föreläsning 3 Kap 3.4, 3.6, 4.2 732G71 Statistik B Exempel 150 slumpmässigt utvalda fastigheter till salu i USA Pris (y) Bostadsyta Tomtyta Antal rum Antal badrum 179000 3060 0.75 8 2 285000 2516 8.1 7

Läs mer

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1 Multipel linjär regression l: Y= β 0 + β X + β 2 X 2 + + β p X p + ε Välj β 0,β,β 2,, β p så att de minimerar summan av residualkvadraterna (Y i -β 0 -β X i - -β p X pi ) 2 Geometrisk tolkning Med Y=β

Läs mer

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

Instruktioner till Inlämningsuppgift 1 och Datorövning 1 STOCKHOLMS UNIVERSITET HT 2005 Statistiska institutionen 2005-10-14 MC Instruktioner till Inlämningsuppgift 1 och Datorövning 1 Kurs i Ekonometri, 5 poäng. Uppgiften ingår i examinationen för kursen och

Läs mer

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson 1 STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson Skriftlig omtentamen på momentet Statistiska metoder SDA III, 2 poäng ingående i kurserna Grundkurs i statistik 20 p samt Undersökningsmetodik

Läs mer

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng. 1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga

Läs mer

Datorövning 2 Multipel regressionsanalys, del 1

Datorövning 2 Multipel regressionsanalys, del 1 Datorövning 2 Multipel regressionsanalys, del 1 Datorövningen utförs i grupper om två personer. I denna datorövning skall ni använda Minitab för att 1. analysera data enligt en multipel regressionsmodell

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15 732G71 Statistik B Föreläsning 6 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15 Efterfrågeanalys Metoder för att studera sambandet mellan efterfrågan på

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet

Läs mer

Instruktioner till Frivillig Inlämningsuppgift 2 och Datorövning 3-4. Fortsättningskurs i statistik, moment 1, Statistisk Teori, 10 poäng.

Instruktioner till Frivillig Inlämningsuppgift 2 och Datorövning 3-4. Fortsättningskurs i statistik, moment 1, Statistisk Teori, 10 poäng. STOCKHOLMS UNIVERSITET HT 2005 Statistiska institutionen 2005-10-12 MC Instruktioner till Frivillig Inlämningsuppgift 2 och Datorövning 3-4 Fortsättningskurs i statistik, moment 1, Statistisk Teori, 10

Läs mer

TENTAMEN I MATEMATISK STATISTIK

TENTAMEN I MATEMATISK STATISTIK UMEÅ UNIVERSITET Institutionen för matematisk statistik Regressions- och variansanalys, 5 poäng MSTA35 Leif Nilsson TENTAMEN 2003-01-10 TENTAMEN I MATEMATISK STATISTIK Regressions- och variansanalys, 5

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Vad Betyder måtten MAPE, MAD och MSD?

Vad Betyder måtten MAPE, MAD och MSD? Vad Betyder måtten MAPE, MAD och MSD? Alla tre är mått på hur bra anpassningen är och kan användas för att jämföra olika modeller. Den modell som har lägst MAPE, MAD och/eller MSD har bäst anpassning.

Läs mer

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar: Flerfaktorförsök Blockförsök, randomiserade block Modell: yij i bj eij i 1,,, a j 1,,, b y ij vara en observation för den i:te behandlingen och det j:e blocket gemensamma medelvärdet ( grand mean ) effekt

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik, LP1, HT 2015, Adam Jonsson LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i enkel regressionsanalys

Läs mer

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka. y Uppgift 1 (18p) I syfte för att se om antalet månader som man ägt en viss träningsutrustning påverkar träningsintensiteten har tio personer som har köpt träningsutrustningen fått ange hur många månader

Läs mer

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab. Räkneövning 5 Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari 016 1 Om uppgifterna För Uppgift kan man med fördel ta hjälp av Minitab. I de fall en figur för tidsserien efterfrågas

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels 7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan

Läs mer

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh 1 STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik

Läs mer

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh 1 STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik

Läs mer

Exempel 1 på multipelregression

Exempel 1 på multipelregression Exempel på multipelregression Hastighet = högsta hastighet som uppnåtts fram till givna år (årtal) Årtal Hastighet 83 3 (tåg) 9 3 (tåg) 93 (flyg) 97 7 (flyg) 9 (flyg) 99 (raket) Fitted Line Plot Hastighet

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

TAMS65 DATORÖVNING 2

TAMS65 DATORÖVNING 2 TAMS65 DATORÖVNING 2 Datorövningen behandlar multipel linjär regression Förberedelser Läs allmänt om regressionsanalys i boken och på föreläsningsanteckningarna Glöm inte att rensa minnet och alla fönster

Läs mer

InStat Exempel 4 Korrelation och Regression

InStat Exempel 4 Korrelation och Regression InStat Exempel 4 Korrelation och Regression Vi ska analysera ett datamaterial som innehåller information om kön, längd och vikt för 2000 personer. Materialet är jämnt fördelat mellan könen (1000 män och

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Uppsala universitet Statistiska institutionen A5 2015-01-13 Tentamen Tillämpad statistik A5 (15hp) 2015-01-13 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 4.00-7.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson 1 STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III, statistiska metoder) 3 högskolepoäng, ingående i kursen Undersökningsmetodik

Läs mer

Räkneövning 3 Variansanalys

Räkneövning 3 Variansanalys Räkneövning 3 Variansanalys Uppgift 1 Fyra sorter av majshybrider har utvecklats för att bli resistenta mot en svampinfektion. Nu vill man också studera deras produktionsegenskaper. Varje hybrid planteras

Läs mer

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Sid (7) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift Nedanstående beräkningar från Minitab är gjorda för en Poissonfördelning med väntevärde λ = 4.

Läs mer

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys) Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson 1 STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik och

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Uppsala universitet Statistiska institutionen A5 2014-08-26 Tentamen Tillämpad statistik A5 (15hp) 2014-08-26 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling

Läs mer

Examinationsuppgifter del 2

Examinationsuppgifter del 2 UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller S0004M Statistik 1 Undersökningsmetodik. Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller Till denna laboration ska det angivna datamaterialet användas och bearbetas med den statistiska

Läs mer

För betyget GODKÄND krävs preliminärt minst 28 poäng. För betyget VÄL GOD- KÄND krävs preliminärt minst 43 poäng.

För betyget GODKÄND krävs preliminärt minst 28 poäng. För betyget VÄL GOD- KÄND krävs preliminärt minst 43 poäng. STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson Skriftlig hemtentamen i Fortsättningskurs i statistik, moment 1, Statistisk Teori, poäng. Deltentamen 2: Regressionsanalys Måndagen den

Läs mer

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta

Läs mer

Följande resultat erhålls (enhet: 1000psi):

Följande resultat erhålls (enhet: 1000psi): Variansanalys Exempel Aluminiumstavar utsätts för uppvärmningsbehandlingar enligt fyra olika standardmetoder. Efter behandlingen uppmäts dragstyrkan hos varje stav. Fem upprepningar görs för varje behandling.

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson 1 STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistiska metoder SDA III, 2 poäng ingående i kurserna Grundkurs i statistik 20 p samt Undersökningsmetodik

Läs mer

TAMS65 - Seminarium 4 Regressionsanalys

TAMS65 - Seminarium 4 Regressionsanalys TAMS65 - Seminarium 4 Regressionsanalys Martin Singull Matematisk statistik Matematiska institutionen Problem 1 PS29 Vid ett test av bromsarna på en bil bromsades bilen upprepade gånger från en hastighet

Läs mer