Tidsserieanalys av dödsfall i trafiken

Storlek: px
Starta visningen från sidan:

Download "Tidsserieanalys av dödsfall i trafiken"

Transkript

1 VI notat Utgivningsår NNNN idsserieanalys av dödsfall i trafiken Astrid Karlsson Kristian Willerö

2

3 Förord Detta notat är ett särtryck av en magisteruppsats i statistik skriven vid Linköpings universitet av Astrid Karlsson och Kristian Willerö. Uppsatsen är genomförd på uppdrag av VI och handledare vid universitetet har varit biträdande professor Stig Danielsson. Åsa Forsman Projektledare VI notat

4 VI notat

5 Magisteruppsats i statistik idsserieanalys av dödsfall i trafiken Astrid Karlsson & Kristian Willerö

6

7 Magisteruppsats i statistik idsserieanalys av dödsfall i trafiken Astrid Karlsson & Kristian Willerö ISRN: LiU-MA-D--05/03--SE

8

9 Abstract his essay has been assigned to us by the Swedish National Road and ransport Research Institute, VI, which perform research and development concerning infrastructure, traffic, and transports. We have been working for the research organization, SA, where a follow up of traffic accidents is an important issue. Our essay discusses the number of fatal traffic accidents from a time series perspective. he main purpose of the this essay has been to make use of one or several time series models in order to explain the correlation that is assumed to exist between the observed and estimated number of people killed in traffic accidents. We also want to develop time series models for predictions. In our analysis, we have used ARIMA and transfer function modeling. ARIMA models explain a future observation using previous values in the same series. he transfer function model is used when the explanatory variable has an impact on the response variable for values in several time periods and when the residuals are dependent. Our data showed a clear seasonal effect and was not stationary which is a requirement for ARIMA modeling. After an adjustment of our data, it was shown that all estimated ARIMA models based on monthly data resulted in moving average parameters. A future observation is explained in a linear composition from former errors. he transfer function model that was adjusted explains the response variable number of people killed with explanatory variable traffic kilometrage. It could not be proven that former values had an effect on the response variable. he residuals for the model could be explained by an ARIMA-process with a moving average parameter. he transfer function model is the model that we found most appropriate and we recommend it for future development. he estimated predictions from our models show no indications that Nollvisionen will be fulfilled without radical changes in traffic. he number of people killed will, according to the predictions, stay at the same level as the recent years.

10

11 Sammanfattning Uppsatsen har skrivits på uppdrag av Statens väg- och transportforskningsinstitut, VI, vilka bedriver forskning och utveckling som avser infrastruktur, trafik och transporter. Vi har arbetat för avdelningen rafik- och säkerhetsanalys, SA, där uppföljningen av dödsolyckor och antalet dödade i trafiken är ett viktigt inslag. Vår uppsats behandlar antalet dödade i vägtrafikolyckor ur ett tidsserieperspektiv. Huvudsyftet med uppsatsen har varit att utnyttja den korrelation som antas finnas mellan observationerna och ta fram en eller flera tidsseriemodeller som kan förklara antalet dödade i vägtrafikolyckor. Vi vill även utveckla tidsseriemodeller för prognostisering. I våra analyser har vi använt oss av ARIMA- och transferfunktionsmodellering. ARIMA-modeller förklarar en framtida observation med hjälp av tidigare värden i samma serie. ransferfunktionsmodeller används då en förklaringsvariabel har effekt på responsvariabeln för värden i flera tidpunkter och residualerna har ett beroende. Våra data uppvisade tydliga säsongseffekter och var inte stationära vilket är ett krav för ARIMA-modeller. Efter transformation av data så visade det sig att samtliga skattade ARIMA-modeller på månadsdata gav medelvärdesparametrar (MA-parametrar). Framtida observationer förklaras av en linjär sammansättning av tidigare brustermer. Den transferfunktionsmodell som anpassades förklarade responsvariabeln antal dödade med förklaringsvariabeln trafikarbete. Det gick inte att påvisa att tidigare värden hade någon effekt på responsvariabeln. Residualerna för modellen kunde förklaras av en ARIMA-process med en medelvärdesparameter. De skattade modellernas prognoser visar inga indikationer på att nollvisionens delmål 2007 på 270 dödade kommer att nås utan radikala förändringar i trafiken. Dödsantalet kommer enligt prognoserna att ligga på ungefär samma nivå som det gjort de senaste åren.

12

13 Förord Detta är en magisteruppsats i statistik skriven vid Linköpings universitet. Uppsatsen är genomförd på uppdrag av Statens väg- och transportforskningsinstitut, VI. Vi vill speciellt tacka vår handledare Stig Danielsson för god handledning under arbetets gång. Vi vill även rikta ett särskilt tack till Åsa Forsman, vår handledare på VI. ack också till Ulf Brüde, VI, för givande diskussioner och hjälp inom ämnet.

14

15 idsserieanalys av dödsfall i trafiken Innehållsförteckning 1 Inledning Bakgrund Problemdiskussion Syfte och problemformulering Avgränsningar Begreppslista Metod Regressionsanalys idsserieanalys ransferfunktioner dynamisk regression Interventionsanalys Data Allmänt Helårsdata Månadsdata Månadsdata Förklaringsvariabler Dödsrisk Resultat Modeller för åren Modeller för antal dödade - regressionsanalys Modeller för dödsrisk regressionsanalys och ARIMA Modeller för åren Modell för antal dödade - ARIMA Modell för antal dödade - ARIMA med intervention Modell för dödsrisk -ARIMA Modeller för åren Modell för antal dödade - ARIMA Modell för antal dödade - ransferfunktion Modell för dödsrisk - ARIMA Prognoser Prognos med ARIMA-modell för dödsrisk Prognoser med ARIMA-modeller för antal dödade och dödsrisk Prognoser med modeller för tidsperioden Prognoser fram till år Diskussion och slutsatser Referenslista Bilagor... 43

16 abellförteckning abell 1: Förväntat mönster i ACF och PACF vid enkla AR- och MA-modeller... 8 abell 2: Jämförelse mellan ARIMA-modeller med och utan intervention abell 3: Prognoser för med ARIMA-modell för dödsrisk abell 4: MAPE-värden för modeller från tidsperioden , fullständig och förkortad serie abell 5: Prognoser för Jan Mar 2005 med modeller från tidsperioden abell 6: MAPE- och MPE-värden för modeller från tidsperioden , de 15 prognostiserade månaderna abell 7: MAPE-värden för modeller från tidsperioden , fullständig och förkortad serie abell 8: Prognoser för Jan 2004-Mar 2005 med modeller från tidsperioden abell 9: MAPE- och MPE-värden för modeller från tidsperioden , de 15 prognostiserade månaderna abell 10: Prognoser för samtliga modeller Diagramförteckning Diagram 1: Utveckling av antal dödade i vägtrafikolyckor , årsdata Diagram 2: Utveckling av antal dödade i vägtrafikolyckor , månadsdata Diagram 3: Utveckling av dödsrisken , årsdata Diagram 4: Utveckling av dödsrisken , månadsdata Diagram 5: Antal dödade , månadsdata, differentierat Diagram 6: Utveckling av antal dödade i vägtrafikolyckor , månadsdata Diagram 7: Prognos med ARIMA-modell för dödsrisk , årsdata Diagram 8: Prognos med ARIMA-modell för dödsrisk förkortad serie, årsdata Diagram 9: Differens mellan prognoser med ARIMA-modell för antal dödade med fullstädig serie och med förkortad serie , månadsdata Diagram 10: Differens mellan prognoser med transferfunktionsmodell med fullständig serie och med förkortad serie , månadsdata Figurförteckning Figur 1: Samband mellan förklaringsvariabler, årsdata Utskriftsförteckning Utskrift 1: Regressionsmodell för dödsrisken Utskrift 2: ARIMA-modell för dödsrisken Utskrift 3: ARIMA-modell antal dödade Utskrift 4: ARIMA-modell för dödsrisk Utskrift 5: ARIMA-modell antal dödade Utskrift 6: Regressionsmodell för antal dödade Utskrift 7: ransferfunktionsmodell Utskrift 8: ARIMA-modell dödsrisk Bilageförteckning Bilaga 1 - Plot över antal dödade uppdelat på månad Bilaga 2 - Källdata Bilaga 3 - Index, trafikarbete Bilaga 4 - Regressionsmodell 1 för antal dödade Bilaga 5 - Regressionsmodell 2 för antal dödade

17 idsserieanalys av dödsfall i trafiken Bilaga 6 - Regressionsmodell för dödsrisk Bilaga 7 - ARIMA-modell för bruset från regressionsmodell för dödsrisk Bilaga 8 - ARIMA-modell för dödsrisk Bilaga 9 - ARIMA-modell för antal dödade Bilaga 10 - ARIMA-modell för antal dödade med intervention Bilaga 11 - Jämförelse ARIMA-modeller med och utan intervention Bilaga 12 - ARIMA-modell för dödsrisk Bilaga 13 - ACF och PACF för antal dödade Bilaga 14 - ACF och PACF för antal dödade differentierat på säsong Bilaga 15 - ARIMA-modell över antal dödade Bilaga 16 - Diagram över antal dödade och trafikarbete , månadsdata Bilaga 17 - Regressionsmodell för antal dödade Bilaga 18 - Autoregressionsmodell för antal dödade Bilaga 19 - ARIMA-modell för bruset från regressionsmodell för antal dödade Bilaga 20 - ransferfunktionsmodell för antal dödade Bilaga 21 - ARIMA-modell för dödsrisk Bilaga 22 - Prognoser och prediktionsintervall... 68

18

19 idsserieanalys av dödsfall i trafiken 1 Inledning Inledningskapitlet beskriver arbetets bakgrund, syfte och problemformulering. Vidare innehåller kapitlet en begreppslista samt en kortare beskrivning av våra data och de avgränsningar som gjorts. 1.1 Bakgrund Statens väg- och transportforskningsinstitut, VI, är en myndighet som arbetar under näringsdepartementet på uppdrag av regeringen. De har till huvuduppgift att bedriva forskning och utveckling som avser infrastruktur, trafik och transporter. I deras arbete ingår även att analysera transportsektorns effekter på miljön och energiförbrukningen. Målet med forskningen är att kontinuerligt förbättra kunskapen om transportsektorn med syfte att bidra till att uppfylla de mål och delmål som regeringen har, däribland säker trafik, god miljö och nollvisionen. 1 Nollvisionens grundtanke är att ingen får dö eller skadas för livet i vägtrafiken. Den enda accepterade siffran för antalet trafikdödade och allvarligt skadade är noll. Riksdagen beslutade i oktober 1997 att nollvisionen skall ligga som grund för trafiksäkerhetsarbetet. Att trafikolyckor inte kan förhindras är förståeligt, människor gör misstag. Man kan däremot göra mycket för att förhindra att olyckor leder till allvarligare skador och dödsfall. Bland annat kan vägar och fordon utvecklas och bli säkrare. Som ett led i detta arbete byggs många fyrvägskorsningar om till cirkulationsplatser och vägar läggs om till mötesfria så kallade 2+1-vägar 2. Dessutom kan människors insikt om vikten av ett trafiksäkert beteende bli mycket större. Nollvisionens delmål för år 2000 på 400 dödsfall i trafiken överskreds då det totala dödstalet blev 564. År 2007 finns det ett nytt delmål, nämligen att dödstalet ej får överskrida 270 människor. 3 Ett viktigt inslag i trafiksäkerhetsarbetet är att följa upp antal dödsolyckor och antal dödade i trafiken. För att kunna analysera utvecklingen är statistiska modeller och metoder till stor hjälp. Modellerna används för att hitta orsaker som kan tänkas ligga bakom dödsolyckornas uppkomst och för att prognostisera Näringsdepartementet, proposition 1996/97:137 1

20 1.2 Problemdiskussion På både Vägverket och VI sker uppföljningen över antalet dödade i trafiken oftast månadsmässigt. De slår även ihop månadsdata från januari till december och tittar på årssummor för att kunna jämföra år från år. Vidare tittar de på så kallade rullande årssummor då de jämför tolvmånadersperioder. Som ett exempel på en rullande årssumma kan man jämföra januari till december med februari till januari. Ett annat sätt att jämföra tidsperioder som de använder sig av är att titta på ackumulerade data. De jämför då de ackumulerade månaderna för aktuellt år med motsvarande period tidigare år. För att få ut mer av uppföljningen bör man använda sig av en modell som kan förklara antalet dödsfall i trafiken på ett bra sätt och som även kan användas till prognoser. VI har tidigare tagit fram regressionsmodeller. Det man nu skulle vilja utnyttja är den korrelation som antas finnas mellan observationerna och ta fram en tidsseriemodell. Det har tagits fram modeller som med hjälp av förklaringsvariabler på ett logiskt sätt kan förklara antalet dödsfall i trafiken men korrelationssambanden mellan observationer har inte beaktats. Många variabler kan vara potentiella förklaringsvariabler och det gäller att hitta sådana som har effekt på dödstalet i trafiken och att sedan undersöka vilka som är relevanta. 1.3 Syfte och problemformulering Uppsatsens huvudsyfte är att försöka finna en eller flera tidsseriemodeller som kan förklara antalet dödsfall i trafiken. Vi kommer att arbeta med nedanstående problemformulering: Vi vill utveckla enkla tidsseriemodeller för att göra så bra prognoser som möjligt. Vi vill utveckla enkla tidsseriemodeller med förklaringsvariabler för att göra så bra prognoser som möjligt. Vi vill jämföra modellerna och sedan rekommendera någon/några av dem. Vi vill göra en utvärdering av saklogiska förklaringsvariabler. Vi vill utveckla saklogiskt motiverade tidsseriemodeller.

21 idsserieanalys av dödsfall i trafiken 1.4 Avgränsningar De data vi kommer att arbeta med är månadsdata över antal dödade i trafiken. Vi har data från januari 1956 till december 2004 (588 observationer). Då det hände väldigt mycket i trafiken fram till 1977, såsom ändringar i hastighetsbegränsningar och bilbälteslagen har vi valt att ej analysera observationer från 1956 fram till 1976 när vi studerar månadsdata. Vi får då kvar 336 observationer. 1.5 Begreppslista Vägtrafikolycka Död Dödsolycka Som vägtrafikolycka räknas händelse som inträffat på väg, vari det deltagit minst ett fordon i rörelse och som medfört person- eller egendomsskador. Som död i vägtrafikolycka räknas här de personer som omkommit till följd av olyckan och inom 30 dagar från olyckstillfället. Personer som drabbats av sjukdom som skulle ha lett till döden oavsett om trafikolyckan inträffat eller inte (i den mån detta kunnat fastställas) är ej medräknade. Som dödsolycka räknas de vägtrafikolyckor där minst en person omkommit enligt definitionen ovan. 4 4 Hela avsnittet baseras på Forsman et al (2005) 3

22

23 idsserieanalys av dödsfall i trafiken 2 Metod Metodkapitlet redogör för de metoder som vi använt för att göra våra analyser. De metoder som beskrivs är: regressionsanalys, tidsserieanalys, transferfunktioner och interventionsanalys. 2.1 Regressionsanalys När man vill studera samband mellan en responsvariabel y och en eller flera förklarande x-variabler kan man använda sig av regressionsanalys. Man beskriver eller förklarar observerad variation i y-data med hjälp av motsvarande x-data. Detta gör man genom att anpassa ett funktionssamband y = f (x). Sambandet är sällan perfekt men den variation som återstår antas ha orsakats av slumpmässiga avvikelser. Regressionsanalys används ofta då man vill se om, och i så fall hur mycket, den eller de olika förklarande x-variablerna inverkar på responsvariabeln y. Man kan även använda sig av regressionsanalys för prognoser av y. 5 I enkel linjär regression förutsätter man att responsvariabeln Y systematiskt beror av den förklarande variabeln X genom en linjär funktion α + βx, där α och β är okända konstanter. Man förutsätter även att Y inte kan observeras utan en slumpmässig avvikelse, e, från α + βx. Avvikelserna e antas vara oberoende, ha väntevärde 0 och 2 varians σ. Ofta antas e vara normalfördelad. Modellen kan då skrivas: Y = α + βx + e (1.1) i i i I multipel regression tillåter man att Y beror linjärt av flera förklarande variabler, X, 1 X, 2..., X k. Modellen för multipel linjär regression blir då: Y = α + β... β + i 1 X i1 + β 2 X i2 + + k X ik ei (1.2) Även här gäller samma antaganden för storheten e. 6 5 Multimediautgåva av Nationalencyklopedin 6 Kapitel 1 i Neter et al (1996) 5

24 2.2 idsserieanalys En tidsserie är en serie data {, t = 1,2... }, där tidsavståndet är detsamma mellan Y t successiva observationer. Karaktäristiskt för en tidsserie är att det finns ett stokastiskt beroende mellan olika Y t -värden. ARIMA (Auto-Regressive Integrated Moving-Average)-modeller är en metodik för att göra prognoser av tidsseriedata. En ARIMA-modell ska förklara en ny observation i tidpunkten t med hjälp av tidigare värden i samma serie. idigare värden fungerar som förklaringsvariabler till det aktuella tidsserievärdet. En förutsättning för att man ska kunna använda ovanstående metod är att tidsserien är stationär. Med stationär menas att serien håller en konstant nivå, konstant varians och att autokorrelationen är konstant. Om ursprungsserien inte skulle vara stationär kan man åtgärda detta genom olika transformationer. De vanligaste metoderna för att uppnå detta är att differentiera och/eller logaritmera. Att differentiera serien innebär att differenser mellan observationer på tidsavstånd k bildas. Man bildar för en ursprungsserie Yt den nya serien Z t = Y Y. Då differentiering är nödvändig är det t vanligt att differentiera en gång på tidsavstånd 1 och/eller en gång på gällande säsongsavstånd, då data uppvisar säsongseffekt. Man differentierar så långt man behöver för att få stationära data men ändå med försiktighet så att differentieringarna inte leder till att data tappar anknytning till verkligheten. Det kan uppkomma ny autokorrelation om för många differentieringar genomförs. t k En ARIMA-modell kan använda sig av autoregressiva parametrar (AR), löpande medelvärdes parametrar (MA), differensbildningar (I) eller en kombination av två eller tre av dessa (ARMA, ARIMA). ARIMA-modellen kan skrivas som ARIMA(p,d,q)(P,D,Q) S där p = Antal autoregressiva parametrar d = Antal differensbildningar på tidsavstånd 1 q = Antal löpande medelvärdesparametrar P = Antal autoregressiva säsongsparametrar D = Antal differensbildningar på säsongsavstånd Q = Antal löpande medelvärdessäsongsparametrar S = Antal perioder per säsong

25 idsserieanalys av dödsfall i trafiken En autoregressiv modell ska förklara en observation i tidpunkten t med en linjär sammansättning av tidigare observationer. Den generella modellen AR(p) skrivs: Y + t = c + φ 1 Yt 1 + φ2yt φ pyt p et (1.3) där c = konstantterm = j:te autoregressiva parametern, j=1,2,,p φ j e t = slumpterm vid tidpunkt t En löpande medelvärdesmodell ska förklara en observation i tidpunkten t med en linjär sammansättning av tidigare brustermer. Den generella modellen MA(q) skrivs: Y t = c + e θ... θ t 1 et 1 θ 2et 2 qet q (1.4) där c = konstantterm = j:te löpande medelvärdesparametern, j=1,2,,q θ j e i = slumpterm vid tidpunkt i Ett exempel på en modell med båda typerna av parametrar, en ARMA(1,1) skrivs: Y t = c + 1Yt 1 + et θ1et 1 φ (1.5) För att bestämma ARIMA-modellens utseende kan man studera tidsseriens autokorrelationsfunktion (ACF) och dess partiella autokorrelationsfunktion (PACF). ACF mäter hur stark korrelation det finns mellan Y t och Y t-k. PACF mäter korrelationen mellan Y t och Y t-k då de mellanliggande observationerna är betingade. När man väl skattat ACF och PACF kan man genom att jämföra med nedanstående tabell försöka identifiera vilken process som gäller för aktuella data. 7

26 Funktionernas utseende ger oss också antalet och vilka parametrar som ska användas. Finns det signifikant partiell autokorrelation så ska man välja antalet AR-parametrar lika med antalet signifikanta korrelationer i PACF, förutsatt att ACF avtar. Korrelationerna benämns ofta som spikar. Antalet MA-parametrar bestäms också av antalet signifikanta spikar men man tittar då istället på ACF, och detta gäller förutsatt att PACF avtar. Dessa generella mönster för stationära AR- och MA-modeller sammanfattas i tabell 1. I de fall där man har signifikanta spikar i såväl ACF som PACF kan det vara lämpligt att testa processer med parametrar av båda typer. Funktionerna ger sällan en helt klar bild av vilken modell som ska användas, därför är det lämpligt att prova flera olika modeller. abell 1: Förväntat mönster i ACF och PACF vid enkla AR- och MA-modeller Process ACF AR(p) Exponentiellt eller sinusartat avtagande MA(q) Spikar i tidsavstånd 1,...,q och därefter 0 PACF Spikar i tidsavstånd 1,...,p och därefter 0 Exponentiellt eller sinusartat avtagande För att testa vald modell kan man genom vanliga t-test se om parametrarna är signifikanta eller ej. I normalfallet utesluts ickesignifikanta parametrar ur modellen. Vid jämförelse mellan olika modeller kan man jämföra deras residualvarianser och man väljer då modellen med lägst varians, under förutsättningen att båda har samma antal parametrar. Ett annat mått för att bestämma vilken av flera modeller som ska väljas är Akaike s informationskriterium(aic). Värdet för AIC räknas ut enligt formel 1.6. AIC = 2 log L + 2m (1.6) där L = Likelihoodfunktionen m = p+q+p+q AIC straffar i normalfallet modeller med stort antal parametrar. Man ska välja modellen med lägst AIC-värde. En sista viktig kontroll är att göra en residualanalys för att säkerställa att modellen har okorrelerade residualer, så kallat vitt brus. 7 7 Hela avsnittet baseras på kapitel 7 och 8 i Makridakis et al (1998)

27 idsserieanalys av dödsfall i trafiken 2.3 ransferfunktioner dynamisk regression Den här typen av modell är användbar när förklaringsvariabeln har effekt på responsvariabeln för värden vid flera tidpunkter. Y t ska alltså inte förklaras bara av aktuella X t utan man måste titta på flera X bakåt i tiden (X t-1, X t-2,...). Den generella modellen skrivs: Y + N t = c + ν 0 X t + ν 1X t ν i X t i = ) 2 i c + ( ν 0B + ν 1B ν i B X t + N t t = c + ν ( B) X t + N t (1.7) där c = konstantterm = impulsresponsvikten för X t-j ν j B j j = tidsavstånd j, B X t = X t j = förklaringsvariabeln vid tidpunkt t-j X t j N t = slumpterm som är en ARIMA-process ν (B) är den del av ekvationen som kallas transferfunktion. Den funktionen förklarar hur en förändring i X t -serien påverkar Y t. ransferfunktionens ordning styrs av hur stort i som finns i modellen. I vissa fall kan i vara mycket stor och detta leder till komplexa modeller med många parametrar och skattningar vilket man vill undvika och använder sig då istället av modellen: ω( B) Y t = c + X t b + N δ ( B) t (1.8) där ω (B) = ω δ (B) = 0 ω B 1... ω B s δ B... δ r B 1 r s De två funktionerna ω (B) och δ (B) ersätter funktionen ν (B) från den tidigare ekvationen (1.7). Anledningen till omskrivningen är att hitta ett enklare sätt att skriva transferfunktionen. Omskrivningen reducerar antalet parametrar som behöver skattas och ger vanligen mer precisa prognoser än den generella modellen. 9

28 För att bestämma modellens utseende måste man bestämma värden på konstanterna b, r och s. Då N t följer ett ARIMA-mönster måste även parametrarna p, d och q bestämmas. Om data har säsongsmönster måste även detta identifieras och skattas. Man kan identifiera modellen med LF (Linear ransfer Function)-metoden som består av sex steg. 1. Anpassa en multipel linjär regressionsmodell på formen Y + N t = c + ν 0 X t + ν 1X t ν i X t i t med så många tidsförskjutna förklaringsvariabler som möjligt men ändå så att den med längst tidsförskjutning kan vara av betydelse. I detta steg är brustermen av mindre betydelse så man kan då välja vilken AR-modell man vill av lägre ordning. 2. Man ska nu göra en residualanalys för modellen från steg 1 för att kontrollera stationäritet. Om kraven på stationäritet är uppfyllda kan man gå vidare till nästa steg, om inte utför man lämpliga differentieringar. Dessa differentieringar utförs på både respons- och förklaringsvariabler. 3. Nu ska man bestämma värden på konstanterna b, r och s. Värdet på b är antalet tidsförskjutningar som behövs innan X har effekt på Y. Med andra ord är b lika med antalet vikter (ν ) i följd som inte är signifikant skilda från noll med början i ν 0. Värdet på s är antalet impulsresponsvikter innan de börjar avta. Värdet på r väljer man beroende på vilket mönster som koefficienterna uppvisar när de börjar avta. Konstanten r kan anta värdena 0, 1 och 2. 0 då man inte kan se något avtagande, utan responsvikterna bara är några spikar i början 1 då vikterna avtar exponentiellt 2 då det avtagande mönstret är svängande 4. Bestäm lämpligt utseende för avvikelserna i genom att anpassa en ARIMA enligt samma metod som för vanliga tidsserier. N t 5. Skatta om modellen med den nya ARIMA-modellen som felterm och transferfunktionen för X.

29 idsserieanalys av dödsfall i trafiken 6. Sist tittar man på residualerna för att se om de kan antas vara vitt brus. Skulle så inte vara fallet bör en ny modell anpassas. När man väl valt modell och samliga parametrar är skattade får vi följande prognosmodell: Y t ω( B) θ ( B) = a + X t b + et (1.9) δ ( B) φ( B) där e t är en slumpterm vid tidpunkt t Interventionsanalys En intervention är en händelse som sker vid en given och känd tidpunkt och som har inverkan på responsvariabeln. Man kan göra modeller för interventionen med hjälp av dynamisk regression. Interventionen kan ske på många olika sätt och den enklaste formen är en stegfunktion. En sådan resulterar i en plötslig och permanent antingen sänkning eller höjning hos responsvariabeln. Anta att interventionen sker i tidpunkt u. Man kan då använda sig av en dummyvariabel med egenskaperna: X t 0 om t < u X t = 1 om t u (1.10) Dummyvariabeln är då 0 innan brytpunkten och 1 vid och efter brytpunkten. Modellen blir då: Y = α + ωx + N (1.11) t t t Här är ω storleken på förändringen orsakad av interventionen och är en ARIMAmodell. N t Successiva effekter är en annan typ. Då ökar eller minskar serien under en lite längre tid tills serien stabiliseras på en ny nivå. Dummyvariabeln (1.10) används även här men modellen blir nu: 8 Hela avsnittet baseras på kapitel 7 och 8 i Makridakis et al (1998) 11

30 ω Y t = α + X t + N t (1.12) 1 δb ω Här är 1 δ förändringen. storleken på den slutliga förändringen och δ anger hastigheten av Pulsfunktion är en annan enkel intervention. Då sker det en tillfällig sänkning eller höjning i en viss tidpunkt men serien återgår genast till samma nivå som tidigare. Modellen (1.11) används men dummyvariabeln blir nu: 0 om t u X t = 1 om t = u (1.13) X t är då 0 överallt förutom i själva pulsen. En sista enkel intervention är återgående funktioner. Serien beter sig vid interventionspunkten som vid en pulsfunktion med en plötslig sänkning eller höjning. Skillnaden från pulsfunktion är att återgången till den gamla nivån är segare och det tar lite tid innan serien är tillbaka på sin gamla nivå. Dummyvariabeln ser ut som vid pulsfunktion (1.13) men modellen blir som vid successiva effekter (1.12). Här är ω storleken på den omedelbara förändringen och δ graden av tillbakagång till den ursprungliga nivån. 9 9 Hela avsnittet baseras på kapitel 7 och 8 i Makridakis et al (1998)

31 idsserieanalys av dödsfall i trafiken 3 Data Datakapitlet innehåller en presentation av det datamaterial som vi använt i våra analyser. Vi beskriver vår responsvariabel, antal dödade i vägtrafikolyckor och våra förklaringsvariabler, mängden trafikarbete, antal körkortsinnehavare, antal fordon i bruk och mängden bensinleveranser. Vidare presenterar vi måttet dödsrisk. 3.1 Allmänt Våra grunddata består av antal dödade i vägtrafikolyckor, enligt definition, per månad för tidsperioden 1956 till Siffrorna för 2004 är något osäkra eftersom det fortfarande pågår utredningar om vissa dödsfall skall klassas som vägtrafiksdödsfall eller ej. Dessa fall är få och korrigeringarna skulle ha sådan liten betydelse vid val av modell att vi kan bortse från det. För att illustrera utvecklingen har vi använt oss av antal dödade per år. Diagram 1 visar att antalet dödade i vägtrafikolyckor ökade stadigt under 50- och 60-talet. Under hela 70-talet och något år in på 80-talet minskade antalet dödade för att sedan i några år öka något. Från 1994 och fram tills idag har antalet dödade legat på en relativt konstant nivå. Diagram 1: Utveckling av antal dödade i vägtrafikolyckor , årsdata Antal dödade År Antal dödade per år 13

32 Vi har valt att studera flera tidsperioder av dessa data såväl på årsbasis som på månadsbasis. De tidsperioder vi valt att analysera är: helårsdata månadsdata månadsdata Helårsdata Vi har i vårt syfte sagt att vi vill utveckla enkla tidsseriemodeller med förklaringsvariabler och utföra en utvärdering av saklogiska förklaringsvariabler. De potentiella förklaringsvariabler vi tänkt använda oss av finns bara på årsbasis och för att få en tidsserie med tillräckligt många observationer har vi varit tvungna att titta långt tillbaka i tiden. För åren 2003 och 2004 saknas data för några av våra tilltänkta förklaringsvariabler. Den serie som ger oss flest observationer med förklaringsvariabler är åren Månadsdata Nästa tidsperiod vi valt att analysera är tidsserien för och den består av månadsdata. Data uppvisar ett säsongsmönster med 12 perioder per år, se bilaga 1. Anledningen till att vi valt denna tidsperiod är att det i slutet av 60-talet och början på 70-talet genomfördes flera trafikreformer som anses ha påverkat utvecklingen av antalet dödade. Dessa reformers effekt har i tidigare VI-rapporter bedömts fått fullt genomslag Därför har vi valt detta år som startår. Diagram 2 visar tidsperiodens utveckling.

33 idsserieanalys av dödsfall i trafiken Diagram 2: Utveckling av antal dödade i vägtrafikolyckor , månadsdata Antal dödade År Antal dödade per månad Månadsdata För att få aktuella och stabila data, vilket tidsserieanalys i viss mån kräver, har vi valt att analysera åren Diagram 2 visar att månadsdata för tidsperioden är mycket stabila med få extremvärden och som synes relativt konstant varians. 3.2 Förklaringsvariabler De förklaringsvariabler vi kommer att använda oss av i våra modeller för att förklara antalet dödsfall i trafiken är: mängden trafikarbete, antal körkortsinnehavare, antal fordon i bruk och mängden bensinleveranser, se bilaga 2. Där finns även siffror över antal dödsfall i vägtrafiken per år. rafikarbetet är ett mått på mängden trafik vid det statliga vägnätet mätt i antal fordonskilometer. Data över trafikarbete finns endast på årsbasis men med hjälp av ett index, se bilaga 3, som Vägverket använder sig av kunde vi få fram skattningar av trafikarbetet på månadsbasis Poul Holmgren, vägverket 15

34 Data över antal körkortsinnehavare har vi tagit från Bilismen i Sverige 11 och Vägverkets databas 12. Siffror över antal fordon i bruk är även de hämtade från Bilismen i Sverige 13. Antal fordon i bruk finns uppdelad på de olika fordonstyperna personbil, bussar, lastbilar, traktorer och motorcyklar. Data för bensinleveranser är hämtade från SCB:s databas 14. Antal körkortsinnehavare saknade värden för år För mängden bensinleveranser och antal fordon i bruk saknades data för både år 2003 och år idsperioden blir alltså den längsta tidsperioden som kan studeras för förklaringsvariablerna. 3.3 Dödsrisk Då trafikarbetet ökat kraftigt under de tidsperioder vi studerar samtidigt som dödsantalet minskat har vi även valt att titta på dödsrisken. Dödsrisken är ett mått på risken att omkomma i en vägtrafikolycka. Vi har räknat ut dödsrisken genom att dividera antalet dödade med antalet miljoner trafikkilometer. Diagram 3 visar utvecklingen av dödsrisken för tidsperioden Vi ser att dödsrisken har sjunkit betydligt fram till mitten av 90-talet för att sedan hamna på en något stabilare nivå. Diagram 4 visar utvecklingen för dödsrisken per månad för tidsperioden Dödsrisken uppvisar liknande varians- och trendbeteende som våra grunddata över antal dödade per månad. 11 Bilismen i Sverige 1966, 1969, 1976, 1978, Bilismen i Sverige

35 idsserieanalys av dödsfall i trafiken Diagram 3: Utveckling av dödsrisken , årsdata 0,08 0,07 Antal dödade per miljoner trafikkm 0,06 0,05 0,04 0,03 0,02 0, År Dödsrisk Diagram 4: Utveckling av dödsrisken , månadsdata 0,035 0,03 Antal dödade per miljoner trafikkm 0,025 0,02 0,015 0,01 0, År Dödsrisk 17

36

37 idsserieanalys av dödsfall i trafiken 4 Resultat Resultatkapitlet innehåller skattade modeller för de tre tidsperioderna , och med tillhörande analyser och prognoser. De modeller som används är regressionsmodeller, ARIMA-modeller och även en transferfunktionsmodell. 4.1 Modeller för åren Modeller för antal dödade - regressionsanalys För den här tidsperioden studerade vi regressionssambandet mellan vår responsvariabel, antal dödade, och våra förklaringsvariabler, som presenterades i avsnitt 3.2. Regressionsmodellen, som visas i bilaga 4, visar på hög multikollinearitet mellan förklaringsvariablerna. Detta är inte på något sätt märkligt då det finns ett tydligt samband mellan förklaringsvariablerna vilket kan ses i figur 1. Sambandet mellan mängden bensinleveranser och de övriga förklaringsvariablerna uppvisar under de sista åren ett beteende som avviker från det annars tydliga linjära sambandet. Detta kan bero på att mängden bensinleveranser efter en tidigare uppåtgående trend nu stabiliserats. Vår valda regressionsmodell har dessvärre ologiska parameterskattningar. ill exempel skulle ett ökat trafikarbete leda till ett minskat antal dödade vilket inte verkar troligt. Figur 1: Samband mellan förklaringsvariabler, årsdata rafikarbete Körkort Bensin Fordon 19

38 Den höga multikollineariteten tillsammans med ologiska koefficienter gjorde oss tveksamma till modellen trots en relativt hög förklaringsgrad och signifikanta parametrar. Den förklaringsvariabel som var mest logisk att behålla i modellen var trafikarbetet som är den variabel som beskriver trafikmängden. Enligt definitionen vi använder så krävs det ett fordon i rörelse som medfört person- eller egendomsskador för att det ska räknas som en vägtrafikolycka. Man inser då att trafikarbetet, som uttrycks i antal fordonskilometer, har ett direkt samband med antalet dödade i trafiken. Vi gjorde ytterligare regressionsförsök där trafikarbetet tillsammans med ytterligare variabler skulle förklara antalet dödade men dessvärre kvarstod multikollinearitetsproblemen i samtliga regressionsmodeller med fler variabler än en. Även då trafikarbetet ensamt skulle förklara antalet dödade så blev parametern ologisk, se bilaga 5. Precis som tidigare skulle ett ökat trafikarbete minska antalet dödade i trafiken. Detta beror på att responsvariabeln och förklaringsvariabeln uppvisade olika trender. Under denna tidsperiod har antalet dödade haft en negativ trend medan trafikarbetet haft en positiv. Att antalet dödade ändå har minskat trots en ökning av trafikarbetet beror troligen på att trafiksäkerhetsarbetet varit av större magnitud än den ökning som skett av trafikarbetet Modeller för dödsrisk regressionsanalys och ARIMA Som vi tidigare nämnt ökar trafikarbetet kraftigt under vår tidsperiod samtidigt som dödsantalet minskar. Vi valde då att istället titta på dödsrisken, antalet dödade dividerat med trafikarbetet. Vi dividerade även våra förklaringsvariabler med trafikarbetet och tog fram regressionsmodeller. Antal körkortsinnehavare dividerat med trafikarbete blev både svårtolkat, fick ologiska parametrar och blev osignifikant som förklaringsvariabel så vi bortsåg från den. Den bästa modellen fick vi då dödsrisken förklarades av mängden bensinleveranser per trafikkilometer, antal personbilar per trafikkilometer och antal lastbilar per trafikkilometer, se SASutskriften nedan. Den justerade förklaringsgraden blev 92,15 procent och fullständig utskrift finns i bilaga 6. Utskrift 1: Regressionsmodell för dödsrisken Parameter- Standard- Variabel DF skattning fel t-värde Pr > t Skärning <.0001 bensinleveranspertrafikarbete <.0001 personbilpertrafikarbete <.0001 lastbilpertrafikarbete <.0001

39 idsserieanalys av dödsfall i trafiken De tidigare problemen med multikollinearitet fanns inte längre kvar. Residualerna uppvisade ej vitt brus för modellen men vi fann ingen övertygande ARIMA-modell för bruset. Möjligen att en ARIMA (1,1,1), se bilaga 7, skulle vara tillräckligt bra. Det sista vi tog fram för denna tidsperiod var en tidsseriemodell för dödsrisken. Det behövdes två differentieringar för att få serien stationär och vi kunde sen i ACF och PACF, se bilaga 8, se indikationer på att en AR-modell vore lämplig. Det fanns en signifikant spik i PACF och ACF uppvisade ett exponentiellt avtagande. Vi valde en ARIMA (1,2,0), vars SAS-utskrift visas nedan. Fullständig utskrift finns även den i bilaga 8. Utskrift 2: ARIMA-modell för dödsrisken Parameter Ungef. Skattning Standardfel t-värde Sh. > t Förskjutning AR1, < Autocorrelation Check of Residuals ill Sh. > förskj. Chi2 DF Chi Autokorrelationer Modeller för åren Modell för antal dödade - ARIMA Vi kunde ur diagram 2 se att serien för tidsperioden inte var stationär. För att få serien stationär krävdes två differensbildningar, en på kort tidsavstånd och en på säsongsavstånd. Serien fick följande utseende: 21

40 Diagram 5: Antal dödade , månadsdata, differentierat Som diagram 5 visar så har differentieringarna tagit bort den trend som originalserien uppvisade och variansen ser ut att vara mer konstant. För att undersöka hur strukturen såg ut för den differentierade serien så studerade vi ACF och PACF. Vi tolkade utseendet i PACF, se bilaga 9, som ett exponentiellt avtagande och det var en indikation på att modellen skulle anpassas med MA-parametrar. I ACF, även den i bilaga 9, kunde vi tydligt se två signifikanta spikar, en på kort tidsavstånd och en på säsongsavstånd, vilket gav oss två MA-parametrar på dessa avstånd. Efter att ha testat flera modeller kunde vi se att den mest lämpliga var en ARIMA(0,1,1)(0,1,1) 12. Båda parametrarna blev signifikanta och residualerna är oberoende enligt SAS-utskriften nedan. I bilaga 9 finns även den fullständiga utskriften. Utskrift 3: ARIMA-modell antal dödade Parameter Skattning Standardfel t-värde Sh. > t Förskjutning MA1, < MA2, < Autocorrelation Check of Residuals

41 idsserieanalys av dödsfall i trafiken ill Sh. > förskj. Chi2 DF Chi Autokorrelationer Modell för antal dödade - ARIMA med intervention Serien för uppvisar först en jämn nivå med jämn varians fram till 1989, för att sedan avta successivt och hitta en ny stabil nivå från 1994 till 2004, se diagram 2. Således var det lämpligt att prova en modell med en intervention med successiva effekter. Vi anpassade då en modell enligt formel (1.12). Det finns flera händelser som skulle kunna motivera en intervention i tidpunkten en om godkänd promillegräns sänks från 0,5 till 0,2 - Höjning av skatten på bensinen var det en topp för såväl antal anmälda rattfylleribrott som misstänkt alkoholpåverkade förare var det en topp för antalet bilförare i den yngsta och äldsta åldersgruppen abell 2 visar att det skiljer väldigt lite mellan de båda modellerna vad gäller den skattade variansen och AIC. För fullständig utskrift av interventionsmodellen se bilaga 10. Inte heller då vi studerade de båda modellernas prognosers följsamhet mot verkliga värden kunde vi säga att de skiljde sig markant åt, se bilaga 11. Dessa båda resultat visade att interventionen inte gav någon avsevärt bättre modell. abell 2: Jämförelse mellan ARIMA-modeller med och utan intervention Modell MSE AIC ARIMA ARIMA med intervention Modell för dödsrisk -ARIMA Vi har även för denna tidsperiod valt att göra en ARIMA-modell för dödsrisken. Originalserien för dödsrisken är långt från stationär. I diagram 4 kunde vi tydligt se att både dödsrisken och variansen sjunker med tiden. På grund av seriens utseende var det naturligt att transformera serien genom logaritmering. Detta gav oss dock inte någon 15 Basstatistik över olyckor och trafik samt bakgrundsvariabler, version

42 förbättring utan differentiering var nödvändig. Det behövdes en differentiering på kortoch en på säsongsavstånd. ACF och PACF, se bilaga 12, visar i princip samma mönster som för data över enbart antal dödade och vår valda modell blev även här en ARIMA(0,1,1)(0,1,1) 12. Vi kunde ur SAS-utskriften nedan se att de båda parametrarna var signifikanta och att residualerna var okorrelerade. Fullständig utskrift finns även den i bilaga 12. Utskrift 4: ARIMA-modell för dödsrisk Parameter Skattning Standardfel t-värde Sh. > t Förskjutning MA1, < MA2, < Autocorrelation Check of Residuals ill Sh. > förskj. Chi2 DF Chi Autokorrelationer Modeller för åren Modell för antal dödade - ARIMA I diagram 6 ges originalserien för månadsdata denna tidsperiod. Serien uppvisar ingen tydlig trend och variansen verkar konstant vilket stämmer väl överens med utseendet för en stationär serie. Men en analys av ACF och PACF, se bilaga 13, motsäger detta.

43 idsserieanalys av dödsfall i trafiken Diagram 6: Utveckling av antal dödade i vägtrafikolyckor , månadsdata Antal dödade År Antal dödade per månad Vi differentierade serien på säsongsavstånd och det visade sig vara tillräckligt. Efter en granskning av nya ACF och PACF, se bilaga 14, kunde vi konstatera att det skulle ge en modell med antingen en MA-, en AR-parameter eller en kombination av de båda parametrarna. Den slutliga modellen blev en ARIMA(0,0,0)(0,1,1) 12. SAS-utskriften nedan visar att MA-parametern var signifikant och att modellen har oberoende residualer. Fullständig utskrift finns i bilaga 15. Utskrift 5: ARIMA-modell antal dödade Parameter Ungef. Skattning Standardfel t-värde Sh. > t Förskjutning MA1, < Autocorrelation Check of Residuals ill Sh. > förskj. Chi2 DF Chi Autokorrelationer Modell för antal dödade - ransferfunktion De data vi har för den här tidsperioden är antal dödade och trafikarbete på månadsbasis. Bilaga 16 visar att de två serierna har ett likartat mönster. Vi skattade en 25

44 regressionsmodell med antal dödade som responsvariabel och trafikarbete som förklaringsvariabel. Denna gång blev inte parameterskattningen ologisk utan påvisade att ett ökat trafikarbete leder till ett högre antal dödade, se SAS-utskriften nedan eller i den fullständiga utskriften i bilaga 17. Med hjälp av transferfunktioner undersökte vi om det fanns någon dynamisk påverkan på antalet dödade av variabeln trafikarbete men detta kunde inte påvisas. Utskrift 6: Regressionsmodell för antal dödade Parameter- Standard- Variabel DF skattning fel t-värde Pr > t Skärning trafikarbete <.0001 Regressionsmodellen ovan hade korrelerade residualer, vilket kan ses i bilaga 18, och vi gick vidare för att undersöka bruset och anpassa en lämplig tidsseriemodell. Brusserien behövde differentieras på säsongsavstånd för att bli stationär och vid analys av ACF och PACF, se bilaga 19, sågs indikationer på att en MA-modell på säsongsavstånd vore lämplig. Insättning av ARIMA-modellen för bruset i transerfunktionen rensade korrelationen men gav ej signifikanta parametrar. Vi studerade impulsresponsvikternas beteende men det var mycket svårt att se något tydligt mönster. Vi provade ett stort antal olika modeller med olika värden på konstanterna b, r och s för att trots problemen kunna hitta en lämplig modell. Vi jämförde modellernas AIC-värden, tittade om modellen fick signifikanta parametrar och om vi fick vitt brus. Den bästa modellen fick vi då s=1, r=2 och b=0 vilken visas i utskrift 7. Fullständig utskrift finns i bilaga 20. Utskrift 7: ransferfunktionsmodell Parameter Ungef. Skattning Standardfel t-värde Sh. > t Förskjutning MA1, < NUM NUM1, DEN1, < Autocorrelation Check of Residuals ill Sh. > förskj. Chi2 DF Chi Autokorrelationer

45 idsserieanalys av dödsfall i trafiken Modell för dödsrisk - ARIMA Även för denna tidsperiod undersökte vi om en tidsseriemodell kunde anpassas för dödsrisken. Grundserien över dödsrisken var ej stationär utan det krävdes en differentiering på säsongsavstånd. Den differentierade seriens ACF och PACF, som visas i bilaga 21, uppvisar indikationer att det även här skulle vara aktuellt med en MA-modell på säsongsavstånd. Den modell som vi fann lämpligast var en ARIMA (0,0,0)(0,1,1) 12 vilken visas i utskrift 8 och den fullständiga utskriften finns även den i bilaga 21. Utskrift 8: ARIMA-modell dödsrisk Parameter Ungef. Skattning Standardfel t-värde Sh. > t Förskjutning MA1, < Autocorrelation Check of Residuals ill Sh. > förskj. Chi2 DF Chi Autokorrelationer Prognoser Prognos med ARIMA-modell för dödsrisk idigare i resultatkapitlet har vi presenterat en modell för dödsrisken för tidsperioden Anledningen till detta tidsintervall var att vi tidigare använde flera förklaringsvariabler och att det saknades data för åren 2003 och 2004 för vissa variabler. I dödsriskmodellen använder vi oss enbart av antalet dödade och trafikarbete vilka vi har data för även för åren 2003 och Vi anpassade nu en ARIMA-modell för tidsperioden så att alla prognoser skulle få samma startpunkt. Vi fick samma modell som tidigare en ARIMA (1,2,0). För att utvärdera vår valda modell för dödsrisk så har vi predikterat värden så långt tillbaka som det var möjligt. Anledningen till detta var att vi ville se hur pass väl prediktionerna överensstämde med de verkliga värdena. Om våra prediktioner låg nära så skulle detta innebära att vår valda modell hade stor träffsäkerhet. Diagram 7 visar hur vår modell anpassade sig till de verkliga värdena. Diagram 7: Prognos med ARIMA-modell för dödsrisk , årsdata 27

46 Antal dödade År Verkligt värde antal dödade Prognos antal dödade Vi studerade också om en förkortad serie kunde anpassas till samma modell. Vi tog bort de sista 7 observationerna från originalserien och studerade den nybildade serien. Den förkortade serien visade likadant beteende som den fullständiga och samma ARIMA-modell kunde anpassas. Nästa steg blev att se hur nära den förkortade seriens prognoser låg i jämförelse med de verkliga värdena. Om även dessa anpassar sig väl till de verkliga värdena så tyder det på att modellen har hög tillförlitlighet. Diagram 8 visar resultatet för den förkortade serien.

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012 Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

ARIMA del 2. Patrik Zetterberg. 19 december 2012

ARIMA del 2. Patrik Zetterberg. 19 december 2012 Föreläsning 8 ARIMA del 2 Patrik Zetterberg 19 december 2012 1 / 28 Undersöker funktionerna ρ k och ρ kk Hittills har vi bara sett hur autokorrelationen och partiella autokorrelationen ser ut matematiskt

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

Något om val mellan olika metoder

Något om val mellan olika metoder Något om val mellan olika metoder Givet är en observerad tidsserie: y 1 y 2 y n Säsonger? Ja Nej Trend? Tidsserieregression Nej ARMA-modeller Enkel exponentiell utjämning Tidsserieregression ARIMA-modeller

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Konjunkturförändringar i åländsk ekonomi

Konjunkturförändringar i åländsk ekonomi Kandidatuppsats i Statistik Konjunkturförändringar i åländsk ekonomi -Val av förklarande variabler för åländska företags omsättning Jesper Gullquist Abstract This paper is made on behalf of Statistics

Läs mer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012 Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta

Läs mer

En dynamisk modell för att prediktera antalet trafikdödade

En dynamisk modell för att prediktera antalet trafikdödade Ö Hallberg 2009-05-26 B 1 En dynamisk modell för att prediktera antalet trafikdödade Örjan Hallberg, Hallberg Independent Research, Trångsund Inledning Statistiska Centralbyrån har sedan 1960-talet utgivit

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Vad Betyder måtten MAPE, MAD och MSD?

Vad Betyder måtten MAPE, MAD och MSD? Vad Betyder måtten MAPE, MAD och MSD? Alla tre är mått på hur bra anpassningen är och kan användas för att jämföra olika modeller. Den modell som har lägst MAPE, MAD och/eller MSD har bäst anpassning.

Läs mer

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, VT2014 2014-05-26 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Regressions- och Tidsserieanalys - F8

Regressions- och Tidsserieanalys - F8 Regressions- och Tidsserieanalys - F8 Klassisk komponentuppdelning, kap 7.1.-7.2. Linda Wänström Linköpings universitet November 26 Wänström (Linköpings universitet) F8 November 26 1 / 23 Klassisk komponentuppdelning

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Föreläsning 4. Kap 5,1-5,3

Föreläsning 4. Kap 5,1-5,3 Föreläsning 4 Kap 5,1-5,3 Multikolinjäritetsproblem De förklarande variablerna kan vara oberoende (korrelerade) av varann men det är inte så vanligt. Ofta är de korrelerade, och det är helt ok men beroendet

Läs mer

F11. Kvantitativa prognostekniker

F11. Kvantitativa prognostekniker F11 Kvantitativa prognostekniker samt repetition av kursen Kvantitativa prognostekniker Vi har gjort flera prognoser under kursen Prognoser baseras på antagandet att historien upprepar sig Trenden följer

Läs mer

Finansiell statistik

Finansiell statistik Finansiell statistik Föreläsning 5 Tidsserier 4 maj 2011 14:26 Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs

Läs mer

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23 732G71 Statistik B Föreläsning 8 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23 Klassisk komponentuppdelning Klassisk komponentuppdelning bygger på en intuitiv

Läs mer

Laboration 2 multipel linjär regression

Laboration 2 multipel linjär regression Laboration 2 multipel linjär regression I denna datorövning skall ni 1. analysera data enligt en multipel regressionsmodell, dvs. inkludera flera förklarande variabler i en regressionsmodell 2. studera

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Laboration 4 R-versionen

Laboration 4 R-versionen Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 VT13, lp3 Laboration 4 R-versionen Regressionsanalys 2013-03-07 Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

Prognostisering av växelkursindexet KIX En jämförande studie. Forecasting the exchange rate index KIX A comparative study

Prognostisering av växelkursindexet KIX En jämförande studie. Forecasting the exchange rate index KIX A comparative study Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2013:14 Prognostisering av växelkursindexet KIX En jämförande studie Forecasting the exchange rate index KIX A comparative

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I

Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I Sebastian Andersson Statistiska institutionen Senast uppdaterad: 15 december 2015 Data kan generellt sett delas in i tre kategorier: 1 Tvärsnittsdata:

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

10.1 Enkel linjär regression

10.1 Enkel linjär regression Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2016-12-13, 8-12 Bertil Wegmann

Läs mer

Regressionsanalys av huspriser i Vaxholm

Regressionsanalys av huspriser i Vaxholm Regressionsanalys av huspriser i Vaxholm Rasmus Parkinson Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:19 Matematisk statistik Juni 2015 www.math.su.se

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14

Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14 STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 16 augusti 2007 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys) Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,

Läs mer

Homework Three. Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo. 28 november Time series analysis

Homework Three. Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo. 28 november Time series analysis Homework Three Time series analysis Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo 28 november 25 1 Vi ska här analysera en datamängd som består av medeltemperaturen månadsvis i New York mellan

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 7

ÖVNINGSUPPGIFTER KAPITEL 7 ÖVNINGSUPPGIFTER KAPITEL 7 TIDSSERIEDIAGRAM OCH UTJÄMNING 1. En omdebatterad utveckling under 90-talet gäller den snabba ökningen i VDlöner. Tabellen nedan visar genomsnittlig kompensation för direktörer

Läs mer

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan

Läs mer

Hemuppgift 2 ARMA-modeller

Hemuppgift 2 ARMA-modeller Lunds Universitet Ekonomihögskolan Statistiska Institutionen STAB 13 VT11 Hemuppgift 2 ARMA-modeller 1 Inledning Denna hemuppgift är uppdelad i två delar. I den första ska ni med hjälp av olika simuleringar

Läs mer

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B Föreläsning 4 Kap 3.5, 3.8 Material om index 732G71 Statistik B Skötsel (y) Transformationer Ett av kraven för regressionsmodellens giltighet är att residualernas varians är konstant. Vad gör vi om så

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet November 6, 2013 Wänström (Linköpings universitet) F3 November 6, 2013 1 / 22 Interaktion

Läs mer

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab. Räkneövning 5 Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari 016 1 Om uppgifterna För Uppgift kan man med fördel ta hjälp av Minitab. I de fall en figur för tidsserien efterfrågas

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data Stat. teori gk, ht 006, JW F16 MULTIPEL LINJÄR REGRESSION (NCT 13.1-13.3, 13.9) Anpassning av linjär funktion till givna data Data med en beroende variabel (y) och K stycken (potentiellt) förklarande variabler

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när

Läs mer

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

Statistiska Institutionen Gebrenegus Ghilagaber (docent) Statistiska Institutionen Gebrenegus Ghilagaber (docent) Lösningsförslag till skriftlig tentamen i FINANSIELL STATISTIK, grundnivå, 7,5 hp, VT09. Onsdagen 3 juni 2009-1 Sannolkhetslära Mobiltelefoner tillverkas

Läs mer

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka. y Uppgift 1 (18p) I syfte för att se om antalet månader som man ägt en viss träningsutrustning påverkar träningsintensiteten har tio personer som har köpt träningsutrustningen fått ange hur många månader

Läs mer

Färdtjänsten i Norrköping

Färdtjänsten i Norrköping Färdtjänsten i Norrköping Orsaker till minskade resor Mirza Topic & Armin Spreco Norrköping, januari 2010 Sammanfattning Resorna inom färdtjänsten har minskat under flera år och det finns behov av att

Läs mer

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1. En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar

Läs mer

VT' notat. Väg- och transport- Ifarskningsinstitutet. Projektnummer: / Nr T

VT' notat. Väg- och transport- Ifarskningsinstitutet. Projektnummer: / Nr T VT' notat Nr T 140-1993 Titel: Bensinpris, trafikutveckling och trafiksäkerhet Reviderad version av VTI Notat T 51 Författare: Avdelning: Peter Wretling Trafik Projektnummer: 74001-9/74322-9 Projektnamn:

Läs mer

Bayesiansk statistik, 732g43, 7.5 hp

Bayesiansk statistik, 732g43, 7.5 hp Bayesiansk statistik, 732g43, 7.5 hp Moment 2 - Linjär regressionsanalys Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA, LiU) Bayesiansk statistik 1 / 29 Översikt moment 2: linjär

Läs mer

732G60 - Statistiska Metoder. Trafikolyckor Statistik

732G60 - Statistiska Metoder. Trafikolyckor Statistik 732G60 - Statistiska Metoder Trafikolyckor Statistik Projektarbete Grupp 2 Linköpings Universitet VT2011 En framtid där människor inte dödas eller skadas för livet i vägtrafiken Albin Bernholtz, albbe876

Läs mer

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, HT2013 2014-02-07 Skrivtid: 13.00-18.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström October 31, 2010 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

Utökade användningsområden för trafikarbetets förändring Expanded uses for the change in traffic density Magnus Kjellman

Utökade användningsområden för trafikarbetets förändring Expanded uses for the change in traffic density Magnus Kjellman Utökade användningsområden för trafikarbetets förändring Expanded uses for the change in traffic density Magnus Kjellman 15-högskolepoängsuppsats inom Statistik III, ht 2012 Handledare: Mikael Möller Förord

Läs mer

Tidsserier. Data. Vi har tittat på två typer av data

Tidsserier. Data. Vi har tittat på två typer av data F9 Tidsserier Data Vi har tittat på två typer av data Tvärsnittsdata: data som härrör från en bestämd tidpunkt eller tidsperiod Tidsseriedata: data som insamlats under en följd av tidpunkter eller tidsperioder

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel

Läs mer

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2014-03-26

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström April 8, 2011 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

Modellutveckling 2015: Regressionsmodellen för inrikes inflyttning

Modellutveckling 2015: Regressionsmodellen för inrikes inflyttning Demografisk rapport 215:6 Modellutveckling 215: Regressionsmodellen för inrikes inflyttning Befolkningsprognos 215 224/5 2(38) 3(38) Regressionsmodellen för inrikes inflyttning i befolkningsprognosen Inledning

Läs mer

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population

Läs mer

Korrelation och autokorrelation

Korrelation och autokorrelation Korrelation och autokorrelation Låt oss begrunda uttrycket r = i=1 (x i x) (y i y) n i=1 (x i x) 2 n. i=1 (y i y) 2 De kvadratsummor kring de aritmetiska medelvärdena som står i nämnaren är alltid positiva.

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik, LP1, HT 2015, Adam Jonsson LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i enkel regressionsanalys

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Korrelation och regression Innehåll 1 Korrelation och regression Spridningsdiagram Då ett datamaterial består av två (eller era) variabler är man ofta intresserad av att veta om det nns ett

Läs mer

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Christian Aguirre Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:17 Matematisk

Läs mer

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Sid (7) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift Nedanstående beräkningar från Minitab är gjorda för en Poissonfördelning med väntevärde λ = 4.

Läs mer

Skrivning i ekonometri lördagen den 25 augusti 2007

Skrivning i ekonometri lördagen den 25 augusti 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA10:3 Skrivning i ekonometri lördagen den 5 augusti 007 1. Vi vill undersöka hur variationen i ölförsäljningen i ett bryggeri i en stad i USA

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 3 Bertil Wegmann IDA, Linköpings universitet November 4, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 4, 2015 1 / 22 Kap. 4.8, interaktionsvariabler Ibland

Läs mer

1 Förberedelseuppgifter

1 Förberedelseuppgifter LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 2 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMS086 & MASB02 Syfte: Syftet med dagens laborationen är att du skall: bli

Läs mer

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION. MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på

Läs mer

Föreläsning 13: Multipel Regression

Föreläsning 13: Multipel Regression Föreläsning 13: Multipel Regression Matematisk statistik Chalmers University of Technology Oktober 9, 2017 Enkel linjär regression Vi har gjort mätningar av en responsvariabel Y för fixerade värden på

Läs mer

Lösningar till SPSS-övning: Analytisk statistik

Lösningar till SPSS-övning: Analytisk statistik UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt

Läs mer

Statistisk analys av komplexa data

Statistisk analys av komplexa data Statistisk analys av komplexa data Trunkerade data och Tobitregression Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 10, 2015 Bertil Wegmann (statistik, LiU) Trunkerade data

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

Kandidatuppsats i Statistik

Kandidatuppsats i Statistik Kandidatuppsats i Statistik Prognostisering av försäkringsärenden Hur brytpunktsdetektion och effekter av historiska lag- och villkorsförändringar kan användas i utvecklingen av prognosarbete Sebastian

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

Skrivning i ekonometri torsdagen den 8 februari 2007

Skrivning i ekonometri torsdagen den 8 februari 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 9 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 1 / 43 Longitudinella data

Läs mer

Laboration 2: Styrkefunktion samt Regression

Laboration 2: Styrkefunktion samt Regression Lunds Tekniska Högskola Matematikcentrum Matematisk statistik Laboration 2 Styrkefunktion & Regression FMSF70&MASB02, HT19 Laboration 2: Styrkefunktion samt Regression Syfte Styrkefunktion Syftet med dagens

Läs mer

Skrivning i ekonometri lördagen den 29 mars 2008

Skrivning i ekonometri lördagen den 29 mars 2008 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan

Läs mer

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen

Läs mer