Svensk varuhandel. Tidsserieanalys över

Storlek: px
Starta visningen från sidan:

Download "Svensk varuhandel. Tidsserieanalys över"

Transkript

1 STATISTISKA INSTITUTIONEN Uppsala universitet Examensarbete C Författare: David Magnusson och Petter Samuelsson Handledare: Lars Forsberg Höstterminen 2010 Tidsserieanalys över Svensk varuhandel januari 1975 augusti

2 Sammandrag Syftet med denna uppsats är att modellera och prognostisera Sveriges varuexport, varuimport och handelsnetto. Vi använder oss av data från januari 1975 till och med augusti 2010 för respektive serie. Dessa data testas och jämförs i olika ARIMA- och SARIMA-modeller samt skattas även medelst säsongsreningsprogrammet TRAMO/SEATS. För de modeller som bäst passar serierna genomförs därefter in sample- och out of sample-analyser med felmåtten RMSE och MAPE. Modellerna med bäst felmått och som därpå väljs ut för att göra prognoser för serierna till och med augusti 2012 är (3,1,0)x(0,1,1) för export, (2,1,1)x(0,1,1) för import samt (0,1,1)x(0,1,1) skattad i TRAMO/SEATS för handelsnetto. Nyckelord: SARIMA; TRAMO/SEATS; prognostisering; varuhandel 1

3 Innehållsförteckning 1. Inledning Avgränsning Disposition Tidigare studier Teori Tidsserieanalys ARMA Säsongsrensning Felmått Modellidentifikation Enhetsrotstest Autokorrelation Modellspecifikation Chows test Data Granskning av data Resultat Modellval Efter 90-talskrisen Utvärdering av modellerna Efter 90-talskrisen Prognoser Slutsats Källförteckning Appendix 1 - Plottar på förstadifferenser Appendix 2 - Korrelogram Appendix 3 - Residualplottar Appendix 4 Prognoser

4 1. Inledning I en allt mer globaliserad värld där den internationella varuhandeln mellan länderna ständigt växer är Sverige inget undantag. Som ett litet export- och importberoende land är Sverige särskilt beroende av en positiv och gynnsam utveckling av den internationella handeln. Sedan år 1975 har både Sveriges export och import mångdubblats och har de senaste åren bestått av omkring % vardera av Sveriges totala BNP, till skillnad från omkring % år Under denna tidsperiod har varuflödena emellertid ej haft en linjär och enkelt förklarad utveckling, utan de har istället varierat i viss omfattning kring en positiv trend. Detta samtidigt som finansiella kriser i omvärlden under vissa perioder har fått utvecklingen att stanna av och i vissa fall även falla. Med hjälp av tidsserieanalytiska verktyg kommer denna uppsats att modellera, diskutera och prognostisera Sveriges månatliga utveckling inom varuexport och varuimport mellan januari 1975 och augusti Samtidigt ger användandet av månadsdata en utmärkt möjlighet att närmare undersöka ifall dessa tidsserier består av trender som är mindre skönjbara i form av säsongsspecifika element och faktorer. När dessa element har hittats och när de olika serierna har passats till relevanta och förklarande modeller kommer dessa slutligen att tillämpas för att göra tvååriga prognoser för framtiden. Med antagandet att framtidens utveckling kommer att kunna förklaras på samma sätt som den gångna är det därpå möjligt att ge tidsserierna plausibla utvecklingsbanor. Syftet med denna uppsats är: Att visa hur Sveriges export, import och handelsnetto (export - import) har utvecklats. Att anpassa de mest lämpade modellerna till dessa tidsserier. Att prediktera seriernas framtida utveckling med hjälp av de bäst lämpade modellerna Avgränsning Denna uppsats begränsar sig till att endast använda månadsdata över Sveriges totala export och import från januari 1975 till och med augusti Metodiken som används är av univariat karaktär där vardera serie analyseras var för sig. Då dessa serier tenderar att bero på andra faktorer i hög grad är det dock vanskligt att låta datamaterialet sträcka sig över en 1 Enligt data från the World Bank. 3

5 längre period. Redan nu kan tidsspannet tänkas vara allt för långt, vilket dock kommer att testas genom Chows brytpunktstest som undersöker ifall effekterna är olika stora under olika delar av tidsperioden. Likaså är vi fullt medvetna över att export och import är två tidsserier som är endogena och därför skulle kunna förklaras med hjälp av flertalet övriga relaterade variabler. Samtidigt har vi inte utrymme för att testa samtliga tidsseriemodeller i denna uppsats, utan kommer därför att fokusera på modeller sprungna ur Box-Jenkins ARMAmodell Disposition Uppsatsen är i fortsättningen strukturerad på följande sätt: Kapitel 2 går igenom ett par tidigare tidsseriestudier inom området svensk varuhandel. Kapitel 3 bygger den teoretiska referensramen, både genom att definiera och konkretisera tidsserier och genom att redogöra för den diagnostik och de tester som är nödvändiga vid användande av tidsseriedata. Kapitel 4 beskriver de data som används i denna uppsats. Kapitel 5 visar sedan de resultat som framkommer när datamaterialet tillämpas i de modeller som beskrivs i den teoretiska delen. Kapitel 6 avslutar slutligen genom att sammanfatta uppsatsen och dra slutsatser av resultaten. 2. Tidigare studier Tidsserieanalyser över den svenska varuhandeln har inte gjorts i någon större omfattning enligt vår kännedom. I Statistiska Centralbyråns serie Bakgrundsfakta till Ekonomisk statistik författade Erkelius och Zeed uppsatsen En tillämpning av TRAMO/SEATS: Den svenska utrikeshandeln (2003). I uppsatsen delades den långa perioden in i fem kortare perioder, som sedan undersöktes och analyserades i en säsongskontext. Den sista perioden , som även ligger närmast en jämförelse med perioden i denna uppsats, uppvisade cykler på mellan 3 och 6 år. I samband med att kronan släpptes fri i november 1992 påfanns positiva effekter på både import och export. En annan slutsats var att sommarsemestereffekten på säsongselementen, som visserligen fortfarande var stora, har minskat under periodens gång. Detta tros bero på en ökad flexibilitet över möjligheterna för anställda när de kan ta ut sin semester. 4

6 Tongur (2010) har i två rapporter använt sig av svensk varuhandelsdata från 1993 till och med I den ena rapporten jämfördes TRAMO/SEATS med att säsongsrensa med hjälp av en dynamisk linjär modell (DLM). Även fast den senare visar intressanta och tillämpbara resultat, kommer TRAMO/SEATS samt SARIMA att användas i vår uppsats. I den andra rapporten diskuteras huruvida direkta eller indirekta säsongsrensningsmetoder är att föredra, utan att komma fram till någon allmän regel. 3. Teori Metoden i denna uppsats är klassisk tidsserieanalysteori. Inom detta område finns en mängd olika modeller, men den som kommer att användas är ARMA-modellen vilken kan utvecklas och anpassas till olika typer av tidsseriedata. Underlaget till denna modell finns bland annat beskrivet i Box, Jenkins & Reinsel (1994). Modellerna i uppsatsen är skattade med hjälp av EViews 7. Vi har även valt att använda TRAMO/SEATS som säsongsrensningsprogram eftersom att de är standard för säsongsrensning vid bland annat SCB och Eurostat. I följande avsnitt kommer denna ARMA-modellen och vidareutvecklingar av denna att definieras och diskuteras i vilka fall den är tillämpbar Tidsserieanalys En tidsserie beskriver utfallet från en stokastisk process och kan definieras som * + vari är det observerbara utfallet i de på varandra följande tidpunkterna t=1,2,,t. En tidsseriemodell syftar till att beskriva och modellera den process som skapade dessa utfall. Vid erhållande av en modell som kan beskriva de historiska observerbara utfallen är det därpå möjligt att använda densamma till att prediktera framtida utfall ARMA En metod som ofta används för att modellera en tidsserie är ARMA-modellen. För att korrekt kunna modellera en tidsserie enligt ARMA-modellen behöver vissa grundantaganden vara uppfyllda. Grundkravet är att den underliggande tidsserien är svagt stationär, det vill säga att serien har konstant medelvärde och varians samt att korrelationskoefficienten mellan y t och y t-k enbart beror på längden av lag k. En serie som innehåller en stokastisk trend och därmed 5

7 inte är stationär kan dock differentieras för att uppnå stationaritet och benämns då som ARIMA. En ARIMA-modell består därför av tre delar; den autoregressiva delen (AR), ett antal differentieringar (I) om den ursprungliga serien inte är stationär samt glidande medelvärde-delen (MA). Följande avsnitt är baserat på Pindyck och Rubinfeld sid Autoregressiv modell - AR(p) Den autoregressiva modellen av ordning p är genererad av ett viktat snitt av observationer p perioder tillbaka i tiden och är definierad enligt ekvation (1)., (1) där är observationen p perioder tillbaka i tiden, är den vikt med vilken observationen för p-perioder sedan påverkar den nuvarande observationen, är feltermen och är en konstant. För att en AR-process skall vara stationär får den inte innehålla någon enhetsrot. Ett nödvändigt villkor för stationaritet är att summan av -termerna är mindre än ett. Om detta villkor inte är uppfyllt är processen en slumpvandring med postitiv trend om är större än noll och med negativ trend om är mindre än noll. I den autoregressiva modellen, liksom i glidande medelvärde-modellen (som presenteras härnäst), antas störningstermerna vara genererade av en vitt brus -process, det vill säga att slumptermerna skall vara okorrelerade över tid samt ha konstant varians och väntevärde. Varje felterm antas dessutom vara normalfördelad med medelvärde 0 och varians σ 2. Autokorrelationsfunktionen 2 i en autoregressiv modell beror på alla tidigare observationer och är normalt avtagande för en stationär process. För att ta reda på av vilken ordning en modell är autoregressiv, alltså storleken på p, används den partiella autokorrelationsfunktionen. De p första värdena i den autoregressiva modellens autokorrelationsfunktion är 2 Se kapitel för en beskrivning av autokorrelationsfunktionerna. 6

8 ,.. (2) Dessa ekvationer är Yule Walker-ekvationerna 3. Om ρ 1, ρ 2,, ρ p är kända kan ekvationerna lösas för. Detta kräver dock att vi redan vet av vilken ordning (p) modellen är autoregressiv. Det går dock att komma fram till rätt ordning genom att testa olika värden på p i Yule-Walker-ekvationen och se om värdet på p (den partiella autokorrelationen vid lag p) är signifikant skilt från noll 4. Glidande medelvärde MA(q) En glidande medelvärde-modell av ordning q är definierad som, (3) Autokorrelationen för en glidande medelvärde-process av ordning q ges av { k = 1,, q k>q. (4) Således har en glidande medelvärde-funktion av ordning q ett minne på q perioder och det är därför möjligt att, genom att undersöka vid vilka laggar autokorrelationen skiljer sig från noll, få en uppfattning om vilken ordning glidande medelvärde-processen består av. Differentiering (I) Om en tidsserie inte är stationär, det vill säga att den underliggande stokastiska processen förändras över tiden, kan serien vanligtvis differentieras en eller flera gånger för att serien ska kunna modelleras i en autoregressiv- och/eller en glidande medelvärde-modell. På motsvarande sätt kan en serie säsongsdifferentieras för exempelvis månadsdata och därmed 3 Se Pindyck och Rubinfeld sid för härledning av Yule Walker-ekvationen 4 Om man t.ex. testar p=n och φ n är signifikant skilt från noll är det autoregressiva modellen åtminstone av ordning n. φ n är även definierat som värdet på den partiella autokorrelation för lag n. Genom att då testa p=n+1 kan man så småningom hitta vilken ordning modellen är av. 7

9 differentieras med avseende på 12 perioder tillbaka. En serie y t är homogent icke-stationär av ordning d ifall serien w t specificerad av ekvation (5), är en stationär serie.. (5) En metod för att upptäcka om en serie är stationär är att undersöka huruvida den har någon enhetsrot eller ej. Om serien har en enhetsrot bör den differentieras en gång för att åstadkomma stationaritet, har den två enhetsrötter bör serien differentieras två gånger och så vidare enligt samma logik vid fler enhetsrötter. ARIMA Vissa tidsserier är vare sig genererade av en ren glidande medelvärde- eller av en ren autoregressiv process, utan är istället genererade av en blandning av dessa. I fallet med en stationär tidsserie definieras för detta fall ARMA-modellen enligt. (6) Denna serie kan skrivas om till ekvation 7 med hjälp av backshiftoperatorn 5 ; ( ) ( ) (7) På liknande sätt kan ARIMA-modellen skrivas om till ( ) ( ). (8) I ekvation 7 och 8 är ( ) och ( ) Säsongsrensning Tidsserier avseende ekonomisk månadsstatistik kan delas upp i dess icke-observerbara delar; trend (T), säsong (S), cyklisk (C) och irreguljära effekter (slumpmässiga) (I). Med trend åsyftas den långsiktiga utvecklingen hos serien vilken exempelvis kan bero på ekonomisk tillväxt. Säsongselement kan vara sommarsemestrar, konsumentbeteenden runt exempelvis jul 5 Backshiftoperatorn (B) står för en lag en period tillbaka i tiden. B( ) är således detsamma som och B j är lika med. 8

10 eller av klimatologiska eller institutionella slag. Den cykliska komponenten däremot beror på periodiska faktorer som exempelvis konjunktureffekter. Slumpdelen fångar upp det brus som existerar i serien. Andra element som kan förekomma och som också kan påverka serierna för enskilda tidpunkter eller under begränsad tid är extremvärden (E) och kalendereffekter (K). Varje observerat värde i en originalserie ser därför ut enligt ekvation (9): O T C S K E (9) Med dessa effekter försvåras tolkningen av data likaså jämförelser över tid. På grund av detta finns det därför anledning att utveckla metoder, alltså säsongsrensning, för att urskilja och eliminera de effekter i datamaterialet som beror på dessa effekter. I en säsongsrensad serie är alla dessa effekter eliminerade. Den säsongsrensade serien kan därför användas för att göra jämförelser mellan alla tidpunkter i en tidsserie. I en säsongsrensad serie finns emellertid alltid ett kvarvarande brus, vilket skapar viss osäkerhet vid dylika jämförelser. Säsongen kan allmänt vara beskaffad på två olika sätt, antigen additiv eller multiplikativ. I den additiva modellen adderas eller subtraheras samma värde för alla de observationer som berör januari respektive februari et cetera. I den multiplikativa metoden är varje komponent istället proportionell mot det observerbara värdet i serien. Vid en logaritmering blir den multiplikativa metoden additiv för den ursprungliga serien. (Öhlén sid. 4-6, 2003) SARIMA I vissa typer av tidsserier förekommer trender i säsongslika strukturer med återkommande mellanrum. Dessa fenomen är speciellt vanliga i ekonomiska data där positiva effekter i handeln kring jul och helger efter löneutbetalningar är två exempel på års- respektive månadssäsonger som är återkommande. En ARIMA-modell kan använda sig av dylik information genom att tillåta säsongsvariation och sålunda bli en SARIMA-modell (Seasonal Autoregressive Integrated Moving Average). Om en vid lag s (exempelvis säsongens längd) differentierad serie ( ( ) ) passas till en ARMA(p,q)-modell ( ( ) ( ) ), ger detta SARIMA(p,d,q)x(P,D,Q)- modellen som är definierad enligt 9

11 ( ) ( ). (10) Där och är polynom av ordning p+sp och q+sq och Y t är differentierad eller säsongsdifferentierad om serien innehåller någon enhetsrot. En skillnad med en SARIMA-modell jämfört med att använda säsongsvariationerna som dummyvariabler är att den tillåter slumpmässighet i säsongstermen. (Brockwell och Davies, sid , 1996) TRAMO/SEATS TRAMO (Time Series Regression with ARIMA Noise) och SEATS (Signal Extraction in ARIMA Time Series) är två program som används tillsammans av bland andra Statistiska Centralbyrån (Can Tongur, SCB) för att säsongsrensa tidsserier. Följande beskrivning av programmen är skriven med vägledning av Ghysels och Osborn (2001) samt Gómez och Maravall (1997). TRAMO lineariserar den ursprungliga tidsserien genom att identifiera och ta bort flera typer av extremvärden, och interpolerar saknade observationer. Den automatiska detektionen av extremvärden plockar bort dessa en och en och estimerar däremellan ARIMA-processens parametrar på nytt för att undersöka deras betydelse för regressionens parametrar. Användaren har också möjlighet att ange specifika extremvärden, vilkas effekt då elimineras av TRAMO. TRAMO innehåller även en modellvalsalgoritm som väljer den modell som optimalt passar till den använda tidsserien. Givet observationsvektorn z som består av alla observationer skattar TRAMO, (11) där är en vektor av regressionsvariabler som kan väljas i TRAMO (till exempel för att fånga effekter av antalet vardagar eller påsk) och är en vektor av deras koefficienter. följer en ARIMA-process som väljs ut av programmet beroende på tidsseriens egenskaper. Programmet undersöker alla möjliga SARIMA-modeller till och med (3,2,3)x(2,1,2) (Gómez 10

12 & Maravall sid ) och väljer modell enligt Hannan-Rissanen kriteriet 6 med Kalmanfilter. Den slutgiltiga modellen väljs sedan ut efter BIC-kriteriet (se kapitel ) med ett möjligt tillval för att öka sannolikheten att antalet AR- och MA-termer skall vara detsamma. SEATS däremot delar upp tidsserien i dess icke-observerbara delar; trend, säsong, cyklisk och irreguljära effekter. Trendkomponenten fångar seriens långsiktiga trend, säsongskomponenten fångar säsongsmönstret, den cykliska komponenten fångar kortvariga variationer som kan uppstå av MA-komponenter av låg ordning. Den slumpmässiga komponenten fångar upp allt brus, vilket gör de tre första delarna brusfria. När SEATS används tillsammans med TRAMO använder programmet den modell som valts ut av TRAMO. Avslutningsvis justeras komponenterna samt prognoserna för de deterministiska effekter som togs bort av TRAMO Felmått När en modell har anpassats till ett datamaterial finns det flera olika sätt att kontrollera hur väl modellen förhåller sig till de faktiska observationerna. Den enklaste metoden är att estimera värden enligt den angivna modellen för att sedan jämföra dessa värden med de sanna värdena. Det finns ett stort antal felmått som kan göra liknande jämförelser, varav två används och förklaras i denna uppsats. Dessutom kan felmåtten användas på olika sätt där skillnader i informationsfönster och sampelstorlek påverkar tolkningen och vars intuition även förklaras i detta avsnitt (Pindyck & Rubinfeld, sid. 210, samt , 1998). RMSE En vanlig metod för att utvärdera en tidsserieprognos är att undersöka modellens RMSE (root mean squared error), där RMSE är definierat enligt ekvation 12, där är det predikterade värdet, är det verkliga värdet och T är antalet perioder. ( ). (12) 6 Enligt Hannan-Rissanen kriteriet skattas först en autoregressiv process till X t. Sedan skattas Xt på [Xt-i, ât-j] där â är residualerna från den första skattningen och där i och j går till p och q. Detta utförs för många olika p och q. (Newbold & Bos) 11

13 Detta kan antingen göras genom att göra en prediktion över det datamaterial som används för modellskattningen, eller genom att skatta en del av tidsserien och undersöka hur bra prediktionen är prognostiserad för den del som inte använts i modellskattningen. Genom att utvärdera modellen på det senare sättet minskar risken för att överskattning av modellen ska påverka felmåttet. MAPE Ett felmått som är relativt och således inte beroende av storleken på de estimerade värdena är MAPE (Mean absolute percentage error). Felmåttet ger värdet noll om modellen är perfekt skattad och saknar övre gräns. MAPE är definierat enligt ( ). (13) In sample En in sample-analys genomförs genom att skatta modellen för hela den undersökta tidsserien. Sedan jämförs modellens prognoser för varje i tidsserien ingående tidpunkt med de sanna värdena. Informationsfönster och Prognosfönster Figur 1. In sample - översiktsbild 12

14 Jan 1975 Nov 1989 Nov 1991 Jan 1975 Okt 1989 Okt 1991 Out of sample I en out of sample-analys är informationsfönstret vanligtvis rullande till skillnad från det fasta i in sample-kontexten I detta fall görs prognoser endast inom en given periodslängd på en modell skattad av en delmängd av samtliga observationer. Jämförelsen mellan de sanna och estimerade värden görs därefter på observationer som inte ingick i modellspecifikationen istället för på hela perioden. Denna delmängd flyttas sedan inom tidsperioden för att på så sätt undersöka felmåttet på olika delmängder. Informationsfönster Prognosfönster Informationsfönster Prognosfönster Figur 2 Out of sample - översiktsbild 3.3. Modellidentifikation I detta avsnitt presenteras de olika test och diagnosverktyg som kommer att användas i denna uppsats vid val och specificering av ARIMA-modell. 13

15 Enhetsrotstest För att kunna genomföra tidsserieanalyser korrekt krävs det att tidsserievariabeln är stationär vid användning av ARMA-modellen. För att testa detta är den konventionella metoden att undersöka huruvida tidsserien innehåller enhetsrötter eller inte. Avsaknad av enhetsrötter implicerar att det ej finns en stokastisk trend, medan en serie med enhetsrötter kan differentieras för att åstadkomma stationaritet. Förekomsten av enhetsrötter kan testas på ett flertal sätt, där ADF-testet och KPSS-testet är två av de mest användbara. Augmented Dickey Fuller (ADF) Det ursprungliga Dickey Fuller-testet är en form av enhetrotstest som undersöker förekomsten av enhetsrötter i en AR-modell (Pindyck & Rubinfeld sid , 1998). Enligt nollhypotesen, δ = 0, förekommer minst en enhetsrot. ADF-testet är en förlängning av det vanliga Dickey Fuller-testet som undersöker förekomsten av enhetsrötter i en AR(p)-modell, istället för en AR(1)-modell som i originaltestet. Enligt nollhypotesen δ = 0 (där δ = ρ 1) förekommer minst en enhetsrot, medan mothypotesen anger att tidsserien är stationär. Testet använder Dickey-Fuller-fördelningen 7, snarare än en vanlig t-fördelning. Testet utgår från. (14) KPSS KPSS-testet är en form av ett enhetrotstest som testar ifall stationaritet föreligger. Nollhypotesen säger att den observerbara originalserien är nivåstationär, alternativt trendstationär., (15) där täljaren är residualerna från en OLS-regression innehållande säsongselement och nämnaren är feltermens varians. Mothypotesen säger däremot att tidsserien har en enhetsrot. (Eviews 7. User Guide II sid. 387) 7 EViews använder sig av MacKinnons förkastelsegränser. 14

16 Autokorrelation Autokorrelationsfunktionen visar korrelationer mellan olika tidpunkter i en stokastisk process, vilket är användbart vid val av modell (se nedan under Modellspecifikation samt för en utförligare beskrivning Pindyck & Rubinfeld se sid , 1998). Tidsserier som innehåller systematiska element, alltså korrelation mellan observationerna i serien, är autokorrelerade. Autokorrelationsfunktionen beskrivs enligt ekvation 16 där autokorrelationen tas fram genom att beräkna korrelationsfunktionen mellan y t och y t+k ( ). (16) Den partiella autokorrelationen mellan och mäter däremot korrelationen mellan dessa variabler om korrelationen som härrör från de mellanliggande variablerna elimineras. Detta är således ett mått på det marginella bidraget till autokorrelationsfunktionen för varje observation. Ljung Box Ljung Box-testet är en form av portmanteau-test som undersöker autokorrelationen i tidsserier (Brockwell och Davies, sid , 1996). Testet är därför speciellt användbart vid användning av ARIMA-modeller eftersom att dessa förutsätter vitt brus. Ljung Box-testet prövar ifall residualerna av en skattad modell i den undersökta tidsserien är signifikant skilda från noll eller inte. Nollhypotesen utgår ifrån att observationerna, alltså populationskorrelationen, är slumpartad. Sålunda : ( ) ( ) ( ) 0. (17) Mothypotesen däremot säger att det inte är slumpartat. Teststatistikan ser ut som följer ( ), (18) där n är stickprovsstorleken på tidsserien, p k är autokorrelationskoeffiecenten vid lag k och h är antalet laggar som testas. Nollhypotesen förkastas vid signifikansnivå α ifall, efter χ 2 -fördelningen med h antal frihetsgrader. Godtas nollhypotesen anses tidsserien vara vitt brus. 15

17 Modellspecifikation För att välja vilken modell som är bäst lämpad till en tidsseries observationer när flertalet modeller är specificerade, finns det flera olika principer samt två stycken kriterier att använda som riktlinjer. Det finns däremot ingen konvention som exakt säger hur modellval rent allmänt skall gå till. Till att börja med är emellertid en modell med färre parametrar att föredra framför en modell med många parametrar, enligt måttfullhetsprincipen. Dessutom är ett högt justerat R 2 -värde att föredra framför en modell med ett lågt värde. Detta gäller speciellt när syftet med modellen är att göra prognoser eftersom att dessa gynnas av en högre förklaringsgrad. En ytterligare vägledning går att finna i autokorrelationsfunktionen och den partiella autokorrelationen. Som tidigare har beskrivits kan den förstnämnda hjälpa till med att bestämma i vilken ordning q MA-delen är beskaffad av, medan den senare går att hänföra till AR-delens antal laggar. AIC och BIC AIC (Akaike Information Criterion) och BIC (Bayesian Information Criterion) kan användas för att välja antalet laggar i en distribuerad lag-modell. AIC är definierat som ( ( ) ), (19) medan BIC definieras som ( ( ) ). (20) Skillnaden mellan att använda dessa kriterier mot att använda justerad R 2 vid modellval är att AIC och BIC till högre grad straffar fler variabler i modellen. Enligt kriteriet skall den modell med lägst värde på AIC eller BIC väljas av de alternativ till modeller som finns. Emellertid är dessa metoder dock inte regelrätta statistiska test för att välja antalet laggar och bör därför alltid användas tillsammans med intuition. (Pindyck & Rubinfeld, sid , 1998) 16

18 Chows test Råder det osäkerhet ifall en modell egentligen innehåller data där effekterna skiljer sig åt mellan olika perioder inom hela tidsperioden är Chows test en metod för att undersöka detta. Testet bryter ner tidsperioden i två delperioder som sedan separat skattas med identiska regressioner: Nollhypotesen blir sålunda (21). (22), vilket indikerar, om det är sant, att parameterkoefficienter för de två regressionerna är likadana och att effekterna därmed lika stora över hela tidsperioden. Kan nollhypotesen förkastas indikerar detta att datamaterialet lider av tidsseriebrott och att effekterna därmed skiljer sig åt i delperioderna inom tidsperioden. (Pindyck & Rubinfeld, sid , 1998) 4. Data Denna uppsats använder sig av tre olika tidsserier hämtade från Statistiska Centralbyrån med månadsdata som alla berör Sveriges varuhandel med omvärlden. Två stycken serier är oberoende av varandra, Sveriges totala export respektive totala import, medan den sista serien är beroende av de två första och består av total export minus total import och sålunda består av Sveriges handelsnetto. Samtliga serier är i originalform varken säsongs-, inflations- eller volymjusterade. Var och en innehåller serierna 428 observationer; en sträckning från januari 1975 till och med augusti De olika seriernas utveckling kan ses i figur 3. 17

19 1975M M M M M M M M M M M M M M M M M M01 Miljoner kronor Sveriges handel januari augusti 2010 Månad import totalt, mkr export totalt, mkr handelsnetto, mkr Figur 3. Svensk varuexport, -import samt handelsnetto i miljontals kronor från och med januari 1975 till och med augusti 2010 Både export- och importserierna har utvecklats positivt sedan Den totala exporten har vuxit från ett värde av miljoner kronor 1975 till ett värde av miljoner kronor i augusti Motsvarande siffror för total import är från miljoner kronor till miljoner kronor. Se tabell 1 för ytterligare deskriptiv statistik. Tabell 1. Deskriptiv statistik för svensk varuexport, -import samt handelsnetto i miljontals kronor från och med januari 1975 till och med augusti Variabel Observationer Medelvärde Standardavvikelse Min-värde Max-värde Import Export Handelsnetto

20 I tabell 2 syns dessutom medelvärdena för respektive månad och serie. Export är låg i början på året, men lägst under juli och augusti samt högst i mars, juni och oktober. Import visar en liknande struktur som exporten, men är klart lägst i juli. Handelsnetto har sin topp i juni och botten i augusti. Överlag är det tydligt att säsongseffekter föreligger, med stora skillnader mellan de högsta och lägsta månadsvisa medelvärdena. Tabell 2. Månadsvisa medelvärden i miljontals kronor för export, import och handelsnetto. Månad Export Import Handelsnetto Januari Februari Mars April Maj Juni Juli Augusti September Oktober November December De positiva trenderna för serierna har egentligen bara brutits ordentligt med nedgångar vid två tillfällen, även om den positiva utvecklingen tillfälligt stannade av både vid 90-talets mitt och under IT-kraschen i början av 2000-talet. I början av 90-talet kan en svag nedgång skönjas i samband med 90-talskrisen efterdyningar medan en starkare nedgång inträffade under den senaste finanskrisen som inleddes Tidsserien kan därför delas in i två perioder; före och efter 90-talskrisen. Även om denna brytpunkt inte är den klaraste gör vi det av två anledningar: i) Brytpunkten är i ungefär mitten av tidsserien. ii) Den ligger mitt i en period där väldigt mycket skedde som påverkade den svenska ekonomin i grunden. En närmare beskrivning av vad som inträffade under denna 19

21 1975M M M M M M M M M M M M M M M M M M01 Miljoner kronor turbulenta tid och vilka följder dessa fick är dock utanför denna uppsats ramar. Vad som emellertid är relevant och värt att nämna är att den svenska kronan släpptes att flyta fritt den 19 november Detta efter åratal av att tidigare ha varit fastknuten mot andra valutor, vilket påverkade den svenska köpkraften och värdet på den svenska kronan gentemot omvärlden. Även om den största delen av den absoluta tillväxten har skett efter krisen, var tillväxten rent procentuellt sett större perioden före krisen gällande exporten. Denna växte med 472 % perioden innan och med 315 % perioden efter. Motsvarande siffror för importen visar däremot en större tillväxt efter (358 %) gentemot perioden före 90-talskrisen (321 %). Sveriges handel januari oktober Månad import totalt, mkr export totalt, mkr handelsnetto, mkr Figur 4. Svensk varuexport, -import samt handelsnetto i miljontals kronor från och med januari 1975 till och med oktober 1992 Handelsnetto kan delas in efter ett liknande mönster. Innan 90-talskrisen fluktuerade det nära och omkring ett balanserat resultat där export och import var lika stora. I början av 90-talet utvecklades detta däremot till ett positivt handelsnetto där export kontinuerligt låg högre än 20

22 1992M M M M M M M M M M M M M M M M M M11 Miljoner kronor import. I samband med den senaste finanskrisen vändes dock trenden med stora fluktuationer och ett negativt handelsnetto i augusti 2010 som följd Sveriges handel nov aug 2010 Månad import totalt, mkr export totalt, mkr handelsnetto, mkr Figur 5. Svensk varuexport, -import samt handelsnetto i miljontals kronor från och med november 1992 till och med augusti Granskning av data De tre serierna har testats för förekomsten av enhetsrötter via ADF- och KPSS-testen. Testresultaten återfinns i tabell 3. I samtliga fall är både intercept och trend inkluderade i testregressionerna. Detta eftersom att den deskriptiva statistiken visar på trender i serierna. Resultaten tyder på att ingen av serierna är stationära enligt samtliga förkastelsegränser upp till 10 procents-nivån. Efter en differentiering av serierna tyder emellertid ADF- och KPSStesten på att export och import är stationära. Testen av handelsnetto visar stationaritet på olika nivåer. ADF-testet kan på 1-procentsninvån förkasta nollhypotesen om enhetsrot medan KPSS-testet på 1-procentsnivån inte förkastar nollhypotesen om stationaritet. Med anledning av detta tillsammans med att vi har undersökt korrelogrammen av serien och residualerna för ett antal modeller samt deras AIC och BIC värden har vi valt att differentiera serien en gång i fortsättningen av uppsatsen. 21

23 Tabell 3. Resultat av enhetsrotstest på serierna export, import samt handelsnetto i miljontals kronor från och med januari 1975 till och med augusti Serie Nivå Första differensen ADF KPSS ADF KPSS Export -2, ,476332*** -4,968191*** 0, Import -1, ,502016*** -7,447996*** 0, Handelsnetto 0, ,272895*** -7,695800*** 0,152056** Dickey-Fuller t-statistika för ADF; förkastelsegränser: 1 % -3,980489, 5 % -3,420768, 10 % -3, Nollhypotes: Serien innehåller en enhetsrot. Test-statistika för KPSS; förkastelsegränser: 1 % 0,216000, 5 % 0,146000, 10 % 0, Nollhypotes: Serien är stationär. *** = signifikant på 1-procentsnivån, ** = signifikant på 5-procentsnivån, * = signifikant på 10- procentsnivån Eftersom att detta ger oss anledning att tro att åtminstone import- och exportserierna inte är stationära på grund av deras respektive positiva trender, tittar vi även på hur utvecklingen av förstadifferensen för respektive serie har utvecklats över vår undersökta tidsperiod. 8 Det framgår att medelvärdena i serierna över perioden är mer konstanta än i de versioner där variablerna inte är differentierade. Däremot ser vi att variansen ökar med tiden, vilket inte uppfyller kriterierna för en ARIMA-modell. Därför logaritmeras serierna innan de differentieras, vilket förbättrar seriernas egenskaper. Då vi enbart undersöker tidsperioden från och med november 1992 ser det ut som att tidsseriernas medelvärde även här är konstanta över tiden. Variansen uppvisar inte lika stora problem med att variera över tiden, men det skulle fortfarande kunna utgöra ett problem för vår analys om tidsserierna inte transformeras. Därför logaritmeras export- och importserierna även i detta fall. 8 För diagram, se appendix 1. 22

24 5. Resultat I detta kapitel presenteras resultaten av denna uppsats. Till att börja med att skattas de olika tidsserierna i ett flertal modeller som har valts ut efter teorin i modellspecifikationsavsnittet. Modellerna valdes ut framför allt med hänsyn till strukturen på de tre olika seriernas autokorrelationer och partiella autokorrelationer. Därefter gjordes de slutliga modellvalen efter vilka modeller som hade de lägsta AIC/BIC-värdena. De modeller som valdes ut användes sedan för att göra in sample- och out-of-sample-jämförelser. Därefter utsågs de modeller med lägst felmått för att göra prognoser två år fram i tiden. Att finna de modeller som passar data bäst innebär, som tidigare har förklarats, att inte alltid färdas på en enkelriktad och intuitiv väg. För att välja ut de modeller som med minst fel predikterar export, import respektive handelsnetto har vi därför först valt ut modeller efter tre olika tillvägagångssätt. I det första har vi först logaritmerat 9 serierna för att sedan själva säsongsrensat serierna med additiv metod och slutligen differentiera dem för att uppnå stationaritet. Serierna har till slut anpassats till ARIMA-modeller. I den andra metoden används SARIMA-modeller där serierna har logaritmerats, i vilka säsongsrensningen sker genom att differentiera serierna även på säsongsnivå (12 månader med anledning av att månadsdata används) och genom inkluderandet av säsongs-ar- respektive -MA-termer (SAR/SMA) i regressionerna. Till vår hjälp i dessa två metoder har vi använt oss av korrelogrammen 10 av de slutgiltiga serierna. I den sista metoden kördes programmet TRAMO/SEATS som själv räknar fram de bästa modellerna. Detta körs utan att korrigera för kalendereffekter men med automatisk extremvärdesdetektion. Resultaten för de, enligt korrelogrammen, mest logiska modellerna samt angränsande modeller för de olika serierna presenteras nedan och är grunden för resten av arbetet. 9 Eftersom att handelsnettoserien innehåller negativa tal kan denna dock inte logaritmeras. 10 För korrelogram över förstadifferenserna, se appendix 2. 23

25 5.1. Modellval Både TRAMO/SEATS och SARIMA pekar ut en modell med två AR-termer och en säsongs- MA-term för export-serien, se tabell 4. När vi själva säsongsrensar serien visar det sig däremot att även inkluderandet av en ordinär MA-term innebar ett lägre AIC-värde. Enligt måttfullhetsprincipen och ett lägre BIC-värde så väljs (2,1,0) för ARIMA. För SARIMA har (1,1,1)x(1,1,1) de lägsta AIC- och BIC-värdena, men eftersom den innehåller både en SARoch SMA-term så väljs även (2,1,0)x(0,1,1) ut. Dessa kommer sedan att användas till att göra prognoser. Tabell 4. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för export januari 1975-augusti Modell Koefficienter P-värde AIC BIC Justerat R 2 (2,1,0) AR(1) -0, , , , AR(2) -0, (1,1,0) AR(1) -0, , , , (1,1,1) AR(1) -0, ,022-2, , , MA(1) -0, (0,1,1) MA(1) -0, , , , (2,1,1) AR(1) -0, AR(2) -0, MA(1) 0, ,031-2, , , (1,1,1)x(1,1,1) AR(1) -0, MA(1) -0, SAR(12) 0, SMA(12) -0, (2,1,1)x(0,1,1) AR(1) -0, AR(2) -0, MA(1) -0, SMA(12) -0, (2,1,0)x(0,1,1) AR(1) -0, AR(2) -0, MA(12) -0, (0,1,1)x(0,1,1) MA(1) -0, SMA(12) -0, (3,1,0)x(0,1,1) AR(1) -0, AR(2) -0, AR(3) -0, SMA(12) -0, TRAMO/SEATS (2,1,0)x(0,1,1) AR(1) 0,81273 AR(2) 0,45119 MA(12) -0, ,085 0,003 0,001 0,005 0,024 0,762-2, , , , , , , , , , , , , , , Fetmarkerade värden är de lägsta AIC/BIC-värdena, vilket innebär bäst modeller inom ARIMA respektive SARIMA.. 24

26 För import-serien visar både ARIMA och SARIMA i grunden ut samma modell, enligt tabell 5. Denna modell innehåller två AR-termer och en MA-term, med en säsongs-ma-term i SARIMA-fallet. TRAMO/SEATS däremot vill inkludera ytterligare en AR-term, något som dock inte får stöd av AIC- och BIC-värdena av en liknande modell enligt de två första metoderna. Tabell 5. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för import januari 1975-augusti 2010 Modell Koefficienter P-värden AIC BIC Justerat R 2 (2,1,0) AR(1) -0, , , , AR(2) -0, (1,1,0) AR(1) -0, , , , (1,1,1) AR(1) -0, ,006-2, , , MA(1) -0, (0,1,1) MA(1) -0, , , , (2,1,1) AR(1) -0, AR(2) -0, MA(1) 0, ,030-2, , , (3,1,1) AR(1) 0, AR(2) -0, AR(3) 0, MA(1) -0, (1,1,1)x(1,1,1) AR(1) -0, MA(1) -0, SAR(12) 0, SMA(12) -0, (3,1,1)x(0,1,1) AR(1) -0, AR(2) -0, AR(3) 0, MA(1) 0, SMA(12) -0, (2,1,1)x(0,1,1) AR(1) -0, AR(2) -0, MA(1) 0, SMA(12) -0, (3,1,0)x(0,1,1) AR(1) -0, AR(2) -0, AR(3) 0, MA(12) -0, ,096 0,337 0,235 0,837 0,019 0,001 0,184 0,322 0,790 0,898 0,101 0,089-2, , , , , , , , , , , , , , , (0,1,1)x(0,1,1) MA(1) -0, SMA(12) -0, TRAMO/SEAT AR(1) 0,68488 S AR(2) 0,36247 (3,1,0)x(0,1,1) AR(3) -0, ,002 MA(12) -0,80695 Fetmarkerade värden är de lägsta AIC/BIC-värdena inom ARIMA respektive SARIMA. -2, , ,

27 I fallet där handelsnettot används pekar samtliga tre metoder ut, se tabell 6, samma modell som den bäst lämpade. Denna innehåller en MA-term och en säsong-ma-term. Tabell 6. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för handelsnetto januari 1975-augusti Modell Koefficienter P-värde AIC BIC Justerat R 2 (2,1,1) AR(1) -0, ,413 17, , , AR(2) 0, MA(1) -0, ,887 (1,1,1) AR(1) -0, ,314 17, , , MA(1) 0, ,038 (0,1,1) MA(1) -0, , , , (1,1,0) AR(1) -0, , , , (1,1,1)x(1,1,1) AR(1) -0, MA(1) -0, SAR(12) 0, SMA(12) -0, ,202 0,301 18, , , (2,1,2)x(0,1,1) AR(1) 0, AR(2) 0, MA(1) -1, MA(2) 0, SMA(12) -0, (2,1,1)x(0,1,1) AR(1) -0, AR(2) 0, MA(1) -0, SMA(12) -0, (3,1,0)x(0,1,1) AR(1) -0, AR(2) -0, AR(3) 0, MA(12) -0, ,727 0,138 0,090 0,674 0,490 0,210 0,067 17, , , , , , , , , (0,1,1)x(0,1,1) MA(1) -0, , , , SMA(12) -0, TRAMO/SEATS (0,1,1)x(0,1,1) MA(1) -0,74291 SMA(12) -0, Fetmarkerade värden är de lägsta AIC/BIC-värdena inom ARIMA respektive SARIMA Efter 90-talskrisen En misstanke är dock att det finns ett brott i tidsserierna eftersom att serierna dels är långa och att det dels skedde mycket under denna period med 90-talskrisen som kulmen av detta. Därför genomför vi Chows brytpunktstest för att utröna om parametereffekterna egentligen skiljer sig åt under perioden istället för att vara konstanta över hela perioden. Eftersom att den svenska kronan släpptes flytande den 19:e november 1992 testar vi ifall det existerar ett brott i tidsserierna vid november i samma år. Testen för export- och import-serierna som visas i tabell 7 förkastar att det inte finns något brott på 5-procentsnivån, medan testet för handelsnetto-serien förkastar nollhypotesen på 10-procentsnivån. 26

28 Tabell 7. Chows brytpunktstest för brott i serien i november Export Import Handelsnetto F-värde 8,16*** 3,15** 2,41* *** = signifikant på 1-procentsnivån, ** = signifikant på 5-procentsnivån, * = signifikant på 10- procentsnivån Med hänsyn av detta skattar vi nya modeller för perioden november 1992 till och med augusti 2010 och exkluderar därför de äldre observationerna. Modellvalen genomförs efter samma metodik som tidigare och resultaten presenteras i tabell 8. Resultaten visar att både export och import bäst förklaras av (3,1,0)x(0,1,1)-modeller, vilka skiljer sig från de modeller som bäst passade till hela perioden. Handelsnettot förklaras dessutom bäst av en (0,1,1)x(0,1,1)-modell i SARIMA-fallet, medan TRAMO/SEATS väljer en (1,1,3)x(0,1,1)-modell för serien. 27

29 Tabell 8. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för export, import samt handelsnetto november 1992-augusti Modell Koefficienter P-värde AIC BIC Justerat R 2 Export (2,1,0)x(0,1,1) AR(1) -0, , , , AR(2) -0, SMA(12) -0, (3,1,0)x(0,1,1) AR(1) -0, , , , AR(2) -0, AR(3) 0, SMA(12) -0, ,003 (0,1,1)x(0,1,1) MA(1) -0, , , , SMA -0, TRAMO/SEATS (3,1,0)x(0,1,1) AR(1) 0,80082 AR(2) 0, AR(3) -0,15358 SMA(12) -0, ,045 Import (2,1,1)x(0,1,1) AR(1) -0, , , , AR(2) -0, MA(1) 0, SMA(12) -0, ,058 (3,1,0)x(0,1,1) AR(1) -0, , , , AR(2) -0, AR(3) 0, MA(12) -0, ,005 0,001 (0,1,1)x(0,1,1) MA(1) -0, , , , SMA(12) -0, TRAMO/SEATS (3,1,0)x(0,1,1) AR(1) 0,68753 AR(2) 0,31497 AR(3) -0,18049 SMA(12) -0, , Handelsnetto (0,1,1)x(0,1,1) MA(1) -0, , , , SMA (12) -0, (1,1,3)x(0,1,1) AR(1) -0, ,987 18, , , MA(1) -0, MA(2) 0, MA(3) -0, SMA(12) -0, ,046 0,576 0,053 TRAMO/SEATS (1,1,3)x(0,1,1) AR(1) -0,09517 MA(1) -0,97196 MA(2) 0,23154 MA(3) -0,10493 SMA(12) -0, ,216 0, Fetmarkerade värden är de lägsta AIC/BIC-värdena inom ARIMA respektive SARIMA. 28

30 5.2. Utvärdering av modellerna De utvalda modellerna från det förra avsnittet har i detta avsnitt använts till att estimera värden för de olika serierna. Dessa har tagits fram i både en in sample-kontext såväl som i en dynamisk out of sample-kontext, för att därefter valideras med hjälp av felmåtten RMSE och MAPE, se tabell 9. Out of sample-analysen har genomförts genom att prediktera de kommande två åren i ett rullande informationsfönster där slutperioden varierar från oktober 1989 till augusti Tabell 9. Felmått för export, import, handelsnetto samt export-import januari 1975-augusti Modell RMSE In sample MAPE In sample RMSE - Out of sample MAPE - Out of sample Export (2,1,0) , ,843 (2,1,0)x(0,1,1) , ,087 (1,1,1)x(1,1,1) , ,087 TRAMO/SEATS N/A 11 N/A ,088 Import (2,1,1) , ,751 (2,1,1)x(0,1,1) , ,087 TRAMO/SEATS N/A N/A ,094 Handelsnetto (0,1,1) , ,745 (0,1,1)x(0,1,1) , ,393 TRAMO/SEATS N/A N/A ,355 Export-Import ARIMA , ,003 SARIMA , ,397 TRAMO/SEATS N/A N/A ,414 För hela tidsperiodens out of sample är det inledningsvis enkelt att se att de olika seriernas ARIMA-modeller leder till betydligt större fel än SARIMA-modellerna och modellerna från TRAMO/SEATS. 12 I övrigt är det svårare att göra någon tydlig gränsdragning mellan de två senare modellernas träffsäkerhet. T/S predikterar export bättre, medan SARIMA-modellen predikterar import bättre. Gällande handelsnetto har T/S ett lägre RMSE-värde, medan SARIMA har ett lägre MAPE-värde. Om vi istället definierar handelsnetto med hjälp av de andra serierna (export-import) ser vi att SARIMA-modellerna ger bättre felmått än TRAMO/SEATS, men sämre än den ursprungliga handelsnettoserien. 11 TRAMO/SEATS ger ingen information om in sample-felmåtten. 12 Eftersom att ARIMA-modellerna visar stora fel exkluderas dessa från vidare diskussion. 29

31 5.2.1 Efter 90-talskrisen Eftersom att vi fann ett brott i tidsserierna och därefter skattade nya modeller för tidsperioden november 1992 fram till och med augusti, gör vi även in-sample- och out-of-sample-analyser för denna kortare tidsperiod, se tabell 10. I dessa fall ligger prognosfönstret mellan februari 1998 till augusti 2010 för export och import, medan det börjar i mars 2006 för handelsnetto 13. SARIMA ger bättre felmått än TRAMO/SEATS i fallen export och import, medan resultaten visar det omvända för handelsnetto. Export-import visar till sist större fel än handelsnetto, detta skulle kunna bero på att handelsnetto är mer stabil än de övriga serierna. Tabell 10. Felmått för export, import, handelsnetto samt export-import november 1992-augusti RMSE In sample MAPE In sample RMSE - Out of sample MAPE - Out of sample Modell Export (3,1,0)x(0,1,1) , ,084 TRAMO/SEATS N/A N/A ,099 Import (3,1,0)x(0,1,1) , ,094 TRAMO/SEATS N/A N/A ,1127 Handelsnetto (0,1,1)x(0,1,1) , ,062 TRAMO/SEATS N/A N/A ,748 Export-Import (Handelsnetto) SARIMA , ,870 TRAMO/SEATS N/A N/A ,824 Då vi har noterat att valet av modell i de kortare serierna förändras vid borttagande av endast ett fåtal variabler, tittar vi istället på det brutna datasetet från november 1992 och framåt, med samma antal AR- och MA-termer som för hela perioden och med samma prognosfönster. När vi gör denna jämförelse ser vi att modellerna anpassade för den kortare tidsperioden har lägre in sample-fel än modellerna som är anpassade för hela perioden men skattade för den korta, se tabell 11. En sådan tydlig skillnad föreligger inte för out of sample-felmåtten. I export-fallets SARIMA-modell, som visar bättre felmått än TRAMO/SEATS, är RMSE-värdet något lägre 13 Anledningen till det kortare prognosfönstret är TRAMO/SEATS-modellen (1,1,3)x(0,1,1) inte kan göra prognoser längre tillbaka i tiden med det rådande informationsfönstret. 30

32 för modellen anpassade för hela perioden medan MAPE-värdet är marginellt lägre (0,0837 mot 0,0840) i modellen anpassad för den korta perioden. För import har modellen på den långa perioden för SARIMA bättre out of sample-felmått i båda fallen. I fallet handelsnetto är det samma modell i SARIMA-fallet och inga jämförelser kan därför göras. I TRAMO/SEATS-fallet, som visar bättre resultat än SARIMA, är RMSE betydligt lägre i modellen anpassad för den långa perioden, medan MAPE är något lägre i modellen anpassad för den korta perioden. Tabell 11. Felmått för export, import samt handelsnetto november 1992-augusti 2010, med samma antal AR- och MA-termer som modellerna anpassade för perioden januari 1975 augusti Modell RMSE In sample MAPE In sample RMSE - Out of sample MAPE - Out of sample Export (2,1,0)x(0,1,1) , ,0840 TRAMO/SEATS N/A N/A ,0964 Import (2,1,1)x(0,1,1) , ,0933 TRAMO/SEATS N/A N/A ,1127 Handelsnetto (0,1,1)x(0,1,1) , ,062 TRAMO/SEATS N/A N/A ,780 De slutliga prognosmodellerna blir sålunda (3,1,0)x(0,1,1) för export, främst med tanke på att vi har ett brott i serien. För import blir det (2,1,1)x(0,1,1), då modellen anpassad för den långa perioden skattad på den korta perioden i samtliga out of sample-fall visar bättre felmått. För handelsnetto väljs (0,1,1)x(0,1,1) från TRAMO/SEATS ut eftersom att denna modell visar avsevärt lägst RMSE-värden. Tittar vi på residualerna 14 från dessa modeller ser vi att export uppvisar lägre Q-värden än import som snabbt visar insignifikans. Däremot kan vi inte säga att residualerna från någon av dessa två modeller består av vitt brus. I motsats till detta tyder residualerna för handelsnetto 14 Korrelogram av residualerna återfinns i appendix 3. 31

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012 Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012 Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov

Läs mer

Finansiell statistik

Finansiell statistik Finansiell statistik Föreläsning 5 Tidsserier 4 maj 2011 14:26 Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs

Läs mer

ARIMA del 2. Patrik Zetterberg. 19 december 2012

ARIMA del 2. Patrik Zetterberg. 19 december 2012 Föreläsning 8 ARIMA del 2 Patrik Zetterberg 19 december 2012 1 / 28 Undersöker funktionerna ρ k och ρ kk Hittills har vi bara sett hur autokorrelationen och partiella autokorrelationen ser ut matematiskt

Läs mer

Korrelation och autokorrelation

Korrelation och autokorrelation Korrelation och autokorrelation Låt oss begrunda uttrycket r = i=1 (x i x) (y i y) n i=1 (x i x) 2 n. i=1 (y i y) 2 De kvadratsummor kring de aritmetiska medelvärdena som står i nämnaren är alltid positiva.

Läs mer

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Analys av egen tidsserie

Analys av egen tidsserie Analys av egen tidsserie Tidsserieanalys Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo 9 december 25 3 25 Antal solfläckar 2 15 1 5 5 1 15 2 25 3 Månad Inledning Vi har valt att betrakta

Läs mer

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23 732G71 Statistik B Föreläsning 8 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23 Klassisk komponentuppdelning Klassisk komponentuppdelning bygger på en intuitiv

Läs mer

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

Sveriges bruttonationalprodukt Årsdata. En kraftig trend. Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs mätningarna vid vissa tidpunkter och med samma avstånd mellan

Läs mer

Regressions- och Tidsserieanalys - F8

Regressions- och Tidsserieanalys - F8 Regressions- och Tidsserieanalys - F8 Klassisk komponentuppdelning, kap 7.1.-7.2. Linda Wänström Linköpings universitet November 26 Wänström (Linköpings universitet) F8 November 26 1 / 23 Klassisk komponentuppdelning

Läs mer

Teknisk not: Lönealgoritmen

Teknisk not: Lönealgoritmen Teknisk not: Lönealgoritmen Konjunkturlönestatistiken, som räknas till den officiella lönestatistiken, har som huvudsyfte att belysa nivån på arbetstagarnas löner i Sverige och hur dessa utvecklas. Konjunkturlönestatistiken

Läs mer

Hemuppgift 2 ARMA-modeller

Hemuppgift 2 ARMA-modeller Lunds Universitet Ekonomihögskolan Statistiska Institutionen STAB 13 VT11 Hemuppgift 2 ARMA-modeller 1 Inledning Denna hemuppgift är uppdelad i två delar. I den första ska ni med hjälp av olika simuleringar

Läs mer

Prognostisering av växelkursindexet KIX En jämförande studie. Forecasting the exchange rate index KIX A comparative study

Prognostisering av växelkursindexet KIX En jämförande studie. Forecasting the exchange rate index KIX A comparative study Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2013:14 Prognostisering av växelkursindexet KIX En jämförande studie Forecasting the exchange rate index KIX A comparative

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 7

ÖVNINGSUPPGIFTER KAPITEL 7 ÖVNINGSUPPGIFTER KAPITEL 7 TIDSSERIEDIAGRAM OCH UTJÄMNING 1. En omdebatterad utveckling under 90-talet gäller den snabba ökningen i VDlöner. Tabellen nedan visar genomsnittlig kompensation för direktörer

Läs mer

Modellskattningen har gjorts med hjälp av minsta kvadratmetoden (OLS).

Modellskattningen har gjorts med hjälp av minsta kvadratmetoden (OLS). MODELLSKATTNINGAR Modeller med bäst anpassning ger inte alltid de bästa prognoserna. Grundantaganden, till exempel vilka modeller som testas, påverkar i viss grad prognosutfallet. Modellerna har, i de

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, HT2013 2014-02-07 Skrivtid: 13.00-18.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

Sveriges bruttonationalprodukt Årsdata. En kraftig trend. Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs mätningarna vid vissa tidpunkter och med samma avstånd mellan

Läs mer

Något om val mellan olika metoder

Något om val mellan olika metoder Något om val mellan olika metoder Givet är en observerad tidsserie: y 1 y 2 y n Säsonger? Ja Nej Trend? Tidsserieregression Nej ARMA-modeller Enkel exponentiell utjämning Tidsserieregression ARIMA-modeller

Läs mer

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, VT2014 2014-05-26 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Summakonsistent säsongrensning

Summakonsistent säsongrensning Summakonsistent säsongrensning Presentation av projektarbete på SCB av Suad Elezović Statistiska institutionen,stockholms universitet 14 Oktober 2009 2009-10-14 Suad Elezović PCA/MFFM-S 1 Säsongrensning

Läs mer

Vad Betyder måtten MAPE, MAD och MSD?

Vad Betyder måtten MAPE, MAD och MSD? Vad Betyder måtten MAPE, MAD och MSD? Alla tre är mått på hur bra anpassningen är och kan användas för att jämföra olika modeller. Den modell som har lägst MAPE, MAD och/eller MSD har bäst anpassning.

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I

Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I Sebastian Andersson Statistiska institutionen Senast uppdaterad: 15 december 2015 Data kan generellt sett delas in i tre kategorier: 1 Tvärsnittsdata:

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Utvärdering av Transportstyrelsens flygtrafiksmodeller

Utvärdering av Transportstyrelsens flygtrafiksmodeller Kandidatuppsats i Statistik Utvärdering av Transportstyrelsens flygtrafiksmodeller Arvid Odencrants & Dennis Dahl Abstract The Swedish Transport Agency has for a long time collected data on a monthly

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 24: Tidsserieanalys III

Tillämpad statistik (A5), HT15 Föreläsning 24: Tidsserieanalys III Tillämpad statistik (A5), HT15 Föreläsning 24: Tidsserieanalys III Sebastian Andersson Statistiska institutionen Senast uppdaterad: 16 december 2015 är en prognosmetod vi kan använda för serier med en

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015 MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 015 1 a 13 och 14

Läs mer

DEN FRAMTIDA VERKSAMHETSVOLYMEN I RÄTTSKEDJAN - CENTRALA PROGNOSER FÖR PERIODEN : RESULTATBILAGA

DEN FRAMTIDA VERKSAMHETSVOLYMEN I RÄTTSKEDJAN - CENTRALA PROGNOSER FÖR PERIODEN : RESULTATBILAGA DEN FRAMTIDA VERKSAMHETSVOLYMEN I RÄTTSKEDJAN - CENTRALA PROGNOSER FÖR PERIODEN 2016-2019: RESULTATBILAGA I denna bilaga beskrivs de prognosmodeller som ligger till grund för prognoserna. Tanken är att

Läs mer

732G71 Statistik B. Föreläsning 9. Bertil Wegmann. December 1, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 9. Bertil Wegmann. December 1, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 9 Bertil Wegmann IDA, Linköpings universitet December 1, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B December 1, 2016 1 / 20 Metoder för att analysera tidsserier Tidsserieregression

Läs mer

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 3 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Inferens om två populationer (kap 8.1 8.) o Parvisa observationer (kap 9.1 9.) o p-värde (kap 6.3) o Feltyper, styrka, stickprovsstorlek

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Utökade användningsområden för trafikarbetets förändring Expanded uses for the change in traffic density Magnus Kjellman

Utökade användningsområden för trafikarbetets förändring Expanded uses for the change in traffic density Magnus Kjellman Utökade användningsområden för trafikarbetets förändring Expanded uses for the change in traffic density Magnus Kjellman 15-högskolepoängsuppsats inom Statistik III, ht 2012 Handledare: Mikael Möller Förord

Läs mer

Paneldata och instrumentvariabler/2sls

Paneldata och instrumentvariabler/2sls Extra anteckningar om paneldata; Paneldata och instrumentvariabler/2sls Oavsett REM, FEM eller poolad OLS så görs antagandet att Corr(x,u) = 0, dvs att vi har svagt exogena regressorer. Om detta inte gäller

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att

Läs mer

Hemuppgift 3 modellval och estimering

Hemuppgift 3 modellval och estimering Lunds Universitet Ekonomihögskolan Statistiska Institutionen STAB 13 VT11 Hemuppgift 3 modellval och estimering 1 Inledning Denna hemuppgift är uppdelad i två delar. I den första ska ni med hjälp av olika

Läs mer

Homework Three. Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo. 28 november Time series analysis

Homework Three. Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo. 28 november Time series analysis Homework Three Time series analysis Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo 28 november 25 1 Vi ska här analysera en datamängd som består av medeltemperaturen månadsvis i New York mellan

Läs mer

MVE051/MSG Föreläsning 7

MVE051/MSG Föreläsning 7 MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel

Läs mer

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för

Läs mer

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa. Betrakta kopparutbytet från malm från en viss gruva. Anta att budgeten för utbytet är beräknad på att kopparhalten ligger på 70 %. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten

Läs mer

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population

Läs mer

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013 Föreläsning 11 Slumpvandring och Brownsk Rörelse Patrik Zetterberg 11 januari 2013 1 / 1 Stokastiska Processer Vi har tidigare sett exempel på olika stokastiska processer: ARIMA - Kontinuerlig process

Läs mer

Avsnitt 2. Modell: intuitiv statistisk

Avsnitt 2. Modell: intuitiv statistisk Avsnitt 2. Modell: intuitiv statistisk En prognos är en utsaga om en framtida händelse. Vi kommer mest att syssla med numeriska prognoser. Med det menar vanligen ett tal på en intervallskala. Exempel:

Läs mer

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information

Läs mer

Den framtida verksamhetsvolymen i rättskedjan - Centrala prognoser för perioden : Resultatbilaga

Den framtida verksamhetsvolymen i rättskedjan - Centrala prognoser för perioden : Resultatbilaga RESULTATBILAGA I resultatbilagan beskrivs de modeller som ligger till grund för prognoserna i rapporten. Tanken är att redovisningen ska öka transparensen i rapporten. Med utgångspunkt i nedstående specificering

Läs mer

Stockholms Universitet Statistiska institutionen Patrik Zetterberg

Stockholms Universitet Statistiska institutionen Patrik Zetterberg Stockholms Universitet Statistiska institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, VT2012 2012-05-31 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan

Läs mer

F3 Introduktion Stickprov

F3 Introduktion Stickprov Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval

Läs mer

F9 SAMPLINGFÖRDELNINGAR (NCT

F9 SAMPLINGFÖRDELNINGAR (NCT Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad

Läs mer

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Säsongrensning i tidsserier.

Säsongrensning i tidsserier. Senast ändrad 200-03-23. Säsongrensning i tidsserier. Kompletterande text till kapitel.5 i Tamhane och Dunlop. Inledning. Syftet med säsongrensning är att dela upp en tidsserie i en trend u t, en säsongkomponent

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen

Läs mer

3 Maximum Likelihoodestimering

3 Maximum Likelihoodestimering Lund Universitet med Lund Tekniska Högskola Finansiell Statistik Matematikcentrum, Matematisk Statistik VT 2006 Parameterestimation och linjär tidsserieanalys Denna laborationen ger en introduktion till

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller: Statistik 2 Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Tentamen SST021 ACEKO16h, ACIVE16h 7,5 högskolepoäng Tentamensdatum: 2018-05-31 Tid: 14.00-19.00 Hjälpmedel: Valfri miniräknare Linjal

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

, s a. , s b. personer från Alingsås och n b

, s a. , s b. personer från Alingsås och n b Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen

Läs mer

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson (examinator) VT2017 TENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER 2017-04-20 LÖSNINGSFÖRSLAG Första version, med reservation för tryck-

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2016-12-13, 8-12 Bertil Wegmann

Läs mer

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab Repetition: Gnuer i (o)skyddade områden χ 2 -metoder, med koppling till binomialfördelning och genetik. Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 Endast 2 av de 13 observationerna

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

F11. Kvantitativa prognostekniker

F11. Kvantitativa prognostekniker F11 Kvantitativa prognostekniker samt repetition av kursen Kvantitativa prognostekniker Vi har gjort flera prognoser under kursen Prognoser baseras på antagandet att historien upprepar sig Trenden följer

Läs mer

Uppgift a b c d e Vet inte Poäng

Uppgift a b c d e Vet inte Poäng TENTAMEN: Dataanalys och statistik för I2, TMS135 Fredagen den 12 mars kl. 8:45-11:45 på V. Jour: Jenny Andersson, ankn 8294 (mobil:070 3597858) Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på

Läs mer

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning

Läs mer

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER När vi mäter en effekt i data så vill vi ofta se om denna skiljer sig mellan olika delgrupper. Vi kanske testar effekten av ett

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, FÖR I/PI, FMS 121/2, HT-3 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Läs mer

Dekomponering av löneskillnader

Dekomponering av löneskillnader Lönebildningsrapporten 2013 133 FÖRDJUPNING Dekomponering av löneskillnader Den här fördjupningen ger en detaljerad beskrivning av dekomponeringen av skillnader i genomsnittlig lön. Först beskrivs metoden

Läs mer

TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )

TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller ) TENTMEN Kurs: Plats: Dataanalys och statistik 2 distans 7,5 hp HiG sal 5:525 B eller annan ort Datum: 2 6 9 Tid: 9: 4: Lärare: Tommy Waller ( tel: 26-64 89 65 eller 74 3 86 3 ) Hjälpmedel: Miniräknare

Läs mer

Preliminärt lösningsförslag - omtentamen i Finansiell statistik,

Preliminärt lösningsförslag - omtentamen i Finansiell statistik, Preliminärt lösningsförslag - omtentamen i Finansiell statistik, 2012-08-22 Uppgift 1a) y x -1 0 1 P(Y = y) -1 1/16 3/16 1/16 5/16 0 3/16 0 3/16 6/16 1 1/16 3/16 1/16 5/16 P(X = y) 5/16 6/16 5/16 1 E[X]

Läs mer

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 4 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Icke-parametriska test Mann-Whitneys test (kap 8.10 8.11) Wilcoxons test (kap 9.5) o Transformationer (kap 13) o Ev. Andelar

Läs mer

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Analytisk statistik. Mattias Nilsson Benfatto, PhD. Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik

Läs mer

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9. Betrakta motstånden märkta 3.9 kohm med tolerans 1%. Anta att vi innan mätningarna gjordes misstänkte att motståndens förväntade värde µ är mindre än det utlovade 3.9 kohm. Med observationernas hjälp vill

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

HYPOTESPRÖVNING sysselsättning

HYPOTESPRÖVNING sysselsättning 0 självmord 20 40 60 HYPOTESPRÖVNING 4. Se spridningsdiagrammen nedan (A, B och C). Alla tre samband har samma korrelation och samma regressionslinje (r = 0,10, b = 0,15). Vi vill testa om sambandet mellan

Läs mer