Svensk varuhandel. Tidsserieanalys över
|
|
- Sandra Hellström
- för 6 år sedan
- Visningar:
Transkript
1 STATISTISKA INSTITUTIONEN Uppsala universitet Examensarbete C Författare: David Magnusson och Petter Samuelsson Handledare: Lars Forsberg Höstterminen 2010 Tidsserieanalys över Svensk varuhandel januari 1975 augusti
2 Sammandrag Syftet med denna uppsats är att modellera och prognostisera Sveriges varuexport, varuimport och handelsnetto. Vi använder oss av data från januari 1975 till och med augusti 2010 för respektive serie. Dessa data testas och jämförs i olika ARIMA- och SARIMA-modeller samt skattas även medelst säsongsreningsprogrammet TRAMO/SEATS. För de modeller som bäst passar serierna genomförs därefter in sample- och out of sample-analyser med felmåtten RMSE och MAPE. Modellerna med bäst felmått och som därpå väljs ut för att göra prognoser för serierna till och med augusti 2012 är (3,1,0)x(0,1,1) för export, (2,1,1)x(0,1,1) för import samt (0,1,1)x(0,1,1) skattad i TRAMO/SEATS för handelsnetto. Nyckelord: SARIMA; TRAMO/SEATS; prognostisering; varuhandel 1
3 Innehållsförteckning 1. Inledning Avgränsning Disposition Tidigare studier Teori Tidsserieanalys ARMA Säsongsrensning Felmått Modellidentifikation Enhetsrotstest Autokorrelation Modellspecifikation Chows test Data Granskning av data Resultat Modellval Efter 90-talskrisen Utvärdering av modellerna Efter 90-talskrisen Prognoser Slutsats Källförteckning Appendix 1 - Plottar på förstadifferenser Appendix 2 - Korrelogram Appendix 3 - Residualplottar Appendix 4 Prognoser
4 1. Inledning I en allt mer globaliserad värld där den internationella varuhandeln mellan länderna ständigt växer är Sverige inget undantag. Som ett litet export- och importberoende land är Sverige särskilt beroende av en positiv och gynnsam utveckling av den internationella handeln. Sedan år 1975 har både Sveriges export och import mångdubblats och har de senaste åren bestått av omkring % vardera av Sveriges totala BNP, till skillnad från omkring % år Under denna tidsperiod har varuflödena emellertid ej haft en linjär och enkelt förklarad utveckling, utan de har istället varierat i viss omfattning kring en positiv trend. Detta samtidigt som finansiella kriser i omvärlden under vissa perioder har fått utvecklingen att stanna av och i vissa fall även falla. Med hjälp av tidsserieanalytiska verktyg kommer denna uppsats att modellera, diskutera och prognostisera Sveriges månatliga utveckling inom varuexport och varuimport mellan januari 1975 och augusti Samtidigt ger användandet av månadsdata en utmärkt möjlighet att närmare undersöka ifall dessa tidsserier består av trender som är mindre skönjbara i form av säsongsspecifika element och faktorer. När dessa element har hittats och när de olika serierna har passats till relevanta och förklarande modeller kommer dessa slutligen att tillämpas för att göra tvååriga prognoser för framtiden. Med antagandet att framtidens utveckling kommer att kunna förklaras på samma sätt som den gångna är det därpå möjligt att ge tidsserierna plausibla utvecklingsbanor. Syftet med denna uppsats är: Att visa hur Sveriges export, import och handelsnetto (export - import) har utvecklats. Att anpassa de mest lämpade modellerna till dessa tidsserier. Att prediktera seriernas framtida utveckling med hjälp av de bäst lämpade modellerna Avgränsning Denna uppsats begränsar sig till att endast använda månadsdata över Sveriges totala export och import från januari 1975 till och med augusti Metodiken som används är av univariat karaktär där vardera serie analyseras var för sig. Då dessa serier tenderar att bero på andra faktorer i hög grad är det dock vanskligt att låta datamaterialet sträcka sig över en 1 Enligt data från the World Bank. 3
5 längre period. Redan nu kan tidsspannet tänkas vara allt för långt, vilket dock kommer att testas genom Chows brytpunktstest som undersöker ifall effekterna är olika stora under olika delar av tidsperioden. Likaså är vi fullt medvetna över att export och import är två tidsserier som är endogena och därför skulle kunna förklaras med hjälp av flertalet övriga relaterade variabler. Samtidigt har vi inte utrymme för att testa samtliga tidsseriemodeller i denna uppsats, utan kommer därför att fokusera på modeller sprungna ur Box-Jenkins ARMAmodell Disposition Uppsatsen är i fortsättningen strukturerad på följande sätt: Kapitel 2 går igenom ett par tidigare tidsseriestudier inom området svensk varuhandel. Kapitel 3 bygger den teoretiska referensramen, både genom att definiera och konkretisera tidsserier och genom att redogöra för den diagnostik och de tester som är nödvändiga vid användande av tidsseriedata. Kapitel 4 beskriver de data som används i denna uppsats. Kapitel 5 visar sedan de resultat som framkommer när datamaterialet tillämpas i de modeller som beskrivs i den teoretiska delen. Kapitel 6 avslutar slutligen genom att sammanfatta uppsatsen och dra slutsatser av resultaten. 2. Tidigare studier Tidsserieanalyser över den svenska varuhandeln har inte gjorts i någon större omfattning enligt vår kännedom. I Statistiska Centralbyråns serie Bakgrundsfakta till Ekonomisk statistik författade Erkelius och Zeed uppsatsen En tillämpning av TRAMO/SEATS: Den svenska utrikeshandeln (2003). I uppsatsen delades den långa perioden in i fem kortare perioder, som sedan undersöktes och analyserades i en säsongskontext. Den sista perioden , som även ligger närmast en jämförelse med perioden i denna uppsats, uppvisade cykler på mellan 3 och 6 år. I samband med att kronan släpptes fri i november 1992 påfanns positiva effekter på både import och export. En annan slutsats var att sommarsemestereffekten på säsongselementen, som visserligen fortfarande var stora, har minskat under periodens gång. Detta tros bero på en ökad flexibilitet över möjligheterna för anställda när de kan ta ut sin semester. 4
6 Tongur (2010) har i två rapporter använt sig av svensk varuhandelsdata från 1993 till och med I den ena rapporten jämfördes TRAMO/SEATS med att säsongsrensa med hjälp av en dynamisk linjär modell (DLM). Även fast den senare visar intressanta och tillämpbara resultat, kommer TRAMO/SEATS samt SARIMA att användas i vår uppsats. I den andra rapporten diskuteras huruvida direkta eller indirekta säsongsrensningsmetoder är att föredra, utan att komma fram till någon allmän regel. 3. Teori Metoden i denna uppsats är klassisk tidsserieanalysteori. Inom detta område finns en mängd olika modeller, men den som kommer att användas är ARMA-modellen vilken kan utvecklas och anpassas till olika typer av tidsseriedata. Underlaget till denna modell finns bland annat beskrivet i Box, Jenkins & Reinsel (1994). Modellerna i uppsatsen är skattade med hjälp av EViews 7. Vi har även valt att använda TRAMO/SEATS som säsongsrensningsprogram eftersom att de är standard för säsongsrensning vid bland annat SCB och Eurostat. I följande avsnitt kommer denna ARMA-modellen och vidareutvecklingar av denna att definieras och diskuteras i vilka fall den är tillämpbar Tidsserieanalys En tidsserie beskriver utfallet från en stokastisk process och kan definieras som * + vari är det observerbara utfallet i de på varandra följande tidpunkterna t=1,2,,t. En tidsseriemodell syftar till att beskriva och modellera den process som skapade dessa utfall. Vid erhållande av en modell som kan beskriva de historiska observerbara utfallen är det därpå möjligt att använda densamma till att prediktera framtida utfall ARMA En metod som ofta används för att modellera en tidsserie är ARMA-modellen. För att korrekt kunna modellera en tidsserie enligt ARMA-modellen behöver vissa grundantaganden vara uppfyllda. Grundkravet är att den underliggande tidsserien är svagt stationär, det vill säga att serien har konstant medelvärde och varians samt att korrelationskoefficienten mellan y t och y t-k enbart beror på längden av lag k. En serie som innehåller en stokastisk trend och därmed 5
7 inte är stationär kan dock differentieras för att uppnå stationaritet och benämns då som ARIMA. En ARIMA-modell består därför av tre delar; den autoregressiva delen (AR), ett antal differentieringar (I) om den ursprungliga serien inte är stationär samt glidande medelvärde-delen (MA). Följande avsnitt är baserat på Pindyck och Rubinfeld sid Autoregressiv modell - AR(p) Den autoregressiva modellen av ordning p är genererad av ett viktat snitt av observationer p perioder tillbaka i tiden och är definierad enligt ekvation (1)., (1) där är observationen p perioder tillbaka i tiden, är den vikt med vilken observationen för p-perioder sedan påverkar den nuvarande observationen, är feltermen och är en konstant. För att en AR-process skall vara stationär får den inte innehålla någon enhetsrot. Ett nödvändigt villkor för stationaritet är att summan av -termerna är mindre än ett. Om detta villkor inte är uppfyllt är processen en slumpvandring med postitiv trend om är större än noll och med negativ trend om är mindre än noll. I den autoregressiva modellen, liksom i glidande medelvärde-modellen (som presenteras härnäst), antas störningstermerna vara genererade av en vitt brus -process, det vill säga att slumptermerna skall vara okorrelerade över tid samt ha konstant varians och väntevärde. Varje felterm antas dessutom vara normalfördelad med medelvärde 0 och varians σ 2. Autokorrelationsfunktionen 2 i en autoregressiv modell beror på alla tidigare observationer och är normalt avtagande för en stationär process. För att ta reda på av vilken ordning en modell är autoregressiv, alltså storleken på p, används den partiella autokorrelationsfunktionen. De p första värdena i den autoregressiva modellens autokorrelationsfunktion är 2 Se kapitel för en beskrivning av autokorrelationsfunktionerna. 6
8 ,.. (2) Dessa ekvationer är Yule Walker-ekvationerna 3. Om ρ 1, ρ 2,, ρ p är kända kan ekvationerna lösas för. Detta kräver dock att vi redan vet av vilken ordning (p) modellen är autoregressiv. Det går dock att komma fram till rätt ordning genom att testa olika värden på p i Yule-Walker-ekvationen och se om värdet på p (den partiella autokorrelationen vid lag p) är signifikant skilt från noll 4. Glidande medelvärde MA(q) En glidande medelvärde-modell av ordning q är definierad som, (3) Autokorrelationen för en glidande medelvärde-process av ordning q ges av { k = 1,, q k>q. (4) Således har en glidande medelvärde-funktion av ordning q ett minne på q perioder och det är därför möjligt att, genom att undersöka vid vilka laggar autokorrelationen skiljer sig från noll, få en uppfattning om vilken ordning glidande medelvärde-processen består av. Differentiering (I) Om en tidsserie inte är stationär, det vill säga att den underliggande stokastiska processen förändras över tiden, kan serien vanligtvis differentieras en eller flera gånger för att serien ska kunna modelleras i en autoregressiv- och/eller en glidande medelvärde-modell. På motsvarande sätt kan en serie säsongsdifferentieras för exempelvis månadsdata och därmed 3 Se Pindyck och Rubinfeld sid för härledning av Yule Walker-ekvationen 4 Om man t.ex. testar p=n och φ n är signifikant skilt från noll är det autoregressiva modellen åtminstone av ordning n. φ n är även definierat som värdet på den partiella autokorrelation för lag n. Genom att då testa p=n+1 kan man så småningom hitta vilken ordning modellen är av. 7
9 differentieras med avseende på 12 perioder tillbaka. En serie y t är homogent icke-stationär av ordning d ifall serien w t specificerad av ekvation (5), är en stationär serie.. (5) En metod för att upptäcka om en serie är stationär är att undersöka huruvida den har någon enhetsrot eller ej. Om serien har en enhetsrot bör den differentieras en gång för att åstadkomma stationaritet, har den två enhetsrötter bör serien differentieras två gånger och så vidare enligt samma logik vid fler enhetsrötter. ARIMA Vissa tidsserier är vare sig genererade av en ren glidande medelvärde- eller av en ren autoregressiv process, utan är istället genererade av en blandning av dessa. I fallet med en stationär tidsserie definieras för detta fall ARMA-modellen enligt. (6) Denna serie kan skrivas om till ekvation 7 med hjälp av backshiftoperatorn 5 ; ( ) ( ) (7) På liknande sätt kan ARIMA-modellen skrivas om till ( ) ( ). (8) I ekvation 7 och 8 är ( ) och ( ) Säsongsrensning Tidsserier avseende ekonomisk månadsstatistik kan delas upp i dess icke-observerbara delar; trend (T), säsong (S), cyklisk (C) och irreguljära effekter (slumpmässiga) (I). Med trend åsyftas den långsiktiga utvecklingen hos serien vilken exempelvis kan bero på ekonomisk tillväxt. Säsongselement kan vara sommarsemestrar, konsumentbeteenden runt exempelvis jul 5 Backshiftoperatorn (B) står för en lag en period tillbaka i tiden. B( ) är således detsamma som och B j är lika med. 8
10 eller av klimatologiska eller institutionella slag. Den cykliska komponenten däremot beror på periodiska faktorer som exempelvis konjunktureffekter. Slumpdelen fångar upp det brus som existerar i serien. Andra element som kan förekomma och som också kan påverka serierna för enskilda tidpunkter eller under begränsad tid är extremvärden (E) och kalendereffekter (K). Varje observerat värde i en originalserie ser därför ut enligt ekvation (9): O T C S K E (9) Med dessa effekter försvåras tolkningen av data likaså jämförelser över tid. På grund av detta finns det därför anledning att utveckla metoder, alltså säsongsrensning, för att urskilja och eliminera de effekter i datamaterialet som beror på dessa effekter. I en säsongsrensad serie är alla dessa effekter eliminerade. Den säsongsrensade serien kan därför användas för att göra jämförelser mellan alla tidpunkter i en tidsserie. I en säsongsrensad serie finns emellertid alltid ett kvarvarande brus, vilket skapar viss osäkerhet vid dylika jämförelser. Säsongen kan allmänt vara beskaffad på två olika sätt, antigen additiv eller multiplikativ. I den additiva modellen adderas eller subtraheras samma värde för alla de observationer som berör januari respektive februari et cetera. I den multiplikativa metoden är varje komponent istället proportionell mot det observerbara värdet i serien. Vid en logaritmering blir den multiplikativa metoden additiv för den ursprungliga serien. (Öhlén sid. 4-6, 2003) SARIMA I vissa typer av tidsserier förekommer trender i säsongslika strukturer med återkommande mellanrum. Dessa fenomen är speciellt vanliga i ekonomiska data där positiva effekter i handeln kring jul och helger efter löneutbetalningar är två exempel på års- respektive månadssäsonger som är återkommande. En ARIMA-modell kan använda sig av dylik information genom att tillåta säsongsvariation och sålunda bli en SARIMA-modell (Seasonal Autoregressive Integrated Moving Average). Om en vid lag s (exempelvis säsongens längd) differentierad serie ( ( ) ) passas till en ARMA(p,q)-modell ( ( ) ( ) ), ger detta SARIMA(p,d,q)x(P,D,Q)- modellen som är definierad enligt 9
11 ( ) ( ). (10) Där och är polynom av ordning p+sp och q+sq och Y t är differentierad eller säsongsdifferentierad om serien innehåller någon enhetsrot. En skillnad med en SARIMA-modell jämfört med att använda säsongsvariationerna som dummyvariabler är att den tillåter slumpmässighet i säsongstermen. (Brockwell och Davies, sid , 1996) TRAMO/SEATS TRAMO (Time Series Regression with ARIMA Noise) och SEATS (Signal Extraction in ARIMA Time Series) är två program som används tillsammans av bland andra Statistiska Centralbyrån (Can Tongur, SCB) för att säsongsrensa tidsserier. Följande beskrivning av programmen är skriven med vägledning av Ghysels och Osborn (2001) samt Gómez och Maravall (1997). TRAMO lineariserar den ursprungliga tidsserien genom att identifiera och ta bort flera typer av extremvärden, och interpolerar saknade observationer. Den automatiska detektionen av extremvärden plockar bort dessa en och en och estimerar däremellan ARIMA-processens parametrar på nytt för att undersöka deras betydelse för regressionens parametrar. Användaren har också möjlighet att ange specifika extremvärden, vilkas effekt då elimineras av TRAMO. TRAMO innehåller även en modellvalsalgoritm som väljer den modell som optimalt passar till den använda tidsserien. Givet observationsvektorn z som består av alla observationer skattar TRAMO, (11) där är en vektor av regressionsvariabler som kan väljas i TRAMO (till exempel för att fånga effekter av antalet vardagar eller påsk) och är en vektor av deras koefficienter. följer en ARIMA-process som väljs ut av programmet beroende på tidsseriens egenskaper. Programmet undersöker alla möjliga SARIMA-modeller till och med (3,2,3)x(2,1,2) (Gómez 10
12 & Maravall sid ) och väljer modell enligt Hannan-Rissanen kriteriet 6 med Kalmanfilter. Den slutgiltiga modellen väljs sedan ut efter BIC-kriteriet (se kapitel ) med ett möjligt tillval för att öka sannolikheten att antalet AR- och MA-termer skall vara detsamma. SEATS däremot delar upp tidsserien i dess icke-observerbara delar; trend, säsong, cyklisk och irreguljära effekter. Trendkomponenten fångar seriens långsiktiga trend, säsongskomponenten fångar säsongsmönstret, den cykliska komponenten fångar kortvariga variationer som kan uppstå av MA-komponenter av låg ordning. Den slumpmässiga komponenten fångar upp allt brus, vilket gör de tre första delarna brusfria. När SEATS används tillsammans med TRAMO använder programmet den modell som valts ut av TRAMO. Avslutningsvis justeras komponenterna samt prognoserna för de deterministiska effekter som togs bort av TRAMO Felmått När en modell har anpassats till ett datamaterial finns det flera olika sätt att kontrollera hur väl modellen förhåller sig till de faktiska observationerna. Den enklaste metoden är att estimera värden enligt den angivna modellen för att sedan jämföra dessa värden med de sanna värdena. Det finns ett stort antal felmått som kan göra liknande jämförelser, varav två används och förklaras i denna uppsats. Dessutom kan felmåtten användas på olika sätt där skillnader i informationsfönster och sampelstorlek påverkar tolkningen och vars intuition även förklaras i detta avsnitt (Pindyck & Rubinfeld, sid. 210, samt , 1998). RMSE En vanlig metod för att utvärdera en tidsserieprognos är att undersöka modellens RMSE (root mean squared error), där RMSE är definierat enligt ekvation 12, där är det predikterade värdet, är det verkliga värdet och T är antalet perioder. ( ). (12) 6 Enligt Hannan-Rissanen kriteriet skattas först en autoregressiv process till X t. Sedan skattas Xt på [Xt-i, ât-j] där â är residualerna från den första skattningen och där i och j går till p och q. Detta utförs för många olika p och q. (Newbold & Bos) 11
13 Detta kan antingen göras genom att göra en prediktion över det datamaterial som används för modellskattningen, eller genom att skatta en del av tidsserien och undersöka hur bra prediktionen är prognostiserad för den del som inte använts i modellskattningen. Genom att utvärdera modellen på det senare sättet minskar risken för att överskattning av modellen ska påverka felmåttet. MAPE Ett felmått som är relativt och således inte beroende av storleken på de estimerade värdena är MAPE (Mean absolute percentage error). Felmåttet ger värdet noll om modellen är perfekt skattad och saknar övre gräns. MAPE är definierat enligt ( ). (13) In sample En in sample-analys genomförs genom att skatta modellen för hela den undersökta tidsserien. Sedan jämförs modellens prognoser för varje i tidsserien ingående tidpunkt med de sanna värdena. Informationsfönster och Prognosfönster Figur 1. In sample - översiktsbild 12
14 Jan 1975 Nov 1989 Nov 1991 Jan 1975 Okt 1989 Okt 1991 Out of sample I en out of sample-analys är informationsfönstret vanligtvis rullande till skillnad från det fasta i in sample-kontexten I detta fall görs prognoser endast inom en given periodslängd på en modell skattad av en delmängd av samtliga observationer. Jämförelsen mellan de sanna och estimerade värden görs därefter på observationer som inte ingick i modellspecifikationen istället för på hela perioden. Denna delmängd flyttas sedan inom tidsperioden för att på så sätt undersöka felmåttet på olika delmängder. Informationsfönster Prognosfönster Informationsfönster Prognosfönster Figur 2 Out of sample - översiktsbild 3.3. Modellidentifikation I detta avsnitt presenteras de olika test och diagnosverktyg som kommer att användas i denna uppsats vid val och specificering av ARIMA-modell. 13
15 Enhetsrotstest För att kunna genomföra tidsserieanalyser korrekt krävs det att tidsserievariabeln är stationär vid användning av ARMA-modellen. För att testa detta är den konventionella metoden att undersöka huruvida tidsserien innehåller enhetsrötter eller inte. Avsaknad av enhetsrötter implicerar att det ej finns en stokastisk trend, medan en serie med enhetsrötter kan differentieras för att åstadkomma stationaritet. Förekomsten av enhetsrötter kan testas på ett flertal sätt, där ADF-testet och KPSS-testet är två av de mest användbara. Augmented Dickey Fuller (ADF) Det ursprungliga Dickey Fuller-testet är en form av enhetrotstest som undersöker förekomsten av enhetsrötter i en AR-modell (Pindyck & Rubinfeld sid , 1998). Enligt nollhypotesen, δ = 0, förekommer minst en enhetsrot. ADF-testet är en förlängning av det vanliga Dickey Fuller-testet som undersöker förekomsten av enhetsrötter i en AR(p)-modell, istället för en AR(1)-modell som i originaltestet. Enligt nollhypotesen δ = 0 (där δ = ρ 1) förekommer minst en enhetsrot, medan mothypotesen anger att tidsserien är stationär. Testet använder Dickey-Fuller-fördelningen 7, snarare än en vanlig t-fördelning. Testet utgår från. (14) KPSS KPSS-testet är en form av ett enhetrotstest som testar ifall stationaritet föreligger. Nollhypotesen säger att den observerbara originalserien är nivåstationär, alternativt trendstationär., (15) där täljaren är residualerna från en OLS-regression innehållande säsongselement och nämnaren är feltermens varians. Mothypotesen säger däremot att tidsserien har en enhetsrot. (Eviews 7. User Guide II sid. 387) 7 EViews använder sig av MacKinnons förkastelsegränser. 14
16 Autokorrelation Autokorrelationsfunktionen visar korrelationer mellan olika tidpunkter i en stokastisk process, vilket är användbart vid val av modell (se nedan under Modellspecifikation samt för en utförligare beskrivning Pindyck & Rubinfeld se sid , 1998). Tidsserier som innehåller systematiska element, alltså korrelation mellan observationerna i serien, är autokorrelerade. Autokorrelationsfunktionen beskrivs enligt ekvation 16 där autokorrelationen tas fram genom att beräkna korrelationsfunktionen mellan y t och y t+k ( ). (16) Den partiella autokorrelationen mellan och mäter däremot korrelationen mellan dessa variabler om korrelationen som härrör från de mellanliggande variablerna elimineras. Detta är således ett mått på det marginella bidraget till autokorrelationsfunktionen för varje observation. Ljung Box Ljung Box-testet är en form av portmanteau-test som undersöker autokorrelationen i tidsserier (Brockwell och Davies, sid , 1996). Testet är därför speciellt användbart vid användning av ARIMA-modeller eftersom att dessa förutsätter vitt brus. Ljung Box-testet prövar ifall residualerna av en skattad modell i den undersökta tidsserien är signifikant skilda från noll eller inte. Nollhypotesen utgår ifrån att observationerna, alltså populationskorrelationen, är slumpartad. Sålunda : ( ) ( ) ( ) 0. (17) Mothypotesen däremot säger att det inte är slumpartat. Teststatistikan ser ut som följer ( ), (18) där n är stickprovsstorleken på tidsserien, p k är autokorrelationskoeffiecenten vid lag k och h är antalet laggar som testas. Nollhypotesen förkastas vid signifikansnivå α ifall, efter χ 2 -fördelningen med h antal frihetsgrader. Godtas nollhypotesen anses tidsserien vara vitt brus. 15
17 Modellspecifikation För att välja vilken modell som är bäst lämpad till en tidsseries observationer när flertalet modeller är specificerade, finns det flera olika principer samt två stycken kriterier att använda som riktlinjer. Det finns däremot ingen konvention som exakt säger hur modellval rent allmänt skall gå till. Till att börja med är emellertid en modell med färre parametrar att föredra framför en modell med många parametrar, enligt måttfullhetsprincipen. Dessutom är ett högt justerat R 2 -värde att föredra framför en modell med ett lågt värde. Detta gäller speciellt när syftet med modellen är att göra prognoser eftersom att dessa gynnas av en högre förklaringsgrad. En ytterligare vägledning går att finna i autokorrelationsfunktionen och den partiella autokorrelationen. Som tidigare har beskrivits kan den förstnämnda hjälpa till med att bestämma i vilken ordning q MA-delen är beskaffad av, medan den senare går att hänföra till AR-delens antal laggar. AIC och BIC AIC (Akaike Information Criterion) och BIC (Bayesian Information Criterion) kan användas för att välja antalet laggar i en distribuerad lag-modell. AIC är definierat som ( ( ) ), (19) medan BIC definieras som ( ( ) ). (20) Skillnaden mellan att använda dessa kriterier mot att använda justerad R 2 vid modellval är att AIC och BIC till högre grad straffar fler variabler i modellen. Enligt kriteriet skall den modell med lägst värde på AIC eller BIC väljas av de alternativ till modeller som finns. Emellertid är dessa metoder dock inte regelrätta statistiska test för att välja antalet laggar och bör därför alltid användas tillsammans med intuition. (Pindyck & Rubinfeld, sid , 1998) 16
18 Chows test Råder det osäkerhet ifall en modell egentligen innehåller data där effekterna skiljer sig åt mellan olika perioder inom hela tidsperioden är Chows test en metod för att undersöka detta. Testet bryter ner tidsperioden i två delperioder som sedan separat skattas med identiska regressioner: Nollhypotesen blir sålunda (21). (22), vilket indikerar, om det är sant, att parameterkoefficienter för de två regressionerna är likadana och att effekterna därmed lika stora över hela tidsperioden. Kan nollhypotesen förkastas indikerar detta att datamaterialet lider av tidsseriebrott och att effekterna därmed skiljer sig åt i delperioderna inom tidsperioden. (Pindyck & Rubinfeld, sid , 1998) 4. Data Denna uppsats använder sig av tre olika tidsserier hämtade från Statistiska Centralbyrån med månadsdata som alla berör Sveriges varuhandel med omvärlden. Två stycken serier är oberoende av varandra, Sveriges totala export respektive totala import, medan den sista serien är beroende av de två första och består av total export minus total import och sålunda består av Sveriges handelsnetto. Samtliga serier är i originalform varken säsongs-, inflations- eller volymjusterade. Var och en innehåller serierna 428 observationer; en sträckning från januari 1975 till och med augusti De olika seriernas utveckling kan ses i figur 3. 17
19 1975M M M M M M M M M M M M M M M M M M01 Miljoner kronor Sveriges handel januari augusti 2010 Månad import totalt, mkr export totalt, mkr handelsnetto, mkr Figur 3. Svensk varuexport, -import samt handelsnetto i miljontals kronor från och med januari 1975 till och med augusti 2010 Både export- och importserierna har utvecklats positivt sedan Den totala exporten har vuxit från ett värde av miljoner kronor 1975 till ett värde av miljoner kronor i augusti Motsvarande siffror för total import är från miljoner kronor till miljoner kronor. Se tabell 1 för ytterligare deskriptiv statistik. Tabell 1. Deskriptiv statistik för svensk varuexport, -import samt handelsnetto i miljontals kronor från och med januari 1975 till och med augusti Variabel Observationer Medelvärde Standardavvikelse Min-värde Max-värde Import Export Handelsnetto
20 I tabell 2 syns dessutom medelvärdena för respektive månad och serie. Export är låg i början på året, men lägst under juli och augusti samt högst i mars, juni och oktober. Import visar en liknande struktur som exporten, men är klart lägst i juli. Handelsnetto har sin topp i juni och botten i augusti. Överlag är det tydligt att säsongseffekter föreligger, med stora skillnader mellan de högsta och lägsta månadsvisa medelvärdena. Tabell 2. Månadsvisa medelvärden i miljontals kronor för export, import och handelsnetto. Månad Export Import Handelsnetto Januari Februari Mars April Maj Juni Juli Augusti September Oktober November December De positiva trenderna för serierna har egentligen bara brutits ordentligt med nedgångar vid två tillfällen, även om den positiva utvecklingen tillfälligt stannade av både vid 90-talets mitt och under IT-kraschen i början av 2000-talet. I början av 90-talet kan en svag nedgång skönjas i samband med 90-talskrisen efterdyningar medan en starkare nedgång inträffade under den senaste finanskrisen som inleddes Tidsserien kan därför delas in i två perioder; före och efter 90-talskrisen. Även om denna brytpunkt inte är den klaraste gör vi det av två anledningar: i) Brytpunkten är i ungefär mitten av tidsserien. ii) Den ligger mitt i en period där väldigt mycket skedde som påverkade den svenska ekonomin i grunden. En närmare beskrivning av vad som inträffade under denna 19
21 1975M M M M M M M M M M M M M M M M M M01 Miljoner kronor turbulenta tid och vilka följder dessa fick är dock utanför denna uppsats ramar. Vad som emellertid är relevant och värt att nämna är att den svenska kronan släpptes att flyta fritt den 19 november Detta efter åratal av att tidigare ha varit fastknuten mot andra valutor, vilket påverkade den svenska köpkraften och värdet på den svenska kronan gentemot omvärlden. Även om den största delen av den absoluta tillväxten har skett efter krisen, var tillväxten rent procentuellt sett större perioden före krisen gällande exporten. Denna växte med 472 % perioden innan och med 315 % perioden efter. Motsvarande siffror för importen visar däremot en större tillväxt efter (358 %) gentemot perioden före 90-talskrisen (321 %). Sveriges handel januari oktober Månad import totalt, mkr export totalt, mkr handelsnetto, mkr Figur 4. Svensk varuexport, -import samt handelsnetto i miljontals kronor från och med januari 1975 till och med oktober 1992 Handelsnetto kan delas in efter ett liknande mönster. Innan 90-talskrisen fluktuerade det nära och omkring ett balanserat resultat där export och import var lika stora. I början av 90-talet utvecklades detta däremot till ett positivt handelsnetto där export kontinuerligt låg högre än 20
22 1992M M M M M M M M M M M M M M M M M M11 Miljoner kronor import. I samband med den senaste finanskrisen vändes dock trenden med stora fluktuationer och ett negativt handelsnetto i augusti 2010 som följd Sveriges handel nov aug 2010 Månad import totalt, mkr export totalt, mkr handelsnetto, mkr Figur 5. Svensk varuexport, -import samt handelsnetto i miljontals kronor från och med november 1992 till och med augusti Granskning av data De tre serierna har testats för förekomsten av enhetsrötter via ADF- och KPSS-testen. Testresultaten återfinns i tabell 3. I samtliga fall är både intercept och trend inkluderade i testregressionerna. Detta eftersom att den deskriptiva statistiken visar på trender i serierna. Resultaten tyder på att ingen av serierna är stationära enligt samtliga förkastelsegränser upp till 10 procents-nivån. Efter en differentiering av serierna tyder emellertid ADF- och KPSStesten på att export och import är stationära. Testen av handelsnetto visar stationaritet på olika nivåer. ADF-testet kan på 1-procentsninvån förkasta nollhypotesen om enhetsrot medan KPSS-testet på 1-procentsnivån inte förkastar nollhypotesen om stationaritet. Med anledning av detta tillsammans med att vi har undersökt korrelogrammen av serien och residualerna för ett antal modeller samt deras AIC och BIC värden har vi valt att differentiera serien en gång i fortsättningen av uppsatsen. 21
23 Tabell 3. Resultat av enhetsrotstest på serierna export, import samt handelsnetto i miljontals kronor från och med januari 1975 till och med augusti Serie Nivå Första differensen ADF KPSS ADF KPSS Export -2, ,476332*** -4,968191*** 0, Import -1, ,502016*** -7,447996*** 0, Handelsnetto 0, ,272895*** -7,695800*** 0,152056** Dickey-Fuller t-statistika för ADF; förkastelsegränser: 1 % -3,980489, 5 % -3,420768, 10 % -3, Nollhypotes: Serien innehåller en enhetsrot. Test-statistika för KPSS; förkastelsegränser: 1 % 0,216000, 5 % 0,146000, 10 % 0, Nollhypotes: Serien är stationär. *** = signifikant på 1-procentsnivån, ** = signifikant på 5-procentsnivån, * = signifikant på 10- procentsnivån Eftersom att detta ger oss anledning att tro att åtminstone import- och exportserierna inte är stationära på grund av deras respektive positiva trender, tittar vi även på hur utvecklingen av förstadifferensen för respektive serie har utvecklats över vår undersökta tidsperiod. 8 Det framgår att medelvärdena i serierna över perioden är mer konstanta än i de versioner där variablerna inte är differentierade. Däremot ser vi att variansen ökar med tiden, vilket inte uppfyller kriterierna för en ARIMA-modell. Därför logaritmeras serierna innan de differentieras, vilket förbättrar seriernas egenskaper. Då vi enbart undersöker tidsperioden från och med november 1992 ser det ut som att tidsseriernas medelvärde även här är konstanta över tiden. Variansen uppvisar inte lika stora problem med att variera över tiden, men det skulle fortfarande kunna utgöra ett problem för vår analys om tidsserierna inte transformeras. Därför logaritmeras export- och importserierna även i detta fall. 8 För diagram, se appendix 1. 22
24 5. Resultat I detta kapitel presenteras resultaten av denna uppsats. Till att börja med att skattas de olika tidsserierna i ett flertal modeller som har valts ut efter teorin i modellspecifikationsavsnittet. Modellerna valdes ut framför allt med hänsyn till strukturen på de tre olika seriernas autokorrelationer och partiella autokorrelationer. Därefter gjordes de slutliga modellvalen efter vilka modeller som hade de lägsta AIC/BIC-värdena. De modeller som valdes ut användes sedan för att göra in sample- och out-of-sample-jämförelser. Därefter utsågs de modeller med lägst felmått för att göra prognoser två år fram i tiden. Att finna de modeller som passar data bäst innebär, som tidigare har förklarats, att inte alltid färdas på en enkelriktad och intuitiv väg. För att välja ut de modeller som med minst fel predikterar export, import respektive handelsnetto har vi därför först valt ut modeller efter tre olika tillvägagångssätt. I det första har vi först logaritmerat 9 serierna för att sedan själva säsongsrensat serierna med additiv metod och slutligen differentiera dem för att uppnå stationaritet. Serierna har till slut anpassats till ARIMA-modeller. I den andra metoden används SARIMA-modeller där serierna har logaritmerats, i vilka säsongsrensningen sker genom att differentiera serierna även på säsongsnivå (12 månader med anledning av att månadsdata används) och genom inkluderandet av säsongs-ar- respektive -MA-termer (SAR/SMA) i regressionerna. Till vår hjälp i dessa två metoder har vi använt oss av korrelogrammen 10 av de slutgiltiga serierna. I den sista metoden kördes programmet TRAMO/SEATS som själv räknar fram de bästa modellerna. Detta körs utan att korrigera för kalendereffekter men med automatisk extremvärdesdetektion. Resultaten för de, enligt korrelogrammen, mest logiska modellerna samt angränsande modeller för de olika serierna presenteras nedan och är grunden för resten av arbetet. 9 Eftersom att handelsnettoserien innehåller negativa tal kan denna dock inte logaritmeras. 10 För korrelogram över förstadifferenserna, se appendix 2. 23
25 5.1. Modellval Både TRAMO/SEATS och SARIMA pekar ut en modell med två AR-termer och en säsongs- MA-term för export-serien, se tabell 4. När vi själva säsongsrensar serien visar det sig däremot att även inkluderandet av en ordinär MA-term innebar ett lägre AIC-värde. Enligt måttfullhetsprincipen och ett lägre BIC-värde så väljs (2,1,0) för ARIMA. För SARIMA har (1,1,1)x(1,1,1) de lägsta AIC- och BIC-värdena, men eftersom den innehåller både en SARoch SMA-term så väljs även (2,1,0)x(0,1,1) ut. Dessa kommer sedan att användas till att göra prognoser. Tabell 4. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för export januari 1975-augusti Modell Koefficienter P-värde AIC BIC Justerat R 2 (2,1,0) AR(1) -0, , , , AR(2) -0, (1,1,0) AR(1) -0, , , , (1,1,1) AR(1) -0, ,022-2, , , MA(1) -0, (0,1,1) MA(1) -0, , , , (2,1,1) AR(1) -0, AR(2) -0, MA(1) 0, ,031-2, , , (1,1,1)x(1,1,1) AR(1) -0, MA(1) -0, SAR(12) 0, SMA(12) -0, (2,1,1)x(0,1,1) AR(1) -0, AR(2) -0, MA(1) -0, SMA(12) -0, (2,1,0)x(0,1,1) AR(1) -0, AR(2) -0, MA(12) -0, (0,1,1)x(0,1,1) MA(1) -0, SMA(12) -0, (3,1,0)x(0,1,1) AR(1) -0, AR(2) -0, AR(3) -0, SMA(12) -0, TRAMO/SEATS (2,1,0)x(0,1,1) AR(1) 0,81273 AR(2) 0,45119 MA(12) -0, ,085 0,003 0,001 0,005 0,024 0,762-2, , , , , , , , , , , , , , , Fetmarkerade värden är de lägsta AIC/BIC-värdena, vilket innebär bäst modeller inom ARIMA respektive SARIMA.. 24
26 För import-serien visar både ARIMA och SARIMA i grunden ut samma modell, enligt tabell 5. Denna modell innehåller två AR-termer och en MA-term, med en säsongs-ma-term i SARIMA-fallet. TRAMO/SEATS däremot vill inkludera ytterligare en AR-term, något som dock inte får stöd av AIC- och BIC-värdena av en liknande modell enligt de två första metoderna. Tabell 5. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för import januari 1975-augusti 2010 Modell Koefficienter P-värden AIC BIC Justerat R 2 (2,1,0) AR(1) -0, , , , AR(2) -0, (1,1,0) AR(1) -0, , , , (1,1,1) AR(1) -0, ,006-2, , , MA(1) -0, (0,1,1) MA(1) -0, , , , (2,1,1) AR(1) -0, AR(2) -0, MA(1) 0, ,030-2, , , (3,1,1) AR(1) 0, AR(2) -0, AR(3) 0, MA(1) -0, (1,1,1)x(1,1,1) AR(1) -0, MA(1) -0, SAR(12) 0, SMA(12) -0, (3,1,1)x(0,1,1) AR(1) -0, AR(2) -0, AR(3) 0, MA(1) 0, SMA(12) -0, (2,1,1)x(0,1,1) AR(1) -0, AR(2) -0, MA(1) 0, SMA(12) -0, (3,1,0)x(0,1,1) AR(1) -0, AR(2) -0, AR(3) 0, MA(12) -0, ,096 0,337 0,235 0,837 0,019 0,001 0,184 0,322 0,790 0,898 0,101 0,089-2, , , , , , , , , , , , , , , (0,1,1)x(0,1,1) MA(1) -0, SMA(12) -0, TRAMO/SEAT AR(1) 0,68488 S AR(2) 0,36247 (3,1,0)x(0,1,1) AR(3) -0, ,002 MA(12) -0,80695 Fetmarkerade värden är de lägsta AIC/BIC-värdena inom ARIMA respektive SARIMA. -2, , ,
27 I fallet där handelsnettot används pekar samtliga tre metoder ut, se tabell 6, samma modell som den bäst lämpade. Denna innehåller en MA-term och en säsong-ma-term. Tabell 6. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för handelsnetto januari 1975-augusti Modell Koefficienter P-värde AIC BIC Justerat R 2 (2,1,1) AR(1) -0, ,413 17, , , AR(2) 0, MA(1) -0, ,887 (1,1,1) AR(1) -0, ,314 17, , , MA(1) 0, ,038 (0,1,1) MA(1) -0, , , , (1,1,0) AR(1) -0, , , , (1,1,1)x(1,1,1) AR(1) -0, MA(1) -0, SAR(12) 0, SMA(12) -0, ,202 0,301 18, , , (2,1,2)x(0,1,1) AR(1) 0, AR(2) 0, MA(1) -1, MA(2) 0, SMA(12) -0, (2,1,1)x(0,1,1) AR(1) -0, AR(2) 0, MA(1) -0, SMA(12) -0, (3,1,0)x(0,1,1) AR(1) -0, AR(2) -0, AR(3) 0, MA(12) -0, ,727 0,138 0,090 0,674 0,490 0,210 0,067 17, , , , , , , , , (0,1,1)x(0,1,1) MA(1) -0, , , , SMA(12) -0, TRAMO/SEATS (0,1,1)x(0,1,1) MA(1) -0,74291 SMA(12) -0, Fetmarkerade värden är de lägsta AIC/BIC-värdena inom ARIMA respektive SARIMA Efter 90-talskrisen En misstanke är dock att det finns ett brott i tidsserierna eftersom att serierna dels är långa och att det dels skedde mycket under denna period med 90-talskrisen som kulmen av detta. Därför genomför vi Chows brytpunktstest för att utröna om parametereffekterna egentligen skiljer sig åt under perioden istället för att vara konstanta över hela perioden. Eftersom att den svenska kronan släpptes flytande den 19:e november 1992 testar vi ifall det existerar ett brott i tidsserierna vid november i samma år. Testen för export- och import-serierna som visas i tabell 7 förkastar att det inte finns något brott på 5-procentsnivån, medan testet för handelsnetto-serien förkastar nollhypotesen på 10-procentsnivån. 26
28 Tabell 7. Chows brytpunktstest för brott i serien i november Export Import Handelsnetto F-värde 8,16*** 3,15** 2,41* *** = signifikant på 1-procentsnivån, ** = signifikant på 5-procentsnivån, * = signifikant på 10- procentsnivån Med hänsyn av detta skattar vi nya modeller för perioden november 1992 till och med augusti 2010 och exkluderar därför de äldre observationerna. Modellvalen genomförs efter samma metodik som tidigare och resultaten presenteras i tabell 8. Resultaten visar att både export och import bäst förklaras av (3,1,0)x(0,1,1)-modeller, vilka skiljer sig från de modeller som bäst passade till hela perioden. Handelsnettot förklaras dessutom bäst av en (0,1,1)x(0,1,1)-modell i SARIMA-fallet, medan TRAMO/SEATS väljer en (1,1,3)x(0,1,1)-modell för serien. 27
29 Tabell 8. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för export, import samt handelsnetto november 1992-augusti Modell Koefficienter P-värde AIC BIC Justerat R 2 Export (2,1,0)x(0,1,1) AR(1) -0, , , , AR(2) -0, SMA(12) -0, (3,1,0)x(0,1,1) AR(1) -0, , , , AR(2) -0, AR(3) 0, SMA(12) -0, ,003 (0,1,1)x(0,1,1) MA(1) -0, , , , SMA -0, TRAMO/SEATS (3,1,0)x(0,1,1) AR(1) 0,80082 AR(2) 0, AR(3) -0,15358 SMA(12) -0, ,045 Import (2,1,1)x(0,1,1) AR(1) -0, , , , AR(2) -0, MA(1) 0, SMA(12) -0, ,058 (3,1,0)x(0,1,1) AR(1) -0, , , , AR(2) -0, AR(3) 0, MA(12) -0, ,005 0,001 (0,1,1)x(0,1,1) MA(1) -0, , , , SMA(12) -0, TRAMO/SEATS (3,1,0)x(0,1,1) AR(1) 0,68753 AR(2) 0,31497 AR(3) -0,18049 SMA(12) -0, , Handelsnetto (0,1,1)x(0,1,1) MA(1) -0, , , , SMA (12) -0, (1,1,3)x(0,1,1) AR(1) -0, ,987 18, , , MA(1) -0, MA(2) 0, MA(3) -0, SMA(12) -0, ,046 0,576 0,053 TRAMO/SEATS (1,1,3)x(0,1,1) AR(1) -0,09517 MA(1) -0,97196 MA(2) 0,23154 MA(3) -0,10493 SMA(12) -0, ,216 0, Fetmarkerade värden är de lägsta AIC/BIC-värdena inom ARIMA respektive SARIMA. 28
30 5.2. Utvärdering av modellerna De utvalda modellerna från det förra avsnittet har i detta avsnitt använts till att estimera värden för de olika serierna. Dessa har tagits fram i både en in sample-kontext såväl som i en dynamisk out of sample-kontext, för att därefter valideras med hjälp av felmåtten RMSE och MAPE, se tabell 9. Out of sample-analysen har genomförts genom att prediktera de kommande två åren i ett rullande informationsfönster där slutperioden varierar från oktober 1989 till augusti Tabell 9. Felmått för export, import, handelsnetto samt export-import januari 1975-augusti Modell RMSE In sample MAPE In sample RMSE - Out of sample MAPE - Out of sample Export (2,1,0) , ,843 (2,1,0)x(0,1,1) , ,087 (1,1,1)x(1,1,1) , ,087 TRAMO/SEATS N/A 11 N/A ,088 Import (2,1,1) , ,751 (2,1,1)x(0,1,1) , ,087 TRAMO/SEATS N/A N/A ,094 Handelsnetto (0,1,1) , ,745 (0,1,1)x(0,1,1) , ,393 TRAMO/SEATS N/A N/A ,355 Export-Import ARIMA , ,003 SARIMA , ,397 TRAMO/SEATS N/A N/A ,414 För hela tidsperiodens out of sample är det inledningsvis enkelt att se att de olika seriernas ARIMA-modeller leder till betydligt större fel än SARIMA-modellerna och modellerna från TRAMO/SEATS. 12 I övrigt är det svårare att göra någon tydlig gränsdragning mellan de två senare modellernas träffsäkerhet. T/S predikterar export bättre, medan SARIMA-modellen predikterar import bättre. Gällande handelsnetto har T/S ett lägre RMSE-värde, medan SARIMA har ett lägre MAPE-värde. Om vi istället definierar handelsnetto med hjälp av de andra serierna (export-import) ser vi att SARIMA-modellerna ger bättre felmått än TRAMO/SEATS, men sämre än den ursprungliga handelsnettoserien. 11 TRAMO/SEATS ger ingen information om in sample-felmåtten. 12 Eftersom att ARIMA-modellerna visar stora fel exkluderas dessa från vidare diskussion. 29
31 5.2.1 Efter 90-talskrisen Eftersom att vi fann ett brott i tidsserierna och därefter skattade nya modeller för tidsperioden november 1992 fram till och med augusti, gör vi även in-sample- och out-of-sample-analyser för denna kortare tidsperiod, se tabell 10. I dessa fall ligger prognosfönstret mellan februari 1998 till augusti 2010 för export och import, medan det börjar i mars 2006 för handelsnetto 13. SARIMA ger bättre felmått än TRAMO/SEATS i fallen export och import, medan resultaten visar det omvända för handelsnetto. Export-import visar till sist större fel än handelsnetto, detta skulle kunna bero på att handelsnetto är mer stabil än de övriga serierna. Tabell 10. Felmått för export, import, handelsnetto samt export-import november 1992-augusti RMSE In sample MAPE In sample RMSE - Out of sample MAPE - Out of sample Modell Export (3,1,0)x(0,1,1) , ,084 TRAMO/SEATS N/A N/A ,099 Import (3,1,0)x(0,1,1) , ,094 TRAMO/SEATS N/A N/A ,1127 Handelsnetto (0,1,1)x(0,1,1) , ,062 TRAMO/SEATS N/A N/A ,748 Export-Import (Handelsnetto) SARIMA , ,870 TRAMO/SEATS N/A N/A ,824 Då vi har noterat att valet av modell i de kortare serierna förändras vid borttagande av endast ett fåtal variabler, tittar vi istället på det brutna datasetet från november 1992 och framåt, med samma antal AR- och MA-termer som för hela perioden och med samma prognosfönster. När vi gör denna jämförelse ser vi att modellerna anpassade för den kortare tidsperioden har lägre in sample-fel än modellerna som är anpassade för hela perioden men skattade för den korta, se tabell 11. En sådan tydlig skillnad föreligger inte för out of sample-felmåtten. I export-fallets SARIMA-modell, som visar bättre felmått än TRAMO/SEATS, är RMSE-värdet något lägre 13 Anledningen till det kortare prognosfönstret är TRAMO/SEATS-modellen (1,1,3)x(0,1,1) inte kan göra prognoser längre tillbaka i tiden med det rådande informationsfönstret. 30
32 för modellen anpassade för hela perioden medan MAPE-värdet är marginellt lägre (0,0837 mot 0,0840) i modellen anpassad för den korta perioden. För import har modellen på den långa perioden för SARIMA bättre out of sample-felmått i båda fallen. I fallet handelsnetto är det samma modell i SARIMA-fallet och inga jämförelser kan därför göras. I TRAMO/SEATS-fallet, som visar bättre resultat än SARIMA, är RMSE betydligt lägre i modellen anpassad för den långa perioden, medan MAPE är något lägre i modellen anpassad för den korta perioden. Tabell 11. Felmått för export, import samt handelsnetto november 1992-augusti 2010, med samma antal AR- och MA-termer som modellerna anpassade för perioden januari 1975 augusti Modell RMSE In sample MAPE In sample RMSE - Out of sample MAPE - Out of sample Export (2,1,0)x(0,1,1) , ,0840 TRAMO/SEATS N/A N/A ,0964 Import (2,1,1)x(0,1,1) , ,0933 TRAMO/SEATS N/A N/A ,1127 Handelsnetto (0,1,1)x(0,1,1) , ,062 TRAMO/SEATS N/A N/A ,780 De slutliga prognosmodellerna blir sålunda (3,1,0)x(0,1,1) för export, främst med tanke på att vi har ett brott i serien. För import blir det (2,1,1)x(0,1,1), då modellen anpassad för den långa perioden skattad på den korta perioden i samtliga out of sample-fall visar bättre felmått. För handelsnetto väljs (0,1,1)x(0,1,1) från TRAMO/SEATS ut eftersom att denna modell visar avsevärt lägst RMSE-värden. Tittar vi på residualerna 14 från dessa modeller ser vi att export uppvisar lägre Q-värden än import som snabbt visar insignifikans. Däremot kan vi inte säga att residualerna från någon av dessa två modeller består av vitt brus. I motsats till detta tyder residualerna för handelsnetto 14 Korrelogram av residualerna återfinns i appendix 3. 31
Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012
Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig
Stokastiska processer med diskret tid
Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna
Stokastiska processer med diskret tid
Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna
Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012
Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov
Finansiell statistik
Finansiell statistik Föreläsning 5 Tidsserier 4 maj 2011 14:26 Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs
ARIMA del 2. Patrik Zetterberg. 19 december 2012
Föreläsning 8 ARIMA del 2 Patrik Zetterberg 19 december 2012 1 / 28 Undersöker funktionerna ρ k och ρ kk Hittills har vi bara sett hur autokorrelationen och partiella autokorrelationen ser ut matematiskt
Korrelation och autokorrelation
Korrelation och autokorrelation Låt oss begrunda uttrycket r = i=1 (x i x) (y i y) n i=1 (x i x) 2 n. i=1 (y i y) 2 De kvadratsummor kring de aritmetiska medelvärdena som står i nämnaren är alltid positiva.
Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012
Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller
Analys av egen tidsserie
Analys av egen tidsserie Tidsserieanalys Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo 9 december 25 3 25 Antal solfläckar 2 15 1 5 5 1 15 2 25 3 Månad Inledning Vi har valt att betrakta
732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23
732G71 Statistik B Föreläsning 8 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23 Klassisk komponentuppdelning Klassisk komponentuppdelning bygger på en intuitiv
Sveriges bruttonationalprodukt Årsdata. En kraftig trend.
Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs mätningarna vid vissa tidpunkter och med samma avstånd mellan
Regressions- och Tidsserieanalys - F8
Regressions- och Tidsserieanalys - F8 Klassisk komponentuppdelning, kap 7.1.-7.2. Linda Wänström Linköpings universitet November 26 Wänström (Linköpings universitet) F8 November 26 1 / 23 Klassisk komponentuppdelning
Teknisk not: Lönealgoritmen
Teknisk not: Lönealgoritmen Konjunkturlönestatistiken, som räknas till den officiella lönestatistiken, har som huvudsyfte att belysa nivån på arbetstagarnas löner i Sverige och hur dessa utvecklas. Konjunkturlönestatistiken
Hemuppgift 2 ARMA-modeller
Lunds Universitet Ekonomihögskolan Statistiska Institutionen STAB 13 VT11 Hemuppgift 2 ARMA-modeller 1 Inledning Denna hemuppgift är uppdelad i två delar. I den första ska ni med hjälp av olika simuleringar
Prognostisering av växelkursindexet KIX En jämförande studie. Forecasting the exchange rate index KIX A comparative study
Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2013:14 Prognostisering av växelkursindexet KIX En jämförande studie Forecasting the exchange rate index KIX A comparative
ÖVNINGSUPPGIFTER KAPITEL 7
ÖVNINGSUPPGIFTER KAPITEL 7 TIDSSERIEDIAGRAM OCH UTJÄMNING 1. En omdebatterad utveckling under 90-talet gäller den snabba ökningen i VDlöner. Tabellen nedan visar genomsnittlig kompensation för direktörer
Modellskattningen har gjorts med hjälp av minsta kvadratmetoden (OLS).
MODELLSKATTNINGAR Modeller med bäst anpassning ger inte alltid de bästa prognoserna. Grundantaganden, till exempel vilka modeller som testas, påverkar i viss grad prognosutfallet. Modellerna har, i de
Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva
Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H
Regressions- och Tidsserieanalys - F7
Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys
Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.
Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, HT2013 2014-02-07 Skrivtid: 13.00-18.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller
Sveriges bruttonationalprodukt Årsdata. En kraftig trend.
Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs mätningarna vid vissa tidpunkter och med samma avstånd mellan
Något om val mellan olika metoder
Något om val mellan olika metoder Givet är en observerad tidsserie: y 1 y 2 y n Säsonger? Ja Nej Trend? Tidsserieregression Nej ARMA-modeller Enkel exponentiell utjämning Tidsserieregression ARIMA-modeller
Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.
Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, VT2014 2014-05-26 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller
Summakonsistent säsongrensning
Summakonsistent säsongrensning Presentation av projektarbete på SCB av Suad Elezović Statistiska institutionen,stockholms universitet 14 Oktober 2009 2009-10-14 Suad Elezović PCA/MFFM-S 1 Säsongrensning
Vad Betyder måtten MAPE, MAD och MSD?
Vad Betyder måtten MAPE, MAD och MSD? Alla tre är mått på hur bra anpassningen är och kan användas för att jämföra olika modeller. Den modell som har lägst MAPE, MAD och/eller MSD har bäst anpassning.
Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I
Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I Sebastian Andersson Statistiska institutionen Senast uppdaterad: 15 december 2015 Data kan generellt sett delas in i tre kategorier: 1 Tvärsnittsdata:
732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris
Utvärdering av Transportstyrelsens flygtrafiksmodeller
Kandidatuppsats i Statistik Utvärdering av Transportstyrelsens flygtrafiksmodeller Arvid Odencrants & Dennis Dahl Abstract The Swedish Transport Agency has for a long time collected data on a monthly
F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall
Tillämpad statistik (A5), HT15 Föreläsning 24: Tidsserieanalys III
Tillämpad statistik (A5), HT15 Föreläsning 24: Tidsserieanalys III Sebastian Andersson Statistiska institutionen Senast uppdaterad: 16 december 2015 är en prognosmetod vi kan använda för serier med en
Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen
Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då
Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 015 1 a 13 och 14
DEN FRAMTIDA VERKSAMHETSVOLYMEN I RÄTTSKEDJAN - CENTRALA PROGNOSER FÖR PERIODEN : RESULTATBILAGA
DEN FRAMTIDA VERKSAMHETSVOLYMEN I RÄTTSKEDJAN - CENTRALA PROGNOSER FÖR PERIODEN 2016-2019: RESULTATBILAGA I denna bilaga beskrivs de prognosmodeller som ligger till grund för prognoserna. Tanken är att
732G71 Statistik B. Föreläsning 9. Bertil Wegmann. December 1, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 9 Bertil Wegmann IDA, Linköpings universitet December 1, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B December 1, 2016 1 / 20 Metoder för att analysera tidsserier Tidsserieregression
TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS
STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan
Grundläggande matematisk statistik
Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x
732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29
732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann
Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 3 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Inferens om två populationer (kap 8.1 8.) o Parvisa observationer (kap 9.1 9.) o p-värde (kap 6.3) o Feltyper, styrka, stickprovsstorlek
Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
Utökade användningsområden för trafikarbetets förändring Expanded uses for the change in traffic density Magnus Kjellman
Utökade användningsområden för trafikarbetets förändring Expanded uses for the change in traffic density Magnus Kjellman 15-högskolepoängsuppsats inom Statistik III, ht 2012 Handledare: Mikael Möller Förord
Paneldata och instrumentvariabler/2sls
Extra anteckningar om paneldata; Paneldata och instrumentvariabler/2sls Oavsett REM, FEM eller poolad OLS så görs antagandet att Corr(x,u) = 0, dvs att vi har svagt exogena regressorer. Om detta inte gäller
Multipel Regressionsmodellen
Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b
För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
F19, (Multipel linjär regression forts) och F20, Chi-två test.
Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med
Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University
Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att
Hemuppgift 3 modellval och estimering
Lunds Universitet Ekonomihögskolan Statistiska Institutionen STAB 13 VT11 Hemuppgift 3 modellval och estimering 1 Inledning Denna hemuppgift är uppdelad i två delar. I den första ska ni med hjälp av olika
Homework Three. Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo. 28 november Time series analysis
Homework Three Time series analysis Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo 28 november 25 1 Vi ska här analysera en datamängd som består av medeltemperaturen månadsvis i New York mellan
MVE051/MSG Föreläsning 7
MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel
Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.
Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för
Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.
Betrakta kopparutbytet från malm från en viss gruva. Anta att budgeten för utbytet är beräknad på att kopparhalten ligger på 70 %. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten
Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING
Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population
Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013
Föreläsning 11 Slumpvandring och Brownsk Rörelse Patrik Zetterberg 11 januari 2013 1 / 1 Stokastiska Processer Vi har tidigare sett exempel på olika stokastiska processer: ARIMA - Kontinuerlig process
Avsnitt 2. Modell: intuitiv statistisk
Avsnitt 2. Modell: intuitiv statistisk En prognos är en utsaga om en framtida händelse. Vi kommer mest att syssla med numeriska prognoser. Med det menar vanligen ett tal på en intervallskala. Exempel:
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information
Den framtida verksamhetsvolymen i rättskedjan - Centrala prognoser för perioden : Resultatbilaga
RESULTATBILAGA I resultatbilagan beskrivs de modeller som ligger till grund för prognoserna i rapporten. Tanken är att redovisningen ska öka transparensen i rapporten. Med utgångspunkt i nedstående specificering
Stockholms Universitet Statistiska institutionen Patrik Zetterberg
Stockholms Universitet Statistiska institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, VT2012 2012-05-31 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan
F3 Introduktion Stickprov
Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever
Regressions- och Tidsserieanalys - F4
Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1
Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval
F9 SAMPLINGFÖRDELNINGAR (NCT
Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad
Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab
Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts
STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys
STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består
Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3
Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest
Säsongrensning i tidsserier.
Senast ändrad 200-03-23. Säsongrensning i tidsserier. Kompletterande text till kapitel.5 i Tamhane och Dunlop. Inledning. Syftet med säsongrensning är att dela upp en tidsserie i en trend u t, en säsongkomponent
F13 Regression och problemlösning
1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell
Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken
Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen
3 Maximum Likelihoodestimering
Lund Universitet med Lund Tekniska Högskola Finansiell Statistik Matematikcentrum, Matematisk Statistik VT 2006 Parameterestimation och linjär tidsserieanalys Denna laborationen ger en introduktion till
Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:
Statistik 2 Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Tentamen SST021 ACEKO16h, ACIVE16h 7,5 högskolepoäng Tentamensdatum: 2018-05-31 Tid: 14.00-19.00 Hjälpmedel: Valfri miniräknare Linjal
Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.
Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:
, s a. , s b. personer från Alingsås och n b
Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen
STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson (examinator) VT2017 TENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER 2017-04-20 LÖSNINGSFÖRSLAG Första version, med reservation för tryck-
Medicinsk statistik II
Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning
Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13
Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare
Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.
Tentamen Linköpings universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2016-12-13, 8-12 Bertil Wegmann
F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab
Repetition: Gnuer i (o)skyddade områden χ 2 -metoder, med koppling till binomialfördelning och genetik. Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 Endast 2 av de 13 observationerna
Statistik B Regressions- och tidsserieanalys Föreläsning 1
Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs
Lektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
F11. Kvantitativa prognostekniker
F11 Kvantitativa prognostekniker samt repetition av kursen Kvantitativa prognostekniker Vi har gjort flera prognoser under kursen Prognoser baseras på antagandet att historien upprepar sig Trenden följer
Uppgift a b c d e Vet inte Poäng
TENTAMEN: Dataanalys och statistik för I2, TMS135 Fredagen den 12 mars kl. 8:45-11:45 på V. Jour: Jenny Andersson, ankn 8294 (mobil:070 3597858) Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:
Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2
Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning
Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi
1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer
Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:
Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal
MVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29
UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN
Regressionsanalys av lägenhetspriser i Spånga
Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016
Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER
Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER När vi mäter en effekt i data så vill vi ofta se om denna skiljer sig mellan olika delgrupper. Vi kanske testar effekten av ett
Föreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, FÖR I/PI, FMS 121/2, HT-3 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar
Dekomponering av löneskillnader
Lönebildningsrapporten 2013 133 FÖRDJUPNING Dekomponering av löneskillnader Den här fördjupningen ger en detaljerad beskrivning av dekomponeringen av skillnader i genomsnittlig lön. Först beskrivs metoden
TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )
TENTMEN Kurs: Plats: Dataanalys och statistik 2 distans 7,5 hp HiG sal 5:525 B eller annan ort Datum: 2 6 9 Tid: 9: 4: Lärare: Tommy Waller ( tel: 26-64 89 65 eller 74 3 86 3 ) Hjälpmedel: Miniräknare
Preliminärt lösningsförslag - omtentamen i Finansiell statistik,
Preliminärt lösningsförslag - omtentamen i Finansiell statistik, 2012-08-22 Uppgift 1a) y x -1 0 1 P(Y = y) -1 1/16 3/16 1/16 5/16 0 3/16 0 3/16 6/16 1 1/16 3/16 1/16 5/16 P(X = y) 5/16 6/16 5/16 1 E[X]
Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 4 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Icke-parametriska test Mann-Whitneys test (kap 8.10 8.11) Wilcoxons test (kap 9.5) o Transformationer (kap 13) o Ev. Andelar
Analytisk statistik. Mattias Nilsson Benfatto, PhD.
Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik
7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.
Betrakta motstånden märkta 3.9 kohm med tolerans 1%. Anta att vi innan mätningarna gjordes misstänkte att motståndens förväntade värde µ är mindre än det utlovade 3.9 kohm. Med observationernas hjälp vill
Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
HYPOTESPRÖVNING sysselsättning
0 självmord 20 40 60 HYPOTESPRÖVNING 4. Se spridningsdiagrammen nedan (A, B och C). Alla tre samband har samma korrelation och samma regressionslinje (r = 0,10, b = 0,15). Vi vill testa om sambandet mellan