Stockholms universitet, statistiska institutionen Finansiell statistik, GN, 7.5 hp, vt2012 Inlämningsuppgift (1.5hp)

Relevanta dokument
Stockholms Univ., Statistiska Inst. Finansiell Statistik, GN, 7,5 hp, VT2009 Inlämningsuppgift (1,5hp)

Stockholms Univ., Statistiska Inst. Finansiell Statistik, GN, 7,5 hp, HT2008 Inlämningsuppgift (1,5hp)

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Stokastiska processer med diskret tid

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

F13 Regression och problemlösning

Regressions- och Tidsserieanalys - F1

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

ARIMA del 2. Patrik Zetterberg. 19 december 2012

Stokastiska processer med diskret tid

Vad Betyder måtten MAPE, MAD och MSD?

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Regressions- och Tidsserieanalys - F1

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

7.5 Experiment with a single factor having more than two levels

Stockholms Universitet Statistiska institutionen Patrik Zetterberg

Analys av egen tidsserie

Preliminärt lösningsförslag - omtentamen i Finansiell statistik,

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

MVE051/MSG Föreläsning 14

Homework Three. Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo. 28 november Time series analysis

Del 2 tillsammans med förberedelsefrågor - tid för inlämning och återlämning meddelas senare.

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

STOCKHOLMS UNIVERSITET HT 2011 Statistiska institutionen Bertil Wegmann

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Matematisk statistik för D, I, Π och Fysiker

Målet för D3 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Något om val mellan olika metoder

Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Multipel Regressionsmodellen

Obligatorisk uppgift, del 1

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Datorövning 5 Exponentiella modeller och elasticitetssamband

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

Statistik B Regressions- och tidsserieanalys Föreläsning 1

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Finansiell statistik

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Föreläsning 12: Linjär regression

Statistiska Institutionen Gebrenegus Ghilagaber (docent) Skriftlig tentamen i FINANSIELL STATISTIK, grundnivå, 7,5 hp, HT08. Torsdagen 15 januari 2009

Metod och teori. Statistik för naturvetare Umeå universitet

Uppgift a b c d e Vet inte Poäng

Datorövning 1: Fördelningar

Lektionsanteckningar 11-12: Normalfördelningen

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Jan Hagberg, Bo Rydén, Christian Tallberg, Jan Wretman

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

Matematisk statistik för B, K, N, BME och Kemister

Räkneövning 4. Om uppgifterna. 1 Uppgift 1. Statistiska institutionen Uppsala universitet. 14 december 2016

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Markovkedjor. Patrik Zetterberg. 8 januari 2013

Matematisk statistik, Föreläsning 5

Regressions- och Tidsserieanalys - F8

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Statistiska samband: regression och korrelation

Grundläggande matematisk statistik

Diskussionsproblem för Statistik för ingenjörer

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

Korrelation och autokorrelation

MVE051/MSG Föreläsning 7

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

OBS! Vi har nya rutiner.

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Arbeta med normalfördelningar

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Föreläsning 12: Regression

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Laboration 4 R-versionen

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Linjär regressionsanalys. Wieland Wermke

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

LABORATION 3 - Regressionsanalys

Regressions- och Tidsserieanalys - F4

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Laboration med Minitab

Transkript:

Stockholms universitet, statistiska institutionen Finansiell statistik, GN, 7.5 hp, vt2012 Inlämningsuppgift (1.5hp) Nicklas Pettersson Anvisningar och hålltider Uppgiften löses i grupp om tre personer och godkänt betyg kan endast ges för uppgiften som helhet. En delvis avklarad uppgift kan inte tillgodoräknas kommande terminer. Lösningar på uppgiften redovisas i dokumentmallen http://gauss.stat.su.se/gu/finstat/fs.doc som finns på hemsidan. Ta endast med de efterfrågade figurerna samt det väsentliga för att besvara frågorna. Inga bilagor är tillåtna. Inlämningsuppgift insändes via mail till nicklas.pettersson@stat.su.se. Ange ämnet på mailet som FS + ert arbetsgruppnummer, dvs FS1 om ni är arbetsgrupp 1. Namnge även filen ni skickar in med FS + ert arbetsgruppnummer, dvs FS1.doc om ni är arbetsgrupp 1. Senaste inlämningsdatum är måndagen den 4/6 2012 klockan 08.00. Feedback på inlämningsuppgift erhålls senast måndagen den 18/6 2012 till den mailadress som skickade in uppgiften (plus de eventuella mailadresser som står som kopia i det inskickade mailet). Senaste inlämningsdatum för komplettering är fredagen den 31/8 2012 klockan 08.00. Feedback på komplettering erhålls senast måndagen den 17/9 2012. Inlämningsuppgift som inkommer efter utsatt tid för inlämning men innan utsatt tid för komplettering kommer att betraktas som en komplettering. Senare inkomna inlämningsuppgifter kommer ej att beaktas överhuvudtaget. 1

Datamaterial och programvara Programvara för att lösa inlämningsuppgiften är valfritt, men då hjälpkoder samt datamaterial återfinns i en programfil (workspace) i R rekommenderas detta program. Studenternas arbetsgruppnummer avgör vilka variabler som skall användas. Utförligare instruktioner ges i hjälpfiler samt under respektive del av inlämningsuppgiften i detta dokument. Uppgiften består av tre delar och en hjälpfil finns till vardera del. http://gauss.stat.su.se/gu/finstat/del1finstatinl.r http://gauss.stat.su.se/gu/finstat/del2finstatinl.r http://gauss.stat.su.se/gu/finstat/del3finstatinl.r Här är de senate Linux, MAC OS X, samt Windowsversionerna av R. http://ftp.sunet.se/pub/lang/cran/bin/linux/ http://ftp.sunet.se/pub/lang/cran/bin/macosx/ http://ftp.sunet.se/pub/lang/cran/bin/windows/base/ Nedanstående länk är till R:s hemsida, som utöver programmet innehåller manualer, tilläggspaket, med mera. http://www.r-project.org/ Tre fönster som finns i R är 1. R console - Här kan man exekvera sin kod genom att skriva eller klistra in den direkt i fönstret, eller i vissa fall köra koden via menyerna. I princip alla statistikprogram har ett liknande programfönster, men vissa har utförligare menystyrning. 2. R editor - Ett vanligt textdokument där man kan skriva in sin kod. Om man sedan markerar den och trycker ctrl + r så skickas den och exekveras automatiskt i R console. Editorn nås via menyn File/New script eller om du vill öppna en tidigare textfil via File/Open script ). 3. R Graphics - Detta fönster får man upp när man gör plottar. Vill man kopiera denna kan man markera fönstret och gå via File menyn, alternativt högerklicka på fönstret och välja hur man vill kopiera. Det är också möjligt att spara sina plottar på hårddisken direkt genom skriven kod. En alternativ texteditor till R editor heter Tinn-R. I denna kan du mycket lättare hålla reda på parenteser, funktioner, etc. Rekommenderas starkt! http://sciviews.org/tinn-r/ Nedanstående manual rekommenderas för den intresserade nybörjaren. Huvudfokuset med datorövningarna är inte att ni skall lära er att programmera. Det vi går igenom på datorövningarna är fullt tillräckligt för att lösa inlämningsuppgiften. http://cran.r-project.org/doc/manuals/r-intro.pdf 2

En annan bra sida med hjälpavsnitt är http://www.statmethods.net/index.html Exempel på några enkla beräkningar i R # This text is to the right of # so it will be ignored by R. # Thus, you can use # if you want to make comments in your code. # Some simple calculations 1+2 # Calculate one plus two, thus you can use R directly as a calculator x <- 1+2 # Let x=3. x # look at x x = 1+2 # alternative way which gives the same result x # look at x 1+2 -> x # a third alternative, so you can use arrows in both directions x # look at x y <- 2*x # Let y = 2 multiplied with x z <- -2:1 # Let z be a series from -2 to 1 z <- c(-2,-1,0,1) # an alternative to the above z <- seq(to=1,from=-2,by=1) # or use the sequence function z*x # z multiplied with x z*x-1 # z multiplied with x, and take all elements minus one z*(x-1) # z multiplied with x minus one z^0.5 # calculates square-root of z. Alternatively write sqrt(z) # which also gives the square root rep(z,times=2) # Repeat z two times rep(z,each=3) # Repeat each element in z three times rep(z,times=2,each=3) # Combine the two above z[1] # Find the first element in z z[2] # Find the second element in z (which in this example is missing) z[1:2] # z[c(1,2)] both first and second element in z z[-3] # all elements in z except the third z<3 # which elements in z are less then 3 z[z>3] # show elements of z for which z is bigger then 3 z[z>3 z<2] # show elements of z for which z>3 or z<2 z[z>3 & z<2] # show elements of z for which z>3 and z<2 (i.e. none) length(z) # this function gives the length of z is.na(z) # which elements of z are missing values?!is.na(z) # which elements of z are not missing values? is.na(z[1:5]) # are the five first elements in z missing values? Några tips Spara den kod ni använder i en separat kodfil. Skulle ni göra ett fel i början kan detta påverka allt efterföljande. Har man sparat sin kod är det enkelt att göra en ändring, och sedan köra om allt på en gång. Detta är också ett bra sätt för att dokumentera det man har gjort, om man vill återanvända det i framtiden. 3

Man kan exekvera flera rader samtidigt, de behöver ej köras en i taget. Använd snabbtangenter, det går i regel mycket fortare. Vill du växla mellan programmet du skriver koden i och R så håll ned shift och använd uppåt/nedåt-pilarna för att markera. ctrl + c kopierar sedan textkoden. Håll därefter in alt och tryck tab (en eller flera gånger) för att växla till R. Klistra sedan in med ctrl och v. Nästan allting går snabbare med tangentbordet istället för mus/pekdon. 1 UPPGIFTSDEL 1: HÄNDELSESTUDIE I denna del studeras huruvida en typ av händelse kan antas påverka värdet på en tillgång, dvs att händelsen ger upphov till en över- eller underavkastning i relation till den förväntade marknadsavkastningen, så kallad abnormal return (AR). Händelsen kan vara unik för den underliggande tillgången, såsom en aktiesplit eller ett uppköp, eller generella såsom en lagändring eller en räntesäkning. Vi kommer använda oss av en enkel typ av studie där händelsen består av att ett VD-byte har annonserats. Frågan är då huruvida detta skickar en signal till marknaden som påverkar den förväntade avkastningen på kort sikt. 1.1 Beskrivning av studien och metoden Inom loppet av tjugo år genomfördes en stor mängd VD-byten i en bransch, men ni som arbetsgrupp erhåller endast ett slumpmässigt urval om I = 1,...,60 stycken av dessa. Handeln i samtliga aktier antas ha hög likviditet. För att avgöra huruvida avvikande avkastning förekommit på kort sikt används daglig aktiekursförändring (avkastning) för en vecka efter att VD-bytet annonserats vid tidpunkten T = 0. Misstanke finns dock om läckage av nyheten varför även avkastningen veckan innan läggs till det fönster som studeras. Fönstret består således av avkastningen under perioden T = 5 till och med T = 5, dvs totalt 11 dagar se figur 1. Figur 1. Tidslinje för en Eventstudie För vart och ett av de 60 företagen kan förväntad avkastning för tidpunkterna inom estimationsfönstret beräknas utifrån den så kallade marknadsmodellen, 4

baserat på tidsperioden T = 65 till och med T = 6, dvs N = 60 dagar innan händelsefönstret. Först skattas regressionsekvationen R IT = α I +β I R MT +ǫ IT,ǫ IT N(0,σ 2 ǫ I ),(T = 65,..., 6) (1) för vart och ett av företagen I, där R IT och R MT är aktieavkastningen respektive marknadsavkastningen (mätt som ränteintensitet). Parameterskattningarna ˆα I och ˆβ I används sedan för att skatta den avvikande avkastningen under perioden T = 5 till och med T = 5 som: AR IT = R IT [ˆα I + ˆβ ] I R MT,(T = 5,...,5). (2) Varianserna för de enskilda observationerna AR IT vid respektive tidpunkt T = 5,...,5, skattas då som (jämför med prediktionsintervall i Newbold et al) där vi har att ˆσ AR 2 IT = ˆσ ǫ 2 I 1+ 1 N + (R MV µ M ) 2 6 (R MT µ M ) 2, (3) µ M = 1 N T= 65 6 T= 65 R MT (4) är den genomsnittliga marknadsavkastningen. För enkelhets skull studeras här endast den summerade avvikande avkastningen (cumulative abnormal return): vars varians skattas som CAR I = 11 T=1 AR IT, (5) ˆσ 2 CAR I = 5 V= 5 ˆσ 2 AR IV. (6) Den genomsnittliga kumulerade avvikande avkastningen för de N = 60 företagen beräknas sedan som CAR = 1 N och den skattade variansen beräknas som ˆσ 2 CAR = 1 N 2 N CAR I, (7) i=1 N ˆσ CAR 2 I. (8) i=1 5

Under nollhypotesen om ingen genomsnittlig kumulativ avvikande avkastning kan antas att dvs t-fördelad med N 1 frihetsgrader. CAR 0 σ CAR t (N 1), (9) I variablerna cari[,gruppnummer] samt carivar[,gruppnummer] återfinnscar I och ˆσ 2 CAR I för de N 1 företag. Det saknade företaget motsvarar ert gruppnummer. Aktiekurs och indexkurs för det saknade företaget återfinns i variablerna comp[,gruppnummer] och market[,gruppnummer]. Båda dessa omfattar tidsperioden T = 66,...,5. Eftersom endast marknadsmodellen finns skattad för 59 av de 60 företagen, så behöver ni skatta för det återstående företaget. Ni kommer därför att behöva skatta marknadsmodellen för det företag som motsvarar ert gruppnummer. 1.2 Marknadsmodellen Marknadsmodellen används normalt för att beräkna risken i en aktie (eller portfölj), där β anger det genomsnittliga sambandet mellan marknadsavkastningen och aktiens avkastning. Aktie I:s totala risk (σ 2 R I ) kan då delas upp i systematisk (β 2 σ 2 R M ) och specifik risk (σ 2 ǫ I ). Uppdelning är alltså direkt relaterad till uppdelningen SST = SSR+SSE i ANOVA-tablån. Här använder vi dock modellen främst för prediktion. Ett viktigt moment vid regressionsanalys är granskning av residualerna. Vanliga plottar för att granska residualerna är: 1. Histogram - detta kan används för att studera normalfördelningsantagandet. En täthetsskattning kan ses som ett utjämnat histogram. 2. Normal QQ-plot - här jämförs den ordnade fördelning för residualerna med en fördelningen för en normalfördelning (det diagonala strecket). 3. Residualerna plottade mot skattade värden - här kan vi t.ex. se om variationen är lika givet olika skattade värden. 4. Residualerna plottade mot ordningen - här kan vi studera om värdena uppträder slumpmässigt eller om det finns något mönster eller samband med ordningen (t.ex. linjärt). Om ordningen är tiden blir detta en tidsserieplot. 5. Residual mot närmastliggande (laggad) residual - här kan studeras om något samband finns mellan närliggande residualer. 6. Korrelogram över residualer - här ses hur stark korrelationen mellan ordnade residualer är för olika avstånd mellan dem. Exercise 1 Framställ figur 1. Verkar regressionsantagandena vara uppfyllda för denna modell? (Det är ok att referera till figurerna ovan som fig1 till fig6). 6

Exercise 2 Hur hög andel av risken är specifik i en portfölj som endast består av denna aktie. Exercise 3 Givet en förändring av marknadsavkastningen på 2 %, hur stor är den förväntade förändringen i avkastning för det aktuella företaget? Obs, svara i icke-numerisk form. 1.3 Abnormal returns Nästa steg är att beräkna abnormal return för företag I. Använd ˆα I och ˆβ I för att beräkna AR IT för perioden T = 5,...,5 och plotta sedan AR IT. Exercise 4 Framställ figur 2. Baserat på antagandet att prediktionsintervallen stämmer, verkar utfallet vara slumpmässigt för det I:te företaget? Beräkna slutligen CAR I och ˆσ 2 CAR I och ersätt de saknade värden för ert urval om 60 företag. För att som investerare kunna uttala sig om eventuella abnormal returns i samband med VD-byten generellt sett, så tänker vi oss att dessa genererats från en modell med ett sant medelvärde µ. Vi vill nu försöka uttala oss om detta sanna medelvärde, och ställer därför upp ett hypotestest. Exercise 5 Genomför lämpligt hypotestest. Det är ok att skatta σ 2 CAR med ˆσ 2 CAR. 2 UPPGIFTSDEL 2: TVÅ INDEXFONDER I andra delen av inlämningsuppgiften studeras ett börsindex samt två stycken fonder som har olika placeringsstrategier men som båda använder börsindexet som jämförelseindex: fonda t, fondb t och Index t, t = 1,...,n. FondA är en aktivt förvaltad fond, där förvaltaren har stor möjlighet att välja branscher och bolag tämligen fritt. Målet för fonden är att gå minst lika bra som, eller åtminstone följa sitt jämförelseindex så nära som möjligt. En årlig avgift om 2% av kapitalet finns inbakad i kursen. FondB är en passivt förvaltad fond som till stor del styrs av en datorprogrammerad algoritm (vilken delvis är baserad på teknisk analys). Denna syftar inte bara till att replikera sitt jämförelseindex, utan även att klara sig bättre. En årlig avgift om 0,5% av kapitalet tas ut, vilken är inbakad i kursen. Vilka variabler som används baseras på ert gruppnummer. Grupp 1 använder de variabler som hämtas genom med kommandot funds[ 1], grupp 2 funds[ 2], grupp 3 funds[ 3], osv. All kod finns närmare beskriven i kodfilerna. 7

2.1 En första granskning av data När nya data skall analyseras börjar man i regel med att plotta dessa. Histogram och boxplot är vanliga diagramtyper för enskilda variaber, samt spridningsdiagram för att undersöka sambandet mellan två eller flera olika variabler. Då en variabel observerats över tid kan detta betraktas som två variabler, variabeln i sig samt tiden. Jämförelser av olika tidsserier, om ej för många, görs lämpligen i ett och samma diagram. Lämpligen standardiserar man då variablerna på ett sådant sätt att relevanta jämförelser möjliggörs. Exercise 6 Framställ figur 3, som visar fonda t, fondb t,och Index t i en tidsserieplott, där serierna är justerade så att det är lätt att jämföra serierna. Har någon av de två fonderna gått bättre än index totalt sett för denna period? Kommentera. Exercise 7 Förekommer trender eller andra mönster i indexserien? Kommentera. 2.2 Två vanliga mått på avkastning Två olika sätt att beräkna avkastning är enkel avkastningsr t = (P t P t 1 )/P t 1 och ränteintensitet R t = (lnp t lnp t 1 ), där P t betecknar pris dag t. En fördelen med R t vid ränteberäkningar är att det är oberoende av tecknet (positivt eller negativt) och därför kan adderas, medan SR t i regel kräver multiplikation. Till en viss gräns är också approximationen R t SR t ok. Exercise 8 Bevisa formelmässigt i högst fyra steg att R t = ln(1+sr t ) (Se exemplet, ni skall inte sätta in några siffror i ekvationerna). Exercise 9 Pröva för vilken nivå på avkastning som den ovan nämnda approximation R t SR t är rimlig eller ej. Detta kan göras genom att se på när det relativa felet är mindre än fem procent eller ej, dvs när gäller det att SRt Rt SR t < 0.05? 2.3 Modeller Fokus ligger nu på den ursprungliga serien för fonda t. Ni kommer att pröva att modellera serien utifrån de 100 första dagarna, för att sedan prognostisera de 10 sista dagarna. Totalt prövas 6 olika modeller 1. Linjär regressionsmodell 2. Random walk modell 3. ARIMA-modell vald utifrån plottar 4. ARIMA-modell automatiskt vald utifrån ett minimeringskriterie 5. Enkel exponentiell utjämning 6. Dubbel exponentiell utjämning 8

2.3.1 Linjär regression Vi börjar med att skatta den linjära modellen. Såsom vi gjorde för marknadsmodellen så kan vi även här studera residualerna i plottar. Exercise 10 Framställ figur 4. Ange om modellantagandena verkar vara uppfyllda. 2.3.2 Random walk modell I tidsserieplotten ni gjorde tidigare konstaterade ni (förhoppningsvis) att serien trendade ganska tydligt. En random walk modell innebär att vi antar att värdet på serien endast beror på föregående värde plus en slumpterm (vitt brus). Anpassning av modellen motsvaras av att serien differentieras. Exercise 11 Tag fram figur 5, dvs motsvarande residualplottar för random walk modellen som användes vid linjär regression. Vilken/vilka av residualplottarna indikerar att residualerna från random-walk modellen liknar vitt brus? 2.3.3 ARIMA-modeller Nästa steg är att pröva att anpassa ARIMA-modeller som också tar hänsyn till samband över tiden såsom autokorrelation eller glidande medelvärden (vilket inte görs av random walk modellen som motsvarar en ARIMA(0,1,0) modell). Tag därför fram figur 6, dvs skatta autokorrelations-, och partiella autokorrelationsfunktionerna för såväl fonda t, som för första (vilket redan gjorts för random walk modellen) och andra differensen av fonda t. Vi skulle formellt kunna testa för stationäritet, men nöjer oss här med att studera plottar. Exercise 12 Hur många gånger (d) behöver serien differentieras för att synas bli stationär (högst två gånger)? Tips, ett mönster som påminner om en AR1- modell (p=1,q=0) samt en första spik i pacf nära 1 indikerar icke-stationäritet. Jämför med figurerna på sidan 6-7 (i avsnitt 3 i kompendiumet) vad som bäst överensstämmer med er acf och pacf plottar, givet den grad av differentiering ni antagit för att uppfylla stationäritet. Begränsa er till modeller av ordning 3, dvs p=(0,1,2,3) och/eller q=(0,1,2,3). Mönstren är inte sällan inte helt tydliga. Fokusera då på acf för graden av MA och pacf för graden av AR. Exercise 13 Vilka koefficienter för p och q får ni för er valda ARIMA(p,d,q)? Maximalt p=1,2,3 och q=1,2,3. (Väljer ni en AR2 MA1 modell skall ni endast fylla i för p=1, p=2 och q=1.) Låt denna vara modell 3. Skatta också den modell 4, dvs den ARIMA-modell med minsta AIC (Akaike Information Criteria), som välj med hjälp av auto.arima funktionen. 9

2.3.4 Exponentiell utjämning Nästa typ av modeller gör exponentiell utjämning av tidsserien, där vi avgränsar oss till additativa modeller. Givet en viss typ av modell ligger svårigheten i att välja en eller flera parametrar som ger en bra utjämning. För att jämföra modeller med olika värden på parametrar(na) använder vi oss av måtten RMSE (root mean squared error) och MAE (mean absolute error). n (y t ŷ t ) 2 RMSE = t=1 n 1/2 n = t=1 n e 2 t 1/2 (10) n n y t ŷ t e MAE = t=1 n = t t=1 n, (11) där e t är residualvärdet vid tidpunkt t. Vi vill nu försöka hitta en rekursiv modell som bara beror av tidigare värden baserat på en utjämningsparameter α (och β). Exercise 14 Skatta en enkel exponentiellt utjämnad modell (modell 6) för fonda t de n=100 första dagarna, och försök att välja utjämningsparametern så att både MAE och RMSE blir små. Tag sedan fram figur 7, som visar RMSE och MAE. Vilket värde (minst två decimaler) på α väljer ni? Tips, gör först en omfattande sökning med stora steg, och minska sedan sökintervall och använd kortare steg. Exercise 15 Skatta en dubbelt exponentiellt utjämnad modell (modell 7) för fonda t de n=100 första dagarna, och försök att välja utjämningsparametrarna α och β så att både MAE och RMSE blir små. Vilka värden (minst två decimaler) på α och β väljer ni? Ni kan ta fram en figur som visar RMSE och MAE, men behöver ej sätta in den i uppgiften. 2.4 Prognoser Nästa steg är att göra prognoser med de sex olika modellerna. Prognoserna görs för dag 101-110, och prognosfelet räknas som MSFE (mean squared forecast error) MSFE = n+10 t=n+1 (y t ŷ t ) 2 10. (12) Exercise 16 Tag fram figur 8 med de olika prognoserna. Vilka modeller ger samma punktprediktion dag 101-110 för fonda? 10

Exercise 17 Vilka modeller har prediktionsintervall vars bredd ej beror av tiden? Kommentera om ett sådant antagande är rimligt eller ej. Exercise 18 Om ni bortser från den automatiskt valda ARIMA-modellen, vilket/vilka prognosintervall är inte symmetriska? Försök att motivera varför dessa ej är symmetriska utifrån den typen av modell som används. 2.5 Mer om test med ARIMA-modeller Hur väl olika modeller kan anpassas beror av hur mycket data som finns tillgängligt. Vi genomför därför en liten studie där vi känner till den sanna datagenererande modellen/processen (DGP), dvs vi har facit. Om vi först låter den automatiska ARIMA funktionen (auto.arima) välja en modell så kan vi sedan alltså avgöra om den lyckades identifiera den sanna modellen eller ej. I den fjärde modellen använde vi AIC (Akaike Information Criteria), som ett av tre tillgängliga minimeringskriterier i auto.arima funktionen. De andra två heter AICc (Akaike Information Criteria corrected for finite samples) och BIC (Bayes Information Criteria). Vi tänker oss att jämföra hur väl dessa tre lyckas identifiera den sanna modellen för data. Först bestämmer vi oss för en modell, ARIMA(0,1,2) där θ 1 = 0,5 och θ 1 = 0,3. Vi genererar därefter 100 stycken utfall (om 100 eller 1000 observationer vardera) från denna modell. Sedan låter vi auto.arima välja en modell, utifrån vart och ett av de tre kriterierna. Slutligen jämför vi hur ofta de tre olika kriterierna identifierade rätt modell, ARIMA(0,1,2). Exercise 19 Genomför simuleringsstudien med 100 observationer, tag fram figur 9, och kommentera resultatet. Exercise 20 Gör om försöket med 1000 genererade observationer, tag fram figur 10, och kommentera skillnaderna i resultat från fallet då 100 observationer användes. Exercise 21 När de 100 utfallen drogs passade programmet också på att skatta den sanna modellen, ARIMA(0,1,2), samt registrera de skattade värdena för θ 1 och θ 2. Plotta de 100 utfallen (med 1000 observationer) och kommentera om skattningarna av θ 1 och θ 2 verkar vara oberoende eller ej. Om ni tycker att resultatet är nedslående, så kom ihåg att modeller alltid är just modeller och inte verkligheten. För att ta ett av de mest kända citaten inom statistikens värld, myntat av George Box som bland annat är verksam inom tidsserieanalys; All models are wrong, but some are useful! 3 UPPGIFTSDEL 3: SIMULERING MED MAR- KOVKEDJOR Vi studerar här marknaden för en vara där den den tekniska utvecklingen gör att typprodukten byts ut efter ett visst antal år. För att göra en bedömning 11

av om det är värt att investera i produktionskapacitet för att framställa den aktuella varan har information om antal försäljningsställen som finns idag, samt en klassificering av omsättningen för försäljningsställena inhämtats. Då konkurrensen är hård pga den minskande marknadsstorleken antas inga nya försäljningsställen tillkomma. Sedan tidigare finns från liknande branschstrukturer uppskattningar av sannolikheter för om marknadsaktörernas omsättning kommer att öka, minska eller att försäljningen av produkten helt upphör mellan två månadsskiften, se nedanstående övergångsmatris: A = Månad t \Månad t+1 Upphört Oms. < 500 Oms. 500 Upphört 1 0 0 Omsättning < 500 35/1000 962/1000 3/1000 Omsättning 500 2/1000 25/1000 973/1000 Idag (t = 1) finns 0 företag i kategorin upphört (i = 1) och 100 företag i vardera av kategorierna låg (i = 2) och hög (i = 3) omsättning, dvs X 1,1 0 X 1 = X 2,1 = 100. X 3,1 100 Eftersom marknaden krymper vill ni först uppskatta hur lång tid det tar tills hälften av de 200 företagen har upphört. Totalt simulerar ni 100 möjliga utfall och beräknar även det teoretiskt förväntade utfallet genom matrisräkning (tips, se avsnitt 3.7 om markovkedjor i kompendiet). Exercise 22 Tag fram figur 11 som jämför det teoretiskt förväntade utfallet med ett enstaka utfall vid simulering. Hur många månader tog det i respektive fall? Exercise 23 Vilken är de långsiktiga andelarna (dvs gränsvärdet) för de tre kategorierna? Förklara varför vi får detta utfall. För att ni skall anse det värt att investera 650 i produktionskapacitet uppskattar ni att nuvärde (net present value, NPV) av investeringen kan beräknas enligt funktionen NPV = ( ) f (Xt,C,p) t (1+r) t 650 (13) där t är månaden, r är ditt månatliga avkastningskrav, samt att funktionen för ditt täckningsbidrag f (X t,c,p) beror av antalet företag (X i,t ), din intäkt (C i ) samt sannolikhet för försäljning (p i ) till företag med låg (i = 2) och hög (i = 3) omsättning. Den exakta funktionen ges i den givna programkoden, där också föreslagna parametrar ges. Exercise 24 Enligt de givna parametrarna för funktionen simulerar ni 100 möjliga utfall av nuvärdet. Motivera sedan utifrån resultatet av simuleringen om ni anser investeringen vara lönsam på 5 års sikt. 12

Exercise 25 Förändras slutsatsen om vi väljer den längre tidshorisonten 10 år? Ta fram figur 12 som visar utfallet både på 5 och 10 års sikt. Lycka till, och se till att hålla tiderna och följa anvisningarna för inlämning! 13