Stockholms Univ., Statistiska Inst. Finansiell Statistik, GN, 7,5 hp, HT2008 Inlämningsuppgift (1,5hp) Nicklas Pettersson 1 Anvisningar och hålltider Uppgiften löses i grupper om 2-3 personer och godkänt betyg kan endast ges för uppgiften som helhet. En delvis avklarad inlämningsuppgift kan alltså inte tillgodoräknas kommande terminer. Lösningar på uppgiften redovisas i den rapport som nns att ladda ned från hemsidan: http://www.stat.su.se/ nstat/inlmall.doc Uppgiften skall lämnas in senast klockan 12.00 måndagen den 19/1 2009, till övningsläraren (via e-mail), eller i postfack i B319 eller på plan 7 (mitt emot hissen). Resultatet av vilka grupper som godkänts publiceras i en lista på hemsidan senast onsdagen den 28/1, och den rättade uppgiften nns sedan att hämta hos Nicklas (rum B790). Eventuell komplettering skall vara inkommen senast klockan 12.00 onsdagen den 11/2. 2 Programvara och datamaterial Det är valfritt vilket program som studenterna vill använda för att lösa inlämningsuppgifterna. Under datortillfällena kommer i första hand datorprogrammet R att användas. Datamaterialet åter nns i den image l för programspråket R som kan hämtas från hemsidan: http://www.stat.su.se/ nstat/inluppgift.rdata Studenternas tilldelade gruppnummer avgör vilka variabler som skall användas. Utförligare instruktioner ges nedan under respektive del. Ett generellt 1
tips är att spara den kod man skriver samt bifoga denna i slutet av inlmall.doc (om man använder R eller något annat program där koden kan sparas vill säga). 3 Del 1 Två indexfonder I första delen av inlämningsuppgiften studeras två stycken fonder, låt oss kalla dem fonda och fondb. Fonderna har olika placeringsstrategier men använder båda samma jämförelseindex. FondA är en aktivt förvaltad fond, där förvaltaren har stor möjlighet att välja branscher och bolag tämligen fritt. Målet för fonden är att gå minst lika bra som, eller åtminstone följa sitt jämförelseindex så nära som möjligt. En årlig avgift om 2% nns inbakad i kursen. FondB är en passivt förvaltad fond som till stor del styrs av en datorprogrammerad algoritm (vilken delvis är baserad på teknisk analys). Denna syftar inte bara till att replikera sitt jämförelseindex, utan även att klara sig bättre. En årlig avgift om 0,5% tas ut, vilken är inbakad i kursen. Vilka variabler som används baseras på det gruppnummer som erhölls första datorövningen. Grupp 1 använder de variabler som hämtas genom kommandot variable[ 1], grupp 2 variable[ 2], grupp 3 variable[ 3], osv. 3.1 Beskrivning och jämförelse av fonderna 3.1.1 Undersök hur data ser ut genom att plotta de båda fonderna och index, fonda t ; fondb t ; och Index t ; t = 1; :::; n, i samma diagram över tiden. Behöver någon justering göras för att underlätta jämförelsen? Gör i sådana fall denna och plotta om. 3.1.2 Använd både beskrivande mått och diagram för att beskriv fördelningen utan hänsyn till tidsordningen för fondb. Verkar det nnas några outliers? 3.1.3 Avkastningen för fonderna kan beräknas som di erenser diff t = (P t P t 1 )=P t 1 respektive ränteintensitet r t = (ln P t ln P t 1 ). Beräkna på båda sätten och jämför med hjälp av boxplottar. 3.1.4 Diskutera för- och nackdelar med de två måtten i följande situationer: 2
Vid jämförelse av data som hämtats in med olika frekvens (t ex dagsvisa och veckovisa kursnoteringar). Om avkastningen från de ingående delarna av en portfölj (där de ingående delarnas vikter är kända) skall summeras för hela portföljen vid en given tidpunkt. Om avkastningen från olika tidsperioder skall summeras för en och samma tillgång, t ex avkastning år 1 och år 2 för en aktie. Välj sedan att använda ränteintensiteten för den fortsatta analysen. 3.2 Jämförelseindex Beräkna även ränteintensiteten för jämförelseindex r t (Index) och utgå från denna i uppgifterna nedan. 3.2.1 Ser r t (Index) ut att följa någon fördelning om ingen hänsyn tas till tidsordningen? Visa gra skt, samt med hjälp av läges- och spridningsmått. 3.2.2 Bilda ett 95%igt kon densintervall för r t (Index). Bilda också ett naivt intervall (motsvarande 2,5% och 97,5% kvantilerna). Presentera intervallen. Baserat på slutsatserna om fördelningen i uppgift 3.2.1, är något av de två sätten att föredra framför det andra? 3.2.3 Plotta hur r t (F onda) respektive r t (F ondb) samvarierar med r t (Index) samt beräkna ett mått på samvariationen. 3.2.4 Ett sätt att bedöma hur väl de båda fonderna replikerar index är att se på sqdr t (F ondx) = [r t (F ondx) r t (Index)] 2 ; (t = 1; :::; n). sqdrt(f ondx) Antag här att ~ 2 2 (1); (t = 1; :::; n) där dessa är oberoende av värdet på t. (Antagandet om oberoende kan ifrågasättas men vi bortser från detta här). Den genomsnittliga variatonen 2 kan skattas med ^ 2 = n P P 1 sqdr 2n t (F onda) + n sqdr t (F ondb). Ni misstänker att detta mått på t=1 t=1 aktivitetsrisk är högre för fonda än för fondb. Testa på lämpligt sätt om så är fallet. Tips! Eftersom P så kommer n t=1 sqdrt(f ondx) 2 sqdr t(f ondx) 2 ~ 2 (n). ~ 2 (1), (t = 1; :::; n) antas vara oberoende 3
3.3 Regression och exponentiell utjämning Fokus ligger nu endast på den ursprungliga serien för jämförelseindex, Index t ; (t = 1; :::; n). 3.3.1 Skatta följande modeller och presentera tidsplottar av serierna, samt parameterskattningar i en tabell: linjär regression med index som beroende och tiden som förklarande variabel. Tips! En tidsvariabel tid skapas enklast med kommandot tid <- 1:n. exponentiellt utjämnad serie. Sätt alfa=0.3. exponentiellt utjämnad serie med trend (Holt- och Winter s metod). Sätt alfa=0.3 och beta=0.2 Antag att den första modellen sparats i variabel model1. Pröva vad som händer med kommandot plot(model1), respektive summary(model1), för de tre modellerna. Detta behöver dock inte redovisas i uppgiften. 3.3.2 Är någon av modellerna olämplig att använda? Varför? np np 3.3.3 Beräkna mean absoulte deviation M AD = np np (y t ^y t) 2 jy t ^y tj t=i = n j tj t=i n t=i t=i mean squared error MSE = = för att avgöra vilken modell n n som synes vara bäst. Tips! Med kommandona model1$ tted.values eller tted.values(model1)[,1] kan skattade värden erhållas för modellerna. Vilket kommando som fungerar beror av typen av modell. 3.4 Prognoser 3.4.1 Gör prognoser (inklusive 95%iga prognosintervall) för de exponentiellt utjämnade metoderna från uppgift 3.3.1 för en och två tidpunkter framåt. När ni återfår uppgiften får ni också de faktiska utfallen för indexkursen. 3.5 (ARIMA modeller) Denna del är ej obligatorisk, men har ni gjort den är det ej till nackdel vid totalbedömningen av uppgiften. 3.5.1 Pröva att plotta autokorrelationsfunktionen acf( Index t ) och partiella autokorrelationsfunktionen pacf( Index t ). Stämmer mönstret in på något av 4 2 t och
de som beskrivs på sidan 6-7, del 3 i kompendiumet som tillhör kurslitteraturen? 3.5.2 Om autokorrelationsfunktionen i uppgift 3.5.1 dör ut långsamt och den första spiken be nner sig nära 1 indikerar detta att serien inte är stationär. Varför? (Detta skulle kunna prövas med t ex ett Dickey-Fuller test, men för att fördjupa sig i det får man läsa en kurs i tidsserier istället!) 3.5.3 Pröva istället att di erentierade modellen en gång och plotta sedan acf(di t (Index)) och pacf(di t (Index)). Liknar mönstret något av dem i kompendiumet? 4 Del 2 Event studie I denna del studeras huruvida en typ av händelse kan antas påverka värdet på en tillgång, dvs att händelsen ger upphov till en över- eller underavkastning i relation till den förväntade marknadsavkastningen, så kallad abnormal return (AR). Händelsen kan vara unik för den underliggande tillgången, såsom en aktiesplit eller ett uppköp, eller generella såsom en lagändring eller en räntesäkning. Denna typ av studie brukar kallas för Event study, och kan utföras på olika sätt. Vi kommer här att använda oss av en något förenklad variant. Vi kan anta att händelsen i detta fall består utav att ett byte av VD annonserats. Frågan är då huruvida det skickar en signal till marknaden, vilken påverkar den förväntade avkastningen på kort sikt. I den studerade branschen genomfördes 42 stycken byten av VD inom loppet av fem år, men varje grupp erhåller endast ett slumpmässigt urval om N = 30 stycken. Handeln i samtliga aktier antas ha hög likviditet. För att avgöra huruvida avvikande avkastning förekommit på kort sikt används en vecka efter att VD bytet annonseras, vilket sker vid tidpunkten T = 0. Misstanke nns dock om läckage av nyheten varför även avkastningen veckan innan läggs till det fönster som studeras. Fönstret består således av avkastningen perioden T = 5 till och med T = 5, dvs totalt 11 dagar se gur 1. 5
Figur 1. Tidslinje för en Event study Förväntad avkastning för företag I för tidpunkterna inom fönstret beräknas utifrån en marknadsmodell, baserat på tidsperioden T = 65 till och med T = 6, dvs n = 60 dagar innan händelsefönstret. Först skattas regressionsekvationen R IT = I + I R MT + IT ; IT ~N(0; 2 I ); T = 65; :::; 6,för vart och ett av företagen I, där R IT och R MT är aktieavkastningen respektive marknadsavkastningen (mätt som ränteintensitet). Parameterskattningarna ^ I och ^ I används sedan för att skatta den avvikande avkastningen h under perioden T = 5 till och med T = 5 som: AR IT = R IT ^ I + ^ i I R MT ; (T = 1 60 5; :::; 5). Varianserna för AR IT vid 2 respektive tidpunkt T 3 = V,V = 5; :::; 5, skattas som ^ 2 AR IV = ^ 2 I P 6 T = 65 R MT. 6 41 + 1 n + (R MV M ) 2 P 6 (R MT M ) 2 T = 65 7 5, där M = (Detta är alltså en typ av prognos för varianserna, jämför sidan 613 i Lee, Lee och Lee). För enkelhets skull studeras här endast den summerade avvikande avkastningen (cumulative abnormal return): CAR I = 11 AR IT, vars varians P skattas som ^ 2 CAR I = 5 P V = 5 ^ 2 AR IV. Den genomsnittliga kumulerade avvikande avkastningen för de N företagen beräknas sedan som CAR = 1 CAR NP N I och den skattade variansen som ^ 2 CAR = 1 N 2 i=1 T =1 i=1 NP ^ 2 CAR I. Under nollhypotesen om ingen genomsnittlig kumulativ avvikande avkastning kan antas att CAR ~t (N CAR N 1 frihetsgrader. 1), dvs t-fördelad med 6
I variablerna cari[,gruppnummer] samt carivar[,gruppnummer] åter nns CAR I och ^ 2 CAR I för N 1 företag undantaget det som motsvarar ert gruppnummer. Aktiekurs och indexkurs för det saknade företaget åter nns i variablerna comp[,gruppnummer] och index[,gruppnummer]. Båda dessa omfattar tidsperioden T 66 till och med T + 5. Tips! Stressa inte igenom uppgifterna, utan ta dem steg för så minskar risken att ni gör något slarvfel. Var bl.a. observanta på när ni använder varianser respektive standardavvikelser. 4.1 Marknadsmodellen 4.1.1 Beräkna parameterskattningarna utifrån marknadsmodellen för det företag(=gruppnummer) som dessa saknas för. Tips! Betänk att index[,gruppnummer] och comp[,gruppnummer] endast innehåller kurserna för jämförelseindex och aktien och inget annat. (4.1.2) Denna del är ej obligatorisk, men har ni gjort den är det ej till nackdel vid totalbedömningen av uppgiften. Undersök residualerna för marknadsmodellen. Verkar regressionsantagandena vara uppfyllda? 4.1.3 Vad blir ^ 2 AR IV för V = 0? 4.1.4 Beräkna CAR I och ^ 2 CAR I för det företag som dessa saknas för. 4.2 Hypotestest 4.2.1 Testa på lämpligt sett hypotesen att E[CAR] = 0, dvs att det inte förekommer någon genomsnittlig kumulerad avvikande avkastning. Ni kan skatta 2 med ^2. CAR CAR 4.2.2 Antag att en analytiker (som ej haft tillgång till det det kvantitativa materialet) klassi cerat VD-bytena utifrån om de skett under en krissituation eller under mer normala förhållanden. I variabeln analytic[,gruppnummer] åter nns denna information, där ANALY T IC = 1 betecknar en krissituation och ANALY T IC = 0 ett icke krisartat byte. Testa på lämpligt sätt hypotesen att E[CARjAN ALY T IC = 1] E[CARjAN ALY T IC = 0], dvs att den genomsnittliga kumulerade avvikande avkastningen skulle vara större då VD bytet skett vid en krissituation. Antag att grupperna har samma varians, dvs ni behöver inte testa hypotesen [ 2 janaly T IC = CAR 1] = [ 2 janaly T IC = 0]. CAR 7
Lycka till! Se till att hålla inlämningstiden, måndagen den 19/1 klockan 12.00, annars kommer er uppgift inte att rättas alls. 8