Lunds Universitet Ekonomihögskolan Statistiska Institutionen STAB 13 VT11 Hemuppgift 3 modellval och estimering 1 Inledning Denna hemuppgift är uppdelad i två delar. I den första ska ni med hjälp av olika simuleringar studera tekniken för hur man väljer modellordning i en tidsserie och med olika metoder skatta dess parametrar. Ni ska också studera hur skattningstekniken beror av tidsseriens längd stickprovsstorleken. I den andra delen ska ni välja modellordning och skatta parametrarna i en given tidsserie. Ni ska också validera er givna modell med hjälp av tekniken enligt kapitel 8 i grundboken. Hemuppgiften redovisas med en kort rapport där ni beskriver tillvägagångssättet vid analysen samt era slutsatser. Valda modeller ska valideras på sedvanligt sätt är parametrarna signikanta, vilken fördelning har residualerna, nns det någon beroende struktur hos dessa, etc. Bakgrundsteorin som behövs för att genomföra hemuppgiften nns i kapitel 6, 7 samt 8 i kursboken: Time series Analysis, Cryer & Chan, 2008. Om rapporten lämnas in via e-mail ska den vara i pdf-format. [e-mail: pegus@maths.lth.se] Hemuppgiften ska lämnas in senast mån 23/5 kl 17.00 1.1 Förberedelseuppgifter a) Under förutsättning att vi har använt Maximum-Likelihoodmetoden för att skatta parametrarna i en AR(2)-process, Y (t) = φ 1 Y (t 1) + φ 2 Y (t 2) + e(t). Bestäm ett 95% kondensintervall för parametrarna φ 1 och φ 2, samt det vita brusets varians σ 2 e. b) Parametern θ i en MA(1)-process har skattats med hjälp av moment metoden, θ MM. Om vi istället hade använt ML-metoden och fått skattningen θ ML. Vilken av skattningarna är eektivast. Hur stor är kvoten (approximativt) mellan dessa skattningars varians, V [θ MM ] V [θml]? c) Antag att vi har skattat korrelationsfunktionen ρ k för en AR(p)-process, sätt upp ett 95% kondensintervall för ρ k när k > p. d) Antag att vi har skattat korrelationsfunktionen ρ k för en MA(q)-process, sätt upp ett 95% kondensintervall för ρ k när k > q. e) Antag att vi har skattat residualerna i en AR(2)-modell ê t = Y (t) ˆ Y (t). Bestäm ett 95% kondensintervall för ˆr 1 respektive ˆr 2. Hur ser motsvarande kondensintervall för en MA(2) process ut? 1
2 ML- och MK-skattning av ARMA(p,q)-processer I denna uppgift ska ni studera ML- respektive MK-skattningarna av parametrarna i ARMA(p,q) processer och hur dessa beror av tidsseriens längd. Välj en AR(1)- en MA(1)- samt en ARMA(1,1)-process med lämpliga värden på parametrarna. Simulera tre olika tidsserier av olika längd för dessa tre processer, n=100, n=200 samt n=1000. Skatta modellordning för respektive simulering med hjälp av acf-, pacf- samt eacf-funktionen i R. Efter att ha skattat respektive modellorning untnyttja denna och identiera skattningarna av parametrarna i respektive simulering dels med MK-tekniken (method='css') samt med ML-tekniken (method='ml') använd funktionen arima(...) i R. Hur pass bra fungerar respektive teknik bilda lämpligt kondensintervall för respektive skattning och jämför dem med de valda värden på parametrarna. Välj en ARMA(p,q)-process av högre ordning (tex p=2, q=2) och undersök denna på motsvarande sätt. 3 Modellval Identiera en lämplig modell, ARMA(p,q), för den stokastiska komponenten X(t) för en av två följande tidsserier Y (t) = µ(t)+x(t). Nederbörd Los Angeles, data(larain) eller CO 2 -koncentration Alert Canada, data(co2). Ni ska validera er modell med hjälp av residualerna i X(t) enligt kap 8 i Cryer & Chan. Ni ska alltså studera residualerna från er skattade modell avvikelsen mellan observerat och skattat värde, ê i = X ˆX i. Residualernas statistiska egenskaper, fördelning, väntevärde samt varians och inte minst autokorrelation och signikans ska undersökas. Om det behövs ska ni först avtrendiera tidsserien enligt gängse teknik antingen genom att identiera en lämplig trendfunktion µ(t) eller genom att utnyttja dierensbildning, Y (t). 3.1 R-cod arima.sim(...) arima(...) ar(...) LB.test(...) Ljung-Box-test. runs(...) acf(...), pacf(...), eacf(...) 2
3
4
Lunds universitet Ekonomihögskolan Statistiska Institutionen STAB 13 VT11 laboranter (namn och grupp): handledare: utförd/inlämnad: godkänd: Redovisning av Hemuppgift 3 Randomiseringsteknik etc. Checklista Ja Nej 1. Är alla momenten i labben (inklusive förberedelseuppgifter) utförda? 2. Har rapporten blivit korrekturläst? Är språk- och skrivfel rättade? 3. Är gurer, tabeller och liknande försedda med gurtexter och tydlig numrering? 4. Har alla gurer storheter inskrivna på alla axlar? 5. Är de beräkningar som kan kontrollräknas kontrollräknade? 6. Har du gjort en rimlighetsbedömning av samtliga resultat? 7. Har eventuella orimliga resultat blivit vederbörligen kontrollerade och kommenterade? 8. Är den löpande texten väl strukturerad med tydliga avsnittsrubriker? 9. Är skriften försedd med: Sammanfattning? Innehållsförteckning? Referenslista? Sidnumrering? Datum? 10. Har förutsättningar, förenklingar och gjorda antaganden tydligt redovisats? 11. Är din rapport läsbar utan tillgång till laborationshandledningen? 12. Är detta försättsblad med checklista fullständigt ifyllt?