Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna kan vara diskreta eller kontinuerliga. Man pratar då om diskreta- respektive kontinuerliga stokastiska processer. Om tiden räknas upp av en en mängd som 1, 2,... säges tiden vara diskret. Det motsvarar att man träffar på de stokastiska variablerna vid bestämda tidpunkter där en viss tid har förflutit emellan. Tidpunkterna kan vara sekunder, minuter, timmar, dagar, veckor, månader eller år. I alla stokastiska processer med diskret tid finns det ett beroende mellan de ingående variablerna X 1, X 2,....
Stokastiska processer med kontinuerlig tid När tiden är kontinuerlig så har man all tid mellan alla tidpunkter hur nära de än är varandra! Man har så att säga all tid! Då säger man att man har en familj av stokastiska variabler {X (t), t T }. De stokastiska variablerna i familjen kan återigen vara diskreta eller kontinuerliga. Man pratar då om diskreta- respektive kontinuerliga stokastiska processer i kontinuerlig tid. Kontinuerlig tid motsvarar att man mäter hela tiden utan upphåll. Vi påminner: i alla stokastiska processer med kontinuerlig tid finns det ett beroende mellan två variabler X ti och X tj.
Typologi för våra stokastiska processer Process\Tid Diskret Kontinuerlig Diskret Markovkedjor, slumpvandring Kontinuerlig ARIMA Brownsk rörelse
Diskret process i diskret tid
Diskret process i diskret tid
Kontinuerlig process i diskret tid
Kontinuerlig process i kontinuerlig tid
Tidsserier, korrelation och stokastiska processer Låt oss säga att vi har en tidsserie x 1, x 2,..., x n. Eftersom dessa mätvärden har observerats i ekvidistanta tidpunkter, så skulle en modell för denna tidsserie vara en stokastiska process i diskret tid. Då mätvärdena inte nödvändigtvis är heltal, så är det vettigt att anta att varje observation är gjord på en kontinuerlig stokastisk variabel. Vi söker alltså en kontinuerlig stokastisk process i diskret tid som sannolikhetsmodell för tidsserien x 1, x 2,..., x n. Det finns alltid korrelation mellan observationerna i en tidsserie. De ingående stokastiska variablerna X 1, X 2,... är således beroende.
Korrelation och realiseringar Vi söker stokastiska processer som har intressanta realiseringar i den meningen att de ser ut som verklighetens tidsserier. Vi kan då tänka att vi har en maskin som kan trolla fram den tidsserie vi är intresserade av. Det visar sig att ARIMA-modellerna kan ge realistiska realiseringar. Andra krav är att modellerna ska vara hanterbara, d v s inte för komplicerade.
Vitt brus Det finns två stokastiska processer som är viktiga för förståelsen av ARIMA-modeller: - Vitt brus (White noise). Det är den enklaste av stokastiska processer. Y t = a t I ett vitt brus saknas mönster (dvs. ingen trend, säsong etc.). Det består av en följd av stokastiska variabler a t, som alla är sinsemellan oberoende (ingen korrelation!) och lika fördelade med väntevärde 0 och konstant varians σ 2. Om det vita bruset dessutom är normalfördelat, har vi vad som kallas Gaussiskt vitt brus. Processen används mycket sällan för prognoser, men är en viktig grundpelare för mer avancerade tidsseriemodeller.
Slumpvandring - Slumpvandring (Random Walk). Y t = Y t 1 + a t, där a t är vitt brus. Y t = Y t 1 + a t = (Y t 2 + a t 1 ) + a t = Y t 2 + a t 1 + a t = (Y t 3 + a t 2 ) + a t 1 + a t = Y t 3 + a t 2 + a t 1 + a t. = Y 0 + a 1 + a 2 + + a t 2 + a t 1 + a t Här ser vi att Y t är en summa av oberoende stokastiska variabler, samt en konstant Y 0.
Autoregressiva modeller av olika ordning I modellerna nedan antas a t vara en följd av (gaussiskt) vitt brus. AR(1)-modellen Y t = φ 1 Y t 1 + a t AR(2)-modellen Y t = φ 1 Y t 1 + φ 2 Y t 2 + a t AR(p)-modellen Y t = φ 1 Y t 1 + φ 2 Y t 2 +... + φ p Y t p + a t
Glidande medelvärdes-modeller av olika ordning MA(1)-modellen Y t = a t θ 1 a t 1 MA(2)-modellen Y t = a t θ 1 a t 1 θ 2 a t 2 MA(q)-modellen Y t = a t θ 1 a t 1 θ 2 a t 2... θ q a t q
ARMA-modeller: I vissa fall används kombinationer av AR, och MA-modeller, t.ex. ARMA(p,q): Y t = φ 1 Y t 1 +φ 2 Y t 2 +...+φ p Y t p +a t θ 1 a t 1 θ 2 a t 2... θ q a t q
Stationäritet-struktur på den stokastiska processen ARIMA-modellerna ställer andra krav på tidsserien än tidigare. Det viktigaste kravet nu är stationäritet, vilket innebär att modellen kräver att tidsserien ska ha: (1) Konstant väntevärde (2) Konstant varians σ 2 I allmänhet är inte tidsserier inte stationära utan man måste tillämpa vissa tekniker för att transformera dem så att den transformerade serien blir stationär.
AR(1) modellens egenskaper Den autoregressiva modellen av ordning 1, AR(1), har följande form z t = φ 1 z t 1 + a t. Konstanten φ 1 är en okänd parameter som måste skattas utifrån stickprovet, och slumptermen a t är vitt brus. Ibland vill man en konstant med i modellen som då skrivs: z t = δ + φ 1 z t 1 + a t Det teoretiska medelvärdet fås genom att vi tar väntevärdet av båda sidor: E(z t ) = δ + φ 1 E (z t 1 ) + E (a t ) (1)
AR(1) modellens egenskaper Eftersom z t antas vara stationär gäller att E(z t ) = E (z t 1 ) = µ så att (1) kan skrivas som dvs. µ = δ + φ 1 µ + 0 µ = δ 1 φ 1 För att räkna ut den teoretiska variansen använder vi en annan form på modellen. Låt δ = µ (1 φ 1 ), d v s z t = µ (1 φ 1 ) + φ 1 z t 1 + a t eller (z t µ) = φ 1 (z t 1 µ) + a t (2)
AR(1) modellens egenskaper Kvadrera bägge sidor av (2) och tag väntevärdet av resultatet, vilket ger E (z t µ) 2 = φ 2 1E (z t 1 µ) 2 +2φ 1 E [(z t 1 µ) a t ]+E ( a 2 t ) (3) Då z t är stationär, så har vi E (z t µ) 2 = E (z t 1 µ) 2 = V (z t ) Vilket medför att vi kan skriva om (3) som: V (z t ) = φ 2 1V (z t ) + 0 + σ 2 a dvs. σ2 a V (z t ) = 1 φ 2 1
AR(1) modellens egenskaper Vi skriver (igen) AR(1)-processen på formen z t µ = φ 1 (z t 1 µ) + a t, Multiplicera på bägge sidor med (z t k µ), så (z t k µ)(z t µ) = φ 1 (z t k µ)(z t 1 µ) + (z t k µ)a t Om vi tar väntevärdet på varje sida, erhåller vi E [(z t k µ)(z t µ)] = φ 1 E [(z t k µ)(z t 1 µ)] + 0. Kovariansen mellan z t och z t k definieras som Cov(z t k, z t ) = E [(z t k µ)(z t µ)].
AR(1) modellens egenskaper Alltså kan vi skriva Cov(z t k, z t ) = φ 1 Cov(z t k, z t 1 ) och eftersom ρ k = Cov(z t k,z t) Var(z t) fås att ρ k = φ 1 ρ k 1. Efter rekursiv utveckling av ρ k 1 fås att den teoretiska autokorrelationsfunktionen för AR(1)-modellen är: ρ k = φ k 1 Det går att visa att den partiella korrelationsfunktionen för AR(1)-processen är: { ρ1 = φ ρ kk = 1 k = 1, 0 om k 2.
Effekten av olika värden på φ 1 Vi vet att AR(1)-modellen är stationär, om 1 < φ 1 < 1. I figuren ser vi hur realiseringarna förändras då φ 1 antar olika värden i detta intervall. (I figuren används istället beteckningen a 1 för φ 1.)