Innehållsföreckning Sammanfaning 3 Inledning 4. Allmän om idsserier 9. Glidande medelvärde 3. Enkel exponeniell ujämning 5 4. Hol-Winers exponeniella ujämningsmodell 8 4. Hol-Winer uan säsong 8 4. Hol-Winer med säsong 0 4.. Addiiv modell 0 4.. Muliplikaiv modell 5. Box-Jenkins modeller 7 5. Icke-säsongsmodeller 7 5.. AR-modeller 7 5.. MA-modeller 3 5. Säsongsmodeller 3 6. Val av modell 33 6. Allmän om arbesgången 33 6. Box-Jenkins modeller 36 6.. Icke-säsong 4 6.. Säsong 47 7. Analser och jämförelser 54 8. Slusaser 56 Lieraurföreckning 57 Bilaga : Bilaga : Bilaga 3: Bilaga 4: Hur prognoser idigare beräknas på Carlsberg Sverige, och hur de beräknas nu Analser och jämförelser: Produksammansällning e urval Analser och jämförelser: Summering av produkgrupper Analser och jämförelser: 6-veckors prognoser
Sammanfaning Försäljningsprognoserna på Carlsberg Sverige har länge vari brisfälliga, och mcke har prövas. Dea har medför sora kosnader för föreage, både i form av ueblivna försäljningsinäker och i form av kassaion av gamla varor. Därför finns på Carlsberg e sor inresse av denna uppsas, vars sfe är a undersöka huruvida de är möjlig a förbära prognoserna. Tanken är a ine skena iväg i allför komplicerade maemaiska modeller, uan a hålla sig på en nivå där man uan sörre svårighe kan förså och överblicka förloppe. Jag har i denna uppsas behandla sex av de vanligase prognosmodellerna. Någon må vara mer komplicerad än de andra, men ingen är i min mening för komplicerad för a kunna appliceras i brggeribranchen. Modellerna beskrivs förs var och en eoreisk för a därefer undersökas och jämföras. I slusasen rekommenderar jag Hol-Winers modell som i alla produkgrupper visade sig generera bäs prognoser. 3
Inledning Carlsberg Sverige AB ingår i Carlsberg Brewer-koncernen som är en av världens sörsa brggeriföreag. Carlsbergs sorimen är bre, och innehåller bl a varumärken som Pripps, Falcon, Carlsberg, Tuborg, Guiness, Pepsi, Fesis, Vich Nouveau och Ramlösa. De finns på Carlsberg 4 s lagersällen (Bromma, Falkenberg, Göeborg och Umeå), med produkion i Bromma, Falkenberg och Ramlösa. Uöver lagersällena finns även e anal sk omlasningsorer där en sor ranspor lasas om på mindre lasbilar för vidare leverans u ill kund. På omlasningsorerna håller man inge lager. Vanligen sker ransporerna med lasbil men på långa sräckor ( ex Falkenberg-Umeå) ransporeras produkerna med åg. Prognoser för Sverige produceras cenral från Bromma veckovis per arikel och lagersälle. De man har för avsik a prognosicera är den kommande försäljningen av berörd produk. Med försäljning menas den volm av en viss produk (mä i anal kolli) som levereras ill kund. E kolli mosvaras ex av en back, e flak, e fa ec. beroende av vilken produk och förpackningsp de handlar om. I regel lägger man en sk basprognos för produken e hel år fram i iden. Basprognosen är rensad från evenuell säsong och kampanj, och uppdaeras varje vecka då närmas föregående veckoförsäljning av samma produk blir illgänglig. Alla produker har e på förhand besäm säkerheslager (som dock ändras regelbunde i samband med a prognosen ändras), och måle är a dessa genom produkion ska kunna upprähållas. Olika produker produceras på olika produkionsorer, där.ex. Pripps illverkas i Bromma, och Falcon i Falkenberg. Gemensam för dem alla är a prognoserna produceras i Bromma. Dea innebär a flöde varierar beroende på vilken produk vi suderar. Lå oss schemaisk se på de fall där Bromma är ensam försörjare: Umeå (lagersälle) Besällning Bromma (produkion/lager) Göeborg (lagersälle) Besällning Falkenberg (produkion/lager) Ramlösa (produkion) 4
I de fall då Falkenberg är ensam försörjare skickas isälle produkbesällningarna di från Göeborg, Bromma och Umeå. Ramlösa är speciell på de säe a de har produkion, med saknar lager. De ar därför emo besällningar från de re andra orerna, producerar, och levererar. Då Ramlösa ine har någo lagersälle går inga leveranser di. Produken Ramlösa produceras bara jus i Ramlösa (srax uanför Helsingborg), vilke innebär a Ramlösa allid är ensam försörjare för hela lande. Andra delen av flöde visas med nedansående figur Till Resauranger, Service/ dagligvaruhandlar och ssembolag, ev via omlasningsplaser Umeå (lagersälle) Disibuionsorder Bromma (produkion/lager) Göeborg (lagersälle) Disribuionsordrar Falkenberg (produkion/lager) Ramlösa (produkion) Till Resauranger, Service/ dagligvaruhandlar och ssembolag, ev via omlasningsplaser Där de sk disribuionsordrarna hel enkel är leveranser av idigare gjorda besällningar. I beskrivningen av hur förloppe går ill (med prognoser, disibuionsorders ec.) gör vi bäs i a ia på hur lagerpåfllningen går ill i Göeborg och i Umeå. På dessa orer har man enlig idigare lager men ingen egen produkion, vilke innebär a man måse göra besällningar från produkionsorerna. Många produker produceras både i Falkenberg och i Bromma. I dessa fall är de i princip så a Falkenberg försörjer Göeborg, och Bromma försörjer Umeå. Man räknar med a man har re dagars sk ledid från besällning ill leverans, dea innebär a en besällning görs då de är mins vå dagar kvar (enlig prognos) ill de a säkerhesgränsen brs. Prognoser beräknas på Carlsberg veckovis för varje produk. För a få den prognosicerade dagsförsäljningen dividerar man hel enkel veckoprognosen med 5. Efer varje dags slu jämförs prognosen med ufalle samma dag. Lå oss se på e fikiv exempel på dea 5
På en viss produk har Umeå e lagersaldo på 0 000 kollin dag. Produkens prognosicerade veckoförsäljning berörd vecka i Umeå är 5 000 kolli, vilke innebär a dagsprognosen blir 3 000 kollin/dag. Vidare är säkerheslagre på berörd produk 5 000 kollin. Tabell : Fikiv exempel på e förlopp i Umeå Lagersaldo vid Lagersaldo efer Dag Dagens början Dagsprognos Ufall dagens slu 0 000 3 000 850 7 50 7 50 3 000 3 070 4 080 3 4 080 3 000 760 30 4 30 3 000 3 390 7 930 5 7 930 3 000 90 5 00 6 0 00 3 000 890 7 0 7 7 0 3 000 3 0 4 00 8 4 00 3 000 800 0 osv En sk disribuionsorder på 5 000 kollin har levereras Besällning görs Volmen på disribuionsordern är uformad så a den enlig prognos ska räcka e viss anal dagar. I falle ovan är volmen 5 000 kollin vilke innebär a man (om prognosen slår rä) måse få en n order om 5 dagar för a ine gå under säkerhesgränsen. Denna ordervolm förändras dock ofa och såväl orderfrekvens som volm är olika för olika produker. Nedansående figur gör förloppe mer överskådlig Figur : Umeåförloppe i diagram 0000 5000 0000 Prognoser Besällning Leverans av disribuionsorder 5000 0 Dag Dag Dag 3 Dag 4 Dag 5 Dag 6 Dag 7 Dag 8 Dag 9 Lagersaldo Säkerheslager 6
I Bromma, Falkenberg och Ramlösa är siuaionen någo annorlunda efersom man där även har produkion, och därför måse använda si lager ill a disribuera ill Göeborg och Umeå. Hur förloppe på produkionsorerna ser u visas enklas med följande figur Figur : Förloppe i Bromma, Falkenberg och Ramlösa 0000 Prognoser 5000 0000 Disr.order Tillverkning 5000 0 Dag Dag Dag 3 Dag 4 Dag 5 Dag 6 Lagersaldo Säkerheslage r De finns för varje produk e schema med förvänade inkommande produkbesällningar, dessa är således med i beräkningen av när produkion ska ske. Vid produkionen finns de för varje produk en lägsa illverkningsvolm, som bgger på a man illverkar mins en sas av produken. För sörre illverkningsvolmer producerar man vanligen en mulipel av denna sas, dea minimerar kosnaden per enhe. Själva illverkningsiden är ofa lien men är ändå någo man måse a hänsn ill i planerande av produkion, dea efersom man bara kan illverka e begränsa anal produker per dag. Vanlig är a kunderna har - leveransdagar i veckan, men självklar finns här sora variaioner. I regel gör kunderna sina besällningar dagar före leverans. Vad blir då effekerna av en felakig prognos? Om prognoserna är för låga mo den verkliga försäljningen innebär dea a lagersaldo går under säkerheslagre, och i värsa fall a produken ar slu på lagre. Dea leder försås ill ueblivna inäker och missnöjda kunder. Om prognoserna däremo är för höga innebär dea a vi får e överlager på berörd produk. Dea är någo som också kosar då man ofa i bris på lagerurmme måse hra plas på exerna lager. Dessuom kan man vara vungna a kasa drcker som blivi gamla som följd av dea. Hållbarhesiden skiljer sig dock mcke för olika produker. 7
Idag uppdaeras prognoserna varje vecka uesluande med prognosmodellen enkel exponeniell ujämning. Man använder parameervärde = 0., inklusive säsongindex (för mer informaion om hur denna prognos beräknas se bilaga ). Då de fanns anledning a ro a andra prognosmodeller och parameersäningar skulle generera bäre prognoser uppkom idén ill denna uppsas. De finns på föreage e inernprogram (Movex) vari de även exiserar en prognosmodul, där e anal sandardmodeller finns illgängliga (glidande medelvärde, exponeniell ujämning, rendberäkningar ec). Min uppgif är a ssemaisk esa dessa prognosmodeller för olika paramerar, och dessuom esa några ej inom föreage befinliga modeller (Hol-Winer, ARIMA-modeller ec). De är full änkbar a bäsa prognosmodell varierar för olika produker/produkgrupper. Därför analseras och jämförs olika modeller på både produknivå och produkgruppsnivå, dea med förhoppning a se någo mönser. I kapiel ges en inrodukion ill idsserieanals, vidare kommer jag i kap -5 i ord och exempel förklara prognosmodellerna Glidande medelvärde, Enkel exponeniell ujämning, Hol-Winers meod sam Box-Jenkins modeller. Därefer följer e kapiel om hur arbesgången se u, främs för Box-Jenkins modeller. Resen av uppsasen kommer beså av analser av dessa modeller för olika produker. Slusaser, referenslisa och bilagor avsluar uppsasen. 8
Inledning Carlsberg Sverige AB ingår i Carlsberg Brewer-koncernen som är en av världens sörsa brggeriföreag. Carlsbergs sorimen är bre, och innehåller bl a varumärken som Pripps, Falcon, Carlsberg, Tuborg, Guiness, Pepsi, Fesis, Vich Nouveau och Ramlösa. De finns på Carlsberg 4 s lagersällen (Bromma, Falkenberg, Göeborg och Umeå), med produkion i Bromma, Falkenberg och Ramlösa. Uöver lagersällena finns även e anal sk omlasningsorer där en sor ranspor lasas om på mindre lasbilar för vidare leverans u ill kund. På omlasningsorerna håller man inge lager. Vanligen sker ransporerna med lasbil men på långa sräckor ( ex Falkenberg-Umeå) ransporeras produkerna med åg. Prognoser för Sverige produceras cenral från Bromma veckovis per arikel och lagersälle. De man har för avsik a prognosicera är den kommande försäljningen av berörd produk. Med försäljning menas den volm av en viss produk (mä i anal kolli) som levereras ill kund. E kolli mosvaras ex av en back, e flak, e fa ec. beroende av vilken produk och förpackningsp de handlar om. I regel lägger man en sk basprognos för produken e hel år fram i iden. Basprognosen är rensad från evenuell säsong och kampanj, och uppdaeras varje vecka då närmas föregående veckoförsäljning av samma produk blir illgänglig. Alla produker har e på förhand besäm säkerheslager (som dock ändras regelbunde i samband med a prognosen ändras), och måle är a dessa genom produkion ska kunna upprähållas. Olika produker produceras på olika produkionsorer, där.ex. Pripps illverkas i Bromma, och Falcon i Falkenberg. Gemensam för dem alla är a prognoserna produceras i Bromma. Dea innebär a flöde varierar beroende på vilken produk vi suderar. Lå oss schemaisk se på de fall där Bromma är ensam försörjare: Umeå (lagersälle) Besällning Bromma (produkion/lager) Göeborg (lagersälle) Besällning Falkenberg (produkion/lager) Ramlösa (produkion) 4
I de fall då Falkenberg är ensam försörjare skickas isälle produkbesällningarna di från Göeborg, Bromma och Umeå. Ramlösa är speciell på de säe a de har produkion, med saknar lager. De ar därför emo besällningar från de re andra orerna, producerar, och levererar. Då Ramlösa ine har någo lagersälle går inga leveranser di. Produken Ramlösa produceras bara jus i Ramlösa (srax uanför Helsingborg), vilke innebär a Ramlösa allid är ensam försörjare för hela lande. Andra delen av flöde visas med nedansående figur Till Resauranger, Service/ dagligvaruhandlar och ssembolag, ev via omlasningsplaser Umeå (lagersälle) Disibuionsorder Bromma (produkion/lager) Göeborg (lagersälle) Disribuionsordrar Falkenberg (produkion/lager) Ramlösa (produkion) Till Resauranger, Service/ dagligvaruhandlar och ssembolag, ev via omlasningsplaser Där de sk disribuionsordrarna hel enkel är leveranser av idigare gjorda besällningar. I beskrivningen av hur förloppe går ill (med prognoser, disibuionsorders ec.) gör vi bäs i a ia på hur lagerpåfllningen går ill i Göeborg och i Umeå. På dessa orer har man enlig idigare lager men ingen egen produkion, vilke innebär a man måse göra besällningar från produkionsorerna. Många produker produceras både i Falkenberg och i Bromma. I dessa fall är de i princip så a Falkenberg försörjer Göeborg, och Bromma försörjer Umeå. Man räknar med a man har re dagars sk ledid från besällning ill leverans, dea innebär a en besällning görs då de är mins vå dagar kvar (enlig prognos) ill de a säkerhesgränsen brs. Prognoser beräknas på Carlsberg veckovis för varje produk. För a få den prognosicerade dagsförsäljningen dividerar man hel enkel veckoprognosen med 5. Efer varje dags slu jämförs prognosen med ufalle samma dag. Lå oss se på e fikiv exempel på dea 5
På en viss produk har Umeå e lagersaldo på 0 000 kollin dag. Produkens prognosicerade veckoförsäljning berörd vecka i Umeå är 5 000 kolli, vilke innebär a dagsprognosen blir 3 000 kollin/dag. Vidare är säkerheslagre på berörd produk 5 000 kollin. Tabell : Fikiv exempel på e förlopp i Umeå Lagersaldo vid Lagersaldo efer Dag Dagens början Dagsprognos Ufall dagens slu 0 000 3 000 850 7 50 7 50 3 000 3 070 4 080 3 4 080 3 000 760 30 4 30 3 000 3 390 7 930 5 7 930 3 000 90 5 00 6 0 00 3 000 890 7 0 7 7 0 3 000 3 0 4 00 8 4 00 3 000 800 0 osv En sk disribuionsorder på 5 000 kollin har levereras Besällning görs Volmen på disribuionsordern är uformad så a den enlig prognos ska räcka e viss anal dagar. I falle ovan är volmen 5 000 kollin vilke innebär a man (om prognosen slår rä) måse få en n order om 5 dagar för a ine gå under säkerhesgränsen. Denna ordervolm förändras dock ofa och såväl orderfrekvens som volm är olika för olika produker. Nedansående figur gör förloppe mer överskådlig Figur : Umeåförloppe i diagram 0000 5000 0000 Prognoser Besällning Leverans av disribuionsorder 5000 0 Dag Dag Dag 3 Dag 4 Dag 5 Dag 6 Dag 7 Dag 8 Dag 9 Lagersaldo Säkerheslager 6
I Bromma, Falkenberg och Ramlösa är siuaionen någo annorlunda efersom man där även har produkion, och därför måse använda si lager ill a disribuera ill Göeborg och Umeå. Hur förloppe på produkionsorerna ser u visas enklas med följande figur Figur : Förloppe i Bromma, Falkenberg och Ramlösa 0000 Prognoser 5000 0000 Disr.order Tillverkning 5000 0 Dag Dag Dag 3 Dag 4 Dag 5 Dag 6 Lagersaldo Säkerheslage r De finns för varje produk e schema med förvänade inkommande produkbesällningar, dessa är således med i beräkningen av när produkion ska ske. Vid produkionen finns de för varje produk en lägsa illverkningsvolm, som bgger på a man illverkar mins en sas av produken. För sörre illverkningsvolmer producerar man vanligen en mulipel av denna sas, dea minimerar kosnaden per enhe. Själva illverkningsiden är ofa lien men är ändå någo man måse a hänsn ill i planerande av produkion, dea efersom man bara kan illverka e begränsa anal produker per dag. Vanlig är a kunderna har - leveransdagar i veckan, men självklar finns här sora variaioner. I regel gör kunderna sina besällningar dagar före leverans. Vad blir då effekerna av en felakig prognos? Om prognoserna är för låga mo den verkliga försäljningen innebär dea a lagersaldo går under säkerheslagre, och i värsa fall a produken ar slu på lagre. Dea leder försås ill ueblivna inäker och missnöjda kunder. Om prognoserna däremo är för höga innebär dea a vi får e överlager på berörd produk. Dea är någo som också kosar då man ofa i bris på lagerurmme måse hra plas på exerna lager. Dessuom kan man vara vungna a kasa drcker som blivi gamla som följd av dea. Hållbarhesiden skiljer sig dock mcke för olika produker. 7
Idag uppdaeras prognoserna varje vecka uesluande med prognosmodellen enkel exponeniell ujämning. Man använder parameervärde = 0., inklusive säsongindex (för mer informaion om hur denna prognos beräknas se bilaga ). Då de fanns anledning a ro a andra prognosmodeller och parameersäningar skulle generera bäre prognoser uppkom idén ill denna uppsas. De finns på föreage e inernprogram (Movex) vari de även exiserar en prognosmodul, där e anal sandardmodeller finns illgängliga (glidande medelvärde, exponeniell ujämning, rendberäkningar ec). Min uppgif är a ssemaisk esa dessa prognosmodeller för olika paramerar, och dessuom esa några ej inom föreage befinliga modeller (Hol-Winer, ARIMA-modeller ec). De är full änkbar a bäsa prognosmodell varierar för olika produker/produkgrupper. Därför analseras och jämförs olika modeller på både produknivå och produkgruppsnivå, dea med förhoppning a se någo mönser. I kapiel ges en inrodukion ill idsserieanals, vidare kommer jag i kap -5 i ord och exempel förklara prognosmodellerna Glidande medelvärde, Enkel exponeniell ujämning, Hol-Winers meod sam Box-Jenkins modeller. Därefer följer e kapiel om hur arbesgången se u, främs för Box-Jenkins modeller. Resen av uppsasen kommer beså av analser av dessa modeller för olika produker. Slusaser, referenslisa och bilagor avsluar uppsasen. 8
. Allmän om idsserier När man mäer en variabel regelbunde ex varje dag klockan olv, den 5:e varje månad eller den januari varje år bildar observaionerna en idsserie. Observaionerna i en idsserie kan avse förhållande vid en viss idpunk, ex anale ansällda på e föreag den januari eller förändringen under en viss idsperiod ex anale nansällningar under januari månad. Ibland är observaionerna någon form av genomsnisvärden för de perioder som suderas, ex årsmedelförsäljning av en viss vara.observaionerna i en idsserie bör naurligvis som varje saisisk maerial granskas med sun förnuf. Till egendomlig avvikande värden kan de finnas enkla förklaringar. Har man en idsserie som ex beskriver en varas pris under en längre period är de vikig a de verkligen är samma vara hela iden och a inga kvaliesförändringar har äg rum. Ibland förekommer bro i idsserien, vilke innebär a definiionen av variabeln har ändras under undersökningsperioden.tidsserier innehåller speciella egenskaper som möjliggör uvecklande av saisiska meoder för dess anals. De allra flesa ekniker inom daaanalsen baseras på anagande om slumpmässig urval, dvs a observaioner i daaserien är oberoende av varandra. Inom idsserieanalsen kan man väldig sällan göra dea anagande, isälle anar man a observaionerna är beroende av varandra på någo sä. T ex kan man ana a den akuella försäljningen av en viss produk i viss mån är beroende av försäljningen den närmas föregående perioden. De är jus dea anagande om beroende mellan observaioner i en idsserie som möjliggör prognoser av densamma. I radiionell idsserieanals brukar man ala om fra olika variaionsorsaker, nämligen rend, konjunkur, säsong och slump. Dessa måse man a hänsn ill vid produkionen av prognoser. Dessa fra komponener har följande innebörd. Med rend menas uvecklingen i sor under en längre idsperiod, dvs den uveckling som sker om vi borser från illfälliga och korsikiga variaioner. Trenden kan för vissa idsserier följa e mcke komplicera mönser. Men ofa är de också möjlig a beskriva renden med en enkel maemaisk modell. Om man mäer en variabel vid samma idpunk ill exempel den försa januari en gång om åre och finner a den årliga förändringen absolu se är ungefär densamma från år ill år säger man a renden är linjär. Dea innebär a idsserien grafisk och maemaisk kan beskrivas som en rä linje. Finner man a de relaiva (procenuella) årliga förändringarna är ungefär desamma för varje år säger man a uvecklingen är exponeniell. Då kan man använda exponenialfunkionen för a beskriva idsserien. Även andra maemaiska funkioner, ex polnom av andra eller redje graden och även högre gradal, används ibland för a approximera renden Kring renden i en idsserie med ekonomiska daa kan de finnas mer eller mindre regelbundna svängningar, som beror på konjunkuren. För a analsera sådana svängningar måse vi sudera idsserien under en mcke lång följd av år. Arbeslösheen i e land och världsmarknadsprise på olika råvaror är båda exempel på ekonomiska variabler som kan påverkas av konjunkursvängningar. Denna konjunkurkomponen kommer ine a as hänsn ill i denna uppsas. 9
I vissa idsserier finner vi a svängningarna kring renden sker enlig e mcke besäm och kanske också komplicera mönser, som hela iden upprepar sig med lika långa idsinervall. Man säger a de förekommer säsongsvariaion eller a variaionen är periodisk. Dessa perioder är hela iden lika långa: e dgn (om man suderar ex emperaur), en vecka (om man ex suderar försäljningen av en veckoidning), en månad (om man ex suderar hur mcke pengar som finns på e lönekono) eller e år (om man ex åerigen suderar emperaur). Vi kommer senare i den uppsas söa på olika former av säsongsvariaion som är knuen ill olika produker En sor del av de svängningar som förekommer i en idsserie kan förklaras med begreppen rend, konjunkur och säsong. Men observaionerna i en idsserie är ibland också e resula av en rad illfälligheer, som spela en roll vid undersökningsillfälle och påverkas också av olika per av mäfel. Dessa variaionsorsaker är allså illfälliga; man alar om slumpmässiga variaioner. I begreppe slumpmässig ligger då a observaionerna ine ssemaisk påverkas i en viss rikning, dvs om man beräknar summan av de slumpmässiga avvikelserna för e sor anal observaioner bör denna eoreisk sä vara nära noll (sora alens lag). Om man däremo bara suderar e fåal observaioner finns de naurligvis allid en risk a slumpfelen snedvrider resulae. När man analserar en idsserie ugår man ofa från en muliplikaiv modell, vilke innebär a man uppfaar observaionerna som en produk av de variaionsorsaker vi har diskuera Trend Konjunkur Säsong Slump Genom a bearbea idsserien på olika sä försöker man mäa dessa variaionsorsaker och på så sä få underlag för prognoser. I vissa fall (se bl.a. Hol-Winers addiiva modell, kap 4..) suderar man en addiiv modell, vilke innebär a man isälle berakar observaioner som en summa av de fra variaionskomponenerna ovan: Trend + Konjunkur + Säsong + Slump Tidigare koncenrerade man sig inom idsserieanalsen främs på a isolera de olika komponenerna så a vid varje given idpunk, urcker en observaion som en sammansäning av rend, säsong, konjunkur och slump. Nuföriden konsrueras vanligen en formell modell, där närvaron av komponenerna sker aningen explici eller implici, i sfe a beskriva idsseriers beeende. Då man bildar en modell finns vå möjliga sä a behandla dessa fra komponener. En möjlighe är a se dem som konsana över iden, ex kan renden represeneras som en rä linje (linjär rend) eller av någon annan algebraisk funkion. Dea angreppssä är ofa användbar i analsen av fsiska eller kemiska daamängder ( ex bakerieuvecklingar), men är ofa ine lämplig i ekonomiska illämpningar. I ekonomiska sammanhang bör man vara försikig med a dra förhasade slusaser om rend, säsong ec, då ofa reguljärieerna är skenbara. För ekonomiska daa är de lämplig med en annan behandling av de fra komponenerna. Isälle för a se dem som konsana, bör man se komponenerna som sändig föränderliga över iden. Lå oss se på e enkel exempel. I figur. övers på näsa sida har vi den fikiva försäljningsuvecklingen vecka för vecka under försa halvåre 00 för en viss vara. 0
Figur.: Försäljningsuveckling försa halvåre 00 Försäljning (k) 000 950 900 850 800 750 700 650 600 550 500 3 5 7 9 3 5 7 9 3 5 Vecka Genom a beraka figuren ovan kan man enkel dra (den förhasade) slusasen a renden är posiiv och a den är linjär. De är san a försäljningen ökar mer eller mindre konsan, men fele ligger i a vi har en mcke begränsad idsserie. Försäljningssiffror är ofa säsongsbeingade, därför är de olämplig a ro a den posiiva linjära renden ska forsäa. Lå oss nu lägga ill försäljningen för andra halvåre 000 och 00. Figur.: Försäljningsuvecklingen juli 000-december 00 050 Försäljning (k) 950 850 750 650 550 450 5 9 3 7 5 9 33 37 4 45 49 53 57 6 65 69 73 77 Vecka Uvecklingen är då vi lag ill vå halvårs försäljningssiffror ine alls längre linjär. Figur. ovan visar på e dlig säsongsmönser. Försäljningen verkar öka ill sommaren, för sedan sjunka under vinerhalvåre. De är ine ovanlig med denna sors mönser, ex kan man ana a försäljningen av glass, kalla drcker ec ökar på sommaren. Omvän mönser visar förmodligen försäljningen av varma kläder, förbrukningen av el ec.
. Allmän om idsserier När man mäer en variabel regelbunde ex varje dag klockan olv, den 5:e varje månad eller den januari varje år bildar observaionerna en idsserie. Observaionerna i en idsserie kan avse förhållande vid en viss idpunk, ex anale ansällda på e föreag den januari eller förändringen under en viss idsperiod ex anale nansällningar under januari månad. Ibland är observaionerna någon form av genomsnisvärden för de perioder som suderas, ex årsmedelförsäljning av en viss vara.observaionerna i en idsserie bör naurligvis som varje saisisk maerial granskas med sun förnuf. Till egendomlig avvikande värden kan de finnas enkla förklaringar. Har man en idsserie som ex beskriver en varas pris under en längre period är de vikig a de verkligen är samma vara hela iden och a inga kvaliesförändringar har äg rum. Ibland förekommer bro i idsserien, vilke innebär a definiionen av variabeln har ändras under undersökningsperioden.tidsserier innehåller speciella egenskaper som möjliggör uvecklande av saisiska meoder för dess anals. De allra flesa ekniker inom daaanalsen baseras på anagande om slumpmässig urval, dvs a observaioner i daaserien är oberoende av varandra. Inom idsserieanalsen kan man väldig sällan göra dea anagande, isälle anar man a observaionerna är beroende av varandra på någo sä. T ex kan man ana a den akuella försäljningen av en viss produk i viss mån är beroende av försäljningen den närmas föregående perioden. De är jus dea anagande om beroende mellan observaioner i en idsserie som möjliggör prognoser av densamma. I radiionell idsserieanals brukar man ala om fra olika variaionsorsaker, nämligen rend, konjunkur, säsong och slump. Dessa måse man a hänsn ill vid produkionen av prognoser. Dessa fra komponener har följande innebörd. Med rend menas uvecklingen i sor under en längre idsperiod, dvs den uveckling som sker om vi borser från illfälliga och korsikiga variaioner. Trenden kan för vissa idsserier följa e mcke komplicera mönser. Men ofa är de också möjlig a beskriva renden med en enkel maemaisk modell. Om man mäer en variabel vid samma idpunk ill exempel den försa januari en gång om åre och finner a den årliga förändringen absolu se är ungefär densamma från år ill år säger man a renden är linjär. Dea innebär a idsserien grafisk och maemaisk kan beskrivas som en rä linje. Finner man a de relaiva (procenuella) årliga förändringarna är ungefär desamma för varje år säger man a uvecklingen är exponeniell. Då kan man använda exponenialfunkionen för a beskriva idsserien. Även andra maemaiska funkioner, ex polnom av andra eller redje graden och även högre gradal, används ibland för a approximera renden Kring renden i en idsserie med ekonomiska daa kan de finnas mer eller mindre regelbundna svängningar, som beror på konjunkuren. För a analsera sådana svängningar måse vi sudera idsserien under en mcke lång följd av år. Arbeslösheen i e land och världsmarknadsprise på olika råvaror är båda exempel på ekonomiska variabler som kan påverkas av konjunkursvängningar. Denna konjunkurkomponen kommer ine a as hänsn ill i denna uppsas. 9
I vissa idsserier finner vi a svängningarna kring renden sker enlig e mcke besäm och kanske också komplicera mönser, som hela iden upprepar sig med lika långa idsinervall. Man säger a de förekommer säsongsvariaion eller a variaionen är periodisk. Dessa perioder är hela iden lika långa: e dgn (om man suderar ex emperaur), en vecka (om man ex suderar försäljningen av en veckoidning), en månad (om man ex suderar hur mcke pengar som finns på e lönekono) eller e år (om man ex åerigen suderar emperaur). Vi kommer senare i den uppsas söa på olika former av säsongsvariaion som är knuen ill olika produker En sor del av de svängningar som förekommer i en idsserie kan förklaras med begreppen rend, konjunkur och säsong. Men observaionerna i en idsserie är ibland också e resula av en rad illfälligheer, som spela en roll vid undersökningsillfälle och påverkas också av olika per av mäfel. Dessa variaionsorsaker är allså illfälliga; man alar om slumpmässiga variaioner. I begreppe slumpmässig ligger då a observaionerna ine ssemaisk påverkas i en viss rikning, dvs om man beräknar summan av de slumpmässiga avvikelserna för e sor anal observaioner bör denna eoreisk sä vara nära noll (sora alens lag). Om man däremo bara suderar e fåal observaioner finns de naurligvis allid en risk a slumpfelen snedvrider resulae. När man analserar en idsserie ugår man ofa från en muliplikaiv modell, vilke innebär a man uppfaar observaionerna som en produk av de variaionsorsaker vi har diskuera Trend Konjunkur Säsong Slump Genom a bearbea idsserien på olika sä försöker man mäa dessa variaionsorsaker och på så sä få underlag för prognoser. I vissa fall (se bl.a. Hol-Winers addiiva modell, kap 4..) suderar man en addiiv modell, vilke innebär a man isälle berakar observaioner som en summa av de fra variaionskomponenerna ovan: Trend + Konjunkur + Säsong + Slump Tidigare koncenrerade man sig inom idsserieanalsen främs på a isolera de olika komponenerna så a vid varje given idpunk, urcker en observaion som en sammansäning av rend, säsong, konjunkur och slump. Nuföriden konsrueras vanligen en formell modell, där närvaron av komponenerna sker aningen explici eller implici, i sfe a beskriva idsseriers beeende. Då man bildar en modell finns vå möjliga sä a behandla dessa fra komponener. En möjlighe är a se dem som konsana över iden, ex kan renden represeneras som en rä linje (linjär rend) eller av någon annan algebraisk funkion. Dea angreppssä är ofa användbar i analsen av fsiska eller kemiska daamängder ( ex bakerieuvecklingar), men är ofa ine lämplig i ekonomiska illämpningar. I ekonomiska sammanhang bör man vara försikig med a dra förhasade slusaser om rend, säsong ec, då ofa reguljärieerna är skenbara. För ekonomiska daa är de lämplig med en annan behandling av de fra komponenerna. Isälle för a se dem som konsana, bör man se komponenerna som sändig föränderliga över iden. Lå oss se på e enkel exempel. I figur. övers på näsa sida har vi den fikiva försäljningsuvecklingen vecka för vecka under försa halvåre 00 för en viss vara. 0
Figur.: Försäljningsuveckling försa halvåre 00 Försäljning (k) 000 950 900 850 800 750 700 650 600 550 500 3 5 7 9 3 5 7 9 3 5 Vecka Genom a beraka figuren ovan kan man enkel dra (den förhasade) slusasen a renden är posiiv och a den är linjär. De är san a försäljningen ökar mer eller mindre konsan, men fele ligger i a vi har en mcke begränsad idsserie. Försäljningssiffror är ofa säsongsbeingade, därför är de olämplig a ro a den posiiva linjära renden ska forsäa. Lå oss nu lägga ill försäljningen för andra halvåre 000 och 00. Figur.: Försäljningsuvecklingen juli 000-december 00 050 Försäljning (k) 950 850 750 650 550 450 5 9 3 7 5 9 33 37 4 45 49 53 57 6 65 69 73 77 Vecka Uvecklingen är då vi lag ill vå halvårs försäljningssiffror ine alls längre linjär. Figur. ovan visar på e dlig säsongsmönser. Försäljningen verkar öka ill sommaren, för sedan sjunka under vinerhalvåre. De är ine ovanlig med denna sors mönser, ex kan man ana a försäljningen av glass, kalla drcker ec ökar på sommaren. Omvän mönser visar förmodligen försäljningen av varma kläder, förbrukningen av el ec.
Glidande medelvärde Slumpvariabeln i idserier kan i vissa fall vara så sor a den sör den underliggande regelbundenheen. En idserieplo av en sådan serie är ofa svårbedömd, och kräver därför en ujämning av någo slag. Ujämningen kan.ex. ske genom användning av s.k.glidande medelvärden. Denna meod baseras på idén a en sor slumpkomponen i en idserie får mindre effek då den grupperas ihop med dess omedelbara grannar, därefer beräknas medelvärde på gruppen. Den enklase ekniken av den här pen brukar kallas enkla cenrerade glidande medelvärden. ( m -punks glidande medelvärde). Idén här är a ba u varje observaion med medelvärde av sig själv och dess m grannar på vardera sidan, dvs ersäs med m m m...... m m j (.) m m jm De glidande medelvärde sägs vara cenrera efersom är de cenrala värde i äljaren i ovansående ekvaion. Lå oss se på e fikiv exempel. I abellen nedan ses försäljningssiffror (fakurera lier) över produken Pepsi under en 5- veckorsperiod på en viss region. Vi väljer i dea fall m =, dvs e 5- punks glidande medelvärde, dessa värden ses även de i abellen nedan. Tabell.: Pepsiförsäljning under en 5-veckorsperiod, med 5 punks glidande medelvärde Vecka Pepsiförsäljning Ujämnad serie, i fakurera lier m= 806 85 3 93 879 4 90 906 5 9 96 6 940 939 7 95 95 8 978 966 9 968 979 0 99 99 005 00 03 05 3 034 08 4 03 5 056 806 85 93 90 9 5 005 03 034 03 056 5 I figur. högs upp på näsa sida ses en grafisk framsällning av abell.
Figur.: Pepsiförsäljning under en 5-veckorsperiod, med 5 punks glidande medelvärde 00 050 000 950 900 850 800 750 700 650 3 5 7 9 3 5 Pepsiförsäljning i fakurera lier Verklig Pepsiförsäljning Ujämnad serie, m= Vecka Vi ser i figur. ovan a Pepsiförsäljningen verkar ha en posiiv rend. Den dliga renden gör a den ujämnade serien följer den rikiga serien mcke väl. I exemple ovan hade vi givevis få en annan glidande medelvärdesserie om vi använ oss av andra värden på m. Serien blir nämligen mer ujämnad deso sörre vi väljer m, dea efersom ensaka sora variaioner får mindre effek i en sörre grupp. På samma sä reagerar den ujämnade serien snabbare på variaioner i den verkliga idsserien då m väljs lie. I figurerna nedan ser vi exempel på dea fenomen för vå olika m-värden (m=, m=), och vå olika siuaioner Figur.: Periodanales inverkan då eferfrågan siger illfällig 6 5 Figur.3: Periodanales inverkan då eferfrågan siger 6 5 4 3 Verklig eferfrågan m= (n=5) m= (n=3) 4 3 Verklig eferfrågan m= (n=5) m= (n=3) 0 3 4 5 6 7 8 9 0 0 3 4 5 6 7 8 9 0 En nackdel med glidande medelvärden är a den ujämnade serien innehåller färre observaioner än den verkliga idserien. Vi appar m scken observaioner både i början och i slue av idsserien. 3
De finns även möjlighe a göra prognoser med hjälp av glidande medelvärden, den ujämnade serien kommer då a bli någo förskjuen. Dea efersom den ujämnade serien reagerar förs då variaioner förekommer i den rikiga idsserien. Glidande medelvärde beräknas således på valfri anal idigare perioder. Väljer vi.ex. m= (n=3), beräknas prognosen för iden som medelvärde av de re föregående perioderna (-, -, -3). I figurerna nedan ser vi hur prognoserna reagerar i vå olika siuaioner och för olika periodanal. Figur.4: Periodanales inverkan på prognos då eferfrågan siger illfällig Figur.5: Periodanales inverkan på prognos då eferfrågan siger 6 5 6 5 4 3 Verklig eferfrågan m= (n=5) m= (n=3) 4 3 Verklig eferfrågan m= (n=5) m= (n=3) 0 3 4 5 6 7 8 9 0 3 0 3 4 5 6 7 8 9 0 Då vi beräknar prognoser med glidande medelvärden kommer vi ine a erhålla några prognosvärden i början av serien. Vi appar där m+ värden, men ill skillnad från idigare har vi prognosvärden för de senase idpunkerna i den rikiga serien, en förusäning för a kunna åsadkomma framida prognoser. Fler prognosmodeller bgger jus på illämpningar av meoden glidande medelvärden, vi kommer i kapiel 5 beröra en av dem, MA(R) -modellen. 4
5
3. Enkel Exponeniell ujämning Denna prognosmodell är ofa värdefull och formar en bas för andra mer invecklade modeller, bla Hol-Winers meod som vi kommer a sifa närmare bekanskap med i näsa kapiel. Enkel exponeniell ujämning används lämpligen då serien som ska prognosiceras saknar bedande säsong och rend. I ueblivande av dessa komponener är måle a uppskaa den akuella nivån av idsserierna. I förklarande av enkel exponeniell ujämning ser vi förs på vå exremmöjligheer. För de försa kan vi använda oss av endas den allra senase observaionen för a göra våra prognoser. Prognosvärde för idpunk säs då i all enkelhe lika med den för närmas föregående observaionen. I vissa sammanhang lämpar sig fakisk denna meod bra, speciell då vi har väldig lie kunskap om de vi ska prognosicera. Men, i många illämpningar exiserar en bedande slumpkomponen, och de skulle då vara e sor missag a begränsa oss ill endas en enda observaion som prognosunderlag. För de andra skulle vi värom kunna uppskaa den akuella nivån genom e medelvärde av alla de idigare observaionerna. Dea innebär a alla observaionerna ges samma vik, vilke ofa är missledande då senare observaioner förmodligen är mer relevana för framiden än observaioner lång bak i iden. Enkel exponeniell ujämning kompromissar mellan dessa vå exremieer, och erbjuder prognoser baserade på vägda medelvärden. Då man formar dessa vägda medelvärden ges sörs vik vid den allra senase observaionen, näs mes vik å den näs senase osv. E sä a åsadkomma dea är a uppskaa nivån vid idpunken med :..., 0 (3.), Dvs. vikerna är,, som är avagande efersom 0. Om vi ex väljer = /, fås prognoser för framida observaioner genom / / 4 /8... Från 3. ovan kan vi nu uppskaa nivån för den idigare perioden genom... 3, 0 (3.) Vi muliplicerar nu 3. med och får 3..., 0 (3.3) 3 5
Genom a subrahera 3.3 från 3. får vi, 0 (3.4) ( ) som är bekväm a använda vid beräkning av nivåskaningar. Den anger nivån,, vid idpunk som e väg medelvärde av den närmas föregående nivån, och den na observaionen. Vikerna besäms av vale på, som ofa kallas för ujämningskonsanen. De var de om eorin bakom enkel exponeniell ujämning, lå oss nu se på e påhia exempel. I abell 3. nedan åerfinns försäljningssiffror för produken Ramlösa under en 0- veckorsperiod. Tabell 3.: Ramlösaförsäljning i fakurera lier, med Exponeniell ujämning = 0., och = 0.4 Vecka Ramlösaförsäljning, Exponeniell Exponeniell Fakurera Lier ujämning, =0. ujämning, =0.4 53 53 53 60 594, 570,4 3 548 55,6 557,0 4 650 640,3 6,8 5 678 674, 65,9 6 635 638,9 64,8 7 599 603,0 66, 8 69 66,4 63,8 9 69 684,5 664, 0 740 734,5 709,7 69 695,3 698,5 765 758,0 738,4 3 844 835,4 80,8 4 78 787,3 789,9 5 88 87,6 844,6 60 0.9 53 0. 60 0.6 53 0.4 Som vi ser i abell 3. ovan, och kanske ännu dligare i figur 3. på näsa sida är a serien för = 0.4 är mer ujämnad än den för = 0.. Då = 0. ges en påaglig vik å den senase observaionen, och dess serie följer därför den verkliga försäljningsserien väldig väl. Lå oss nu se på abell 3. i e grafisk perspekiv 6
Figur 3.: Ramlösaförsäljning i fakurera lier, med Exponeniell ujämning = 0., och = 0.4 Ramlösaförsäljning i fakurera lier 500 Verklig Ramlösaförsäljning Exp. ujämning (alfa=0.) Exp. ujämning (alfa=0.4) 3 5 7 9 3 5 Vecka Hur ska man då välja ujämningskonsanen,? Har man sora erfarenheer av a analsera daa på en viss produkgrupp så har man förmodligen också goda kunskaper om vilke värde på som passar bäs i de specifika falle. Ofa har man dock ine mcke erfarenhe a förlia sig på. I sådana siuaioner är de ofa användbar a inspekera grafen över daaserien. Om serien verkar innehålla en bedande slumpkomponen vill vi ine ge den allra senase observaionen all för mcke vik, då den kanske ine är speciell indikaiv för framida prognoser. I linje med formel 3.4 bör vi där välja e relaiv hög värde på ujämningskonsanen. Om serien däremo förefaller jämn, bör vi isälle välja e lägre värde på. En mer objekiv meod är a esa olika värden på och hel enkel se vilke som bäs passar på hisoriska idsserier. Man kan då ex beräkna ujämnade serier för = 0., 0.,, 0.9. är prognosen av gjord vid idpunken ( ), blir fele i denna prognos. Om e Man kan vidare för varje värde på man vill esa räkna u summan av de kvadrerade prognosfelen n e n Värde på som ger minsa kvadrerade prognosfel kommer a användas vid framida prognoser. I prakiken används vanligen värden på i inervalle 0. - 0.3, och många saisikprogram, bl a Miniab, använder som sandardinsällning = 0.. 7
7
4. Hol-Winers exponeniella ujämnings modell Många prognosmeoder använder sig av exponeniell ujämning av någo slag. Vi har idigare se på enkel exponeniell ujämning som främs används då serien som ska prognosiceras saknar säsong och rend I de här kapile ska vi sifa bekanskap med en exponeniell ujämningsmeod som lämpligen används då serien innefaar rend och senare även säsong. Förs ska se på siuaionen då vi har rend, men ingen påaglig säsong. 4. Prognoser på serier med rend, ej säsong I den enkla exponeniella ujämningen skaade vi den akuella nivån av en serie, här inkluderar vi även en rendskaning. Trenden beräknas som skillnaden mellan den akuella och den föregående nivån av en serie. Värde av serien vid idpunk skrivs, medan liksom idigare beecknar skaningen av nivån. Trendskaningen beecknas T. Skaningsprincipen av dessa vå kvanieer är relaiv lik den för enkel exponeniell ujämning. De vå skaningsekvaionerna är och T, (0 ) (4..) T T, (0 ) (4..) där och är ujämningskonsaner med värde mellan 0 och. Vi illämpar dessa beräkningar på vår Pepsi-exempel från kapiel. Vi säer och T I abell 4.. högs upp på näsa sida är således =85 och T = 85 806 = 46 Vi använder oss av ujämningskonsanerna = 0,3 och =0,4 8
Tabell 4..: Pepsiförsäljning inklusive nivå, -och rendskaningar enlig Hol-Winers exponeniella ujämningsmeod, med = 0,3 och =0,4 Vecka T 806 85 85,0 46,0 3 93 908,5 5,3 4 90 99,6 7,6 5 9 99,6 6,0 6 940 94,7 3,7 7 95 95,3,8 8 978 973,8 7,6 9 968 975,0 7,8 0 99 988,5, 005 003,4 3,4 03 04,,8 3 034 03,6 5, 4 03 036,4 9,0 5 056 05,8 3,4 I abell 4.. ovan fås ex 3 och T3 som och T 0,7 0,385 46 0,7 93 908, 5 3 0,3 3 0,4 46 0,6908,5 85 5, 3 T 3 0,4T 0,6 3 Vi har i vår Pepsi-exempel en serie,,..., 5 med senase nivå, och rendskaningarna 5 resp T 5. Vid prognoser anas de a renden forsäer efer den senase nivåskaningen. Prognoser för 6 och 7 är således ˆ 6 = 5 + T 5 = 05,8 + 3.4 = 066, ˆ 7 = 5 + T 5 = 05,8 + (3,4) = 079,6 Generell gäller a då man sår vid idpunk n, och vill göra prognoser h idpunker in i framiden ˆ n h = n + ht n 9
4. Prognoser på serier med rend och säsong Dea avsni behandlar en uvidgning av Hol-Winers exponeniella ujämningsmeod, då den även innefaar säsongsvariaioner. I många prakiska illämpningar ar man säsongsfakorn som muliplikaiv, dvs man kan se ex januari månad i en idsserie i ermer av månadsmedelvärden. Liksom idigare anas rendkomponenen vara addiiv. Vi använder även i dea avsni beeckningarna, och T för de observerade värde, nivå resp rendskaningen vid idpunk. Säsongsfakorn beecknas. Om idsserien besår av s perioder per år, beecknas säsongsfakorn för samma period föregående år,. F F s Hol-Winers säsongsmodeller kan vidare delas upp i addiiva och muliplikaiva modeller. Lå oss förs se på den addiiva modellen 4.. Addiiv Hol-Winer Den addiiva Hol-Winer modellen behandlar serier med säsong, med eller uan rend. Nivå, rend och säsongsskaningarna uppdaeras med följande re ekvaioner. T F s, 0 (4...) T T, 0 (4...) F s F, 0 (4...3) där, och är ujämningskonsaner med värde mellan 0 och. En prognos,, ges av ˆ ˆ F (4...4) T s Den addiiva modellen används bäs då säsongssvängningarna ine är proporionella mo sorleken på daa. Figuren nedan är e exempel på en kurva där de särskil lämpar sig med den addiiva Hol-Winer modellen. 0
Figur 4... Icke-proporionell säsongsmönser Noera a de ej behöver exisera någon rend, de cenrala är a säsongssvängningarna är konsana. Lå oss nu se på den andra säsongsmodellen, den muliplikaiva Hol-Winer modellen. 4.. Muliplikaiv Hol-Winer Liksom den addiiva Hol-Winer modellen behandlar även den muliplikaiva modellen serier med säsong, med eller uan rend. Skaningarna av nivån, renden och säsongen uppdaeras av följande re ekvaioner: T, 0 (4...) F s T T, 0 (4...) F F s, 0 (4...3) där, och är ujämningskonsaner med värde mellan 0 och. En prognos,, ges av ˆ ˆ F (4...4) T s Noera a säsongsfakorn i skaningen mulipliceras med T i den muliplikaiva Hol-Winer modellen, isälle för a adderas som i den addiiva. ˆ
I ekvaion 4... är ermen T en skaning av nivån vid idpunk. Denna skaning uppdaeras sedan då en n observaion blir illgänglig. De är nödvändig a a bor säsongsinfluensen från den na observaionen genom a dividera den med senase säsongsskaningen, F s. Säsongsfakorn skaas genom ekvaion 4...3. Den mes akuella skaningen av säsongsfakorn är. Divideras den na observaionen med nivåskaningen ges en F s säsongsfakor /. Den na skaningen av säsongsfakorn är e väg medelvärde av de båda kvanieerna. Till skillnad från den addiiva modellen lämpar sig den muliplikaiva modellen bäs då säsongssvängningarna är proporionella ill sorleken på daa. Se nedansående figur Figur 4... Proporionell säsongsmönser Noera även här a de ine behöver exisera rend för a den muliplikaiva modellen ska fungera. Vi illusrerar nu Hol-Winers muliplikaiva säsongsmodell med e exempel. Lå oss här se på 4 års fikiva försäljningssiffror indelade kvaralsvis för produken Carlsberg Hof. Då vi har kvaralsdaa och de föreligger säsong väljer vi lämpligen vi e 4 punks glidande medelvärde a ugå ifrån då vi gör vidare beräkningar. Dea gör vi efersom vi vill a varje kvaral ska represeneras i vår medelvärde, och dea lika många gånger. Som vi ve från kapiel är e 4 punks glidande medelvärde ej cenrera, vi gör därför bäs i a cenrera den ujämnade serien. I abell 4... övers på näsa sida ses försäljningssiffrorna, nivåskaningar, rendskaningar T sam skaningar av säsongsfakorn F
Tabell 4...: Obs Period Försäljningssiffror för produken Carlsberg Hof, med 4-punks ickecenrera och cenrera glidande medelvärde, sam nivå, rend, -och säsongsskaningar 4-punks glidande medelvärde Cenrera glidande medelvärde 998 Q 560 Q 3945 3 Q3 865 855,00 887,50 4 Q4 3050 90,00 978,75 5 999 Q 80 3037,50 3053,3 6 Q 445 3068,75 3086,5 7 Q3 990 303,75 336,88 0,640 8 Q4 390 370,00 34,38,008 9 000 Q 3085 358,75 373,3 0,933 0 Q 4770 387,50 330,50 330,50 9,37,437 Q3 05 337,50 333,50 330,47 8,67 0,637 Q4 330 3347,50 3365,63 3306,44 7,3,003 3 00 Q 305 3383,75 3405,00 3374,46 37,67 0,945 4 Q 495 346,5 3446,5 346,3 39,7,438 5 Q3 75 3466,5 353,69 68,59 0,644 6 Q4 3470 350,95 37,93 0,99 Där de cenrerade glidande medelvärdena hel enkel räknas u som de e medelvärde av de vå närmase icke-cenrerade glidande medelvärdena. 855 90 887,50 90 3037,50, 978, 75 Vi ser i abell 4... ovan a skaningarna av säsongsfakorn börjar vid idpunk 7, och a nivå och rendskaningarna förs börjar vid idpunk 0. Så är dock allid falle, p g a formlernas (4..., 4... och 4...3) naur. Som sarvärde på den skaade nivå-serien används de cenrerade glidande medelvärde för idpunk 0, 330, 0 50. I figur 4... nedan ses den skaade nivå-serien med den rikiga idsserien. osv. Figur 4...: Verklig Carlsberg Hof-försäljning med nivåskaningar T F Carlsberg Hof-försäljning 5500 5000 4500 4000 3500 3000 500 000 500 000 Försäljning Nivåskaning 3 5 7 9 3 5 Kvaral 3
Trenden vid idpunk 0 kan esimeras som differensen i nivå mellan idpunk 0 och 9, dvs. T 330,50 373,3 0 0 9 9,37 Tabell 4... ger oss vå säsongsskaningar för varje kvaral. För de redje kvarale år 998 fås säsongsfakorn 865 / 887,50 och för samma period år 999 fås fakorn 990 / 336,88. Som sarvärden för skaningarna av säsongsfakorn F använder vi medelvärde av dessa fakorer. Vår skaning av säsongsfakorn för de redje kvarale 000 är således F 865 990 887,50 336,88 7 0,640 och på samma sä för de re övriga kvaralen F 445 4770 3086,5 330,50 0,437 Då dea är gjor kan de reserande värdena beräknas. Vi har i abell 4... använ oss av ujämningskonsanerna =0,5, =0,5 och =0,3. Säer vi in dessa konsaner i ekvaionerna 4...-4...3 får vi 0,5 T 0, 5 (4...5) F 0,5T 0, 5 4 T (4...6) F 0,3F 4 0, 7 (4...7) Vi använder oss nu av dessa ekvaioner för a beräkna nivå, rend och säsongsskaningar. Nivåskaningen för idpunk fås från 4...5 0,5 05 T 0,5 0,5330,50 9,37 0,5 330, 47 0 0 F7 0,640 4
Trendskaningen för idpunk fås genom illämpning av ekvaion 4...6 T 0,5T 0 0,5 0 0,5 9,37 0,5330,46 330,50 8, 67 Till sis ges säsongsskaningen för idpunk från ekvaion 4...7 F 0,3F 0,7 05 0,3 0,640 0,7 330,46 7 0,637 Skaningarna för idpunkerna,3,,6 beräknas på precis samma sä som ovan. Då vi har beräkna skaningar av nivån, renden och säsongen, så kan vi använda dessa i produkionen av framida prognoser. De senase nivå och rendskaningarna i vår Carlsberg Hof exempel är 350,95 och T 37,93 6 6 och de fra senase skaningarna av säsongsfakorn är F 3 0,945, F 438 4,, F 0, 5 644 och F 0, 99 6 Lå oss nu göra en prognos för idpunk 7, dvs försa kvarale år 00. Vi börjar med a addera den senase nivåskaningen, 6, med den senase rendskaningen T 6. Denna summa mulipliceras därefer med försa kvarales senase skaade säsongsfakor,. Prognosen för blir då ˆ F3 7 T F 350,95 37,930,945 3363, 4 7 6 6 3 Då vi gör en prognos för de andra kvarale år 00 (idpunk 8) befinner vi oss vå idpunker från basen varifrån våra prognoser beräknas ifrån. Vi måse då addera den senase rendskaningen T vå gånger ill nivåskaningen. Dea mulipliceras sedan med den senase skaningen för kvaral, ˆ 6 6 F 4. Vi får då T F 350,95 37,93,438 57, 8 6 6 4 och på samma sä ˆ 3T F 350,95 3 37,930,644 340, 77 9 6 6 5 Vi kan på dea sä beräkna prognoser så lång fram vi önskar. På näsa sida ses en miniabuskrif över Carlsberg Hof försäljningen inklusive Hol-Winers muliplikaiva modell. 5
Figur 4...3: Kvaralsdaa för Carlsberg Hof försäljning 998-00 inklusive e års prognoser och dess 95%-iga konfidensinervall Hur ska man då välja ujämningskonsanerna,,, och? Om dessa viker väljs små resulerar dea i sörre variaioner i vår modell, och vice versa. På en relaiv jämn serie någon uan sörre slumpkomponen bör man därför välja relaiv låga värden på våra ujämningskonsaner,, och. Liksom för exponeniell ujämning kan dea val dock göras både objekiv och subjekiv. En person som är van a analsera daa på en viss produkgrupp har förmodligen också en bra uppfaning om vilka värden på ujämningskonsanerna som lämpar sig bäs. En mer veenskaplig meod är a esa modellen för olika värden på,, och, och därefer beräkna prognosfele för dessa värden all enlig meoden som användes i kapiel 3. Den kombinaion av värden på de re ujämningskonsanerna som ger minsa kvadrerade prognosfel används för prognos. 6
5 Box-Jenkins modeller Inom prognoseorin är Box-Jenkins modeller väldig cenral. I huvudsak kan man dela in dessa i auoregressiva och glidande medelvärdes modeller. Jag kommer i uppsasexen ibland skriva AR(p) för den auoregressiva modellen (från engelskans Auoregressive), och MA(q) för glidande medelvärdes modellen (Moving Average). Vi kan vidare göra en indelning i säsongs och icke säsongs modeller. I de här kapile ser vi förs på modeller uan säsong, där vi börjar med den auoregressiva modellen, där även en inrodukionen ill Box-Jenkins modeller ges. Därefer ser vi på den glidande medelvärdes-modellen. Kapile avsluas med en kor diskussion om säsongsmodeller. 5. Icke säsongsmodeller 5.. Auoregressiva modeller uan säsong Dea är e annorlunda angreppssä ill idsserier och dess prognoser, i vilken man använder illgängliga daa för a skapa en modell som kan ha generera serien vi är inresserade av. Idén är a beraka en idsserie som en serie av sokasiska variabler. I prakiska sammanhang anar man ofa a dessa variabler alla har samma medelvärde och varians. De är däremo e sor missag a ana a de sokasiska variablerna vore oberoende av varandra. Om man ex är inresserad av akuella försäljningssiffror av en viss produk, så kan man förmodligen ana a de är relaerade ill försäljningssiffrorna de närmas föregående perioderna. Vi förvänar oss med andra ord en bedande korrelaion över iden i våra serier. Man brukar kalla korrelaion av de här slage för auokorrelaion. Vanligas är a auokorrelaionen är som högs då man jämför värden som ligger inill varandra, och a denna sedan avar då man iar på observaioner med sörre avsånd. Man brukar som e approximaiv må säga a om korrelaionen mellan vå inilliggande värden är, då är korrelaionen mellan värden som är vå idsperioder ifrån varandra lika 3 med, re idsperioder isär, osv. Dvs låer vi vara värde på idsserien vid idpunk, så har vi modellen för auokorrelaion j, Corr j ( j =,, 3, ) (5...) De kan visas a idsseriens modell som ger upphov ill auokorrelaionssrukuren i (5...) är a (5...) där och är konsana paramerar, och de sokasiska variablerna a har alla medelvärde 0, är okorrelerade och har konsan varians för alla. Modellen (5...) kallas vanligen för försa ordningens auoregressiv modell, och urcker de akuella värde,, av en serie i ermer av de föregående värde, och den sokasiska variabeln. Efersom a ej är auokorrelerad så är den omöjlig a säga någo om. Därför beror framida prognoser bara på de allra senase värde i serier som genereras av en försa ordningens auoregressiv modell. a 7
I många illämpningar vill vi dock använda mer än bara de senase värde som underlag för prognoser. Nära ill hands ligger a uvidga modell (5...) ovan så a de akuella värde,, bero på de vå närmas föregående värdena. Vi använder oss då av följande modell a (5...3) som kallas för andra ordningens auoregressiv modell, där,och är konsana paramerar. Generell, för varje posiiv helal p, kan de akuella värde göras beroende av de p närmas föregående värdena, vi får då en auoregressiv modell av ordning p... p p a (5...4) där,,, är konsana paramerar. p Ana a vi har en serie observaioner,,... n. Vi vill nu uppskaa de okända paramerarna,,, av den auoregressiva modellen (5...4). Dea kan göras med hjälp av den sk. minsa kvadra meoden. Parameerskaningarna av värdena på, p n... p p p,, ges för de värden för vilka summan är minimal. Dessa beräkningar är idsödande och görs enklas med e saisikprogram, ex Miniab. I figur (5...) nedan ser vi den fikiva försäljningsserien av produken Zingo en 30- veckorsperiod. Figur 5...: Zingoförsäljning, fakurera lier under en 30-veckorsperiod p Zingoförsäljning, Fakurera lier 400 350 300 50 00 50 00 050 000 950 900 4 7 0 3 6 9 5 8 Försäljning Vecka I abellen nedan ses e kor udrag av idsserien i Figur 5... Tabell 5...: Zingoförsäljning, fakurera lier under en 30-veckorsperiod Observaion 3 8 9 30 Försäljning 0 988 3 349 340 8
Vi vill nu skaa de okända paramerarna för en försa ordningens auoregressiv modell,,, dea görs med hjälp av Miniab. Där fås följande uskrif Tabell 5...: Miniab-uskrif för en försa ordningens auoregressiv modell, anpassad efer Zingoförsäljningen i figur 5... Vår anpassade försa ordningens auoregressiv modell var således 45.996 0.96 a där 45.996 är en skaning av och 0.96 är en skaning av. I abell 5...3 nedan ses en Miniab-uskrif för en andra ordningens auoregressiva modell. Tabell 5...3 Miniab-uskrif för en andra ordningens auoregressiv modell, anpassad efer Zingoförsäljningen i figur 5... Vår andra ordningens auoregressiva modell är 5.647 0.9784 0. 0 De är nödvändig a besämma auoregressionens ordning, p, då man vill använda en auoregressiv modell för prognoser. Å ena sidan vill vi välja ordningen illräcklig sor för a äcka upp alla vikiga auokorrelaioner. Å andra sidan kommer e för hög värde på p leda ill en modell med irrelevana paramerar och ineffekiva skaningar av de paramerar som verkligen är vikiga. Vale av p kan således ses som en balansak mellan dessa båda aspeker. En ssemaisk och veenskaplig meod a välja lämplig värde på p börjar med a säa upp en nollhpoes och en mohpoes: H H 0 : : p p 0 0 För varje värde på p esas med andra ord nollhpoesen mo den våsidiga mohpoesen. a 9
Tese baseras på de fakum a ill en god approximaion, kommer parameerskaningen dividera med de esimerade sandardfele, följa en sandardiserad normalfördelning då nollhpoesen är sann. Vi förkasar därför nollhpoesen om ˆ s p p z eller ˆ s p p z där är eses signifikansnivå, ˆ är parameerskaningen och sandardfel. z är värde för vilke p s p parameerskaningens P(Z z ) =,där Z är en sandardiserad normalfördelad variabel Denna procedur forgår ills vi funni e värde på p för vilke nollhpoesen kan förkasas. Vi illämpar nu dea på vår Zingo-exempel, och använder oss av signifikansnivån 0.0, dvs = 0.. z = =.645 z 0.05 Lå oss börja ia på vår andra ordningens auoregressiva modell. Från abell 5...3 ovan får vi a parameern skaades ill 0.0, med sandardfel s = 0.00 Vi får ˆ = s 0. 00 0.0-0.09 Efersom dea värde är uppenbar mindre än.645 kan vi ine förkasa nollhpoesen a H 0 : 0. Vi iar isälle på den försa ordningens auoregressiva modellen, där vi från abell 5... får parameerskaningen av = 0.96, och dess sandardfel är 0.095. ˆ 0. = 095 s 96 0. 0.390 De höga värde gör a vi för den försa ordningens auoregressiva modellen kan förkasa H 0 : 0. Noera a vi egenligen ine behöver beräkna sorheen ˆp s p då man i Tabell 5... ovan kan läsa av denna sorhe som respekive parameers T-värde. Vi har nu funni en lämplig skaad auoregressiv modell, och vi vill nu beräkna prognoser med hjälp av denna. Den skaade modellen har enlig idigare följande useende 45.996 0.96 a Vi har i vår maerial 30 scken observaioner och vill nu göra en prognos för idpunk 3. 30
I vår skaade modell säer vi =3, dvs 3 45.996 0. 96 30 a 3 a 3 är här en okorrelerad sokasisk variabel med vänevärde 0, vår bäsa skaning av denna variabel är därför 0. Prognosen för ges av 3 ˆ 3 45.996 0. 96 I abell 5... ovan finner vi värde på ˆ 3 45.996 0.96340 333.87 30 = 340. Insäning av dea värde i modellen ger 30 Vi använder vidare dea skaade värde för a göra en prognos för ˆ 3 ˆ 3 45.996 0.96ˆ 3 a 3 Åerigen är 0 den bäsa skaningen av. Vi får då skaningen av ˆ som a3 3 ˆ ˆ 3 45.996 0.96 3 = 45.996 0.96333.87 37. 98 På dea sä forsäer man så länge man önskar. I figur 5... nedan ses en Miniab-uskrif på vår Zingoförsäljning inklusive prognoser för vecka 3 och 3. Prognosvärdena ges med e 95%-ig konfidensinervall. Figur 5...: Miniab-uskrif för Zingoförsäljning under en 30-veckorsperiod, inklusive prognoser för vecka 3 och 3 gjord med en försa ordningens auoregressiv modell I figuren ovan ser vi hur osäkerheen på prognosen ökar från vecka 3 ill vecka 3. Dea är hel naurlig efersom prognosen för vecka 3 beräknas genom en skaning av vecka 3 ( ˆ 45.996 0.96ˆ ). 3 3 3
5.. Glidande medelvärdesmodellen uan säsong Denna modell ges bedlig mindre urmme än den auoregressiva modellen, dea för a ine behöva upprepa mig då diagnosiken är densamma för dem bägge. Modellen a... a a qaq (5...) kallas för den icke-säsongs glidande medelvärdesmodellen av ordning q. Termen glidande medelvärde för oss ill de fakum a man här ine bara ser ill den mes akuella slumpermen,, uan också använder alla föregående slumpermerna a a, a,..., a, q q a.,..., är alla okända paramerar. Varje slumpvärde,, är e slumpvärde som anas vara slumpmässig vald från en normalfördelning med 0, och en varians som är samma för varje period,. Vidare anas a a,,... vara oberoende., a3 5. Box-Jenkins modeller med säsong I de här kora delkapile ser vi främs på useende på olika Box-Jenkins modeller innehållande säsong. Modellen, L L, L L... P, L PL a (5..) kallas för den auoregressiva modellen med säsong av ordning P. De kan visas a denna modell har nollskilda pariella auokorrelaioner mellan observaioner på idsavsånd L, L,,PL, och a de pariella auokorrelaionerna är 0 annars. Vidare dör auokorrelaionerna u på idsavsånd L, L,,PL,där L beecknar säsongslängden (L=4 vid kvaralsdaa, L= vid månadsdaa ec). Om idsserien b, b,..., n har signifikaiv höga pariella auokorrelaioner på idsavsånd L, L,,PL och försvinner efer PL, och om auokorrelaionerna dör u i säsongsdelen, så bekräfar dea a idsserien bäs beskrivs med den säsongsauoregressiva modellen av ordning P, AR(P). Modellen a a, L L, L L... Q, L a a QL (5..) kallas för glidande medelvärdesmodellen med säsong av ordning Q. De kan visas a denna modell har nollskilda auokorrelaioner mellan observaioner på idavsånd L, L,, QL, och a auokorrelaionen är 0 annars. Om idsserien b, b,..., n har signifikaiv höga auokorrelaioner på idsavsånd L, L,,QL och försvinner efer QL, och om de pariella auokorrelaionerna dör u i säsongsdelen, så bekräfar dea a idsserien bäs beskrivs med den säsongs glidande medelvärdes modellen av ordning Q, MA(Q). Dea var en väldig kor genomgång av Box-Jenkins säsongsmodeller. En mer omfaande genomgång ges i näsa kapiel, där vi i dealj kommer sudera arbesgången på såväl säsongs, som icke-säsongsmodeller. 3
33
6. Val av prognosmodell - en beskrivning av arbesgången Då de ine finns möjlighe a i uppsasexen i dealj ureda bäsa modellanpassning för alla ariklar, kommer jag i dea kapiel isälle allmän beskriva arbesgången som sedan i de dolda appliceras på alla produker. Saisikprogramme Miniab gör de enkel a kvaliesundersöka och jämföra våra modeller för olika paramerar. Undanage är dock Box-Jenkins modeller som kräver en hel del arbee, vilke moiverar a modellen behandlas i e ege delkapiel. 6. Allmän om arbesgången Arbesgången är någo förenkla: Idenifiering av modell Skaning av paramerar Diagnosik Håller modellen? Nej Prognoser Ja E försa seg i idenifieringen av en modell är a beraka idsserieploen över den arikel vi är inresserade av. Denna plo ger oss ofa vikig informaion om idsseriens säsong, rend, variaioner ec. Lå oss se på idsserieploar över några Carlsbergproduker. I figur 6.. nedan verkar observaionerna vara oberoende, någo man ine kan säga om observaionerna i figurerna 6.. och 6..3 där de exiserar en bedande rend resp säsongskomponen. Lå oss förs sudera försäljningsuvecklingen för Vichvaen på 33 cl reurflaska (33R). 33
Figur 6..: Veckoförsäljning av Vichvaen 33R, v 999 - v0 00 I figur 6.. ovan ser vi ingen uppenbar säsong eller rend, observaionerna verkar ufalla oberoende av den närmas föregående observaionen. Lå oss se på e anna exempel En produk som innehåller en bedande rendkomponen i sin försäljningsserie är ex Lapin Kula 3,5 på 50 cl burk, en graf för denna åerfinnes nedan. Figur 6..: Veckoförsäljning av Lapin Kula 50B, v 999 - v0 00 34
Vi ser i figur 6.. ovan a försäljningsserien för Lapin Kula på 50B har en dlig negaiv rend. De är däremo svår a avgöra rendens sor (linjär, exponeniell avagande ec.) eller om de exiserar någon säsong. Figur 6..3: Veckoförsäljning av Zingo 50C, v 999 - v0 00 I figur 6..3 ovan ser vi erligare e n mönser. Försäljningen av Zingo på 50 cl åervinningspe enderar a öka markan under sommaren. Huruvida de föreligger någon rend är mer osäker, man kan möjligen skönja en svag posiiv rend. I de vå sisa idsserierna (Zingoförsäljningen och Lapin Kula-försäljningen) är de uppenbar a de föreligger e beroendesamband mellan observaionerna. Dea kan vi enkel också se genom a sudera auokorrelaionerna på idsserierna. Mer om auokorrelaioner i näsa avsni om Box- Jenkins modeller. Vi kan allså genom a beraka idsserieploar få en ungefärlig bild av seriens rend, säsong, variaioner, medelvärde ec. Dea gör också a vi får en vägledning om vilken modell vi ska använda, där kanske exponeniell ujämning väljs då vi ine har någon dlig säsong eller rend (jmf kap 3). 35
6. Box-Jenkins modeller Vi kommer i denna uppsas söa på vå scken sk Box-Jenkins modeller (AR och MA). För a kunna besämma lämplig modell måse vi använda oss av och analsera auokorrelaioner och pariella auokorrelaioner och deras funkioner. Auokorrelaionen är e må på sambande mellan observaioner med e på förhand besäm avsånd ill varandra. För a skaa auokorrelaionerna r k använder vi oss av de par av observaioner där idskillnadenär k. Lå oss ia på falle då k= Observaioner Tidsavsånd k= 3 3 4 4......... n n n n n Auokorrelaionerna beräknas genom r k = nk n k där hel enkel är medelvärde n n och i vår speciella fall då k = n n r = 36
Om vi ex har observaionerna Sorheen n = 4, 7, 5, 9, 9, 8, så är = 7 blir då 3 0... Då vi beräknar r blir äljaren Dea ger r 4 0,8 3 0 4 På samma sä beräknas auokorrelaionen för idsavsånd k = ill r 0, 09, och r 8 0, 364. 3 E vikig verkg i vale av Box-Jenkins modell är även de pariella auokorrelaionerna. Nedan preseneras formler för hur den pariella auokorrelaionen,, och dess sandardfel, s r kk, beräknas. r kk Den pariella auokorrelaionen vid idavsånd k är för idsserien,..., b, b n r kk r k r k j k j r k, j r k, j r k j r j om k om k,3,... där r kj r k, j rkkrk för j,,... k, k j Sandardfele för r är n b kk sr kk I e räkneexempel åergår vi ill observaionerna = 4, 7, 5, 9, 9, 8. Vi har idigare beräkna r 0,09, r 4 0, 8 och r 8 0, 364. 3 37
Vi har då a och r r 0,09 r r, jr j j r rr 0,8 (0,09)(0,09) r 0, 75 rr (0,09)(0,09) r r j, j j r r rr 0,09 (0,75)(0,09) 0,075 vidare är r osv. 33 r 3 3 j r 3, j r 3 j r3 ( rr rr ) ( r r r r ) 3 r3, jrj j 0,364 (0,075)(0,8) (0,75)(0,09) (0,075)(0,09) (0,75)(0,8) 0,409 Vidare kräver Box-Jenkins modeller a serien vi ska analsera är saionär. Dvs då vi ska idenifiera en Box-Jenkins modell så måse vi förs avgöra huruvida serien är saionär eller ej. Om ine måse vi förs ransformera den ill en saionär serie. En saionär serie är per definiion en serie vars medelvärde, varians och kovarians är konsana över iden. Lå oss åer se på figurerna 6..-6..3 ovan. I figur 6.. har vi en serie som skulle kunna vara saionär, dvs a observaionerna verkar oberoende av varandra. De kan man däremo ine säga om figurerna 6.. och 6..3 där vi ser e sark beroende mellan observaionerna. Om en plo av en idsserie med n scken värden,,..., n indikerar a serien är icke-saionär, så kan vi ofa ransformera serien ill a bli saionär genom a a försa differenserna av den ickesaionära serien.dvs försa differenserna av idsserien,..., är, n för,3,..., n 38
Ibland händer de a försa differenser av en icke-saionär serie ej genererar en saionär serie. I dessa fall kan sk andra differenser vara nödvändiga. Andra differenserna av en idsserie,,..., n är för 3,4,..., n Hur ska man då besämma huruvida en serie är saionär eller ej? E illvägagångsä är a analsera seriens auokorrelaionsfunkioner. Som vi ska se baseras denna eknik på e anal umregler. (De bör dock noeras a man med erfarenhe och sor sakkunnighe på område ofa med bloa öga kan avgöra om en idsserie är saionär eller ej.) Lå oss nu se på auokorrelaionerna för de vå produkerna beskrivna i figur 6..-6.. Figur 6..: Auokorrelaionsfunkion för Vichvaen 33R, v 999 v0 00 Här är de svår a avgöra huruvida den ursprungliga idsserien är saionär. Vi ser inge dlig mönser. Möjligen kan man idenifiera en svag nedgång av mo slue, och a auokorrelaionerna är relaiv höga run vecka 5 någo som kan anda en svag säsong. Förmodligen gör man bäs i a beräkna försa differenser på serien för a försäkra sig om saionärie. Till skillnad mo figur 6.. råder de i figur 6.. inga som hels vivel om icke-saionärie. Figur 6..: Auokorrelaionsfunkion för Lapin Kula 50B, v 999 v0 00 39
Då vi suderar en idsserie med negaiv (linjär) rend är de vanlig med mcke långsam avagande auokorrelaioner, dea är figur 6.. e dlig exempel på. Lå oss se på auokorrelaionsfunkionen för Zingo (jmf fig 6..3) Figur 6..3: Auokorrelaionsfunkion för Zingo 50C, v 999 v0 00 Liksom för Lapin Kula der figur 6..3 ovan på en icke-saionär serie. Auokorrelaionerna vinar om en krafig säsong, mer om dea i avsni 6... Nedansående umregler är ofa användbara:. Om auokorrelaionerna av en viss idsserie r, r,..., r n aningen avmaas (går mo 0) eller försvinner relaiv for, kan man ana a idsserien är saionär.. Om auokorrelaionerna av idsserien r, r,..., r n aningen avmaas eller försvinner väldig långsam, då bör idsserien anas vara icke-saionär Lå oss nu se på några olika auokorrelaions funkioner som är saionära, enlig punk ovan. Auokorrelaionsfunkionen dör u 0-40
Ovan ser vi a r och r är väldig sora i en jämförelse med de andra auokorrelaionerna. Vidare ser vi a funkionen för auokorrelaionerna relaiv snabb dör u -någo som känneecknar en saionär serie. Nedan ser vi några exempel på auokorrelaionsfunkioner där den underliggande serien är saionär. Gemensam för dem är ine bara a de går mo 0, uan också a de avmaas på e konsan sä. Auokorrelaionsfunkionen avmaas dämpa exponeniell, uan oskillaion Auokorrelaionsfunkionen avmaas dämpa exponeniell, med oskillaion 0 0 - - Nedan följer erligare en auokorrelaionsfunkion på en saionär serie, denna gång avar auokorrelaionerna lik en dämpad sinusfunkion. Auokorrelaionsfunkionen avmaas i en dämpad sinusfunkion 0 - Då man använder Box-Jenkins modeller måse man behandla serier uan säsong och serier med säsong olika. Gemensam för dem båda är emellerid krave på a serierna måse vara saionära. Lå oss förs ia på falle då serien vi vill prognosicera saknar bedande säsong. 4
6.. Box-Jenkins modeller på icke-säsongsserier Lå oss ia närmare på Lapin Kula (se figur 6..3 och 6..) i e exempel. I figur 6.. har vi e dlig fall av icke-saionärie (auokorrelaionerna avar långsam). Dessuom kan vi ine heller skönja någon bedande säsong. Vi måse därför förs ransformera om vår icke-saionära idsserie ill en saionär idsserie. I enlighe med ovan görs dea lämpligen genom illämpning av försa differenser av den ursprungliga idsserien. Jag besparar både Er och mig själv beräkningarna och använder isälle Miniab. Nedan ser vi en figur på Lapin Kulas försa differenser Figur 6...: Försa differenser för Lapin Kula I figur 6... ovan är de veksam om vi har saionärie, medelvärde verkar vara konsan (=0) Variansen verkar dock vara avagande, dvs ej konsan som defiionen för saionärie kräver. Vi gör därför bäs i a göra erligare en ransformaion, dvs a beräkna :a differenserna. I figuren nedan ser vi en Miniabuskrif på Lapin Kulas :a differenser. Figur 6...: Andra differenser för Lapin Kula 4
Vi anar nu a vi har en saionär serie. Skulle de visa sig a så ej är falle skulle dea i slusege ge svårigheer a finna en lämplig modell, och vi skulle se oss vugna a börja om igen. Vidare bör medelvärde på differenserna ligga nära 0, vi konrollerar dea genom följande Miniabuskrif Tabell 6...: Deskripiv saisik på 00435 Lapin Kulas andra differenser Vi ser i abellen ovan a medelvärde är, någo som i sammanhange kan beecknas som väldig lie. Vidare ser vi i abellen även andra läges och spridningsmå (median, sandardavvikelse ec.). Vi kan även från abell 6... beräkna sorheen SE, dvs idsseriens medelvärde dividera med dess sandardfel. Sorleken på denna sorhe ger oss informaion om vi ska använda oss av en konsanerm i vår modell. Nämligen är de så a modellen behöver konsanerm om denna sorhe är sörre än. I vår Lapin Kula exempel har vi, dvs vi behöver ine någon konsanerm. 408 Nu ska vi finna en lämplig modell för Lapin Kula. Vi börjar a i figur 6...3 nedan se på auokorrelaionsfunkionen för den saionära serien (:a differenserna). Figur 6...3: Auokorrelaionsfunkion på Lapin Kulas :a differenser. 43
Vi kan genas noera a auokorrelaionen med idsavsånd en vecka, r, är väldig hög (-0,5). De är vidare bara r som översiger de vå sandardavvikelser breda bande (den sräckade röda linjen). I vår jak på lämplig Box-Jenkinsmodell är de en nödvändighe a även se på den pariella auokorrelaionsfunkionen. Figur 6...4: Pariell auokorrelaionsfunkion på Lapin Kulas :a differenser. Hur ska man då uifrån auokorrelaions, och den pariella auokorrelaionsfunkionen idenifiera en bäsa Box-Jenkins modell? De finns (se kap 5) både auoregressiva (AR) och glidande medelvärdes (MA) Box-Jenkins modeller. Genom a beraka auokorrelaionerna och de pariella auokorrelaionerna kan man besämma vilken p av Box- Jenkins modell och vilken ordning på denna, som vi bör välja. Lå oss ia på den (icke-säsongs) auoregressiva Box-Jenkins modellen. Enlig kap 5 har denna useende... p p a som är en auoregressiv modell av ordning p, där,,, p är konsana paramerar. 44
För denna modell gäller följande:. Auokorrelaionsfunkionen är avagande. Den pariella auokorrelaionsfunkionen har signifikan höga värden på idsavsånd,,,p och avar efer idsavsånd p. Punkerna och ovan beskriver en (icke-säsongs) auoreggresiv modell av ordning p. Lå oss nu se på den (icke-säsongs) glidande medelvärdes modellen, som enl kap 5 har useende och har ordning q. a a a... För denna modell gäller a: q a q. Auokorrelaionsfunkionen har signifikan höga värden på idsavsånd,,,q och avar därefer.. Den pariella auokorrelaionsfunkionen är avagande. och ovan vinar om en (icke-säsongs) glidande medelvärdes modell av ordning q. Lå oss nu applicera dea på vår Lapin Kula exempel. I figur 6...3 såg vi en sor auokorrelaion på idavsånd ( r 0,5 ). Vidare verkar den pariella auokorrelaionsfunkionen vara avagande. Dea innebär a de förmodligen är fråga om en glidande medelvärdesmodell av ordning, MA(). Lå oss gå vidare med denna modell och se om den håller. Modellen esas med en rad es som uförs med hjälp av Miniab. Vi börjar med a se om modellens MA() koefficien är signifikan för idserien. I Miniabuskrifen ovan ser vi a T-värde är väldig hög (7,3), med illhörande låga P-värde ( 0). Dea indikerar a MA()-koefficienen är signifikaiv, och bör vara med i modellen. 45
Vi håller på med en modell för a a Då vi enlig idigare ine behöver någon konsan ( SE ) blir modellen med insa koefficien a 0,7967a Vidare bör vi även se på slumpmässigheen hos seriens residualer med e sk Runs-es. Nollhpoesen är a observaionerna, dvs här residualerna, kommer i slumpmässig ordning under och över e viss värde. Här är de värde 0 omkring vilke vi esar slumpmässigheen Runs-ese görs i Miniab: Uskrifen ovan säger oss a vi ine kan förkasa nollhpoesen, dvs a residualerna är slumpmässiga. Sluligen esar vi om residualerna är normalfördelade, genom e sk normalies es. I figur 6...5 nedan ser vi en normaliesplo med illhörande P-värde. Figur 6...5: Normaliesplo för Lapin Kulas residualer P-värde i figuren ovan är angive ill 0,8, vi kan allså ine förkasa nollhpoesen a de föreligger normalie. Residualerna förusäs i forsäningen vara normalfördelade. Slusasen av ovansående analser är a vi vågar ro på den valda Box-Jenkins modellen. 46
6.. Box-Jenkins modeller på säsongsserier Även för säsongsserier gäller de a förs ransformera serien vi har för avsik a analsera så a denna blir saionär. De finns i sor re olika sä a göra dea på (isälle för bara e då vi ej hade säsong). Den försa ransformaionen känner vi igen från falle då vi ine hade någon säsong, nämligen försa reguljära differenser., n,...,,3 om denna ransformaion ine genererar en saionär serie, iar vi enlig idigare på andra reguljärdifferenserna,,...,n 3,4 Anledningen ill användningen av orde reguljära är för ine blanda ihop denna ransformaion med försa säsongsdifferenserna. För a förklara säsongsdifferenser låer vi L beeckna säsongslängden Då skapar ransformaionen L försa säsongsdiffererade värden. Sluligen kan man även skapa ransformaioner som innehåller både en reguljär, och en säsongsdifferens. ) ( ) ( L L L L Tabell 6... Tre saionäriesransformaioner L L L 3 3.. L L. L L L L L.. 3 3 3 L L L......... n n n L n n n L L 47
För a besämma vilken ransformaion som är lämplig suderar vi beeende på auokorrelaionerna av värdena b, b,..., n både reguljär och på säsong. Med reguljär brukar menas de observaioner på idsavsånd om L-3. Dea innebär a vi reguljär vid månadsdaa är inresserade av observaioner på idsavsånd ill 9, därefer räknas de som säsong. Reguljär sägs en auokorrelaion, och en pariell auokorrelaion, vara signifikan sor om r k och rkk Då vi ser på säsongsdelen innebär dea a vi suderar auokorrelaioner på idsavsånd L, L, För dessa exaka säsongsidsavsånd sägs en auokorrelaion vara signifikan sor om r k,5 och om en pariell auokorrelaion rkk De är också inressan a sudera auokorrelaioner på idavsånd nära säsong, dvs L-, L-, L+, L+, L-, L-, osv. För dessa säger man a en auokorrelaion är signifikan sor om r k och rkk Som umregel används a om idsseriens ( b, b, b,..., n ) auokorrelaioner försvinner eller dör u relaiv snabb i både den reguljära delen och i säsongsdelen, sägs serien vara saionär. Lå oss nu sudera produken Zingo som enlig figur 6..3 har en dlig säsongskomponen. Vi noerar förs a en ransformaion är nödvändig då serien på inge sä kan anas vara saionär, vilke även figur 6..3 påvisar. Vi genomför ransformaionerna i abell 6... i vår jak på en saionär serie, med början i ransformaionen Lå oss sudera auokorrelaionsfunkionen för Zingos försa differenser. 48
Figur 6...: Auokorrelaionsfunkion för Zingo, Vi har i figuren ovan enbar en signifikan sor auokorrelaion, 4, 79, övriga relaiv små. De är knapp märkbar a auokorrelaionerna dör u. Om de dör u så sker dea mcke långsam både reguljär och i säsongsdelen. Dea innebär a även serien som erhölls med ransformaionen, är icke-saionär. Vi berakar isälle ransformaionen. Efersom vi har veckodaa innebär de a vi är inresserade av ransformaionen 5. Vi kommer med denna ransformaion förlora 5 scken observaioner i början av serien som en effek av säsongsdifferensen. Vi ransformerar nu med säsongsdifferenser och ser på dess auokorrelaionsfunkion i figur 6... nedan. L r 49
Figur 6...: Auokorrelaionsfunkion för Zingo, 5 Auokorrelaionsfunkionen i figuren ovan skulle kunna vara saionär, dea efersom auokorrelaionerna dör u relaiv for. På idavsånd har vi en sor auokorrelaion 4, 9, därefer har vi erligare en signifikan r auokorrelaion på idsavsånd 5,, 08. Lå oss även se på de pariella auokorrelaionerna. r5 Figur 6...3: Pariell auokorrelaionsfunkion för Zingo, 5 50
Reguljär har vi nu re scken signifikan sora pariella auokorrelaioner, dessa på idsavsånd, resp 3. I säsongsdelen saknas signifikana pariella auokorrelaioner. Vidare är de pariella auokorrelaionerna avagande både reguljär och i säsongsdelen. Konklusionen blir därför a den säsongsdiffererade ransformaionen genererar en saionär serie. Lå oss ändå ia på den redje och sisa ransformaionen, L L. Då vi enlig idigare arbear med veckodaa kan vi skriva ransformaionen som. 5 53 Figur 6...4: Auokorrelaionsfunkion för Zingo, 5 53 Vi har i figuren ovan någo som kanske skulle kunna vara saionär. Men då de är uppenbar a auokorrelaionerna i figur 6... dör u forare än i figur 6...4, nöjer vi oss med a säga a den säsongsdiffererande ransformaionen,, genererar en mer saionär serie än forsaa anals. 5 53 5. Vi kommer därför a använda den säsongsdiffererade serien i vår 5