Fö 2: Prognostisering Tobias Andersson
Källor Delar av materialet till denna föreläsning är hämtat från: Kap 7 av Airport Planning av Lynn S. Bezilla Edlund, Högberg, Leonardz: Beslutsmodeller redskap för ekonomisk argumentation Magnusson, E., Ambulanslogistik - prognostisering av ambulansuppdrag, Examensarbete, LITH-ITN-KTS 07/009--SE 2
Prognoser Prognosis (gr) betyder förutsägelse En prognos kan vara Värdet på en variabel vid en viss tidpunkt Tidpunkten för en händelse Resultatet av en händelse Syfte Organisera och analysera befintlig kunskap så att osäkerheten i en beslutssituation minskar Resurser Reduktionen i osäkerhet är vanligen proportionell mot kostnaden för prognosen Förlust pga osäkerhet måste vägas mot kostnaden för prognosen 3
Varför behövs prognoser vid planering av flygplatser? Shortterm Upp till 5 år Mediumterm 6-10 år Diskutera! Longterm 10 år och längre
Använda prognoser Planeringen baseras på prognoser, men det fysiska arbetet påbörjas inte förrän behovet uppstår Pengar kan dock behöva sättas av för investeringar innan En prognos är bra om den lyckas förutsäga framtiden En prognos anses bra om beslutsfattare i nyckelpositioner accepterar den Endast en uppsättning prognoser bör finnas för en flygplats Flera prognoser bör göras för olika scenarier Prognoserna bör uppdateras varje år
Vad är det man ser i en prognos?
Egenskaper hos prognosen FAA rekommenderar at prognosen ska: Vara realistisk Använda senaste datan Spegla nuvarande förhållanden på flygplatsen Stödjas av dokumentation Stödja och rättfärdiga planer och utveckling av flygplasten Bezilla tycker också att den ska bygga på: Enkelhet Den ska vara lätt att förklara Konsistens Logik Hänga ihop med andra och tidigare prognoser Om den skiljer sig, ska detta kunna förklaras Ta hänsyn till pågående initiativ (marknadsföring, byggnationer, etc) Expertkunskaper bör byggas in i modellen
Vad ska prognostiseras? Diskutera! Vad ska planeras? Vad ska prognostiseras för att kunna göra bra planering? För vilka tidsperioder ska man prognostisera? 8
Tidsperiod Medelvärden År Vecka Dag Hur få data? Peak Peak month Peak day Peak hour Flygplatser planeras inte efter perioden (timme, dag) med allra mest trafik utan bryts ner tex från peak månad Funkar hyggligt för peakdag Svårare för peak-timme (data på timnivå nödvändig) 9
Passagerare De som går på planet (boarding) Ursprungspassagerare Anslutande passagerare Använder olika faciliteter och ligger därmed till grund för olika typer av planering
Gods Till grund för godsterminalplanering och personalplanering Kan vara svårt att hitta data
Flygprognoser Rörelser Planering av airside, personal Statistik från FAA, LFV, ACR, TS Flygplan med flygplatsen som bas Planering av hangarer, bränsle, underhåll, etc. Flygplansmix Underlag för buller-studier, kapacitetsstudier, gateplanering, etc. Data från ANSP, TS Socioekonomisk data För efterfrågeprognoser, regressionsanalys Tex från SCB
Prognosmodeller Kvalitativa modeller Bygger på åsikter och bedömningar (från experter) Långsiktiga prognoser Historisk data saknas Kvantitativa modeller Matematiska Historisk data används Extrapolering av historiska värden Kausala modeller Tidsseriemodeller 13
Efterfrågemodell Man skiljer ibland på efterfrågemodell och prognosmetod Efterfrågemodellen är en beskrivning av den process som genererar efterfrågan Efterfrågemodellen skattas av historisk data Prognosmetoden baseras på efterfrågemodellen Innan man väljer prognosmetod bör man ha skaffat sig en god uppfattning om hur efterfrågan historiskt sett ut 14
Metodik Visualisering/analys av historisk data -> efterfrågemodell Val av prognosmetod baserat på efterfrågemodellen Validering av prognosmodellen 15
Analys av historisk data Plotta data Tex i Excel, Matlab, etc Aggregera på olika tidsintervall för att hitta olika effekter Antal händelser per månad Antal händelser per dag Antal händelser per timme Bestäm vilka faktorer som ska ingå i prognosen 16
Antal uppdrag per dag 140 Summa av Antal 120 100 80 60 Totalt Linjär (Totalt) 40 20 0 Datum Källa: Magnusson, 2007 17
Antal uppdrag per månad 2500 Summa av Antal 2000 1500 Totalt 1000 500 0 1 2 3 4 5 6 7 8 9 10 11 12 Månad Källa: Magnusson, 2007 18
Antal uppdrag per veckodag 3600 Summa av Antal 3500 3400 3300 3200 3100 Totalt 3000 2900 2800 2700 2600 Måndag Tisdag Onsdag Torsdag Fredag Lördag Söndag Källa: Magnusson, 2007 Veckodag 19
250 Summa av Antal 200 150 100 Veckodag Måndag Tisdag Onsdag Torsdag Fredag Lördag Söndag 50 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Källa: Magnusson, 2007 Timme 20
Metodik Visualisering/analys av historisk data -> efterfrågemodell Val av prognosmetod baserat på efterfrågemodellen Validering av prognosmodellen 21
Faktorer vid prognosmodellval Tidshorisont Kortsiktiga (max 1 år) Medellånga (5-10 år) Långsiktiga (20 år och framåt) Långa tidshorisont ger större osäkerhet och mindre nytta av historiska data Datamönster T (Trend) K (Konjunktur) S (Säsong) ε (Slumpterm) Impulser (tillfälliga effekter) Nivåförändringar Trendbrott 22
Faktorer vid prognosmodellval Kostnad Komplexitet i modellen ger ökad kostnad Noggrannhet Förmåga att generera prognoser som ligger nära det riktiga värdet Tillgång på data Kan vara svårt speciellt för kausala modeller Användarvänlig Detaljnivå Samma variabel kan prognostiseras på olika detaljnivå Efterfrågan Årsefterfrågan Per försäljningskanal Per månad Nedbrutet på komponentnivå Delprognoserna bör summera till totalprognosen 23
Kvantitativa prognosmetoder Naiva modeller Utjämningsmodeller Komponentuppdelningsmodeller Regressionsmodeller y t = prognosvariablens riktiga värde period t y * t+k = prognos för y i period t+k x t = förklarande variabel e t = y t y * t = prognosfelet 24
Naiva modeller Enklast: y * t+1 = y t Säsong: y * t+1 = y t-11 Trend: y * t+1 = y t + T t (alt T t y t ) Används ofta för att jämföra mot mer avancerade modeller 25
Utjämningsmodeller Slumpmässig variation gör att naiva modeller fungerar dåligt Utjämningsmodeller jämnar ut prognosen till en jämnare nivå Glidande medeltal: t = y N i= t N * 1 t + k i + 1 N väljs så att prognosfelet minimeras y 26
Planering av flygplatser Glidande medeltal exempel 8 November, 2016 TNFL06 Tobias Andersson 27
28
Exponentiell utjämning Glidande medeltal ger alla observationer samma vikt, och kastar observationer äldre än N perioder bak i tiden Exponentiell utjämning ger nya observationer större vikt, och behåller all information sedan start Enkel exponentiell utjämning (för nivåserier) Dubbel exponentiell utjämning (vid trend) Winters metod för exponentiell utjämning (vid trend och säsong) 29
Enkel exponentiell utjämning y * t+k = αy t + (1-α)y * t 0 < α < 1 α bestäms genom försök Vad gör man om det kommer kraftigt avvikande observationer? 30
Enkel exp utj exempel y * t+k = αy t + (1-α)y * t 31
32
Dubbel exponentiell utjämning y * t+k = a t + b t k a är nivån tid tiden t, b är trenden vid tiden t Både a och b kan uppdateras när nya observationer görs y t = αy t + (1-α)y t-1 y t = αy t + (1-α)y t-1 a t = 2y t y t b t = α/(1- α) (y t-y t) 33
Dubbel ex utj exempel 34
Planering av flygplatser 8 November, 2016 TNFL06 Tobias Andersson 35
Planering av flygplatser Winters exponentiella utjämning y*t+k = (y t + btk) St-L+k 8 November, 2016 TNFL06 Tobias Andersson 36
Komponentuppdelningsmodeller I traditionell tidsserieanalys finns fyra komponenter: Trend, Konjunktur, Säsong och Slump Om tidsserien kan delas upp i dessa komponenter kan slutsatser dras om deras betydelse y t = T t S t ε t 1. skatta trendkomponeneten 2. eliminera trendkomponeneten 3. skatta säsongskomponenten 4. säsongsrensa 5. kontroll att enbart slumptermen återstår 6. prognos 37
Regressionsmodeller Regressionsanalys Grafiska och analytiska metoder för att bestämma samband mellan en beroende variabel och en (enkel regression) eller flera (multipel regression) förklarande variabler y = α + β 1 x 1 + β 2 x 2 + + β k x k + ε Ingående parametrar skattas genom minimering av prognosfelen (minsta-kvadrat-metoden (MKM)) Vid enkel regression med tiden som förklarande variabel blir det en tidsseriemodell, annars en kausal modell Som mått på sambandets styrka används andelen förklarad variation r 2 (vid enkel regression) eller förklaringsgraden R 2. Höga värden på R 2 ger ett starkt statistiskt samband (behöver dock inte vara kausalt) 38
Minsta-kvadrat-metoden Linjär modell, enkel regression y t = a + bx t Minimera summan av kvadratfelen: Min sum_t (y t (a + bx t )) 2 Mätvärden för ett antal y t och x t existerar Hur får vi a och b? 39
Regressionsanalys exempel År Försäljning [st] Pris [kr/st] 1 168 56 2 163 64 3 166 64 4 157 77 5 139 80 6 139 79 7 [129] [81] y t = 237.7 1.177 x t : r 2 = 0.79 y t = 177.9 6.457 t : r 2 = 0.84 1. Grafisk analys 2. Val av modell y t = α + βx t + ε t y t = α + βt + ε t 3. Skattning av modell Räkna fram α och β genom MKM, eller använd Excel 4. Tolkning av resultat 5. Prognos 40
Metodik Visualisering/analys av historisk data -> efterfrågemodell Val av prognosmetod baserat på efterfrågemodellen Validering av prognosmodellen 41
Utvärdering av prognoser Prognosfel Slumpmässiga Medelvärdet nära noll Systematiska Medelvärde skiljt från noll Noggrannhet: överensstämmelse mot korrekt värde Precision: graden av variation Prognosfel beror på Mätfel Slumpmässig variation Felaktig prognosmodell Ändrade förutsättningar 42
Mått på prognosfel Medelkvadratfelet: MSE = sum(e 2 )/ n Bestraffar stora avvikelser hårt Medelfelet: ME = sum(e)/n Bör vara nära noll om inte systematiskt fel Medelabsolutfelet: MAE = sum( e )/n Bestraffar inte stora avvikelser lika hårt som MSE 43
Valideringsmetodik Om tillräckligt med data finns Dela upp data i två mängder En kalibreringsmängd En valideringsmängd Kalibreringsmängden kan vara större än valideringsmängden Analysera först hela mängden för att välja rätt modell Kalibrera (bestäm värden på parametrar i modellen), enbart baserat på kalibreringsmängdens data Validera modellen med valideringsmängdens data Om en systemförändring skett (tex en ny flight, terminal eller bana har tillkommit) fungerar inte detta 44
Valideringsmetoder Beräkna prognos, jämför mot faktiskt utfall Beräkna medelfel, medelabsolutfel, etc Kontrollera grafer, kartor, etc visuellt för att kolla så att prognosen ser vettig ut Låt experter bedöma prognosen Hitta förklaringar för eventuella avvikelser Känslighetsanalys Hur mycket varierar prognosen om indata varieras? Hur påverkas beslut som ska baseras på prognosen, beroende på hur prognosen ser ut? Hur vet man om den är valid? Går inte att säga i det enskilda fallet Den behöver inte stämma perfekt, så länge den kan anses användbar I slutändan måste en subjektiv bedömning göras, i bästa fall av flera systemexperter som är ense 45
Metodik Visualisering/analys av historisk data -> efterfrågemodell Val av prognosmetod baserat på efterfrågemodellen Validering av prognosmodellen 46