Prediktion av elproduktion.

Relevanta dokument
Regressions- och Tidsserieanalys - F4

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Stokastiska processer med diskret tid

Metod och teori. Statistik för naturvetare Umeå universitet

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Regressions- och Tidsserieanalys - F7

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

Skrivning i ekonometri lördagen den 25 augusti 2007

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Något om val mellan olika metoder

TENTAMEN I STATISTIK B,

Exempel 1 på multipelregression

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Exempel 1 på multipelregression

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Föreläsning 4. Kap 5,1-5,3

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Stokastiska processer med diskret tid

Skrivning i ekonometri torsdagen den 8 februari 2007

10.1 Enkel linjär regression

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Skrivning i ekonometri lördagen den 29 mars 2008

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

ARIMA del 2. Patrik Zetterberg. 19 december 2012

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Tentamen Tillämpad statistik A5 (15hp)

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Tentamen i matematisk statistik

7.5 Experiment with a single factor having more than two levels

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Examinationsuppgifter del 2

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Regressions- och Tidsserieanalys - F5

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Regressions- och Tidsserieanalys - F1

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Laboration 2 multipel linjär regression

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Regressions- och Tidsserieanalys - F1

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tentamen i Matematisk statistik Kurskod S0001M

Multipel Regressionsmodellen

Homework Three. Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo. 28 november Time series analysis

Regressions- och Tidsserieanalys - F3

Föreläsning G60 Statistiska metoder

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Skrivning i ekonometri lördagen den 15 januari 2005

Tentamen Tillämpad statistik A5 (15hp)

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TENTAMEN I MATEMATISK STATISTIK

Prognostisering av växelkursindexet KIX En jämförande studie. Forecasting the exchange rate index KIX A comparative study

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Tentamen i matematisk statistik

Föreläsning 12: Regression

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Läs noggrant informationen nedan innan du börjar skriva tentamen

2.1 Minitab-introduktion

Tentamen i Matematisk statistik Kurskod S0001M

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Korrelation och autokorrelation

Följande resultat erhålls (enhet: 1000psi):

Regressionsanalys av lägenhetspriser i Spånga

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Tentamen i Matematisk statistik Kurskod S0001M

Konjunkturförändringar i åländsk ekonomi

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

7.5 Experiment with a single factor having more than two levels

Finansiell statistik

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Regressions- och Tidsserieanalys - F3

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

Tidsserieanalys av dödsfall i trafiken

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

tentaplugg.nu av studenter för studenter

Lektionsanteckningar 11-12: Normalfördelningen

Tentamen i matematisk statistik

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Tentamen i Matematisk statistik Kurskod S0001M

Transkript:

Prediktion av elproduktion. Modellering av icke reglerbara vattenkraftverk. Anton Edström Viktor Sjödin Student Vt 212 Examensarbete, 15 hp Statistik C, 3 hp Handledare: Johan Svensson

Sammanfattning Denna uppsats skrivs på uppdrag åt elhandelsföretaget Bixia. Uppsatsen handlar om prognostisering av icke reglerbara vattenkraftverk. Det som prognostiseras är elproduktionen på timbasis för olika vattenkraftverk. Uppdraget är att undersöka om det går att finna en generell modell/metod som kan appliceras på olika vattenkraftverk, samt att göra en specifik modell för varje kraftverk vi har data på. Det insamlade datamaterialet består av elproduktion, nederbörd, temperatur, vindhastighet och global solinstrålning från nio kraftverk. Då det finns seriell autokorrelation i elproduktionen så tillför vi en SARIMA del till regressionsmodellen. De resulterande modellerna för de olika verken ger skilda förklaringsgrader. Det beror på att data från de mest närliggande observationerna på elproduktionen inte går att tillgå då vid prognostillfället och de närmaste observationerna av elproduktionen förklarar mer eller mindre mycket, beroende på vilket verk vi modellerar. Denna modell ger en bra justerad förklaringsgrad för en del verk men måste kompletteras alternativt ändras för andra verk. Abstract This paper was written on assignment for the electricity company Bixia. The paper is about electric power forecasting in hydropower plants. The prediction is electricity production in different hydropower plants. The assignment is to find a general model / method that can be applied to the various hydropower plants. The collected data material consists of electricity production data from nine hydropower plants, additional data are wind, rain, temperature and global solar insolation. We use a regression model with a SARIMA part because of the autocorrelation. The result was that the method gave us models that have quite different predictive power. It may be that data from the closest observations of water production is not available when the prediction is made, and these data contains more or less information depending on which plant we are modeling. The method works but may need to be changed or developed for some hydropower plants.

Populär sammanfattning Att Sverige har så mycket förnyelsebara energikällor beror till stor del på att vi har vattenkraft. Den har gett oss ett stort försprång när vi nu ska ta oss an klimatpåverkningarnas framfart. Därför är det viktigt att vi kan lita på vattenkraften och att den ger elektricitet när det behövs. Detta arbete skrivs åt elhandelsföretaget Bixia som säljer elektricitet till sina kunder. För Bixia är det viktigt att veta hur mycket elektricitet deras vattenkraft ger från dag till dag. Uppgiften är att skapa en generell metod som kan förutse elproduktionen på timbasis. Resultatet blev att modellerna vi får av metoden förklarar olika mycket av elproduktionen för de olika kraftverken. Modellerna är bra men metoden kan utvecklas så att modellerna förutser elproduktionen bättre. Tillkännagivanden Tack till Alain Angeralides, Johan Svensson och alla andra som gett kommentarer och råd om vårt arbete.

Innehåll 1 Inledning... 1 1.1 Bakgrund... 1 1.2 Syfte och problemformulering... 3 1.3 Avgränsningar... 3 1.4 Disposition... 3 2. Teori... 4 2.1 Oberoende... 4 2.2 Stationäritet... 4 2.3 SARIMA... 5 2.4 Box-Jenkins metod... 6 2.5 Cross correlation... 7 2.6 VIF... 7 2.7 AIC... 8 2.8 Prediktion och relativt fel... 8 3. Metod... 9 3.1 Datamaterialet... 9 3.2 Metod... 1 4. Modeller och Resultat... 11 4.1 Modeller för elproduktion vid kraftverk Å... 11 4.2 Sammanfattning arbetsgång och resultat för de nio kraftverken... 14 4.3 Prognoser för elproduktion och relativt fel vid kraftverk Å... 15 5 Diskussion och slutsatser... 17

1 Inledning 1.1 Bakgrund I det moderna samhälle vi lever i drivs allt fler saker av el och vardagslivets kvalitet är beroende av ett fungerande elnät. Vi ser en fungerande och pålitlig elförsörjning som en självklarhet. Indirekt är det solens energi som driver vattenkraften, genom vattnets kretslopp där vattnet avdunstar av solvärmen och sedan kondenserar i snö och regn. 1 Det bildas forsar, älvar och åar som driver vattenkraftverken. Vattenkraftverken omvandlar vattenströmmar till el då forsande vatten gör att verkets turbiner börjar snurra. Turbinen driver en generator som tar vara på energin i vattnet och omvandlar den till el, hur mycket energi som genereras beror av vattnets massa och fallhöjd. Vatten kan regleras av dammar och sparas i vattenmagasin. Det är på våren som det mesta vattnet rinner till men det är på vinterhalvåret som efterfrågan på el är som störst, därför fyller dammarna en mycket viktig funktion då de gör att man kan hushålla med vattnet och använda det då efterfrågan på el är som störst. Då älvar är reglerade kan man bestämma och planera hur mycket vatten man ska släppa på och därav hur mycket el som ska produceras. Dock så regleras inte alla vattenkraftverk och det är just de icke reglerbara vattenkraftverken som vårt arbete kommer att handla om. Vattenkraftverken producerar ca 45 procent av den el som svenskarna använder. 2 Vattenkraft är fortfarande Sveriges viktigaste förnybara energikälla, då vattenkraften inte förbrukar några ändliga naturresurser. Vattenkraften bidrar relativt lite till växthuseffekten och den påverkar nästan bara miljön när kraftverk och dammar byggs. Fastän vattenkraften har funnits länge så försöker man hela tiden förbättra den och det forskas bl.a. om lönsamheten i att reglera vattendrag, man försöker även hitta lösningar på ekosystemets påverkan vid uppbyggnaden av vattenkraftverk. I Sverige finns det ca 18 vattenkraftverk och sammantaget producerar de 65 TWh el under ett normalår. Norrland står för 8 % av den svenska vattenkraftens elproduktion. Vattenkraft är driftsäkert och lätt reglerat efter marknaden då tekniken är väl prövad och utvecklad. 1 Svenskenergi. http://www.svenskenergi.se/sv/om-el/vattenkraft/, nedladdad dem 212-5-23 2 Ibid 1

Vattenkraftverkens elproduktion varierar mycket mellan åren i Sverige och den varierar även dagligen. 3 Vattenkraftens elproduktion beror av hur mycket nederbörd det är och varierar därför beroende på om vi har ett torr-, normal- eller våtår (3 TWh mellan högsta och lägsta notering). Elproduktionen i vattenkraftverken har ett stort inflytande på prisnivån för elektricitet. Vattenrika år leder till mycket elproduktion och lägre elpriser. År då det inte är lika mycket nederbörd innebär att man vill spara el till vintern vilket innebär högre elpriser. Vattenkraftens elproduktion avgör också hur mycket av den alternativa elproduktionen som behövs för att motsvara elkonsumtionen. Vattenkraften är en billig, miljövänlig och väl prövad energikälla som ofta föredras framför andra energikällor. Att kunna förutse vattenkraftens elproduktion är av stor vikt för elhandelsbolag då det ger dem en fördel på elmarknaden och underlättar balansansvaret. 4 Figur.1 Ett diagram över hur mycket el vattenkraften i Sverige producerat per år mellan 195 till 25. Nollnivån motsvarar elproduktionens medelvärde som är 65 TWh/år. 3 Svenskenergi. http://www.svenskenergi.se/sv/om-el/vattenkraft/, nedladdad dem 212-5-23 4 Svenska Kraftnät. http://www.svk.se/energimarknaden/el/, nedladdad dem 212-5-23 2

1.2 Syfte och problemformulering Syftet med detta arbete är att skapa modeller för icke reglerade vattenkraftverk, vilket kommer att medföra mindre fel när elhandelsföretag köper och säljer el. En ineffektiv elmarknad leder till att elhandelsföretagen m.fl. förlorar pengar samt att miljön påverkas negativt. Prognoser hjälper även elhandelsföretagen att upprätthålla balansansvaret. Uppgiften är att hitta en generell modell som går att använda på ett visst antal vattenkraftverk som inte är reglerade. Modellen ska användas till att prognostisera elproduktion per timme, prognoser kommer att hjälpa elhandelsföretag att förutse hur mycket el som kommer att produceras. Modellen ska i första hand användas till att göra prognoser på timbasis för nästkommande dag. Går det att skatta specifika modeller för de nio kraftverken det finns data för och än viktigare går det att hitta en generell modell/metod som kan appliceras på nya kraftverk? 1.3 Avgränsningar Det finns flera modeller som kan användas till att modellera en tidsserie. Vi kommer att inrikta oss på en regressionsmodell med en SARIMA del. Modellerna inkluderar bara andra ordningens interaktionstermer, detta för att det inte ska bli för många variabler samt att interaktioner av högre ordning rimligen är försumbara. Vi har resonerat oss fram till vilka lagg vi använder då inte CCF, ACF och PACF varit entydliga. 1.4 Disposition Uppstatsen är uppdelat i fem delar, inledning, teori, metod, resultat samt slutssats och diskussion. Inledningen består av bakgrund till problemet och grundläggande fakta om vattenkraft. I inledningen skrivs även uppsatsens problemformulering och avgränsningar. I teoridelen presenteras valda delar av teorin som ingår i uppsatsen och det förklaras vad en tidsserie är. Metoddelen behandlar data samt den metod vi använder till att skapa tidsseriemodellerna. I resultatdelen redovisas arbetsgången för ett av kraftverken samt en sammanfattning av resultaten för alla nio kraftverk. Då arbetet innefattat många modeller, skattade modeller, skattade ACF och PACF samt flera test, så redovisa valda delar av dessa i bilagor. Modellerna utvärderas genom att göra prognoser. I den sista delen drar vi slutsatser och diskuterar, här återkopplar vi till problemformuleringen. Modellerna jämnförs mot varandra och granskas kritiskt hur de kunde gjorts annorlunda, slutligen berörs vidare arbeten. 3

2. Teori Denna del behandlar teori om oberoende, stationäritet, SARIMA-processer, Box-Jenkins metoden, crosskorrelation, VIF, AIC och slutligen prognoser samt relativa fel. 2.1 Oberoende Skillnaden mellan regression- och tidserieansatsen är att regressionen antar ett oberoende mellan observationerna vilket inte tidserien gör. I data där det finns autokorrelation passar det bättre att använda sig av en tidsserieansats. För att kontrollera om det finns autokorrelation i en tidsserie använder man sig med fördel av test. I uppsatsen används tre typer av test för att undersöka om autokorrelation, Durbin Watson test 5, Runs test 6 och Ljung-Box test 7. Om testen visar på ett beroende mellan residualerna i en regressionsmodell så behandlas residualen som en SARIMA-process 8. En regression med en SARIMA del definieras som,,. 2.2 Stationäritet Vid arbetet med tidsserier görs antagande om stationäritet 9. Det finns två former av stationäritet, svag och strikt. Där den svaga är den mest vanliga att modellera med. I en svagt stationär process gäller det att väntevärdet och variansen är konstant över tiden samt att kovariansen inte beror av tiden utan bara av tidsavståndet. För en strikt stationär process ska de simultana fördelningarna vara samma för alla tidsserier oavsett vilket tidssteg vi tar. I denna uppsats används bara svag stationäritet. Då det är svårt att avgöra om en process är svagt stationär används med fördel Dickey-Fuller testet 1. När en stationär process är vitt brus gäller två antaganden, observationerna ska vara oberoende samt likafördelade. Vitt brus har väntevärde noll och konstant varians 11. Oberoendet mellan ger att kovariansen mellan observationerna är noll, vilket medför att korrelationen mellan observationerna är noll. 5 Andersson, Dennis R. etal. STATISTICS FOR BUSINESS AND ECONOMICS, Ohio, USA, Thomson Learning, 29, 537-539. 6 Cryer,J.D & Kung-Sik Chan. Time Series Analysis with Applications in R, Andra upplagan, New York: Springer, 28, 46. 7 Ibid, 182 8 Ibid, 262 9 Ibid, 16f 1 Ibid, 128 11 Box, G.E.P & Jenkins, G.M. Time Series Analysis forecasting and control, San Fransisco, Californien, 197, 46f. 4

2.3 SARIMA SARIMA-processer modellerar autokorrelation. Residualen i en SARIMA-process är vitt brus. En Autoregressive (AR)-process bygger på att observationer i tiden kan förklaras med hjälp av en linjärkombination av tidigare observationer. En AR-process med ett specifikt antal parametrar, en AR där slumptermen är vitt brus definieras som 12,. En Moving average (MA)-process bygger på att observationer i tiden kan förklaras med hjälp av en linjärkombination av dess tidigare observationers variation. En MA-process med ett specifikt antal parametrar, en MA där slumptermen är vitt brus definieras som 13,. Differentieringar genomförs på processer som inte är stationära, ett exempel på en differentiering är, = 14. En ARIMA-process har differentierats och är en kombination av AR- och MA-processer. En modell med specifikt antal parametarar skrivs ARIMA, där d:et står för antalet differentieringar som genomförs. De ARIMAprocesser som innehåller säsongsvariation kallas SARIMA-processer och en modell med specifikt antal parametarar skrivs SARIMA 15 Där s är hur många tidssteg en säsong är, vilket avgör tidsstegen som parameterna kopplas till och P, Q och D är antalet säsongsparametrar och säsongsdifferentieringar. 12 Cryer,J.D & Kung-Sik Chan. Time Series Analysis with Applications in R,. 66-67 13 Ibid, 57 14 Ibid, 88 15 Ibid, 226 5

2.4 Box-Jenkins metod Givet ett beroende mellan observationerna är Box-Jenkins en lämplig metod till att identifiera vilken typ av SARIMA process som verkar rimlig. Box-Jenkins metod grundas på tre steg modellval, skattning av variabler och utvärdering av modellen. 16 1. Modellval. Kontrollera om processen är stationär. Om modellen inte är stationär skall den differentieras. Det ska också kontrolleras efter säsongstrender och möjliga säsongsdifferentieringar. Sen används Autocorrelation function (ACF) och Partial autocorrelation function (PACF) för att identifiera kandidater till vilken SARIMA process som verkar rimlig. 2. Skattning av variabler. Här skattas de variabler till den SARIMA modell som valdes i första steget. Vanlig skattningsmetod är maximum likelihood eller minsta kvadrat metoden. 3. Modellen utvärderas. Undersöker om modellen uppfyller kraven. De residualer som modellen ger ska vara vitt brus. Upprepa alla steg tills modellen klarar kraven. ACF och PACF för ARMA-processer För att identifiera hur seriell autokorrelation bör modelleras undersöks korrelationen mellan olika tidpunkter i processen. ACF beskriver korrelationen i en process mellan olika tidslagg 17 och PACF beskriver korrelation i en process mellan olika lagg givet de mellanliggande tidslaggen i modellen. ACF- och PACF - verktygen används genom att jämföra ACF- och PACF- skattningar med hur de olika SARIMA processerna definieras i teorin, för att identifiera en lämplig modell. AR(p) MA(q) ARMA(p,q) givet p> och q> ACF exponentiellt avtagande Spik till lag q exponentiellt avtagande PACF Spik till lag p exponentiellt avtagande exponentiellt avtagande Tabell.1: Teoretiska ACF och PACF för ARMA processer 18 16 Box, G.E.P & Jenkins, G.M. Time Series Analysis forecasting and control, 18-19 17 Cryer,J.D & Kung-Sik Chan. Time Series Analysis with Applications in R, 19-112 18 Ibid s.116 6

2.5 Cross correlation Om den beroende variabeln inte bara beror av de oberoende variablerna vid det givna tillfället utan även tidigare värden, så är cross-correlation function (CCF) ett verktyg till att identifiera vilka tidigare värden som är relevanta 19. Om = + +, där är vitt brus oberoende av X, så definieras CCF, (X, Y) =, där dem. =, då k -d, vilket innebär att X och Y korrelerar då det är k tidssteg mellan 2.6 VIF Variance inflation factor (VIF) är ett mått på samvariationen mellan k stycken oberoende variabler i en modell. VIF definieras,. Där är förklaringsgraden av den i:te variabeln av de övriga givna oberoende variablerna i modellen. Ett högt VIF-värde indikerar att det finns problem med multikollinaritet 2. En tumregel är att ett VIF-värde över 1 indikerar risk för multikollinearitet. Multikollinaritet kan öka parametrarnas variansskattningar vilket kan ge en modell med hög förklaringsgrad men utan signifikanta variabler. Stora stickprov ger dock robusta skattningar även om VIF är högt, då variansskattningarna för parametrarna inte skenar iväg. 21 Då formeln för den i:te parameterns variansskattning ( ) går skriva om så att är i nämnaren, där är stickprovets storlek. Det ger att, givet allt annat lika, så minskar den skattade variansen av den i: te regressionskoefficienten om stickprovsstorleken ökar. T.ex. Om utgångsprovet är 25 observationer och jämförelseprovet är 97 observationer, så blir den skattade variansen en fjärdedel så stor,, allt annat lika. 19 Cryer,J.D & Kung-Sik Chan. Time Series Analysis with Applications in R, 261 2 Kleinbaum, David G. etal. Applied Regression Analysis and Other Multivariable Methods, 4 uppl, Canada, Thomson Brooks/Cole, 31 21 O`Brien, Robert M. A Caution Regarding Rules of Thumb for Variance Inflation Factors, Quality & Quantity, 27 7

2.7 AIC Akaike information criterion (AIC) mäter hur bra en modell är anpassad till datamaterialet. AIC definieras som 22,. AIC är uppdelad i två termer, den första är en funktion av loglikelihooden och den andra tar hänsyn till antalet variabler i modellen. En modells AIC kan bara vara relevant när det jämnförs med andra modellers AIC, givet samma data. Desto lägre AIC desto mer förklarar modellen av datamateralet. Ett stort antal av variabler ökar AIC, då k är antalet skattade parametrar. 2.8 Prediktion och relativt fel Prognos för ϳ tidssteg framåt definieras, = μ för alla ARMA processer 24, där μ är väntevärdet för Y. 23. Då blir stort så blir Prognosfelet definieras som, ( ) =. Prognosfelet ( ) har väntevärde noll då skattningen är unbiased och variansen är V( ( )). Under antagande om att prognosfelet är normalfördelat så definieras ett prediktionsintervall för steg framåt som, ±. För att utvärdera modeller används måttet relativt fel (RF). Detta ska ge en god fingervisning på hur exakt modellen skattar. Definitionen av uttrycket RF är, RF = 22 Chatfield, Christopher. The Analysis of Time Series An introduction, 6 uppl, Florida, CRC Press, 256 23 Cryer,J.D & Kung-Sik Chan. Time Series Analysis with Applications in R, 191 24 Ibid, 2-23 8

3. Metod 3.1 Datamaterialet Datat är från nio olika vattenkraftverk och det finns 1896 observationer från varje verk. Observationerna är gjorda under två år och två månader mellan 21-1-1 till 212-2-29. 1. Elproduktion(KWH/timme) 2. Nederbördsmängd (mm/timme) 3. Temperatur (Celsius) 4. Vindhastighet (m/s) 5. Global solinstrålning (W/ ). Elproduktionen, Temperaturen, vindhastigheten och den globala solinstrålningen är mätt på timbasis. Nederbörden divideras med 24 för att få värden på timbasis då den är mätt på dygnsbasis. Nederbörden transformeras så att effekten av nederbörden på elproduktionen utjämnas och blir exponentiellt avtagande, 25 = a + (1 - a). De första observationerna av nederbörd saknas på en del av verken, där imputeras medelvärdet. När det byts mellan sommar- och vintertid uppstår det mätproblem, saknat värde ersätts med medelvärdet av de två närliggande observationerna och värden som är summan av två timmars elproduktion halveras. Krafterk Medelvärde Standardavvikelse Varians Variationskoefficient X 2634 1294 1675588,49148 Y 851 617 3814,7247 Z 937 63 39877,67343 Å 1947 929 86265,47712 A 133 45 1983,3349 B 755 363 131978,48112 C 794 453 25437,57113 D 377 159 25145,4272 E 838 623 387924,74368 Tabell.2 Statistik över elproduktionen för de olika kraftverken. Variationskoefficienten är ett normaliserat standardavvikelsemått 26. 25 Brockwell, Peter.J. & Richard A. Davis. Time Series: Theory and Methods, 2 uppl, New York, Springer, 26, 17 26 Wackerly, Dennis D., William Mendenhall III, Richard L. Scheaffer. Mathemathical Statistics with Applications, 7 uppl, Canada, Thomson Learning, 28, 387 9

Förutsättningar vid prognostillfället Prognosen ska göras senast kl 11: dagen före och datamaterialet från gårdagen inkommer kl 1:. Det här medför att det inte går att använda data för elproduktionen de närmaste timmarna innan det givna tillfället i modellen. Dock går det att använda prognoser för nederbörd, temperatur, vindhastighet och global solinstrålning för det givna tillfället. 3.2 Metod Generell metod/tankegång med sex steg till att bygga prognosmodeller för elproduktionen vid de icke reglerbara vattenkraftverken. 1. CCF används till att identifiera vilka tidigare värden på de oberoende variablerna som korrelerar med elproduktionen. 2. Om det finns seriell autokorrelation så används Box-Jenkins metoden för att hitta vilken typ av SARIMA process som verkar rimlig. 3. Modellen modifieras beroende på förutsättningarna när data erhålls och när prognoserna utförs. 4. Undersök om någon Box-Cox transformation kan förbättra modellen. Det man vill förbättra är modellens justerade förklaringsgrad och hur den uppnår modellantagandena. 5. För att undersöka vilka förklaringsvariabler som ska ingå i modellen används stepwise AIC 27, modellen kompletteras sedan med de huvudeffekter som valdes bort men återfinns i interaktionstermerna enligt hierarkiprincipen. 6. Det kommer att råda olika förutsättningar beroende på vilken timme det är som skall modelleras, därför används en modell för varje timme. 27 Faraway, Julian J. Extending the Linear Modell with R, Florida, Chapman & Hall/CRC, 26, 19-21 1

4. Modeller och Resultat Här redovisas arbetsgången för att identifiera en rimlig modell för ett av verken, kraftverk Å, det blir fyra olika modeller som kan jämföras. Sedan har samma resonemang använts för de andra åtta kraftverkens modeller som en kontroll av metoden. Avslutningsvis utvärderas modellerna för kraftverken genom att göra prognoser och beräkna RF. Vi redovisar enbart prognoserna för kraftverk Å. 4.1 Modeller för elproduktion vid kraftverk Å Det är svårt att utläsa något ur CCF i figur 7, 8, 9 och 1 28 då det finns skenkorrelationer men det finns mönster som visar att var tolfte alternativ var tjugofjärde lagg påverkar mest, därför resonerar vi oss fram till följande regressionsmodell att utgå ifrån. Modell 1. 29 En regressionsmodell med elproduktionen som beroende variabel. Elproduktionen beror rimligen av variablerna nederbördsmängd, temperatur, vindhastighet samt global solinstrålning vid det givna tillfället t, men även av dessa variabler de senaste dagarna. Elproduktionen antas bero av de rådande förhållandena de senaste sex dagarna så modellen använder t.ex. nederbörden för, 12, 24, 36 144 timmar sedan som förklarande variabler. Eftersom att nederbördsmängd, temperatur, vindhastighet och global solstrålning inte varierar så mycket mellan varje timme används var tolfte observation av de oberoende variablerna i modellen. Modellen innehåller interaktionstermer då t.ex. temperaturens effekt på elproduktionen rimligen beror av vindstyrkan. Skattar Modell 1 3. Den här modellen ger en justerad förklaringsgrad på 37,6% och modellantagandena brister då det finns mönster- samt en bristande homoscedascicitet och normalitet i residualen. Runs- och Durbin Watson testen visar att det finns beroende mellan observationerna. 28 Se bilaga 1 29 Se bilaga 2 3 Se bilaga 3 11

Partial Autocorrelation Autocorrelation Modell 2 tar hänsyn till den seriella autokorrelationen i modell 1 och behandlar modell 1 residualen som en SARIMA-process 1,,8,6,4,2, -,2 -,4 -,6 -,8-1, Autocorrelation Function for RES (with 5% significance limits for the autocorrelations) 1 1 2 3 4 5 Lag 6 7 8 9 1 Figur.2 Skattad ACF på modell 1 residualer. 1,,8,6,4,2, -,2 -,4 -,6 -,8-1, Partial Autocorrelation Function for RES (with 5% significance limits for the partial autocorrelations) 1 2 4 6 8 1 Lag 12 14 16 18 2 Figur.3 Skattad PACF på modell 1 residualer. ACF i figur 2 avtar exponentiellt och PACF i figur 3 har spikar i var 24 lagg vilket tyder på en SARIMA(2,,)(. Skattar Modell 2 31. Om SARIMA processen som identifierats ovan tillförs till modell 1 så ger den en justerad förklaringsgrad på 98,8% och det finns inte kvar något beroende enligt Durbin-Watson testet. 31 Se bilaga 4 12

Modell 3 32. De närmaste 47 observationerna av elproduktionen innan det givna tillfället är inte kända vid prognostillfället. Modell 3 innehåller därför AR-termer med start 48 timmar innan då det är dessa data som finns tillgängliga. Modellen inkluderar tidigare elproduktion upp till 168 timmar tidigare då PACF motiverar detta, alltså en vecka tidigare. Inkluderar även fyra interaktionstermer då tidigare elproduktion kan tänkas påverka effekten av t.ex. tidigare nederbörd på elproduktionen. Det är inte aktuellt med en transformation av elproduktionen eller de oberoende variablerna, eftersom det inte förbättrar modellens justerade förklaringsgrad eller hur den klarar modellantagandena. Använder stepwise AIC till att undersöka vilka variabler som ska finnas med i modellen. Kompletterar sedan modellen enligt hierarkiprincipen med de huvudeffekter som plockas bort men som återfinns i interaktionstermerna, den resulterande modellen betecknas Modell 3*. Skattar Modell 3* 33, denna modell ger en justerad förklaringsgrad på 82,8% men vi ser i residualen och i testen att det finns ett oförklarat beroende mellan observationerna. Modellens VIF värden är högre än tumregeln för flertalet variabler. Modell 4 34. Det kommer att råda olika förutsättningar för prediktionerna, beroende på vilken timme på dygnet det är. Då dygnets första timme ska predikteras så kommer vi att känna elproduktionen 25 timmar tidigare men då dygnets sista timme ska predikteras så kommer förutsättningarna att vara sämre då vi inte känner elproduktionen de 47 tidigare timmarna. För att göra så bra prognoser som möjligt så gör vi därför 24 stycken modeller, en för varje timme, där modellen för dygnets första timme får högst justerad förklaringsgrad och sedan blir den justerade förklaringsgraden successivt lite lägre för varje timme 35. Så beroende på vilken timme som ska predikteras så kompletteras modell 3* med närmre observationer av elproduktionen som förklarande variabel. Den sista timmen får enbart använda Modell 3* samtidigt som den första timmens modell kompletteras med 23 förklarande variabler. 32 Se bilaga 5 33 Se bilaga 6 34 Se bilaga 7 35 Se bilaga 8 13

4.2 Sammanfattning arbetsgång och resultat för de nio kraftverken För de övriga åtta kraftverken finns det även skenkorrelationer i CCF och det finns mönster som pekar på att var tolfte alternativt var tjugofjärde lagg korrelerar mest. Modell 1 residualerna visar att det finns ett beroende mellan observationerna för alla verk. Om modell 1 residualen ses som en SARIMA-process så identifierar Box-Jenkins metoden någon form av SAR process för alla verkens modeller. Då det genomgående skattas en exponentiellt avtagande ACF, och där det är spikar i var tolfte alternativt var tjugofjärde lagg i den skattade PACF:n, vilket indikerar ett säsongsberoende. Om den identifierade SARprocessen tillförs till modellen så ger samtliga verks modeller en hög justerad förklaringsgrad, 97,4 % som lägst förutom C som har 83,5 %. Den enda modell som förbättras av en transformation är modellen för kraftverk X, där elproduktionen logaritmerades. Stepwise AIC ger modellerna olika variabler för de olika kraftverken och parameterskattningarna är inte samma för de olika kraftverken. Verk Område Modell 1 Modell 2 Modell 3* Modell 4 X 4 21 99,7 95,1 95,1-97,2 Y 3 25,4 99,6 94,4 94,4-96,1 Z 2 15,1 99,4 92,7 92,7-95, Å 3 37,6 98,8 82,8 82,8-88,2 A 2 16,4 98,5 75,2 75,2-81,4 B 3 25,6 99,2 9,8 9,8-94,4 C 3 17,2 83,5 64,7 64,7-68,7 D 4 29,9 97,4 85,4 85,4-89,8 E 4 47,4 99,4 94,9 94,9-95,8 Tabell.3: Summering av den justerade förklaringsgraden för modell 1 till 4 för de olika verken 14

Data Data 4.3 Prognoser för elproduktion och relativt fel vid kraftverk Å Andra verks modeller har testats genom att göra prognoser men bara kraftverk Å redovisas. Prognoserna är gjorda för två olika fyradygnsperioder. Den ena perioden är mellan 26-29 juli 211 36 och den andra perioden är för 26-29 februari 212. Obs vs Modell 2 Skattningar26-29 Februari 212 29 28 27 Variable Obs Skatt KI_U KI_Ö PI_U PI_Ö 26 25 24 23 22 1 1 2 3 4 5 Index 6 7 8 9 Figur.4 Prognos för elproduktionen med modell 2 Obs vs Modell 3* Skattningar 26-29 Februari 212 35 3 Variable OBS Skatt KI_U KI_Ö PI_U PL_Ö 25 2 15 1 1 2 3 4 5 Index 6 7 8 9 Figur.5 Prognos för elproduktionen med modell 3* 36 Se bilaga.9 15

Data 4 35 3 Obs vs Modell 4 Skattningar 26-29 Februari 212 Variable OBS Skatt KIU KIÖ PIU PIÖ 25 2 1 1 2 3 4 5 Index 6 7 8 9 Figur.6 Prognos för elproduktionen med modell 4 För att utvärdera modellerna beräknas medelvärdet av RF för de olika modellerna för de två fyradygnsperioderna. Modell 2 Modell 3* Modell 4 RF Feb 1% 7.4% 7.5% RF Juli 7.3% 46.2% 42.4% Tabell.4: Sammanställning av prediktionens RF medelvärde med modell 2 till 4 för de två prognostillfällena. 16

5 Diskussion och slutsatser Här utvärderas modellerna och dess prognoser. Vi diskuterar, drar slutsatser, kritiserar och ger exempel på vidare undersökningar. Utvärdering och modellval Modell 1 beskriver inte data nöjsamt för något av verken, som tabell 3 visar. Detta för att modell 1 inte tar hänsyn till den seriella autokorrelationen. När autokorrelationen modeleras enligt Box-Jenkins metoden i modell 2 ger detta en mycket hög justerad förklaringsgrad för alla verk, med undantag verk C som tabell 3 visar. Elproduktionen i verk C går inte att förklara lika bra med en enklare SARIMA. Vi har undersökt om elproduktionen i verk C beskrivs bättre om processen differentieras, men utan lyckat resultat. Modell 3* och modell 4 tar hänsyn till förutsättningarna som råder då prognosen ska göras. Modell 4 har en högre justerad förklaringsgrad än modell 3* förutom för dygnets sista timme då det är samma modell. Modellernas antaganden brister då residualen och testen visar på ett beroende mellan observationerna. Beroendet förklaras av att de närmsta laggen inte används. Alla modellerna har höga VIF värden för flertalet variabler vilket varnar för multikollinaritet, men det är vanligt i den här typen av tidsserieprocess och då vi har så många observationer så får vi inte några problem med robustheten i våra parameterskattningar. I en jämförelse mellan prognoserna av modell 2, modell 3* och modell 4 så är prognosen av modell 2 näst intill felfri. Prognoserna av modell 3* och modell 4 liknar till stor del varandra och är, i jämförelse med prognoserna av modell 2, inte så träffsäkra. I en jämförelse av RF mellan prognoserna av modell 3* och modell 4, så predikterar modell 4 bättre i juliprognosen samtidigt som den predikterar lite sämre i februariprognosen, som tabell 4 visar. I en jämförelse av RF mellan de olika prognosperioderna så blir prediktionen bättre av alla modeller i februariprognosen, som tabell 4 visar. 17

Modell 3* och modell 4 har en hög justerad förklaringsgrad men prognosfelen blir stora då elproduktionen varierar mycket, som vi ser i tabell 2. Att elproduktionen varierar mycket ser vi även på att prediktionsintervallen är väldigt brett jämfört med konfidensintervallen, vilket beror på att prediktionsintervallet utöver de skattade parametrarnas osäkerhet även tar hänsyn till variationen för den nya observationen 37. Figur 16 och 17 38 visar att RF i juliprognoserna blir stora jämfört med hur hög justerad förklaringsgrad modellerna har. Detta går att sammankoppla med att elproduktionens variationskoefficient är hög som tabell 2 visar. Modell 2 har den högsta justerade förklaringsgraden och lägst RF då vi jämför de olika modellerna, men den går inte att använda p.g.a. förutsättningarna vid prognostillfället. Därför blir den bästa modellen som går att hitta modell 4, denna modellerar de nio vattenkraftverkens elproduktion nöjsamt, med reservation för verk C. Därför är det rimligt att utgå ifrån modell 4 när man ska bygga prognosmodeller för andra kraftverk. Metodkritik Nedan kritiseras data och metoden som använts till att bygga modeller. 1. Om data för elproduktion närmare det givna tillfället erhålls innan prognosen ska göras så kan det bli bättre prediktioner, eftersom att en modell som innehåller närmre AR-termer har en högre justerad förklaringsgrad. 2. Det vore önskvärt om det fanns längre dataserier, då är det lättare att se om det finns säsongsmönster beroende på årstid. Med dessa data så tillför säsongsdummys för årstid och dess interaktionstermer försvinnande lite samtidigt som de mångdubblar antalet variabler. 3. Om data för nederbörd var på timbasis istället för på dygnsbasis, så skulle nederbörden rimligen förklara mer. Nederbördsdata på dygnsbasis förklarar inte mycket av elproduktion/timme. T.ex. vid kraftverk Å så förklaras bara 1.6 % av elproduktionen av en regressionsmodell med nederbörd och tidigare nederbörd som oberoende variabler. 4. Det kan finnas fler förklarande variabler som vi inte har data på. Andra externa variabler som rimligen skulle tillföra modellen något kan t.ex. vara, andra naturfaktorer, om det finns andra verk tidigare i älven och avbrott i hela eller delar av produktionen. 37 Wackerly, Dennis D., William Mendenhall III, Richard L. Scheaffer. Mathemathical Statistics with Applications, 387 38 Se bilaga.9 18

5. Alla lagg för alla variabler har inte testats och det känns rimligt att det skulle finnas någon lagg som vi inte inkluderar i modellen som skulle tillföra något. Samtidigt så ska man inte tillföra variabler till modellen som inte verkar rimliga och modellen ska göras så enkel som möjligt 39. 6. Prognoserna görs endast på två fyradygnsperioder, så utvärderingen av modellerna görs på ett litet stickprov. Vidare arbeten Vidare så kan det vara av intresse att summera elproduktionen för flera verk, t.ex. av alla verk som ligger i samma område. Givet att elproduktionen i de olika verken är oberoende av varandra så försvinner det en del av prognosfelet då flera kraftverk summeras, då kanske ett verk underskattar produktionen samtidigt som ett annat överskattar produktionen och vice versa 4. För att undersöka om det finns något beroende mellan prognosfelen för verk i samma område så undersöks korrelationen mellan modellernas residualer. På en 5 % signifikansnivå så finns det ett beroende i område 3 och 4 men inte i område 2 för de kraftverk det finns data på 41. Men i praktiken så finns det många fler verk i de olika områdena vilket rimligen innebär att det blir många kovarianser att ta hänsyn till då variansen beräknas, vilket innebär att prognostiseringsfelet inte behöver bli relativt mindre. Det skulle vara intressant att undersöka summering av elproduktionen för två eller flera verk mer utförligt. Vidare så finns det alternativa metoder som skulle kunna tillämpas till att bygga modellet för elproduktion. ARCH och GARCH modeller lämpar sig bra då det inte är konstant varians och Functional Data Analysis modellerar in- och utflöde. Det hade varit intressant att jämföra modell 4 mot resultatet av alternativa metoder. Det kan tänkas att vår metod passar bättre för en del av kraftverken samtidigt som någon annan metod kanske bättre beskriver elproduktionen för de verk där vi fick mindre bra resultat. 39 Cryer,J.D & Kung-Sik Chan. Time Series Analysis with Applications in R, 8 4 Wackerly, Dennis D., William Mendenhall III, Richard L. Scheaffer. Mathemathical Statistics with Applications, 271 41 Se bilaga.1 19

Litteraturförteckning Svensk energi. (212). Hämtat från http://www.svenskenergi.se/sv/om-el/vattenkraft/: http://www.svenskenergi.se/sv/om-el/vattenkraft/ den 22 maj 212 Svenska Kraftnät. (den 23 maj 212). Hämtat från www.svk.se: http://www.svk.se/energimarknaden/el/, nedladdad dem 212-5-23 Andersson, D. R., Sweeney, D. J., Williams, T. A., Freeman, J., & Shoesmith, E. (29). Statistics for business and economics. Ohio, USA: Thomson Learning. Box, G., & Jenkins, G. (197). Time Series Analysis forecasting and control. San Fransisco, Kalifornien: Holden-Day Series in Time Series Analysis. Brockwell, P. J., & Davis, R. A. (26). Time Series: Theory and methods (2 uppl.). New York: Springer. Chatfield, C. (24). The Analysis of Time Series (6 uppl.). Florida: CRC press. Cryer, J. D., & Chan, K.-S. (28). Time Series Analysis with Applications in R. New York: Springer. Faraway, J. J. (26). Extending the Linear Model with R. Florida: CRC. Kleinbaum, D. G., Kupper, L. L., Nizam, A., & Muller, K. E. (27). Applied regression analysis and other multivariable methods (4 uppl.). Mendenhall, W., Scheaffer, R. L., & Wackerly, D. D. (28). Mathematical Statistics With Applications (7 uppl.). Canada: Thomas Learning. O Brien, R. M. (27). A Caution Regarding Rules of Thumb for Variance Inflation Factors. Quality & Quantity, ss. 673 69.

Cross Correlation Cross Correlation Bilaga.1 Cross Correlation Functions mellan elproduktion och de oberoende variablerna, vid kraftverk Å. Cross Correlation Function mellan nederbörd och elproduktion 1,,8,6,4,2, -,2 -,4 -,6 -,8-1, -14-12 -1-8 -6-4 -2 Lag 2 4 6 8 1 12 14 Figur.7 CCF mellan nederbörd och elproduktion vid kraftverk Å. Cross Correlation Function mellan temperatur och elproduktion 1,,8,6,4,2, -,2 -,4 -,6 -,8-1, -14-12 -1-8 -6-4 -2 Lag 2 4 6 8 1 12 14 Figur.8 CCF mellan temperatur och elproduktion vid kraftverk Å.

Cross Correlation Cross Correlation Cross Correlation Function mellan vindhastighet och elproduktion 1,,8,6,4,2, -,2 -,4 -,6 -,8-1, -14-12 -1-8 -6-4 -2 Lag 2 4 6 8 1 12 14 Figur.9 CCF mellan Vindhastighet och elproduktion vid kraftverk Å. Cross Correlation Function mellan global solinstrålning och elproduktion 1,,8,6,4,2, -,2 -,4 -,6 -,8-1, -14-12 -1-8 -6-4 -2 Lag 2 4 6 8 1 12 14 Figur.1 CCF mellan global solinstrålning och elproduktion vid kraftverk Å.

Bilaga.2 Modell 1 = Elproduktionen vid tidpunkten t. = Nederbördsmängd vid tidpunkten t. = Temperatur vid tidpunkten t. = Vindhastighet vid tidpunkten t. = Global solinstrålning vid tidpunkten t. = + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * +

* * + * * + * * + * * + * * + * * + * * + ~N(,σ) är oberoende stokastiska variabler. Det blir alltså 78 parametrar som ska skattas och till vår hjälp använder vi oss av minitab som skattar parametrarna med minsta kvadrat metoden.

Bilaga.3 Skattad Modell 1 på vattenkraftverk Å. S = 735,365 R-Sq = 37,9% R-Sq(adj) = 37,6% Analysis of Variance Source Regression Residual Error Total DF 77 18738 18815 SS 618475252 1132796637 16317546889 MS 8321432 54762 F 148,53 P, Mdl1 residualer för VP vid kraftverk Å Normal Probability Plot Versus Fits 99,99 2 9 Residual Percent 99 5 1 1,1 1-1 -2-4 -2 Residual 2 4 Histogram 4 2 45 Residual Frequency 3 Versus Order 6 3 15 1 2 Fitted Value 1-1 -2-165 -11-55 55 11 165 22 Residual Figur.11 Residualer för modell 1. Durbin-Watson statistic =,345914 Runs Test: RES Runs test for RES Runs above and below K = -1,5293E-11 The observed number of runs = 744 The expected number of runs = 942,9 9153 observations above K; 9663 below P-value =, 1 2 4 6 8 1 12 14 16 18 Observation Order

Frequency Residual Percent Residual Bilaga.4 Skattad Modell 2 på kraftverk Å. S = 11,528 R-Sq = 98,8% R-Sq(adj) = 98,8% Analysis of Variance Source DF SS MS F P Regression 1 16184161 1618416 15626,74, Residual Error 18689 192646134 138 Total 18789 163687744 Mdl1+SARIMA residualer för VP vid vattenkraftverk Å Normal Probability Plot Versus Fits 99,99 99 9 1 5 5 1 1,1-5 -1-1 -5 Residual 5 1 1 2 3 Fitted Value 4 48 36 24 12-975 -65-325 325 Residual Figur.12 Residualer för modell 2. Histogram 65 Durbin-Watson statistic = 1,99651 Runs Test: RES Runs test for RES 975 Runs above and below K = -1,178E-11 The observed number of runs = 8971 The expected number of runs = 9395,74 9346 observations above K; 9444 below P-value =, 1 5-5 -1 1 2 4 6 8 Versus Order Observation Order 1 12 14 16 18

Bilaga.5 Modell 3 = * + * + * + * + * + * + * + * + * + * + * + * + * + Teoretisk Modell 1(Men utan ) + * * + * * + * * + * * + där är vitt brus. är oberoende av varandra och oberoende av,,, och för alla t och för alla k. E( ) = och V( ) = Det blir alltså 95 parametrar som ska skattas, använder vi oss av minitab.

Bilaga.6 Skattad Modell 3* på vattenkraftverk Å. S = 386,257 R-Sq = 82,9% R-Sq(adj) = 82,8% Analysis of Variance Source Regression Residual Error Total DF 68 18723 18791 SS 1357663376 2793365453 163128828 MS 19864218 149194 F 1331,43 P, Mdl 3* residualer vid kraftverk Å Normal Probability Plot Versus Fits 2 99,99 1 9 Residual Percent 99 5 1 1,1-2 -1 Residual 1-1 -2 2 1 Histogram 4 2 9 Residual Frequency 3 Versus Order 12 6 3 2 Fitted Value -135-9 -45 45 Residual 9 135 1-1 -2 1 2 4 6 8 1 12 14 16 18 Observation Order Figur.13 Residualer för modell 3*. Durbin-Watson statistic =,855247 Runs Test: RES Runs test for RES Runs above and below K = -1,22484E-11 The observed number of runs = 1338 The expected number of runs = 9396,91 9425 observations above K; 9367 below P-value =, Parameterskattningar: Predictor Constant VP 48 h sedan VP 5 h sedan VP 6 h sedan Coef 32,15,3858,484,4788 SE Coef 21,55,1794,1661,11 T 1,49 21,47 2,91 4,78 P,136,,4, VIF 35,155 3,148 1,944

VP 72 h sedan -,3849,1132-3,4,1 14, VP 96 h sedan,4597,1143 4,2, 14,293 VP 18 h sedan -,2333,171-2,18,29 12,544 VP 12 h sedan -,273,1169-2,34,2 14,936 VP 132 h sedan -,142,1171 -,89,374 14,969 VP 144 h sedan,15762,1154 13,66, 14,539 VP 156 h sedan,3597,162 3,39,1 12,38 VP 168 h sedan,313648,9543 32,87, 9,931 Ned Nu 342,4 39,44 8,67, 6,431 Ned 12 h sedan 42,22 37,76 1,12,264 5,896 Ned 24 h sedan 66,7 66,19 1,,318 18,113 Ned 36 h sedan 46,68 44,43 1,5,293 8,161 Ned 48 h sedan 42,76 6,2,71,478 14,979 Ned 6 h sedan 87,39 39,91 2,19,29 6,581 Ned 72 h sedan 547,39 58,59 9,34, 14,185 Ned 96 h sedan 131,95 17,13 7,7, 1,212 Ned 12 h sedan 116,75 16,91 6,9, 1,18 Ned 144 h sedan 185, 16,61 11,14, 1,127 Temp Nu 8,159 1,281 6,37, 18,78 Temp 12 h sedan 3,245 1,267 2,56,1 18,368 Temp 24 h sedan 2,783 1,356 2,5,4 21,77 Temp 36 h sedan -4,335 1,312-3,3,1 19,81 Temp 48 h sedan -3,818 1,738-2,2,28 34,921 Temp 6 h sedan -3,17 1,328-2,27,23 2,471 Temp 72 h sedan -,739 1,442 -,51,68 24,23 Temp 84 h sedan 3,389 1,376 2,46,14 22,94 Temp 96 sedan -3,326 1,33-2,55,11 19,849 Temp 18 sedan 5,25 1,344 3,91, 21,125 Temp 12 h sedan 3,136 1,184 2,65,8 16,466 Temp 132 h sedan -8,12 1,72-7,55, 13,531 Vind Nu -1,473 2,458 -,6,549 2,151 Vind 12 h sedan -1,68 2,245-4,76, 1,792 Vind 24 h sedan -14,163 2,469-5,74, 2,167 Vind 48 h sedan 3,246 5,46 5,99, 9,5 Vind 72 h sedan 17,63 2,824 6,24, 2,833 Vind 84 h sedan -4,216 2,17-1,94,52 1,672 Vind 18 h sedan 4,368 2,42 2,14,32 1,48 Vind 132 h sedan 5,521 1,964 2,81,5 1,367 Glob Nu -,8545,5616-1,52,128 15,669 Glob 24 h sedan -,1423,4313-3,25,1 9,242 Glob 36 h sedan -,14554,479-3,57, 8,267 Glob 48 h sedan,6338,9368,68,499 43,594 Glob 6 h sedan,4711,4264 1,1,269 9,33 Glob 72 h sedan,47263,7759 6,9, 29,94 Glob 84 h sedan,4854,427 1,14,256 9,58 Glob 96 h sedan -,9938,4173-2,38,17 8,649 Glob 18 h sedan -,18248,474-4,48, 8,244 NedNu*TempNu -26,56 2,65-1,, 5,627 TempNu*VindNu -1,815,2298-7,88, 6,655 VindNu*GlobNu,374,119 3,34,1 9,391 NedNu*Ned24 152,4 52,76 2,88,4 3,48 Ned24*Temp24-6,959 2,883-2,41,16 6,91 Ned 24*Vind24 26,25 1,92 2,4,16 7,719 Ned48*Vind48-25,98 1,98-2,37,18 7,812 Temp48*Glob48,14268,3739 3,82, 21,242 Vind48*Glob48 -,3453,117-3,39,1 7,898 Ned48*Ned72-59,16 52,19-1,13,257 3,45 Ned72*Temp72-23,364 2,824-8,27, 6,633 Ned72*Vind72-36,9 1,98-3,36,1 7,81 Temp72*Glob72 -,23592,3661-6,44, 2,375 Vind72*Glob72 -,4111,113-4,6, 7,836 VP 48*Ned48,17629,211 8,39, 3,565 VP 48*Temp48,12361,548 2,45,14 1,25 VP 48*Vind48 -,9114,1994-4,57, 1,399 VP 48*Glob48 -,6356,1988-3,2,1 8,226

Bilaga.7 Modell 4 = Modell 3* + Där i är vilken timme på dygnet det är, i =1-24, vilket ger oss 24 olika modeller.

Data Bilaga.8 Radj% Flera Modeller vs En Modell 88 Variable Radj% Radj%EnkelMdl 87 86 85 84 83 1 1 2 3 4 5 Index 6 7 8 9 Figur.14 Justerad förklaringsgrad för modellerna för de fyra sista dygnens timmar vid kraftverk Å, beroende på om vi använder en modell för varje timme eller om vi använder den enklare modellen.

Data Data Bilaga.9 Prognoser av modell 2, modell 3* och modell 4 för elproduktionen vid kraftverk Å 26-29 juli 211. 25 2 15 Obs vs Modell 2 Skattning 26-29 Juli 211 Variable Obs Skatt KIU KIÖ PIU PIÖ 1 5 1 1 2 3 4 5 Index 6 7 8 9 Figur.15 Prognos för elproduktionen den 26-29 juli 211 med modell 2. Obs vs Modell 3* Skattning 26-29 Juli 211 25 2 15 Variable Obs Skatt KIU KIÖ PIU PIÖ 1 5-5 1 1 2 3 4 5 Index 6 7 8 9 Figur.16 Prognos för elproduktionen den 26-29 juli 211 med modell 3*.

Data Obs vs Modell4 Skattning 26-29 Juli 211 25 2 15 Variable Obs Skatt KIU KIÖ PIU PIÖ 1 5-5 1 1 2 3 4 5 Index 6 7 8 9 Figur.17 Prognos för elproduktionen den 26-29 juli 211 med modell 4.

Z Bilaga.1 Undersöker beroendet mellan prognosfelen i område 2. 2 Residualerna för kraftverk Z och A plottade mot varandra 1-1 -2-2 -15-1 -5 A 5 1 15 Figur.18 Korrelation mellan modell 3* residualerna för kraftverk A och Z. Pearson correlation of Z and A =,5 Test av : att residualerna är oberoende ger p-värdet =,528