Prediktion av elproduktion.

Storlek: px
Starta visningen från sidan:

Download "Prediktion av elproduktion."

Transkript

1 Prediktion av elproduktion. Modellering av icke reglerbara vattenkraftverk. Anton Edström Viktor Sjödin Student Vt 212 Examensarbete, 15 hp Statistik C, 3 hp Handledare: Johan Svensson

2

3 Sammanfattning Denna uppsats skrivs på uppdrag åt elhandelsföretaget Bixia. Uppsatsen handlar om prognostisering av icke reglerbara vattenkraftverk. Det som prognostiseras är elproduktionen på timbasis för olika vattenkraftverk. Uppdraget är att undersöka om det går att finna en generell modell/metod som kan appliceras på olika vattenkraftverk, samt att göra en specifik modell för varje kraftverk vi har data på. Det insamlade datamaterialet består av elproduktion, nederbörd, temperatur, vindhastighet och global solinstrålning från nio kraftverk. Då det finns seriell autokorrelation i elproduktionen så tillför vi en SARIMA del till regressionsmodellen. De resulterande modellerna för de olika verken ger skilda förklaringsgrader. Det beror på att data från de mest närliggande observationerna på elproduktionen inte går att tillgå då vid prognostillfället och de närmaste observationerna av elproduktionen förklarar mer eller mindre mycket, beroende på vilket verk vi modellerar. Denna modell ger en bra justerad förklaringsgrad för en del verk men måste kompletteras alternativt ändras för andra verk. Abstract This paper was written on assignment for the electricity company Bixia. The paper is about electric power forecasting in hydropower plants. The prediction is electricity production in different hydropower plants. The assignment is to find a general model / method that can be applied to the various hydropower plants. The collected data material consists of electricity production data from nine hydropower plants, additional data are wind, rain, temperature and global solar insolation. We use a regression model with a SARIMA part because of the autocorrelation. The result was that the method gave us models that have quite different predictive power. It may be that data from the closest observations of water production is not available when the prediction is made, and these data contains more or less information depending on which plant we are modeling. The method works but may need to be changed or developed for some hydropower plants.

4 Populär sammanfattning Att Sverige har så mycket förnyelsebara energikällor beror till stor del på att vi har vattenkraft. Den har gett oss ett stort försprång när vi nu ska ta oss an klimatpåverkningarnas framfart. Därför är det viktigt att vi kan lita på vattenkraften och att den ger elektricitet när det behövs. Detta arbete skrivs åt elhandelsföretaget Bixia som säljer elektricitet till sina kunder. För Bixia är det viktigt att veta hur mycket elektricitet deras vattenkraft ger från dag till dag. Uppgiften är att skapa en generell metod som kan förutse elproduktionen på timbasis. Resultatet blev att modellerna vi får av metoden förklarar olika mycket av elproduktionen för de olika kraftverken. Modellerna är bra men metoden kan utvecklas så att modellerna förutser elproduktionen bättre. Tillkännagivanden Tack till Alain Angeralides, Johan Svensson och alla andra som gett kommentarer och råd om vårt arbete.

5 Innehåll 1 Inledning Bakgrund Syfte och problemformulering Avgränsningar Disposition Teori Oberoende Stationäritet SARIMA Box-Jenkins metod Cross correlation VIF AIC Prediktion och relativt fel Metod Datamaterialet Metod Modeller och Resultat Modeller för elproduktion vid kraftverk Å Sammanfattning arbetsgång och resultat för de nio kraftverken Prognoser för elproduktion och relativt fel vid kraftverk Å Diskussion och slutsatser... 17

6 1 Inledning 1.1 Bakgrund I det moderna samhälle vi lever i drivs allt fler saker av el och vardagslivets kvalitet är beroende av ett fungerande elnät. Vi ser en fungerande och pålitlig elförsörjning som en självklarhet. Indirekt är det solens energi som driver vattenkraften, genom vattnets kretslopp där vattnet avdunstar av solvärmen och sedan kondenserar i snö och regn. 1 Det bildas forsar, älvar och åar som driver vattenkraftverken. Vattenkraftverken omvandlar vattenströmmar till el då forsande vatten gör att verkets turbiner börjar snurra. Turbinen driver en generator som tar vara på energin i vattnet och omvandlar den till el, hur mycket energi som genereras beror av vattnets massa och fallhöjd. Vatten kan regleras av dammar och sparas i vattenmagasin. Det är på våren som det mesta vattnet rinner till men det är på vinterhalvåret som efterfrågan på el är som störst, därför fyller dammarna en mycket viktig funktion då de gör att man kan hushålla med vattnet och använda det då efterfrågan på el är som störst. Då älvar är reglerade kan man bestämma och planera hur mycket vatten man ska släppa på och därav hur mycket el som ska produceras. Dock så regleras inte alla vattenkraftverk och det är just de icke reglerbara vattenkraftverken som vårt arbete kommer att handla om. Vattenkraftverken producerar ca 45 procent av den el som svenskarna använder. 2 Vattenkraft är fortfarande Sveriges viktigaste förnybara energikälla, då vattenkraften inte förbrukar några ändliga naturresurser. Vattenkraften bidrar relativt lite till växthuseffekten och den påverkar nästan bara miljön när kraftverk och dammar byggs. Fastän vattenkraften har funnits länge så försöker man hela tiden förbättra den och det forskas bl.a. om lönsamheten i att reglera vattendrag, man försöker även hitta lösningar på ekosystemets påverkan vid uppbyggnaden av vattenkraftverk. I Sverige finns det ca 18 vattenkraftverk och sammantaget producerar de 65 TWh el under ett normalår. Norrland står för 8 % av den svenska vattenkraftens elproduktion. Vattenkraft är driftsäkert och lätt reglerat efter marknaden då tekniken är väl prövad och utvecklad. 1 Svenskenergi. nedladdad dem Ibid 1

7 Vattenkraftverkens elproduktion varierar mycket mellan åren i Sverige och den varierar även dagligen. 3 Vattenkraftens elproduktion beror av hur mycket nederbörd det är och varierar därför beroende på om vi har ett torr-, normal- eller våtår (3 TWh mellan högsta och lägsta notering). Elproduktionen i vattenkraftverken har ett stort inflytande på prisnivån för elektricitet. Vattenrika år leder till mycket elproduktion och lägre elpriser. År då det inte är lika mycket nederbörd innebär att man vill spara el till vintern vilket innebär högre elpriser. Vattenkraftens elproduktion avgör också hur mycket av den alternativa elproduktionen som behövs för att motsvara elkonsumtionen. Vattenkraften är en billig, miljövänlig och väl prövad energikälla som ofta föredras framför andra energikällor. Att kunna förutse vattenkraftens elproduktion är av stor vikt för elhandelsbolag då det ger dem en fördel på elmarknaden och underlättar balansansvaret. 4 Figur.1 Ett diagram över hur mycket el vattenkraften i Sverige producerat per år mellan 195 till 25. Nollnivån motsvarar elproduktionens medelvärde som är 65 TWh/år. 3 Svenskenergi. nedladdad dem Svenska Kraftnät. nedladdad dem

8 1.2 Syfte och problemformulering Syftet med detta arbete är att skapa modeller för icke reglerade vattenkraftverk, vilket kommer att medföra mindre fel när elhandelsföretag köper och säljer el. En ineffektiv elmarknad leder till att elhandelsföretagen m.fl. förlorar pengar samt att miljön påverkas negativt. Prognoser hjälper även elhandelsföretagen att upprätthålla balansansvaret. Uppgiften är att hitta en generell modell som går att använda på ett visst antal vattenkraftverk som inte är reglerade. Modellen ska användas till att prognostisera elproduktion per timme, prognoser kommer att hjälpa elhandelsföretag att förutse hur mycket el som kommer att produceras. Modellen ska i första hand användas till att göra prognoser på timbasis för nästkommande dag. Går det att skatta specifika modeller för de nio kraftverken det finns data för och än viktigare går det att hitta en generell modell/metod som kan appliceras på nya kraftverk? 1.3 Avgränsningar Det finns flera modeller som kan användas till att modellera en tidsserie. Vi kommer att inrikta oss på en regressionsmodell med en SARIMA del. Modellerna inkluderar bara andra ordningens interaktionstermer, detta för att det inte ska bli för många variabler samt att interaktioner av högre ordning rimligen är försumbara. Vi har resonerat oss fram till vilka lagg vi använder då inte CCF, ACF och PACF varit entydliga. 1.4 Disposition Uppstatsen är uppdelat i fem delar, inledning, teori, metod, resultat samt slutssats och diskussion. Inledningen består av bakgrund till problemet och grundläggande fakta om vattenkraft. I inledningen skrivs även uppsatsens problemformulering och avgränsningar. I teoridelen presenteras valda delar av teorin som ingår i uppsatsen och det förklaras vad en tidsserie är. Metoddelen behandlar data samt den metod vi använder till att skapa tidsseriemodellerna. I resultatdelen redovisas arbetsgången för ett av kraftverken samt en sammanfattning av resultaten för alla nio kraftverk. Då arbetet innefattat många modeller, skattade modeller, skattade ACF och PACF samt flera test, så redovisa valda delar av dessa i bilagor. Modellerna utvärderas genom att göra prognoser. I den sista delen drar vi slutsatser och diskuterar, här återkopplar vi till problemformuleringen. Modellerna jämnförs mot varandra och granskas kritiskt hur de kunde gjorts annorlunda, slutligen berörs vidare arbeten. 3

9 2. Teori Denna del behandlar teori om oberoende, stationäritet, SARIMA-processer, Box-Jenkins metoden, crosskorrelation, VIF, AIC och slutligen prognoser samt relativa fel. 2.1 Oberoende Skillnaden mellan regression- och tidserieansatsen är att regressionen antar ett oberoende mellan observationerna vilket inte tidserien gör. I data där det finns autokorrelation passar det bättre att använda sig av en tidsserieansats. För att kontrollera om det finns autokorrelation i en tidsserie använder man sig med fördel av test. I uppsatsen används tre typer av test för att undersöka om autokorrelation, Durbin Watson test 5, Runs test 6 och Ljung-Box test 7. Om testen visar på ett beroende mellan residualerna i en regressionsmodell så behandlas residualen som en SARIMA-process 8. En regression med en SARIMA del definieras som,,. 2.2 Stationäritet Vid arbetet med tidsserier görs antagande om stationäritet 9. Det finns två former av stationäritet, svag och strikt. Där den svaga är den mest vanliga att modellera med. I en svagt stationär process gäller det att väntevärdet och variansen är konstant över tiden samt att kovariansen inte beror av tiden utan bara av tidsavståndet. För en strikt stationär process ska de simultana fördelningarna vara samma för alla tidsserier oavsett vilket tidssteg vi tar. I denna uppsats används bara svag stationäritet. Då det är svårt att avgöra om en process är svagt stationär används med fördel Dickey-Fuller testet 1. När en stationär process är vitt brus gäller två antaganden, observationerna ska vara oberoende samt likafördelade. Vitt brus har väntevärde noll och konstant varians 11. Oberoendet mellan ger att kovariansen mellan observationerna är noll, vilket medför att korrelationen mellan observationerna är noll. 5 Andersson, Dennis R. etal. STATISTICS FOR BUSINESS AND ECONOMICS, Ohio, USA, Thomson Learning, 29, Cryer,J.D & Kung-Sik Chan. Time Series Analysis with Applications in R, Andra upplagan, New York: Springer, 28, Ibid, Ibid, Ibid, 16f 1 Ibid, Box, G.E.P & Jenkins, G.M. Time Series Analysis forecasting and control, San Fransisco, Californien, 197, 46f. 4

10 2.3 SARIMA SARIMA-processer modellerar autokorrelation. Residualen i en SARIMA-process är vitt brus. En Autoregressive (AR)-process bygger på att observationer i tiden kan förklaras med hjälp av en linjärkombination av tidigare observationer. En AR-process med ett specifikt antal parametrar, en AR där slumptermen är vitt brus definieras som 12,. En Moving average (MA)-process bygger på att observationer i tiden kan förklaras med hjälp av en linjärkombination av dess tidigare observationers variation. En MA-process med ett specifikt antal parametrar, en MA där slumptermen är vitt brus definieras som 13,. Differentieringar genomförs på processer som inte är stationära, ett exempel på en differentiering är, = 14. En ARIMA-process har differentierats och är en kombination av AR- och MA-processer. En modell med specifikt antal parametarar skrivs ARIMA, där d:et står för antalet differentieringar som genomförs. De ARIMAprocesser som innehåller säsongsvariation kallas SARIMA-processer och en modell med specifikt antal parametarar skrivs SARIMA 15 Där s är hur många tidssteg en säsong är, vilket avgör tidsstegen som parameterna kopplas till och P, Q och D är antalet säsongsparametrar och säsongsdifferentieringar. 12 Cryer,J.D & Kung-Sik Chan. Time Series Analysis with Applications in R, Ibid, Ibid, Ibid, 226 5

11 2.4 Box-Jenkins metod Givet ett beroende mellan observationerna är Box-Jenkins en lämplig metod till att identifiera vilken typ av SARIMA process som verkar rimlig. Box-Jenkins metod grundas på tre steg modellval, skattning av variabler och utvärdering av modellen Modellval. Kontrollera om processen är stationär. Om modellen inte är stationär skall den differentieras. Det ska också kontrolleras efter säsongstrender och möjliga säsongsdifferentieringar. Sen används Autocorrelation function (ACF) och Partial autocorrelation function (PACF) för att identifiera kandidater till vilken SARIMA process som verkar rimlig. 2. Skattning av variabler. Här skattas de variabler till den SARIMA modell som valdes i första steget. Vanlig skattningsmetod är maximum likelihood eller minsta kvadrat metoden. 3. Modellen utvärderas. Undersöker om modellen uppfyller kraven. De residualer som modellen ger ska vara vitt brus. Upprepa alla steg tills modellen klarar kraven. ACF och PACF för ARMA-processer För att identifiera hur seriell autokorrelation bör modelleras undersöks korrelationen mellan olika tidpunkter i processen. ACF beskriver korrelationen i en process mellan olika tidslagg 17 och PACF beskriver korrelation i en process mellan olika lagg givet de mellanliggande tidslaggen i modellen. ACF- och PACF - verktygen används genom att jämföra ACF- och PACF- skattningar med hur de olika SARIMA processerna definieras i teorin, för att identifiera en lämplig modell. AR(p) MA(q) ARMA(p,q) givet p> och q> ACF exponentiellt avtagande Spik till lag q exponentiellt avtagande PACF Spik till lag p exponentiellt avtagande exponentiellt avtagande Tabell.1: Teoretiska ACF och PACF för ARMA processer Box, G.E.P & Jenkins, G.M. Time Series Analysis forecasting and control, Cryer,J.D & Kung-Sik Chan. Time Series Analysis with Applications in R, Ibid s.116 6

12 2.5 Cross correlation Om den beroende variabeln inte bara beror av de oberoende variablerna vid det givna tillfället utan även tidigare värden, så är cross-correlation function (CCF) ett verktyg till att identifiera vilka tidigare värden som är relevanta 19. Om = + +, där är vitt brus oberoende av X, så definieras CCF, (X, Y) =, där dem. =, då k -d, vilket innebär att X och Y korrelerar då det är k tidssteg mellan 2.6 VIF Variance inflation factor (VIF) är ett mått på samvariationen mellan k stycken oberoende variabler i en modell. VIF definieras,. Där är förklaringsgraden av den i:te variabeln av de övriga givna oberoende variablerna i modellen. Ett högt VIF-värde indikerar att det finns problem med multikollinaritet 2. En tumregel är att ett VIF-värde över 1 indikerar risk för multikollinearitet. Multikollinaritet kan öka parametrarnas variansskattningar vilket kan ge en modell med hög förklaringsgrad men utan signifikanta variabler. Stora stickprov ger dock robusta skattningar även om VIF är högt, då variansskattningarna för parametrarna inte skenar iväg. 21 Då formeln för den i:te parameterns variansskattning ( ) går skriva om så att är i nämnaren, där är stickprovets storlek. Det ger att, givet allt annat lika, så minskar den skattade variansen av den i: te regressionskoefficienten om stickprovsstorleken ökar. T.ex. Om utgångsprovet är 25 observationer och jämförelseprovet är 97 observationer, så blir den skattade variansen en fjärdedel så stor,, allt annat lika. 19 Cryer,J.D & Kung-Sik Chan. Time Series Analysis with Applications in R, Kleinbaum, David G. etal. Applied Regression Analysis and Other Multivariable Methods, 4 uppl, Canada, Thomson Brooks/Cole, O`Brien, Robert M. A Caution Regarding Rules of Thumb for Variance Inflation Factors, Quality & Quantity, 27 7

13 2.7 AIC Akaike information criterion (AIC) mäter hur bra en modell är anpassad till datamaterialet. AIC definieras som 22,. AIC är uppdelad i två termer, den första är en funktion av loglikelihooden och den andra tar hänsyn till antalet variabler i modellen. En modells AIC kan bara vara relevant när det jämnförs med andra modellers AIC, givet samma data. Desto lägre AIC desto mer förklarar modellen av datamateralet. Ett stort antal av variabler ökar AIC, då k är antalet skattade parametrar. 2.8 Prediktion och relativt fel Prognos för ϳ tidssteg framåt definieras, = μ för alla ARMA processer 24, där μ är väntevärdet för Y. 23. Då blir stort så blir Prognosfelet definieras som, ( ) =. Prognosfelet ( ) har väntevärde noll då skattningen är unbiased och variansen är V( ( )). Under antagande om att prognosfelet är normalfördelat så definieras ett prediktionsintervall för steg framåt som, ±. För att utvärdera modeller används måttet relativt fel (RF). Detta ska ge en god fingervisning på hur exakt modellen skattar. Definitionen av uttrycket RF är, RF = 22 Chatfield, Christopher. The Analysis of Time Series An introduction, 6 uppl, Florida, CRC Press, Cryer,J.D & Kung-Sik Chan. Time Series Analysis with Applications in R, Ibid,

14 3. Metod 3.1 Datamaterialet Datat är från nio olika vattenkraftverk och det finns 1896 observationer från varje verk. Observationerna är gjorda under två år och två månader mellan till Elproduktion(KWH/timme) 2. Nederbördsmängd (mm/timme) 3. Temperatur (Celsius) 4. Vindhastighet (m/s) 5. Global solinstrålning (W/ ). Elproduktionen, Temperaturen, vindhastigheten och den globala solinstrålningen är mätt på timbasis. Nederbörden divideras med 24 för att få värden på timbasis då den är mätt på dygnsbasis. Nederbörden transformeras så att effekten av nederbörden på elproduktionen utjämnas och blir exponentiellt avtagande, 25 = a + (1 - a). De första observationerna av nederbörd saknas på en del av verken, där imputeras medelvärdet. När det byts mellan sommar- och vintertid uppstår det mätproblem, saknat värde ersätts med medelvärdet av de två närliggande observationerna och värden som är summan av två timmars elproduktion halveras. Krafterk Medelvärde Standardavvikelse Varians Variationskoefficient X ,49148 Y ,7247 Z ,67343 Å ,47712 A ,3349 B ,48112 C ,57113 D ,4272 E ,74368 Tabell.2 Statistik över elproduktionen för de olika kraftverken. Variationskoefficienten är ett normaliserat standardavvikelsemått Brockwell, Peter.J. & Richard A. Davis. Time Series: Theory and Methods, 2 uppl, New York, Springer, 26, Wackerly, Dennis D., William Mendenhall III, Richard L. Scheaffer. Mathemathical Statistics with Applications, 7 uppl, Canada, Thomson Learning, 28, 387 9

15 Förutsättningar vid prognostillfället Prognosen ska göras senast kl 11: dagen före och datamaterialet från gårdagen inkommer kl 1:. Det här medför att det inte går att använda data för elproduktionen de närmaste timmarna innan det givna tillfället i modellen. Dock går det att använda prognoser för nederbörd, temperatur, vindhastighet och global solinstrålning för det givna tillfället. 3.2 Metod Generell metod/tankegång med sex steg till att bygga prognosmodeller för elproduktionen vid de icke reglerbara vattenkraftverken. 1. CCF används till att identifiera vilka tidigare värden på de oberoende variablerna som korrelerar med elproduktionen. 2. Om det finns seriell autokorrelation så används Box-Jenkins metoden för att hitta vilken typ av SARIMA process som verkar rimlig. 3. Modellen modifieras beroende på förutsättningarna när data erhålls och när prognoserna utförs. 4. Undersök om någon Box-Cox transformation kan förbättra modellen. Det man vill förbättra är modellens justerade förklaringsgrad och hur den uppnår modellantagandena. 5. För att undersöka vilka förklaringsvariabler som ska ingå i modellen används stepwise AIC 27, modellen kompletteras sedan med de huvudeffekter som valdes bort men återfinns i interaktionstermerna enligt hierarkiprincipen. 6. Det kommer att råda olika förutsättningar beroende på vilken timme det är som skall modelleras, därför används en modell för varje timme. 27 Faraway, Julian J. Extending the Linear Modell with R, Florida, Chapman & Hall/CRC, 26,

16 4. Modeller och Resultat Här redovisas arbetsgången för att identifiera en rimlig modell för ett av verken, kraftverk Å, det blir fyra olika modeller som kan jämföras. Sedan har samma resonemang använts för de andra åtta kraftverkens modeller som en kontroll av metoden. Avslutningsvis utvärderas modellerna för kraftverken genom att göra prognoser och beräkna RF. Vi redovisar enbart prognoserna för kraftverk Å. 4.1 Modeller för elproduktion vid kraftverk Å Det är svårt att utläsa något ur CCF i figur 7, 8, 9 och 1 28 då det finns skenkorrelationer men det finns mönster som visar att var tolfte alternativ var tjugofjärde lagg påverkar mest, därför resonerar vi oss fram till följande regressionsmodell att utgå ifrån. Modell En regressionsmodell med elproduktionen som beroende variabel. Elproduktionen beror rimligen av variablerna nederbördsmängd, temperatur, vindhastighet samt global solinstrålning vid det givna tillfället t, men även av dessa variabler de senaste dagarna. Elproduktionen antas bero av de rådande förhållandena de senaste sex dagarna så modellen använder t.ex. nederbörden för, 12, 24, timmar sedan som förklarande variabler. Eftersom att nederbördsmängd, temperatur, vindhastighet och global solstrålning inte varierar så mycket mellan varje timme används var tolfte observation av de oberoende variablerna i modellen. Modellen innehåller interaktionstermer då t.ex. temperaturens effekt på elproduktionen rimligen beror av vindstyrkan. Skattar Modell 1 3. Den här modellen ger en justerad förklaringsgrad på 37,6% och modellantagandena brister då det finns mönster- samt en bristande homoscedascicitet och normalitet i residualen. Runs- och Durbin Watson testen visar att det finns beroende mellan observationerna. 28 Se bilaga 1 29 Se bilaga 2 3 Se bilaga 3 11

17 Partial Autocorrelation Autocorrelation Modell 2 tar hänsyn till den seriella autokorrelationen i modell 1 och behandlar modell 1 residualen som en SARIMA-process 1,,8,6,4,2, -,2 -,4 -,6 -,8-1, Autocorrelation Function for RES (with 5% significance limits for the autocorrelations) Lag Figur.2 Skattad ACF på modell 1 residualer. 1,,8,6,4,2, -,2 -,4 -,6 -,8-1, Partial Autocorrelation Function for RES (with 5% significance limits for the partial autocorrelations) Lag Figur.3 Skattad PACF på modell 1 residualer. ACF i figur 2 avtar exponentiellt och PACF i figur 3 har spikar i var 24 lagg vilket tyder på en SARIMA(2,,)(. Skattar Modell Om SARIMA processen som identifierats ovan tillförs till modell 1 så ger den en justerad förklaringsgrad på 98,8% och det finns inte kvar något beroende enligt Durbin-Watson testet. 31 Se bilaga 4 12

18 Modell De närmaste 47 observationerna av elproduktionen innan det givna tillfället är inte kända vid prognostillfället. Modell 3 innehåller därför AR-termer med start 48 timmar innan då det är dessa data som finns tillgängliga. Modellen inkluderar tidigare elproduktion upp till 168 timmar tidigare då PACF motiverar detta, alltså en vecka tidigare. Inkluderar även fyra interaktionstermer då tidigare elproduktion kan tänkas påverka effekten av t.ex. tidigare nederbörd på elproduktionen. Det är inte aktuellt med en transformation av elproduktionen eller de oberoende variablerna, eftersom det inte förbättrar modellens justerade förklaringsgrad eller hur den klarar modellantagandena. Använder stepwise AIC till att undersöka vilka variabler som ska finnas med i modellen. Kompletterar sedan modellen enligt hierarkiprincipen med de huvudeffekter som plockas bort men som återfinns i interaktionstermerna, den resulterande modellen betecknas Modell 3*. Skattar Modell 3* 33, denna modell ger en justerad förklaringsgrad på 82,8% men vi ser i residualen och i testen att det finns ett oförklarat beroende mellan observationerna. Modellens VIF värden är högre än tumregeln för flertalet variabler. Modell Det kommer att råda olika förutsättningar för prediktionerna, beroende på vilken timme på dygnet det är. Då dygnets första timme ska predikteras så kommer vi att känna elproduktionen 25 timmar tidigare men då dygnets sista timme ska predikteras så kommer förutsättningarna att vara sämre då vi inte känner elproduktionen de 47 tidigare timmarna. För att göra så bra prognoser som möjligt så gör vi därför 24 stycken modeller, en för varje timme, där modellen för dygnets första timme får högst justerad förklaringsgrad och sedan blir den justerade förklaringsgraden successivt lite lägre för varje timme 35. Så beroende på vilken timme som ska predikteras så kompletteras modell 3* med närmre observationer av elproduktionen som förklarande variabel. Den sista timmen får enbart använda Modell 3* samtidigt som den första timmens modell kompletteras med 23 förklarande variabler. 32 Se bilaga 5 33 Se bilaga 6 34 Se bilaga 7 35 Se bilaga 8 13

19 4.2 Sammanfattning arbetsgång och resultat för de nio kraftverken För de övriga åtta kraftverken finns det även skenkorrelationer i CCF och det finns mönster som pekar på att var tolfte alternativt var tjugofjärde lagg korrelerar mest. Modell 1 residualerna visar att det finns ett beroende mellan observationerna för alla verk. Om modell 1 residualen ses som en SARIMA-process så identifierar Box-Jenkins metoden någon form av SAR process för alla verkens modeller. Då det genomgående skattas en exponentiellt avtagande ACF, och där det är spikar i var tolfte alternativt var tjugofjärde lagg i den skattade PACF:n, vilket indikerar ett säsongsberoende. Om den identifierade SARprocessen tillförs till modellen så ger samtliga verks modeller en hög justerad förklaringsgrad, 97,4 % som lägst förutom C som har 83,5 %. Den enda modell som förbättras av en transformation är modellen för kraftverk X, där elproduktionen logaritmerades. Stepwise AIC ger modellerna olika variabler för de olika kraftverken och parameterskattningarna är inte samma för de olika kraftverken. Verk Område Modell 1 Modell 2 Modell 3* Modell 4 X ,7 95,1 95,1-97,2 Y 3 25,4 99,6 94,4 94,4-96,1 Z 2 15,1 99,4 92,7 92,7-95, Å 3 37,6 98,8 82,8 82,8-88,2 A 2 16,4 98,5 75,2 75,2-81,4 B 3 25,6 99,2 9,8 9,8-94,4 C 3 17,2 83,5 64,7 64,7-68,7 D 4 29,9 97,4 85,4 85,4-89,8 E 4 47,4 99,4 94,9 94,9-95,8 Tabell.3: Summering av den justerade förklaringsgraden för modell 1 till 4 för de olika verken 14

20 Data Data 4.3 Prognoser för elproduktion och relativt fel vid kraftverk Å Andra verks modeller har testats genom att göra prognoser men bara kraftverk Å redovisas. Prognoserna är gjorda för två olika fyradygnsperioder. Den ena perioden är mellan juli och den andra perioden är för februari 212. Obs vs Modell 2 Skattningar26-29 Februari Variable Obs Skatt KI_U KI_Ö PI_U PI_Ö Index Figur.4 Prognos för elproduktionen med modell 2 Obs vs Modell 3* Skattningar Februari Variable OBS Skatt KI_U KI_Ö PI_U PL_Ö Index Figur.5 Prognos för elproduktionen med modell 3* 36 Se bilaga.9 15

21 Data Obs vs Modell 4 Skattningar Februari 212 Variable OBS Skatt KIU KIÖ PIU PIÖ Index Figur.6 Prognos för elproduktionen med modell 4 För att utvärdera modellerna beräknas medelvärdet av RF för de olika modellerna för de två fyradygnsperioderna. Modell 2 Modell 3* Modell 4 RF Feb 1% 7.4% 7.5% RF Juli 7.3% 46.2% 42.4% Tabell.4: Sammanställning av prediktionens RF medelvärde med modell 2 till 4 för de två prognostillfällena. 16

22 5 Diskussion och slutsatser Här utvärderas modellerna och dess prognoser. Vi diskuterar, drar slutsatser, kritiserar och ger exempel på vidare undersökningar. Utvärdering och modellval Modell 1 beskriver inte data nöjsamt för något av verken, som tabell 3 visar. Detta för att modell 1 inte tar hänsyn till den seriella autokorrelationen. När autokorrelationen modeleras enligt Box-Jenkins metoden i modell 2 ger detta en mycket hög justerad förklaringsgrad för alla verk, med undantag verk C som tabell 3 visar. Elproduktionen i verk C går inte att förklara lika bra med en enklare SARIMA. Vi har undersökt om elproduktionen i verk C beskrivs bättre om processen differentieras, men utan lyckat resultat. Modell 3* och modell 4 tar hänsyn till förutsättningarna som råder då prognosen ska göras. Modell 4 har en högre justerad förklaringsgrad än modell 3* förutom för dygnets sista timme då det är samma modell. Modellernas antaganden brister då residualen och testen visar på ett beroende mellan observationerna. Beroendet förklaras av att de närmsta laggen inte används. Alla modellerna har höga VIF värden för flertalet variabler vilket varnar för multikollinaritet, men det är vanligt i den här typen av tidsserieprocess och då vi har så många observationer så får vi inte några problem med robustheten i våra parameterskattningar. I en jämförelse mellan prognoserna av modell 2, modell 3* och modell 4 så är prognosen av modell 2 näst intill felfri. Prognoserna av modell 3* och modell 4 liknar till stor del varandra och är, i jämförelse med prognoserna av modell 2, inte så träffsäkra. I en jämförelse av RF mellan prognoserna av modell 3* och modell 4, så predikterar modell 4 bättre i juliprognosen samtidigt som den predikterar lite sämre i februariprognosen, som tabell 4 visar. I en jämförelse av RF mellan de olika prognosperioderna så blir prediktionen bättre av alla modeller i februariprognosen, som tabell 4 visar. 17

23 Modell 3* och modell 4 har en hög justerad förklaringsgrad men prognosfelen blir stora då elproduktionen varierar mycket, som vi ser i tabell 2. Att elproduktionen varierar mycket ser vi även på att prediktionsintervallen är väldigt brett jämfört med konfidensintervallen, vilket beror på att prediktionsintervallet utöver de skattade parametrarnas osäkerhet även tar hänsyn till variationen för den nya observationen 37. Figur 16 och visar att RF i juliprognoserna blir stora jämfört med hur hög justerad förklaringsgrad modellerna har. Detta går att sammankoppla med att elproduktionens variationskoefficient är hög som tabell 2 visar. Modell 2 har den högsta justerade förklaringsgraden och lägst RF då vi jämför de olika modellerna, men den går inte att använda p.g.a. förutsättningarna vid prognostillfället. Därför blir den bästa modellen som går att hitta modell 4, denna modellerar de nio vattenkraftverkens elproduktion nöjsamt, med reservation för verk C. Därför är det rimligt att utgå ifrån modell 4 när man ska bygga prognosmodeller för andra kraftverk. Metodkritik Nedan kritiseras data och metoden som använts till att bygga modeller. 1. Om data för elproduktion närmare det givna tillfället erhålls innan prognosen ska göras så kan det bli bättre prediktioner, eftersom att en modell som innehåller närmre AR-termer har en högre justerad förklaringsgrad. 2. Det vore önskvärt om det fanns längre dataserier, då är det lättare att se om det finns säsongsmönster beroende på årstid. Med dessa data så tillför säsongsdummys för årstid och dess interaktionstermer försvinnande lite samtidigt som de mångdubblar antalet variabler. 3. Om data för nederbörd var på timbasis istället för på dygnsbasis, så skulle nederbörden rimligen förklara mer. Nederbördsdata på dygnsbasis förklarar inte mycket av elproduktion/timme. T.ex. vid kraftverk Å så förklaras bara 1.6 % av elproduktionen av en regressionsmodell med nederbörd och tidigare nederbörd som oberoende variabler. 4. Det kan finnas fler förklarande variabler som vi inte har data på. Andra externa variabler som rimligen skulle tillföra modellen något kan t.ex. vara, andra naturfaktorer, om det finns andra verk tidigare i älven och avbrott i hela eller delar av produktionen. 37 Wackerly, Dennis D., William Mendenhall III, Richard L. Scheaffer. Mathemathical Statistics with Applications, Se bilaga.9 18

24 5. Alla lagg för alla variabler har inte testats och det känns rimligt att det skulle finnas någon lagg som vi inte inkluderar i modellen som skulle tillföra något. Samtidigt så ska man inte tillföra variabler till modellen som inte verkar rimliga och modellen ska göras så enkel som möjligt Prognoserna görs endast på två fyradygnsperioder, så utvärderingen av modellerna görs på ett litet stickprov. Vidare arbeten Vidare så kan det vara av intresse att summera elproduktionen för flera verk, t.ex. av alla verk som ligger i samma område. Givet att elproduktionen i de olika verken är oberoende av varandra så försvinner det en del av prognosfelet då flera kraftverk summeras, då kanske ett verk underskattar produktionen samtidigt som ett annat överskattar produktionen och vice versa 4. För att undersöka om det finns något beroende mellan prognosfelen för verk i samma område så undersöks korrelationen mellan modellernas residualer. På en 5 % signifikansnivå så finns det ett beroende i område 3 och 4 men inte i område 2 för de kraftverk det finns data på 41. Men i praktiken så finns det många fler verk i de olika områdena vilket rimligen innebär att det blir många kovarianser att ta hänsyn till då variansen beräknas, vilket innebär att prognostiseringsfelet inte behöver bli relativt mindre. Det skulle vara intressant att undersöka summering av elproduktionen för två eller flera verk mer utförligt. Vidare så finns det alternativa metoder som skulle kunna tillämpas till att bygga modellet för elproduktion. ARCH och GARCH modeller lämpar sig bra då det inte är konstant varians och Functional Data Analysis modellerar in- och utflöde. Det hade varit intressant att jämföra modell 4 mot resultatet av alternativa metoder. Det kan tänkas att vår metod passar bättre för en del av kraftverken samtidigt som någon annan metod kanske bättre beskriver elproduktionen för de verk där vi fick mindre bra resultat. 39 Cryer,J.D & Kung-Sik Chan. Time Series Analysis with Applications in R, 8 4 Wackerly, Dennis D., William Mendenhall III, Richard L. Scheaffer. Mathemathical Statistics with Applications, Se bilaga.1 19

25 Litteraturförteckning Svensk energi. (212). Hämtat från den 22 maj 212 Svenska Kraftnät. (den 23 maj 212). Hämtat från nedladdad dem Andersson, D. R., Sweeney, D. J., Williams, T. A., Freeman, J., & Shoesmith, E. (29). Statistics for business and economics. Ohio, USA: Thomson Learning. Box, G., & Jenkins, G. (197). Time Series Analysis forecasting and control. San Fransisco, Kalifornien: Holden-Day Series in Time Series Analysis. Brockwell, P. J., & Davis, R. A. (26). Time Series: Theory and methods (2 uppl.). New York: Springer. Chatfield, C. (24). The Analysis of Time Series (6 uppl.). Florida: CRC press. Cryer, J. D., & Chan, K.-S. (28). Time Series Analysis with Applications in R. New York: Springer. Faraway, J. J. (26). Extending the Linear Model with R. Florida: CRC. Kleinbaum, D. G., Kupper, L. L., Nizam, A., & Muller, K. E. (27). Applied regression analysis and other multivariable methods (4 uppl.). Mendenhall, W., Scheaffer, R. L., & Wackerly, D. D. (28). Mathematical Statistics With Applications (7 uppl.). Canada: Thomas Learning. O Brien, R. M. (27). A Caution Regarding Rules of Thumb for Variance Inflation Factors. Quality & Quantity, ss

26 Cross Correlation Cross Correlation Bilaga.1 Cross Correlation Functions mellan elproduktion och de oberoende variablerna, vid kraftverk Å. Cross Correlation Function mellan nederbörd och elproduktion 1,,8,6,4,2, -,2 -,4 -,6 -,8-1, Lag Figur.7 CCF mellan nederbörd och elproduktion vid kraftverk Å. Cross Correlation Function mellan temperatur och elproduktion 1,,8,6,4,2, -,2 -,4 -,6 -,8-1, Lag Figur.8 CCF mellan temperatur och elproduktion vid kraftverk Å.

27 Cross Correlation Cross Correlation Cross Correlation Function mellan vindhastighet och elproduktion 1,,8,6,4,2, -,2 -,4 -,6 -,8-1, Lag Figur.9 CCF mellan Vindhastighet och elproduktion vid kraftverk Å. Cross Correlation Function mellan global solinstrålning och elproduktion 1,,8,6,4,2, -,2 -,4 -,6 -,8-1, Lag Figur.1 CCF mellan global solinstrålning och elproduktion vid kraftverk Å.

28 Bilaga.2 Modell 1 = Elproduktionen vid tidpunkten t. = Nederbördsmängd vid tidpunkten t. = Temperatur vid tidpunkten t. = Vindhastighet vid tidpunkten t. = Global solinstrålning vid tidpunkten t. = + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * + * * +

29 * * + * * + * * + * * + * * + * * + * * + ~N(,σ) är oberoende stokastiska variabler. Det blir alltså 78 parametrar som ska skattas och till vår hjälp använder vi oss av minitab som skattar parametrarna med minsta kvadrat metoden.

30 Bilaga.3 Skattad Modell 1 på vattenkraftverk Å. S = 735,365 R-Sq = 37,9% R-Sq(adj) = 37,6% Analysis of Variance Source Regression Residual Error Total DF SS MS F 148,53 P, Mdl1 residualer för VP vid kraftverk Å Normal Probability Plot Versus Fits 99, Residual Percent , Residual 2 4 Histogram Residual Frequency 3 Versus Order Fitted Value Residual Figur.11 Residualer för modell 1. Durbin-Watson statistic =, Runs Test: RES Runs test for RES Runs above and below K = -1,5293E-11 The observed number of runs = 744 The expected number of runs = 942, observations above K; 9663 below P-value =, Observation Order

31 Frequency Residual Percent Residual Bilaga.4 Skattad Modell 2 på kraftverk Å. S = 11,528 R-Sq = 98,8% R-Sq(adj) = 98,8% Analysis of Variance Source DF SS MS F P Regression ,74, Residual Error Total Mdl1+SARIMA residualer för VP vid vattenkraftverk Å Normal Probability Plot Versus Fits 99, , Residual Fitted Value Residual Figur.12 Residualer för modell 2. Histogram 65 Durbin-Watson statistic = 1,99651 Runs Test: RES Runs test for RES 975 Runs above and below K = -1,178E-11 The observed number of runs = 8971 The expected number of runs = 9395, observations above K; 9444 below P-value =, Versus Order Observation Order

32 Bilaga.5 Modell 3 = * + * + * + * + * + * + * + * + * + * + * + * + * + Teoretisk Modell 1(Men utan ) + * * + * * + * * + * * + där är vitt brus. är oberoende av varandra och oberoende av,,, och för alla t och för alla k. E( ) = och V( ) = Det blir alltså 95 parametrar som ska skattas, använder vi oss av minitab.

33 Bilaga.6 Skattad Modell 3* på vattenkraftverk Å. S = 386,257 R-Sq = 82,9% R-Sq(adj) = 82,8% Analysis of Variance Source Regression Residual Error Total DF SS MS F 1331,43 P, Mdl 3* residualer vid kraftverk Å Normal Probability Plot Versus Fits 2 99, Residual Percent , Residual Histogram Residual Frequency 3 Versus Order Fitted Value Residual Observation Order Figur.13 Residualer för modell 3*. Durbin-Watson statistic =, Runs Test: RES Runs test for RES Runs above and below K = -1,22484E-11 The observed number of runs = 1338 The expected number of runs = 9396, observations above K; 9367 below P-value =, Parameterskattningar: Predictor Constant VP 48 h sedan VP 5 h sedan VP 6 h sedan Coef 32,15,3858,484,4788 SE Coef 21,55,1794,1661,11 T 1,49 21,47 2,91 4,78 P,136,,4, VIF 35,155 3,148 1,944

34 VP 72 h sedan -,3849,1132-3,4,1 14, VP 96 h sedan,4597,1143 4,2, 14,293 VP 18 h sedan -,2333,171-2,18,29 12,544 VP 12 h sedan -,273,1169-2,34,2 14,936 VP 132 h sedan -,142,1171 -,89,374 14,969 VP 144 h sedan,15762, ,66, 14,539 VP 156 h sedan,3597,162 3,39,1 12,38 VP 168 h sedan,313648, ,87, 9,931 Ned Nu 342,4 39,44 8,67, 6,431 Ned 12 h sedan 42,22 37,76 1,12,264 5,896 Ned 24 h sedan 66,7 66,19 1,,318 18,113 Ned 36 h sedan 46,68 44,43 1,5,293 8,161 Ned 48 h sedan 42,76 6,2,71,478 14,979 Ned 6 h sedan 87,39 39,91 2,19,29 6,581 Ned 72 h sedan 547,39 58,59 9,34, 14,185 Ned 96 h sedan 131,95 17,13 7,7, 1,212 Ned 12 h sedan 116,75 16,91 6,9, 1,18 Ned 144 h sedan 185, 16,61 11,14, 1,127 Temp Nu 8,159 1,281 6,37, 18,78 Temp 12 h sedan 3,245 1,267 2,56,1 18,368 Temp 24 h sedan 2,783 1,356 2,5,4 21,77 Temp 36 h sedan -4,335 1,312-3,3,1 19,81 Temp 48 h sedan -3,818 1,738-2,2,28 34,921 Temp 6 h sedan -3,17 1,328-2,27,23 2,471 Temp 72 h sedan -,739 1,442 -,51,68 24,23 Temp 84 h sedan 3,389 1,376 2,46,14 22,94 Temp 96 sedan -3,326 1,33-2,55,11 19,849 Temp 18 sedan 5,25 1,344 3,91, 21,125 Temp 12 h sedan 3,136 1,184 2,65,8 16,466 Temp 132 h sedan -8,12 1,72-7,55, 13,531 Vind Nu -1,473 2,458 -,6,549 2,151 Vind 12 h sedan -1,68 2,245-4,76, 1,792 Vind 24 h sedan -14,163 2,469-5,74, 2,167 Vind 48 h sedan 3,246 5,46 5,99, 9,5 Vind 72 h sedan 17,63 2,824 6,24, 2,833 Vind 84 h sedan -4,216 2,17-1,94,52 1,672 Vind 18 h sedan 4,368 2,42 2,14,32 1,48 Vind 132 h sedan 5,521 1,964 2,81,5 1,367 Glob Nu -,8545,5616-1,52,128 15,669 Glob 24 h sedan -,1423,4313-3,25,1 9,242 Glob 36 h sedan -,14554,479-3,57, 8,267 Glob 48 h sedan,6338,9368,68,499 43,594 Glob 6 h sedan,4711,4264 1,1,269 9,33 Glob 72 h sedan,47263,7759 6,9, 29,94 Glob 84 h sedan,4854,427 1,14,256 9,58 Glob 96 h sedan -,9938,4173-2,38,17 8,649 Glob 18 h sedan -,18248,474-4,48, 8,244 NedNu*TempNu -26,56 2,65-1,, 5,627 TempNu*VindNu -1,815,2298-7,88, 6,655 VindNu*GlobNu,374,119 3,34,1 9,391 NedNu*Ned24 152,4 52,76 2,88,4 3,48 Ned24*Temp24-6,959 2,883-2,41,16 6,91 Ned 24*Vind24 26,25 1,92 2,4,16 7,719 Ned48*Vind48-25,98 1,98-2,37,18 7,812 Temp48*Glob48,14268,3739 3,82, 21,242 Vind48*Glob48 -,3453,117-3,39,1 7,898 Ned48*Ned72-59,16 52,19-1,13,257 3,45 Ned72*Temp72-23,364 2,824-8,27, 6,633 Ned72*Vind72-36,9 1,98-3,36,1 7,81 Temp72*Glob72 -,23592,3661-6,44, 2,375 Vind72*Glob72 -,4111,113-4,6, 7,836 VP 48*Ned48,17629,211 8,39, 3,565 VP 48*Temp48,12361,548 2,45,14 1,25 VP 48*Vind48 -,9114,1994-4,57, 1,399 VP 48*Glob48 -,6356,1988-3,2,1 8,226

35 Bilaga.7 Modell 4 = Modell 3* + Där i är vilken timme på dygnet det är, i =1-24, vilket ger oss 24 olika modeller.

36 Data Bilaga.8 Radj% Flera Modeller vs En Modell 88 Variable Radj% Radj%EnkelMdl Index Figur.14 Justerad förklaringsgrad för modellerna för de fyra sista dygnens timmar vid kraftverk Å, beroende på om vi använder en modell för varje timme eller om vi använder den enklare modellen.

37 Data Data Bilaga.9 Prognoser av modell 2, modell 3* och modell 4 för elproduktionen vid kraftverk Å juli Obs vs Modell 2 Skattning Juli 211 Variable Obs Skatt KIU KIÖ PIU PIÖ Index Figur.15 Prognos för elproduktionen den juli 211 med modell 2. Obs vs Modell 3* Skattning Juli Variable Obs Skatt KIU KIÖ PIU PIÖ Index Figur.16 Prognos för elproduktionen den juli 211 med modell 3*.

38 Data Obs vs Modell4 Skattning Juli Variable Obs Skatt KIU KIÖ PIU PIÖ Index Figur.17 Prognos för elproduktionen den juli 211 med modell 4.

39 Z Bilaga.1 Undersöker beroendet mellan prognosfelen i område 2. 2 Residualerna för kraftverk Z och A plottade mot varandra A Figur.18 Korrelation mellan modell 3* residualerna för kraftverk A och Z. Pearson correlation of Z and A =,5 Test av : att residualerna är oberoende ger p-värdet =,528

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012 Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB2 Skrivning i ekonometri onsdagen den 1 juni 211 1. Vi vill undersöka hur variationen i försäljningspriset för ett hus (i en liten stad i USA

Läs mer

Skrivning i ekonometri lördagen den 25 augusti 2007

Skrivning i ekonometri lördagen den 25 augusti 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA10:3 Skrivning i ekonometri lördagen den 5 augusti 007 1. Vi vill undersöka hur variationen i ölförsäljningen i ett bryggeri i en stad i USA

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

Något om val mellan olika metoder

Något om val mellan olika metoder Något om val mellan olika metoder Givet är en observerad tidsserie: y 1 y 2 y n Säsonger? Ja Nej Trend? Tidsserieregression Nej ARMA-modeller Enkel exponentiell utjämning Tidsserieregression ARIMA-modeller

Läs mer

TENTAMEN I STATISTIK B,

TENTAMEN I STATISTIK B, 732G7 Tentamen. hp TENTAMEN I STATISTIK B, 24-2- Skrivtid: kl: -2 Tillåtna hjälpmedel: Ett A4-blad med egna handskrivna anteckningar samt räknedosa Jourhavande lärare: Lotta Hallberg Betygsgränser: Tentamen

Läs mer

Exempel 1 på multipelregression

Exempel 1 på multipelregression Exempel på multipelregression Hastighet = högsta hastighet som uppnåtts fram till givna år (årtal) Årtal Hastighet 8 (tåg) 95 (tåg) 9 (flyg) 97 7 (flyg) 95 5 (flyg) 99 5 (raket) Regression Plot Hastighet

Läs mer

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:.. TENTAMEN Tentamensdatum 8-3-7 Statistik för ekonomer, Statistik A, Statistik A (Moment ) : (7.5 hp) Namn:.. Personnr:.. Tentakod: A3 Var noga med att fylla i din kod samt uppgiftsnummer på alla lösningsblad

Läs mer

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab. Räkneövning 5 Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari 016 1 Om uppgifterna För Uppgift kan man med fördel ta hjälp av Minitab. I de fall en figur för tidsserien efterfrågas

Läs mer

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B Föreläsning 4 Kap 3.5, 3.8 Material om index 732G71 Statistik B Skötsel (y) Transformationer Ett av kraven för regressionsmodellens giltighet är att residualernas varians är konstant. Vad gör vi om så

Läs mer

Exempel 1 på multipelregression

Exempel 1 på multipelregression Exempel på multipelregression Hastighet = högsta hastighet som uppnåtts fram till givna år (årtal) Årtal Hastighet 83 3 (tåg) 9 3 (tåg) 93 (flyg) 97 7 (flyg) 9 (flyg) 99 (raket) Fitted Line Plot Hastighet

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Föreläsning 4. Kap 5,1-5,3

Föreläsning 4. Kap 5,1-5,3 Föreläsning 4 Kap 5,1-5,3 Multikolinjäritetsproblem De förklarande variablerna kan vara oberoende (korrelerade) av varann men det är inte så vanligt. Ofta är de korrelerade, och det är helt ok men beroendet

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

Skrivning i ekonometri torsdagen den 8 februari 2007

Skrivning i ekonometri torsdagen den 8 februari 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)

Läs mer

10.1 Enkel linjär regression

10.1 Enkel linjär regression Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot

Läs mer

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka. y Uppgift 1 (18p) I syfte för att se om antalet månader som man ägt en viss träningsutrustning påverkar träningsintensiteten har tio personer som har köpt träningsutrustningen fått ange hur många månader

Läs mer

Skrivning i ekonometri lördagen den 29 mars 2008

Skrivning i ekonometri lördagen den 29 mars 2008 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1! LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal

Läs mer

ARIMA del 2. Patrik Zetterberg. 19 december 2012

ARIMA del 2. Patrik Zetterberg. 19 december 2012 Föreläsning 8 ARIMA del 2 Patrik Zetterberg 19 december 2012 1 / 28 Undersöker funktionerna ρ k och ρ kk Hittills har vi bara sett hur autokorrelationen och partiella autokorrelationen ser ut matematiskt

Läs mer

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression Enkel linjär regression Exempel.7 i boken (sida 31). Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben och höjder på sockeln. De halvledare

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Uppsala universitet Statistiska institutionen A5 2014-08-26 Tentamen Tillämpad statistik A5 (15hp) 2014-08-26 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling

Läs mer

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS, TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS, 204-0-3 Skrivtid: kl 8-2 Hjälpmedel: Räknedosa. Bowerman, B.J., O'Connell, R, Koehler, A.: Forecasting, Time Series and Regression. 4th ed. Duxbury, 2005 som

Läs mer

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Sid (7) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift Nedanstående beräkningar från Minitab är gjorda för en Poissonfördelning med väntevärde λ = 4.

Läs mer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012 Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 4.00-7.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels 7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan

Läs mer

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng. 1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga

Läs mer

Examinationsuppgifter del 2

Examinationsuppgifter del 2 UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).

Läs mer

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data Stat. teori gk, ht 006, JW F16 MULTIPEL LINJÄR REGRESSION (NCT 13.1-13.3, 13.9) Anpassning av linjär funktion till givna data Data med en beroende variabel (y) och K stycken (potentiellt) förklarande variabler

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Regressions- och Tidsserieanalys - F5

Regressions- och Tidsserieanalys - F5 Regressions- och Tidsserieanalys - F5 Linda Wänström Linköpings universitet November 20 Wänström (Linköpings universitet) F5 November 20 1 / 24 Modellbygge - vilka oberoende variabler ska vara med i modellen?

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: Betygsgränser: 732G21 Sambandsmodeller 2009-01-14,

Läs mer

Laboration 2 multipel linjär regression

Laboration 2 multipel linjär regression Laboration 2 multipel linjär regression I denna datorövning skall ni 1. analysera data enligt en multipel regressionsmodell, dvs. inkludera flera förklarande variabler i en regressionsmodell 2. studera

Läs mer

Föreläsning 3 Kap 3.4, 3.6, 4.2. 732G71 Statistik B

Föreläsning 3 Kap 3.4, 3.6, 4.2. 732G71 Statistik B Föreläsning 3 Kap 3.4, 3.6, 4.2 732G71 Statistik B Exempel 150 slumpmässigt utvalda fastigheter till salu i USA Pris (y) Bostadsyta Tomtyta Antal rum Antal badrum 179000 3060 0.75 8 2 285000 2516 8.1 7

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2017-12-08, 8-12 Bertil Wegmann

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2015-12-09, 8-12 Bertil Wegmann

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal

Läs mer

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt Introduktion Vi har fått ta del av 13 mätningar av kroppstemperatur och hjärtfrekvens, varav på hälften män, hälften kvinnor, samt en studie på 77 olika flingsorters hyllplaceringar och sockerhalter. Vi

Läs mer

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9. Statistisk försöksplanering och kvalitetsstyrning Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Tentamen 4I2B KINAF4, KINAR4, KINLO4, KMASK4 7,5 högskolepoäng Tentamensdatum: 28 oktober 206 Tid:

Läs mer

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta? Tentamen i Matematisk statistik, S0001M, del 1, 2008-01-18 1. Ett företag som köper enheter från en underleverantör vet av erfarenhet att en viss andel av enheterna kommer att vara felaktiga. Sannolikheten

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (9 uppgifter) Tentamensdatum 2013-08-27 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson och

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Homework Three. Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo. 28 november Time series analysis

Homework Three. Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo. 28 november Time series analysis Homework Three Time series analysis Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo 28 november 25 1 Vi ska här analysera en datamängd som består av medeltemperaturen månadsvis i New York mellan

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2015-02-06, 8-12 Bertil Wegmann

Läs mer

Skrivning i ekonometri lördagen den 15 januari 2005

Skrivning i ekonometri lördagen den 15 januari 2005 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA102:3 Skrivning i ekonometri lördagen den 15 januari 5 1. Vi vill undersöka hur variationen i försäljningspris = price för hus i en liten stad

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Uppsala universitet Statistiska institutionen A5 2015-01-13 Tentamen Tillämpad statistik A5 (15hp) 2015-01-13 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig

Läs mer

TENTAMEN I MATEMATISK STATISTIK

TENTAMEN I MATEMATISK STATISTIK UMEÅ UNIVERSITET Institutionen för matematisk statistik Regressions- och variansanalys, 5 poäng MSTA35 Leif Nilsson TENTAMEN 2003-01-10 TENTAMEN I MATEMATISK STATISTIK Regressions- och variansanalys, 5

Läs mer

Prognostisering av växelkursindexet KIX En jämförande studie. Forecasting the exchange rate index KIX A comparative study

Prognostisering av växelkursindexet KIX En jämförande studie. Forecasting the exchange rate index KIX A comparative study Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2013:14 Prognostisering av växelkursindexet KIX En jämförande studie Forecasting the exchange rate index KIX A comparative

Läs mer

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4. Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student)

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2014-03-26

Läs mer

2.1 Minitab-introduktion

2.1 Minitab-introduktion 2.1 Minitab-introduktion Betrakta följande mätvärden (observationer): 9.07 11.83 9.56 7.85 10.44 12.69 9.39 10.36 11.90 10.15 9.35 10.11 11.31 8.88 10.94 10.37 11.52 8.26 11.91 11.61 10.72 9.84 11.89 7.46

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2014-06-05 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Jesper

Läs mer

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, VT2014 2014-05-26 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Korrelation och autokorrelation

Korrelation och autokorrelation Korrelation och autokorrelation Låt oss begrunda uttrycket r = i=1 (x i x) (y i y) n i=1 (x i x) 2 n. i=1 (y i y) 2 De kvadratsummor kring de aritmetiska medelvärdena som står i nämnaren är alltid positiva.

Läs mer

Följande resultat erhålls (enhet: 1000psi):

Följande resultat erhålls (enhet: 1000psi): Variansanalys Exempel Aluminiumstavar utsätts för uppvärmningsbehandlingar enligt fyra olika standardmetoder. Efter behandlingen uppmäts dragstyrkan hos varje stav. Fem upprepningar görs för varje behandling.

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, HT2013 2014-02-07 Skrivtid: 13.00-18.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1. En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2013-10-29 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Mykola

Läs mer

Konjunkturförändringar i åländsk ekonomi

Konjunkturförändringar i åländsk ekonomi Kandidatuppsats i Statistik Konjunkturförändringar i åländsk ekonomi -Val av förklarande variabler för åländska företags omsättning Jesper Gullquist Abstract This paper is made on behalf of Statistics

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan och att en inblandning mellan 10% och 40% är bra. För att

Läs mer

Finansiell statistik

Finansiell statistik Finansiell statistik Föreläsning 5 Tidsserier 4 maj 2011 14:26 Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs

Läs mer

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK UMEÅ UNIVERSITET Institutionen för matematisk statistik MSTA16, Statistik för tekniska fysiker A Peter Anton TENTAMEN 2004-08-23 LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK Statistik för tekniska

Läs mer

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet November 6, 2013 Wänström (Linköpings universitet) F3 November 6, 2013 1 / 22 Interaktion

Läs mer

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum Examiner Linus Carlsson 016-01-07 3 hours In English Exam (TEN) Probability theory and statistical inference MAA137 Aids: Collection of Formulas, Concepts and Tables Pocket calculator This exam consists

Läs mer

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

Statistiska Institutionen Gebrenegus Ghilagaber (docent) Statistiska Institutionen Gebrenegus Ghilagaber (docent) Lösningsförslag till skriftlig tentamen i FINANSIELL STATISTIK, grundnivå, 7,5 hp, VT09. Onsdagen 3 juni 2009-1 Sannolkhetslära Mobiltelefoner tillverkas

Läs mer

Tidsserieanalys av dödsfall i trafiken

Tidsserieanalys av dödsfall i trafiken VI notat 30-2005 Utgivningsår NNNN www.vti.se/publikationer idsserieanalys av dödsfall i trafiken Astrid Karlsson Kristian Willerö Förord Detta notat är ett särtryck av en magisteruppsats i statistik

Läs mer

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 3 Bertil Wegmann IDA, Linköpings universitet November 4, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 4, 2015 1 / 22 Kap. 4.8, interaktionsvariabler Ibland

Läs mer

tentaplugg.nu av studenter för studenter

tentaplugg.nu av studenter för studenter tentaplugg.nu av studenter för studenter Kurskod Kursnamn SM Matematisk statistik Datum LP - Material Laboration 4 Kursexaminator Adam Betygsgränser Tentamenspoäng Övrig kommentar Försättsblad inlämningsuppgift

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid (5) i matematisk statistik Statistisk processtyrning 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-3.00 ger maximalt 2 poäng. För godkänt krävs

Läs mer

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar: Flerfaktorförsök Blockförsök, randomiserade block Modell: yij i bj eij i 1,,, a j 1,,, b y ij vara en observation för den i:te behandlingen och det j:e blocket gemensamma medelvärdet ( grand mean ) effekt

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2013-01-18 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Ove

Läs mer