En tidsseriestudie av varviga sjösediment från Kassjön

Storlek: px
Starta visningen från sidan:

Download "En tidsseriestudie av varviga sjösediment från Kassjön"

Transkript

1 En tidsseriestudie av varviga sösediment från Kassön av Per-Ola Carlén Examensarbete i matematisk statistik Umeå universitet, 2 Handledare: Sara Söstedt-de Luna

2 Abstract This thesis aims to analyse a time series containing the annual accumulation rate of minerogenic matter in the lake Kassön. First there is a theoretical survey of some frequently used tools for the analysis of time series in the time domain and in the frequency domain. This survey is followed by a simulation study that illustrates how the theoretical tools work in practice. After this, the time series "toolbox" is used to analyse the time series from Kassön (57 data points). The time series data is analysed in the time domain as well as in the frequency domain. The time domain study focuses on the behaviour of the autocorrelation and the partial autocorrelation function. The frequency domain study analyses the standard periodogram and the periodogram smoothed with weights. The periodogram study tells us that the important components - for the behaviour of the series - are those with low angular frequency which corresponds to slow oscillations. The interesting cycles are approximately 33 years and can be identified more or less throughout the series. 2

3 Förord Detta är mitt slutliga arbete på programmet för matematisk statistik vid Umeå universitet och det är många människor som haft betydelse för dess genomförande. Först vill ag passa på att tacka all personal vid institutionen utan vars hälp - i form av föreläsningar och trevligt bemötande - detta examensarbete aldrig skulle ha tillkommit. Sedan vill ag speciellt tacka min handledare Sara Söstedt-de Luna, för utmärkt handledning och stort engagemang. Ett tack sänder ag också till mina uppdragsgivare Gunilla Pettersson och Ingemar Renberg, för att ha introducerat mig på området "varviga sösediment" och för relevanta synpunkter vid arbetets framväxt. Ytterligare ett tack till Gunilla för sitt medgivande om publicering av en del bilder i detta arbete med ursprung i hennes doktorsavhandling. Examensarbetet har varit mycket givande och gett mig en hel del erfarenheter att ta med när ag nu vandrar vidare i livet (läs arbetslivet). Harmånger Augusti, 2 Per-Ola Carlén 3

4 Innehåll Inledning Bakgrund Teori Klassisk uppdelning Stationära processer i tidsdomänen Skattningar Stationära processer i frekvensdomänen Skattningar Från teori till praktik Simulering Slumpvandring (random walk) N(, ) - slumptal Modeller med säsong Analys av tidsseriedata från Kassön Period 4 f Kr - 3 f Kr Årsdata för perioden 4 f Kr - 3 f Kr Femårsmedel för perioden 4 f Kr - 3 f Kr Sammanfattning för perioden 4 f Kr - 3 f Kr Period 3 f Kr - 2 f Kr Årsdata för perioden 3 f Kr - 2 f Kr Femårsmedel för perioden 3 f Kr - 2 f Kr Sammanfattning för perioden 3 f Kr - 2 f Kr Period 2 f Kr f Kr Årsdata för perioden 2 f Kr f Kr Femårsmedel för perioden 2 f Kr f Kr Sammanfattning för perioden 2 f Kr f Kr Period 255 f Kr - 7 e Kr Årsdata för perioden 255 f Kr - 3 f Kr Femårsmedel för perioden 255 f Kr e Kr Sammanfattning för perioden 255 f Kr - 7 e Kr Period 4 f Kr - 7 e Kr Årsdata för perioden 4 f Kr - 7 e Kr Diskussion och Slutsatser Litteraturförteckning Böcker, avhandlingar och artiklar Program

5 Inledning I dag görs väderprognoser av varierande längd och förmedlas dagligen till oss medborgare via televisionens nyhetssändningar. Vädret verkar vara ett viktigt inslag i vårt dagliga liv och vi verkar även vila veta hur vädret ska bli både i en nära och avlägsen framtid. Generellt gäller att den faktiska framtiden är helt okänd för oss människor och detta gäller naturligtvis också framtida väder- och klimatförhållanden. Det bästa vi då kan göra är att studera historien och genom denna försöka förstå de mekanismer som styr klimatet. Idealet skulle naturligtvis vara om meteorologiska mätningar av t ex temperatur och nederbörd funnes tillgängliga för en mycket lång tidsperiod. Tyvärr är långa sådana mätserier mycket sällsynta. Enligt [2], s 34, är den längsta sammanställda tidsserien i världen - över månatliga temperaturer - från år 659 e Kr, vilket fram till i dag endast är en period av ca 342 år. Detta betyder att även om sådana data är mycket intressanta så är dataserien för kort för att säga något om klimatförändringar på riktigt lång sikt. I sökandet efter väder- och klimatcykler måste forskarna därför studera andra data än de från kontinuerliga meteorologiska mätningar. Exempelvis kan klimatdata framställas ur iskärnor från Grönland ([2], s 76-77), årsringar på träd [5] eller från avlagringar på söbotten [8]. Under sådana studier har olika periodiska komponenter hittats och en kritisk genomgång av dessa undersökningar och analyser kan studeras i [2], där en översikt av de funna periodlängderna ges på s 6-6. Det konstateras i [2] att periodlängderna som hittats sträcker sig alltifrån 2,2 år upp till runt 2 år. Detta examensarbete - inom matematisk statistik vid Umeå Universitet - behandlar en lång tidsserie (ca 64 år) från en sö i Umeås närhet vid namn Kassön. Tidsserien finns publicerad i en doktorsavhandling från 999 av Gunilla Pettersson med titeln "Image Analysis, Varved Lake Sediments and Climate Reconstruction" [8]. Syftet med detta arbete är att med statistiska tidsserieverktyg analysera denna tidsserie och identifiera eventuella trender, säsongsmönster och övriga intressanta egenskaper. Rapporten inleds med en bakgrundsbeskrivning som ger en kort sammanfattning av Pettersons avhandling i kapitel 2. Därefter ges i kapitel 3 en översiktlig genomgång av teorin som kommer att användas i den senare delen av arbetet. Teorin föls av ett simuleringsavsnitt i kapitel 4, där de statistiska analysverktygen testas under kontrollerade former. Slutligen analyseras tidsserien från Kassön i kapitel 5, vilket föls av en diskussion och slutsatser i kapitel 6. 5

6 2 Bakgrund Gunilla Pettersons doktorsavhandling [8] innehåller fem uppsatser inom området "årsvarviga sösediment". Den första artikeln (I) ger en historisk överblick och sammanfattning av forskningen runt "årsvarviga sösediment" i Sverige från år 884 fram till idag. De fyra fölande uppsatserna (II, III, IV, V) riktar in sig på Pettersons egen forskning inom området, vilket omfattar tre söar i norra Sverige. Söarna heter Nylandssön, Koltärnen och Kassön (Figur ). Petterson har studerat sedimenten för att se om dessa kan ge information om historiska väderleks- och klimatförhållanden. Årsvarviga sösediment uppvisar urskilbara årslager - liknande årsringar på träd - med en tocklek runt,5 mm per år. Årslagren kallas varv och deras bildning och utseende är kopplat till årstidernas växlingar. På våren - i samband med snösmältningen - transporteras mineralkorn från omgivande marker ner i sön och ger ett lust skikt i årsvarvet. Under sommaren sunker rester av de dur och växter som levt i sön till botten och bildar ett mörkt Figur. Kassön, Nylandssön och Koltärnen. Omarbetning av bild från [8], II, s 96. skikt. Årsvarvet avslutas med ett smalt, svart skikt som tillhör vintersäsongen då sön är täckt med is. För att varven ska kunna bevaras genom tiden måste det råda syrebrist på söbotten så att de bottenlevande dur som gräver i botten inte trivs. Syre förbrukas vid nedbrytningen av organiskt material och brist uppstår under sommar och vinter när vattenmassan är temperaturskiktad och inget nytt syre kan tillföras. Årsvarven har högst kvalitet i den dupaste delen av sön där syrebristen varar längst. Halvcirkelformade sedimentkärnor (en meter långa och åtta cm i diameter) tas upp från söbotten med hälp av torvprovtagare av rysk modell. Ett exempel på en fotograferad borrkärna med tydliga årsvarv visas i Figur 2. I artikel II visar Petterson att en borrkärna från den dupaste delen av sön är representativ för varvens utseende och tocklek, dvs man behöver inte analysera flera parallella borrkärnor. Hon visar även hur bildanalys kan användas för att översätta sedimentets färgskiftningar till obektiva gråskalevärden på en skala från (svart) till 255 (vitt). Även varvens tocklek kan mätas via bildanalys vilket är en mer obektiv och snabbare metod än att använda mikroskop. Nybildade varv är tocka eftersom de innehåller mycket vatten (9-99%). Tockleken och vattenhalten minskar när tyngden av nya varv pressar ur en del av vattnet. Efter ca år har varvet tryckts ihop klart och materialet sägs då vara konsoliderat. I artikel II visar också Petterson att trots att årsvarvens tocklek minskar med tiden, bevaras varvens individuella färgförändringar. 6

7 Artikel III beskriver bildanalysmetoden och en modell presenteras över hur de erhållna "gråskalevärdena" kan översättas till kvantitativa värden på ackumulationen av minerogent material (g cm -2 år - ) Bildanalysmetoden beskrivs översiktligt nedan: Videofotografera borrkärnan med årsvarv i lämplig förstoring. Digitalisera bilden. Vare bild består av bildpunkter (pixlar) som var och en antar ett gråskalevärde mellan (svart) och 255 (vitt). Väl ut ett område där varven har hög kvalitet. Dra en line (en pixel bred) över bilden - vinkelrätt mot årsvarven - och ta fram gråskalevärdena. Upprepa nio gånger inom ett snävt område. Tag bort tydliga "outliers" och beräkna en "medelgråkurva". PR-markeringen i Figur 2 visar den första och tionde pixelraden. De övriga åtta raderna är ämt fördelade inom PR-området. Figur 2. Fotografi av 8 årsvarv från Kassön med tillhörande "medelgråkurva". Kurvans toppar motsvarar lusa områden (minerogent material) och dalarna motsvarar mörka områden (organiskt material). Bilden kommer från [8], III, s 2. I artikel III utvecklades också en modell för att knyta ihop medelgråvärdena med ett årsvarvs innehåll av huvudsakliga komponenter, såsom organiskt material, biogent kisel, minerogent material och vatten. Eftersom årsvarven är så pass tunna (ca,5 mm) skars för denna undersökning femårsprover ut och provets areal - dvs den yta som provet täcker på söbotten - mättes (cm 2 ). Modellen sammanfattas i det fölande. Modell Antag att ett årsvarv består av av n st strimmor där vare strimma är en pixel bred (2 µm). Antag vidare att gråskalevärdet för vare strimma i är proportionellt mot summan av vare komponents gråskalebidrag i strimma i. Vi får då modellen gs i komp i + komp 2i + + komp ki, () där gs i är gråskalevärdet för strimma i ( i =... n), betyder "proportionellt mot", och komp i är komponent i där ( =... k) är index för de k komponenterna. Genom att summera över de n strimmorna i ett årsvarv erhålls n i= gs i = gs n n i= n i= komp i + komp2i kompki, (2) där gs är medelgråskalevärdet per strimma inom årsvarvet. Eftersom n är proportionellt mot varvtockleken vt dvs n i= 7

8 gs n gs vt, (3) erhålls gs vt = a + b n i= n b a gs = + vt vt där a, b b k är konstanter. komp i= i komp + b i n 2 i= n b2 + vt komp i= 2i komp n b komp (4) 2i k i= i= ki n bk kompki, (5) vt För att erhålla värden på komp till komp k delades borrkärnan i prover om fem varv. De mest betydande beståndsdelarna analyserades och värden på vare beståndsdels årliga ackumulation beräknades (g cm -2 år - ). Det optimala hade varit att dela in borrkärnan i individuella varv istället för femårsvarv, men det ansågs omöligt att göra en exakt delning mellan,5-,6 mm tocka varv. Vidare begränsades studien av borrkärnans innehåll till perioden 476 e Kr-5 e Kr. Två signifikanta modeller skapades genom stegvis multipel regression enligt sambanden (4) och (5). (4) gs vt = 34,9 + 2,87 MinMa + 5,82 BSiO2 (R 2 =,8) (6) MinMa OrgMa (5) gs = ,7, 9 (R 2 =,95) (7) vt vt MinMa är minerogent material, OrgMa organiskt material och BsiO 2 är biogent kisel. De oberoende variablerna i (6) (MinMa, BsiO 2 ) är ackumulationsvärden (g cm -2 år - ) och de oberoende variablerna i (7) (MinMa / vt, OrgMa / vt) är koncentrationsvärden (g cm -3 ). Ett försök till att förklara varvtockleken gordes också. Resultatet blev en modell med tre signifikanta variabler - minerogent material, vatten och biogent kisel - men med låg förklaringsgrad (R 2 =,45). Slutsatsen var att de processer som bestämmer varvtockleken är komplexa och att gråskalevärdena därför är en bättre indikator på klimatsignaler från varviga sediment från Kassön. Eftersom det minerogena materialet bidrar med 6-88% av den torkade massan så konstaterades att kgv approximativt kan användas för att bestämma mängden minerogent material i årsvarven. För ett utförligare resonemang runt valet av modell, se [8], III, s. I uppsats IV undersöktes huruvida varvstrukturerna i två närliggande söar (Koltärnen och Nylandssön) uppvisade likheter eller inte med avseende på varvens tocklek, gråfärg och ackumulation av sedimentets huvudsakliga beståndsdelar. Studien tyder på ett komplext samband mellan varvtocklek, storleken på söns avrinningsområde, söns produktivitet och de processer som styr varvbildningen. Slutsatsen blir att man inte får ha en alltför enkel bild av Femårsproverna skars ut från 6 mm långa, rektangulära bitar som skurits ut från borrkärnan. För att säkerställa replikerbarheten och samla tillräcklig mängd sediment upprepades utskärningarna tre gånger. För att veta hur stor area av söbotten som vare prov representerade mättes arean på vare bit. Proverna analyserades med avseende på minerogent och organiskt material, biogent kisel samt vattenhalt. Till sist beräknades ackumulationen per ytenhet och år (g cm -2 år - ) för vare beståndsdel. För en utförlig beskrivning av metoden se [8], III, s

9 varvs möligheter att fungera som indikatorer på tidigare klimat, särskilt om söarna ligger i områden med hög ordbruksaktivitet. I uppsats V används erfarenheterna från föregående uppsatser och studier till att utföra bildanalys på en ca fem meter lång (ca 64 år) varvig borrkärna från Kassön. Sön har en yta av,23 km 2, ett maximalt dup av ca 2 meter och ett avrinningsområde på 3 km 2. Metoden som presenterades i artikel III används för att ta fram gråskalevärden och en ny regressionsekvation - som beskriver sambandet mellan kgv och ackumulationen av minerogent material - skattas enligt (8). Biogent kisel har utelämnats från ekvation (6) enligt tidigare approximationsresonemang. Detta ger gs vt = 42,86 + 2,93 MinMa (8) gs vt 42,86 MinMa =. 2,93 Hela tidsserien över årlig ackumulation av minerogent material (mg cm -2 år - ) presenteras i Figur 3. Den del som omfattas av analysen i detta examensarbete är perioden 4 år f Kr till 7 år e Kr. Böran är exkluderad eftersom faktorer vid söns bildande eventuellt kan överskugga klimatets påverkan på mängden minerogent material under denna tidsperiod. Tidsseriens slut kan antas påverkas av ett allt intensivare ordbruk. Dessa två orsaker är av mindre intresse än den information som den mellanliggande tidsserien eventuellt kan innehålla. Inför analysen av tidsserien i Figur 3 kommer först ett teoriavsnitt vilket behandlar de statistiska tidsserieverktyg som kommer att användas. Därefter föler ett simuleringsavsnitt där verktygen används under "kontrollerade" former, i den meningen att strukturerna för tidsserierna som analyseras är kända. Efter dessa två avsnitt är vi redo att analysera det slutliga målet för detta arbete, tidsseriedatat i Figur 3. 9

10 Figur 3. Årlig ackumulation av minerogent material (mg cm -2 år - ) i Kassön från 4486 f Kr till 9 e Kr (6.387 datapunkter och år). Bilden kommer från [8], V, s 9.

11 3 Teori Ett mål med tidsserieanalys kan vara att översätta en dataseries uppträdande till en statistisk modell för att utifrån denna modell göra prognoser om framtida värden. Dataseriens uppträdande kan delas upp i olika komponenter såsom säsong, trend och residualer. Det som utmärker residualerna - vid en sådan uppdelning av en tidsserie - är att de inte nödvändigtvis behöver vara oberoende sinsemellan. Eftersom tidsserien genereras av någon slags process som ger upphov till tidsordnade data så kan man mycket väl tänka sig att tidiga värden påverkar senare värden. För att studera dessa beroende residualer finns inom statistisk teori begreppet stationära processer. Genom att anpassa en stationär modell till de beroende residualerna kan residualernas information nyttas och bidra till bättre prognoser än om denna information utelämnas. När en stationär modell anpassats skapar denna modell nya residualer som då ska vara oberoende om modellen är bra. I detta arbete är inte målet att bilda prognoser om framtiden utan målet är istället att undersöka den historiska tidsserien och försöka identifiera dess byggstenar i form av trend, säsong och residualernas beroendestruktur. Den studerade tidsserien är reellvärd med årliga observationer, dvs observationer på det diskreta avståndet ett. Av denna anledning kommer denna teoridel att behandla uteslutande sådana processer. 3. Klassisk uppdelning Den klassiska uppdelningen av en tidsserie kan uttryckas som X t = m t + s t + Y t t =,, n, (9) där X t är det observerade värdet vid tidpunkt t, m t är trendkomponenten vid tidpunkt t, s t är säsongskomponenten med en period av längd d och Y t är en stationär process. Trendkomponenten är en funktion av tiden, m t = f(t), och kan vara t ex linär eller kvadratisk. Säsongskomponenten summerar till noll och återkommer på avstånd d, dvs t+ d i i= t s = och s t+d = s t. () När man studerar en tidsserie genom observerade värden på diskreta avstånd från varandra och undersöker beroendet mellan observationer på olika avstånd, brukar det sägas att man betraktar serien i tidsdomänen och att tidsserien är diskret. 3.2 Stationära processer i tidsdomänen Stationära processer med tillhörande analysverktyg är kända begrepp inom den statistiska teorin och kan studeras utförligt i ett stort antal böcker. Detta avsnitt syftar till att ge en enkel genomgång av de verktyg och begrepp som kommer att användas i kommande avsnitt. Utförligare genomgångar kan hittas i t ex [], [3] och [9] där inspiration och en del beteckningar hämtats till detta avsnitt.

12 Vi börar med att definiera det viktiga begreppet svagt stationär process. Svagt stationär process (definition **) {Y t } är en svagt stationär process om och i) E[Y t ] är oberoende av t ii) Cov[Y t+h, Y t ] är oberoende av t för vare h. Kovariansfunktionen brukar i detta fall kallas autokovariansfunktion (ACVF) och betecknas γ (h) = Cov[Y t+h, Y t ]. () Y Motsvarande korrelationsfunktion kallas autokorrelationsfunktion (ACF) med beteckningen γ ( ) ρ Y (h) = Cor[Y t+h, Y t ] = h Y. (2) γ Y () I fortsättningen kommer vi att med en stationär process avse en svagt stationär process. Vidare kommer vi att anta att väntevärdet för processen är noll, dvs E [ Y t ] =. Detta är inte någon inskränkning eftersom vare stationär process med godtyckligt väntevärde kan förvandlas till en process med väntevärde noll genom att subtrahera det godtyckliga väntevärdet från den ursprungliga processen. ACVF och ACF mäter - enligt ovan - samma sak, dvs beroendet mellan observationer på avstånd h. Vid grafisk framställning brukar ofta ACF visas. Precis som den vanliga korrelationskoefficienten antar ACF värden i intervallet [,]. Minus ett visar på ett perfekt negativt linärt beroende och ett visar på ett perfekt positivt linärt beroende mellan två stokastiska variabler. I tidsseriefallet utgörs dessa två stokastiska variabler av variabler på avstånd h från varandra. ACVF och ACF är verktyg som kan användas för att analysera beroendestrukturen i en stationär tidsserie. De kan även användas till att hitta t ex deterministiska säsongsmönster vilket är en form av icke-stationaritet. Vitt brus är en stationär tidsserie som består av tidsordnade, okorrelerade stokastiska variabler enligt nedanstående definition där ~ betyder "tillhör". Vitt Brus (definition *2*) {Z t } ~ Vitt Brus (, σ ) om Z t är en sekvens av okorrelerade stokastiska variabler med 2 E[Z t ] = och V[Z t ] = σ. 2

13 En vanlig famil av stationära processer är ARMA-processerna, dvs ARMA( p, q )-process (definition *3*) {Y t } är en ARMA ( p, q) -process om {Y t } är stationär och för vare t Y t = φ Y t- + + φ p Y t-p + Z t + θ Z t- + + θ q Z t-q, där {Z t } ~ Vitt Brus (, σ ) och polynomen φ (z) = ( - φ z - - φ p z p ) och θ (z) = (+θ z + + θ q z q ) inte har några gemensamma faktorer. I ovanstående definition är {Y t } och {Z t } földer av tidsordnade stokastiska variabler medan θ är parametervärden. En ARMA ( p, ) -process kallas en AR(p)-process { } p φi och { } q i= = (AutoRegresiv) och en ARMA (, q) -process kallas en MA(q)-process (Moving Average). Formeln för en ARMA-process beskriver hur senare stokastiska variabler beror av tidigare samt även hur dessa senare stokastiska variabler beror av vita-brus-processen { Z } t. I fallet t= AR(p) gäller formeln Y t = φ Y t- + + φ p Y t-p + Z t, (3) vilket beskriver en process där värdet vid tidpunkt t beror av p st tidigare värden från processen samt slumptermen Z t. En MA(q)-process genereras enligt Y t = Z t + θ Z t- + + θ q Z t-q. (4) I detta fall bildas nya värden genom en linärkombination av ( q + ) värden från en process av vitt brus. Det kan visas att ACF "klipper" på avstånd q om processen är en ren MA(q)- process. Med detta menas att autokorrelationen är noll för observationer som ligger längre ifrån varandra än q och skild från noll för observationer på avstånd q, dvs ρ Y (h) > för h = q och ρ Y (h) = för h > q. (5) Precis som att observationer av en stokastisk variabel kan anta olika värden så kan en observation av en hel tidsserie betraktas som ett värde bland flera. Om man t ex skulle simulera en viss ARMA-process x gånger skulle dessa simuleringar förmodligen ge upphov till lika många "stigar". Vare sådan stig kallas en realisering av processen. En observerad tidsserie betecknas med små bokstäver { } t bokstäver { Y t }. y till skillnad från den stokastiska modellens stora 3

14 Till sist definieras den partiella autokorrelationsfunktionen. Partiell autokorrelationsfunktion PACF (definition *4*) PACF till en ARMA process {Y t } är funktionen α ( ) definierad av ekvationerna Y och α ( ) =, Y α ( h) = φ, h, Y hh där φ hh är sista komponenten i där φ h = Γ h γ h, h Γ = γ ( )] och h [ Y i i, = T γ h = [ γ Y (), γ Y (2),..., γ Y ( h)]. φ h är en kolumnvektor med elementen φ hh, Γ h är autokovariansmatrisen och γ h är en kolumnvektor med h stycken autokovarianser. Störst användning av PACF har man när det gäller att bestämma ordningen p för en ren AR(p)-process, eftersom det kan visas att PACF "klipper" på avstånd p vid denna modell. Med detta menas att partiella autokorrelationen är noll för observationer som ligger längre ifrån varandra än p och skild från noll för observationer på avstånd p, dvs α (h) > för h = p och α (h) = för h p. (6) Y Y 3.2. Skattningar Vid analys av en tidsserie ställs man inför problemet att utifrån en realisering av en process försöka identifiera vilken slags process det rör sig om. Vi har observationer { y } n t och vill t= utifrån dessa skatta ACVF, ACF och PACF för att få en uppfattning om vilken slags ARMAprocess som bäst beskriver tidsserien. ACVF skattas med _ n h * ( yt y) ( yt+ h y) y ( h) = t= n γ, (7) där y är medelvärdet av observationerna. ACF skattas sedan med * γ ( ) * y h ρ y ( h) =, (8) * γ y () dvs den skattade ACVF dividerad med den skattade variansen för processen. Den skattade ACF-funktionen är den som kommer att framgå av bilderna i simulerings- och analysavsnittet. PACF skattas genom att skattningarna av ACVF stoppas in i definitionen för PACF. När beroendestrukturen i tidsserien analyserats med ACF och PACF kan denna ge stöd i sökandet efter den bästa ARMA-modellen. Parametervärden kan bestämmas genom en sökprocess där startvärden gissas, residualkvadratsumman beräknas och processen sedan upprepas med nya parametervärden. De parametervärden väls som minimerar residualkvadratsumman. 4

15 3.3 Stationära processer i frekvensdomänen Spektralanalys är ett verktyg som används för att betrakta en stationär tidsserie i frekvensdomänen istället för tidsdomänen. En analys i frekvensdomänen kan vara det naturliga angreppssättet för att söka efter cykler och periodiciteter i en tidsserie. Framställningen i detta avsnitt föler till största delen [3], s Låt oss betrakta den reellvärda, diskreta tidsserien Yt = R cos( ω t + θ ) + Z t t =, ±, ± 2,..., (9) där R är amplituden, ω vinkelfrekvensen, θ fasförskutningen och Z t är vitt brus. Vinkelfrekvensen mäts i radianer per tidsenhet och fasförskutningen mäts i radianer. Periodlängden är den tid det tar för cosinusvågen att utföra en hel svängning (t ex från en topp till nästa topp). Det direkta sambandet mellan periodlängd och vinkelfrekvens blir därför 2 π periodlängd =. ω Begreppen fasförsutning, amplitud och periodlängd visas i Figur 4. Tidsserien (9) är på en mycket enkel form och kan generaliseras till att omfatta k st amplituder, vinkelfrekvenser och fasförskutningar enligt k Yt = R cos( t + θ ) + = ω Z t =, ±, ± 2,... (2) t Om amplituderna och fasförskutningarna är konstanta i (2) är inte denna typ av tidsserie stationär eftersom väntevärdet varierar med tiden. Om vi istället tänker oss att antingen R } är okorrelerade stokastiska variabler med väntevärde noll, eller att { θ } är likafördelade stokastiska variabler på intervallet (, 2π ) - och konstanta för vare realisering av processen - så blir processen stationär. Formel (2) kan skrivas om på formen k Y t = ( A cos( ω t) + B sin( ω t) ) + Z t, (2) = B 2 2 där A = R cosθ, B = R sin θ R = A + B och θ = tan. A Om vi tar processen (2) och låter k gå mot så erhålls processens spektrala representation π = cos( ω t) du( ω) + π Y t sin( ω t) dv( ω). (22),5,,5, -,5 -, -,5 Fasförskutning Amplitud(R), vinkelfrekvens(omega) och fasförskutning(teta) Amplitud,, 2, 3, Figur 4. Illustration av begreppen fasförskutning (θ = π / 2), amplitud (R = ) och periodlängd ( = 2π / ω =,25). Uttrycket (22) innehåller stokastiska integraler och behöver inte utredas vidare för den kommande analysen. Det viktiga är tankesättet att en diskret stokastisk process kan betraktas Tid Periodlängd { Cosinusvåg 5

16 som en linärkombination av cosinus- och sinustermer enligt (2). När antalet frekvenser ökas mot oändligheten så övergår beskrivningen av processen i (22). Om vi betraktar en diskret tidsprocess med observationer på avstånd ett, går det inte att skila variation med högre vinkelfrekvens än π från variation inom intervallet (, π ). Den största vinkelfrekvens vi kan hitta i processen är således ω = π och denna frekvens kallas Nyqvistfrekvensen. Ovanstående demonstreras i Figur 5 där det visas att frekvenserna ω = 2π / 5 och ω = 8π / 5 inte kan skilas från ω = 2π / 5 vid avläsning på avstånd ett. Den teoretiska modellen (2) beskriver en tidsserie utifrån att den består av periodiska komponenter omgivna av det vita bruset {Z t }. Vinkelfrekvenserna för de ingående komponenterna antar diskreta värden i intervallet (, π ), t ex ω = 2π /, 4π / osv. ARMA-modellerna innehåller som bekant inte några deterministiska sinuskomponenter men kan ändå uppvisa sinusliknande svängningar. En ARMA-process kan analyseras utifrån ett frekvensperspektiv genom en funktion som kallas spektrala täthetsfunktionen - eller kortare - spektrum. Spektrala täthetsfunktionen till en stationär process {Y t } uppfyller π γ Y ( h) = cos( ω h) fy ( ω) dω, (23) där γ Y (h) är autokovariansfunktionen och f Y (ω ) är spektraltätheten (spektrum) till {Y t }. Om vi sätter k = och konstaterar att cos() = och γ () = variansen för Y t så gäller att π = γ Y () = V[Y t ] f Y ( ω) dω. (24) Spektraltätheten visar således hur seriens variation fördelas över olika frekvenser på intervallet (, π ). Spektrum är definierad över en kontinuerlig mängd frekvenser och beskriver en ARMA-process ur en annan synvinkel än vad ACVF och ACF gör. Det omvända sambandet mellan spektrum och ACVF är = + fy ( ω ) γ Y () 2 γ Y ( h) cos( ω h). (25) π h= Om processen innehåller en helt deterministisk sinuskomponent - med en bestämd vinkelfrekvens ω - existerar inte det teoretiska spektrumet. Detta p g a att summan i (25) då e konvergerar och därmed är inte f ω ) definierad (spektrum blir oändligt stort för ω = ω ). Y ( Y Figur 5. Tre cosinusfunktioner med egenskaperna: ) R =, ω = 2π/5, θ = (svänger snabbast) 2) R 2 =, ω = 8π/5, θ = (svänger näst snabbast) 3) R 3 =, ω = 2π/5, θ = (svänger långsammast) 6

17 3.3. Skattningar I verkligheten har vi observerat en tidsserie { y } n t och vill utifrån denna skatta spektrum t= f Y (ω). Om vi sätter in den skattade autokovariansfunktionen (7) i (25) (med summering till (n-) istället för till ) och utvecklar detta, erhålls skattningen n 2 n 2 * f y ( ω ) = yt cos ( ω t) + yt sin ( ω t). (26) nπ t= t= Om vi använder de så kallade Fourierfrekvenserna = 2 πp ω =,,..., n p p n, (27) 2 där [ x ] betyder heltalsdelen av x, fås en skattning av spektrum som kallas periodogram och betecknas I y ( ω p ), dvs * 2 2 * n n f y ( ω p ) = I y ( ω p ) = yt cos ( ω pt) + yt sin ( ω pt) (28) nπ t= t= Man kan visa att E [ I y ( ω p )] = fy ( ω p ) samt att V [ I y ( ω p )] inte går mot noll när antal observationer går mot oändligheten. met är således en väntevärdesriktig men icke-konsistent skattning av spektrum. met har starka band till modell (2). Klammern markerad med * i (28) är nämligen en betydande del av den term som förklarar variation i tidsserien beroende på att den innehåller en komponent med vinkelfrekvensen ω p. Sambandet mellan periodogrammet (28) och modell (2) utreds nedan. Om vi tänker oss att vi observerat en tidsserie { y } n t och vill anpassa en modell till dessa t= data av typen (2) så är det lämpligt att använda minsta-kvadrat-metoden. Vi bildar kvadratsumman 2 n k Q = Yt ( A cos( ω t) + B sin( ω t) ) = =, (29) t där vi väler frekvenserna (27) eftersom dessa ger enkla räkningar vid bestämningen av A och B för =... k. Genom att derivera Q med avseende på A och B för alla, sätta derivatorna lika med noll och lösa detta erhålls skattningarna n n * 2 * 2 A = Yt cos( ω t) och B = Yt sin( ω t). (3) n t= n t= Om vi byter ut de stokastiska variablerna i (3) mot de observerade värdena, kvadrerar och summerar skattningarna får vi + = 4 n n a b y 2 t cos( ω t) yt sin( ω t). (3) n t= t= Storheten i (3) är ett mått på hur stor vikt komponenten med vinkelfrekvens ω har i modell (2). Ju större värde desto större vikt. Om (3) multipliceras med n / 4π och ω = ω p erhålls periodogrammet (28). 7

18 Om datat kan beskrivas med modell (2), visar periodogrammets pikar på vilka frekvenser som är av stor vikt i modellen. I y ( ω p ) plottas mot ω p och om ω p är en av de frekvenser som ingår i den modellerade tidsserien (2), kommer I ω ) att få ett stort värde för denna y ( p frekvens. Om ω p inte ingår i modellen blir värdet litet. En noggrann utredning av detta kan studeras i t ex [9], s Om en konsistent skattning av spektrum önskas kan ekvation (25) användas genom att "klippa av" summan och vikta de skattade autokovarianserna enligt M * * * f y ( ω ) = λ γ y () + 2 λh γ y ( h) cos( ω h), (32) π h= där { λ } M h är en mängd vikter som kallas (lag-) fönster och M (< n) kallas trunkeringspunkt. I h= litteraturen föreslås en mängd skattningar av detta slag vilka i huvudsak skiler sig åt när det gäller uppsättningen vikter. Se t ex [3], s 4-6 eller [9], s för en genomgång av olika skattningar på denna form. Det fönster som kommer att användas i detta arbete kallas -fönster och tillhörande vikter är på formen π h λ h = + cos h =,,..., M. (33) 2 M Valet av hur stort M ska vara blir en avvägning mellan storleken på skattningens varians och bias. Ett litet värde på M ger liten varians på skattningen och stor bias medan det omvända gäller för ett stort värde på M. Ett M att utgå ifrån - och det som kommer att användas här - är M = 2 n som bland annat föreslås i [3], s 5. Det är nu av intresse att kunna avgöra om en periodogrampik har betydelse vid anpassning av modell (2) till observerat data, eller om en sådan pik - lika väl - kan uppkomma vid analys av en tidsserie innehållandes enbart vitt brus. Om vi tänker oss en tidsserie med normalfördelat vitt brus kan man visa att 2 σ Z E[ I y ( ω p )] =, (34) π samt att I y ( ω p ) är oberoende för alla ω p. En teststatistika för hypotesen är H = tidsserien består av normalfördelat vitt brus, (35) n g = 2 Det kan visas att när max [( n ) / 2] p= ( I ( ω )) I y y p ( ω ) p. (36) n så är fördelningsfunktionen för g under H P(g > z) - ( - e -z ) [(n-) / 2]. (37) Om H inte är sann antar g ett stort värde och vi förkastar därför H om P(g > z) (P-värdet) är ett tillräckligt litet värde. Detta kallas Walkers test för max I ( ω )) och utreds mer i detal i ( y p 8

19 t ex [9] s Formlerna här föler inte [9] exakt utan skiler sig något, främst beroende på att [9] definierar periodogram och spektrum för ω ( π, π ) och att vi i denna rapport håller oss till ω (, π ). För att i praktiken beräkna P-värdet beräknar man först värdet på teststatistikan (36). Därefter sätter man in detta värde istället för z i (37) och erhåller på så vis P-värdet. Om P-värdet är mindre än t ex,5 kan vi förkasta hypotesen (35) på 5%-nivån. Detta betyder att sannolikheten att H ändå är sann är 5%, trots att vi fick det värde vi fick på teststatistikan (36). 3.4 Från teori till praktik Teoretiskt kan en tidsserie betraktas som en realisering av en ARMA-process. Vägledning om vilken av alla de möliga ARMA-modellerna som passar bäst till observerat data, kan fås ur skattningarna av ACF, PACF och spektrum. Teoretiskt ger ACF och spektrum exakt samma information om beroendestrukturen i en tidsserie genom de direkta sambanden (2), (23) och (25). I praktiken skattas spektrum med periodogrammet (28) eller med ett utslätat periodogram (32). met visar vilka frekvenser som är av betydelse vid anpassningen av modell (2) till datamaterialet och är också en väntevärdesriktig - men icke-konsistent - skattning av spektrum. Eftersom teorin runt ARMA-processer - och nyttandet av periodogram som skattning av spektrum - bygger på stationaritet är det viktigt att vid analys av en tidsserie först försöka uppfylla detta villkor. Detta betyder t ex att serien måste rensas från uppenbar trend eftersom denna ingrediens annars kommer att påverka analyserna på ett icke önskvärt sätt. Vid inslag av trend kommer ACF att visa på ett längre och större beroende mellan observationer än om trenden rensas bort. met kommer att ge alltför stort utslag på låg frekvens eftersom modell (2) kommer att uppfatta en våg med långsam svängning som viktig för processen. I analysavsnittet (kapitel 5) kommer all uppenbar icke-stationaritet att rensas bort innan analys sker i form av anpassning av ARMA-modeller och periodogramstudier. Vidare kommer avvikelse från väntevärde noll alltid att usteras genom avtrendning eller genom subtraktion av det ursprungliga väntevärdet. Innan analysavsnittet arbetar vi oss först igenom ett simuleringsavsnitt för att känna på de teoretiska verktygen under kontrollerade former. 9

20 4 Simulering Simulering är ett bra verktyg för att öka förståelsen för hur en realisering av en tidsserie kan se ut och hur de statistiska metoderna fungerar vid analys av serien. I detta avsnitt har Marsaglias slumptalsgenerator [6] använts för att generera st av vardera N (,) - och U (,) -slumptal 2. De likformiga slumptalen genereras direkt av slumptalsgeneratorn och de normalfördelade slumptalen erhålls genom "den polära Marsaglia metoden" beskriven i [7] s N (,) -slumptalen förvandlas till N (,) -slumptal genom multiplikation med. Startvärdena - till Marsaglia - för skapandet av dessa slumptal är 53, 5, 24 och 9. Startvärdena garanterar att simuleringen är upprepningsbar - med identiskt slutresultat - eftersom samma slumptal kommer att genereras om samma startvärden anges vid en ny simulering. Detta gäller åtminstone om exakt likadan utrustning i form av dator, programvara och operativsystem används. Vid simuleringarna har en Pentium-66Mhz med Windows 95 nyttats. I detta simuleringsavsnitt - och i det kommande analysavsnittet - kommer Minitab [] att användas för analysen i tidsdomänen och ett egenutvecklat Excel-program svarar för analyserna i frekvensdomänen. De implementerade formlerna för periodogram, spektrum och test föler teoriavsnittet i detta arbete. Excel-programmet producerar resultat i form av en bild över periodogram och -spektrum samt en utskrift av Walkers test. 4. Slumpvandring (random walk) Slumpvandring är en icke-stationär process som uppkommer enligt Y t = Y t- + Z t, (38) där startvärdet är Y = och { Z t } är vitt brus. Simulering av observationer med N (,) -brus från denna process gav tidsserien i Figur 6 med tillhörande autokorrelationsfunktion (Figur 7). Autokorrelationernas utseende (stark och långvarig korrelation) ger anledning till att misstänka icke-stationaritet. Om man sedan tittar på den partiella autokorrelationen (Figur 8) ser man där det typiska AR()-utseendet med ett högt värde på avstånd ett och därefter värden nära noll. Om vi inte visste att processen skapats enligt (38) skulle vi lika väl kunna tro att realiseringen i Figur 6 innehöll en eller flera cosinusvågor, t ex enligt modell (2). Detta belyser problemet att väla den "rätta" modellen för att beskriva en realisering av en process. 2 Normalfördelade slumptal ( N(, ) ) med väntevärde noll och standardavvikelse ett. Likafördelade slumptal ( U(, ) ) på intervallet (, ). 2

21 SlumpVandring Tid SV Figur 6. Simulerad slumpvandring enligt (38). Autokorrelation Autokorrelation för SlumpVandring,,8,6,4,2, -,2 -,4 -,6 -,8 -, Figur 7. Autokorrelation för slumpvandring. Partiell Autokorrelation PACF för SlumpVandring,,8,6,4,2, -,2 -,4 -,6 -,8 -, Figur 8. Partiell autokorrelation för slumpvandring. Figur 7 och Figur 8 visar - förutom storleken på skattade ACF respektive skattade PACF - även 95%-iga konfidensband. Konfidensbanden för ACF är h = * ρ ( i) 95% i I ρ ( h) = = ± t,25 ( n ) h =, 2,..., (39) n 95% där I ρ beskriver det intervall inom vilket sannolikheten är,95 att skattad ACF hamnar ( h) = om den sanna ACF-funktionen är noll för laggar större än h-, t ( n ) är t-fördelningens,25,25 kvantil för (n-) stycken frihetsgrader, n är antal observationer och ρ * ( i ) är skattad ACF på avstånd i. Konfidensbanden för PACF är t,25 ( n ) 95% Iα ( h) = = ± h =, 2,..., (4) n 95% där I α ( h) = beskriver det intervall inom vilket sannolikheten är,95 att skattad PACF hamnar om den sanna PACF-funktionen är noll för laggar större än h-. Tolkningen av konfidensintervallen är att om skattningarna av ACF och PACF ligger utanför banden, kan dessa anses vara signifikant skilda från noll på 5%-nivån. Liknande figurer kommer att vara vanligt förekommande i fortsättningen av denna rapport. 2

22 Test Statistika = 9,536 P-värde =, Undersökt värde = 32428,3588 Undersökt frekvens =,257 35, 3, 25, och -Spektrum met i Figur 9 visar höga värden för mycket låga frekvenser vilket tyder på att en cosinusvåg med mycket långsam svängning har stor betydelse för processens uppförande. Detta är rimligt om man betraktar processen i Figur 6 eftersom den rör sig långsamt utan alltför brusigt utseende. I (), Spektrum 2, 5,, 5,,,,25,5,75,,26,5,76 2, 2,26 2,5 2,76 3,2 Figur 9. och -spektrum för slumpvandring. Walkers test ger ett P-värde nära noll vilket ger ett signifikant resultat på %-nivån för ω =,257 vilket motsvarar periodlängden 2π 5 tidsenheter.,257 Vi vet att serien i detta fall genererats enligt modell (38). Om vi trots denna vetskap använder modell (2), är en våg med vinkelfrekvensen ω =, 257 en viktig komponent för att förklara datat vid denna realisering. 4.2 N(, ) - slumptal Om vi betraktar de oberoende slumptal som bygger upp slumpvandringen erhålls Figur. En närmare studie av de första observationerna visas i Figur. Autokorrelationerna och de partiella autokorrelationerna i Figur 2 respektive Figur 3 är som väntat svaga, vilket är karakteristiskt för normalfördelade, oberoende slumptal. Intressant att notera är att ögat kan lura betraktaren till att upptäcka ett vågliknande mönster, trots att serien genererats helt slumpmässigt 3. Om man tittar ännu närmare på serien - som i Figur - kan man även här (med ett visst mått av fantasi) eventuellt hitta något slags mönster. N (, ) - obs. N (, ) - obs N (, ) N (, ) Tid Tid Figur. st simulerade N (, )-slumptal. Figur. De första observationerna från Figur. 3 Pseudo-slumptal från Marsaglias slumptalsgenerator. 22

23 Autokorrelation Autokorrelation för N (, ),,8,6,4,2, -,2 -,4 -,6 -,8 -, Figur 2. Autokorrelation för N (, )-slumptal. 75 Partiell Autokorrelation PACF för N (, ),,8,6,4,2, -,2 -,4 -,6 -,8 -, Figur 3. Partiell autokorrelation för N (, )-slumptal. Test Statistika = 5,6698 P-värde =,826 Undersökt värde = 83,7852 Undersökt frekvens =,278 met i Figur 4 visar på ett brusigt utseende, ämnt utspritt över alla frekvenser i intervallet (, π). Med hälp av formel (25) kan det teoretiska spektrumet för vitt brus beräknas till 2 σ Z f ( ω) = (4) Z Figur 4. och -spektrum för N (, )-slumptal. π eftersom alla autokovarianser i teorin är noll. Detta ger teoretiskt ett konstant spektrum på ca 3,8 i fallet N (, )-slumptal. Denna teoretiska nivå utgörs av den streckade, horisontella linen i Figur 4. Vi ser här att Walkers test ger ett P-värde på,826 vilket betyder att vi inte kan förkasta hypotesen (35). Testet fick oss denna gång att dra "rätt" slutsats om datamaterialet. -spektrumet visar på ett ämnt utseende utan någon topp som skiler sig skarpt från de övriga. I (), Spektrum 2, 8, 6, 4, 2,, 8, 6, 4, 2,, och -Spektrum,,25,5,75,,26,5,76 2, 2,26 2,5 2,76 3,2 4.3 Modeller med säsong Vi studerar nu en tidsserie enligt formel (9), dvs Yt = R cos ( ω t + θ ) + Z t t =, ±, ± 2,... (42) För enkelhets skull tänker vi oss att fasförskutningen är θ = och väler därefter amplituden till R = 5. Z t är som vanligt normalfördelat vitt brus. Eftersom periodogrammet plottas mot Fourierfrekvenserna ω p = 2π p / n är det av intresse att studera vad som händer om tidsserien består av en våg med en vinkelfrekvens mellan två sådana observationspunkter. Detta studeras i Figur 5 och 6. Figur 5 visar periodogrammet för en cosinusvåg med Fourierfrekvensen ω p = 2π 3 /. Figur 6 visar periodogrammet för en cosinusvåg med en vinkelfrekvens mitt emellan två Fourierfrekvenser, nämligen ω = 2π 3,5 /. Antalet observationer för dessa tidsserier är st. Observera att Figur 5 och 6 visar periodogrammen för rena cosinusvågor, dvs modell (42) utan termen Z t. 23

24 Test Statistika = 498,99999 P-värde =, Undersökt värde = 989,43679 Undersökt frekvens =,88496 och -Spektrum Test Statistika = 22,4478 P-värde =, Undersökt värde = 87,2276 Undersökt frekvens =,88496 och -Spektrum 25, 9, 8, 2, 7, 5, 6, I (), Spektrum, I (), Spektrum 5, 4, 3, 5, 2,,,,,25,5,75,,26,5,76 2, 2,26 2,5 2,76 3,2,,,25,5,75,,26,5,76 2, 2,26 2,5 2,76 3,2-5, -, Figur 5. och -spektrum för cosinusvåg på Fourierfrekvensen, Figur 6. och -spektrum för cosinusvåg med vinkelfrekvens,888979, dvs mellan de båda Fourierfrekvenserna, och, Det som hände vid denna simulering var att toppen - eller snarare topparna - blev lägre vid cosinusvågen mellan Fourierfrekvenserna än den med exakt frekvens. Några större problem att urskila var periodiciteten i tidsserierna finns torde det dock inte vara. Till höger visas hur periodogrampikarna fördelade sig på Fourierfrekvenserna runt den "sanna" frekvensen för periodogrammet i Figur 6. met i Figur 5 visar bara en pik och då på "rätt" frekvens. Fourier frekvenser, ,494, ,5763, ,4234, ,86732, ,2276, ,45883, ,3275, ,876, ,33847, ,8642 För att göra tidsserien lite mer verklighetstrogen lägger vi till normalfördelat vitt brus till den studerade cosinusvågen med ω p = 2π 3 /. Den nakna vågen visas i Figur 7 och i Figur 8 visas vågen inklädd i N (,) -brus. Säsong med periodlängd 3 /3 Säsong med slump Säsong SäsongSlump Tid Tid Figur 7. Cosinusvågen som genererat periodogrammet i Figur 5. Figur 8. Tidsserien i Figur 7 inklädd i N(, )-brus. För tydlighetens skull visas endast de första observationerna. Det som nu är intressant att studera är hur metoderna med autokorrelation och spektrum fungerar i sökandet efter säsongsmönstret när det omges av brus med relativt stor standardavvikelse i förhållande till säsongens amplitud, dvs enligt Figur 7 och 8. I Figur 9 visas ACF för den rena vågen i Figur 7 och i Figur 2 visas ACF för den inklädda vågen i Figur 8. Med denna metod skulle det vara svårt att upptäcka säsongsmönstret 24

25 eftersom de flesta autokorrelationerna håller sig inom det 95%-iga konfidensintervallet i Figur 2. Figur 9 uppvisar det förväntade mönstret för en tidsserie enbart bestående av säsong. Autokorrelation för cosinusvåg Autokorrelation för våg + slump. Autokorrelation,,8,6,4,2, -,2 -,4 -,6 -,8 -, Autokorrelation,,8,6,4,2, -,2 -,4 -,6 -,8 -, Figur 9. Autokorrelationer tillhörandes serien i Figur Figur 2. Autokorrelationer tillhörandes serien i Figur 8. Test Statistika = 47,8952 P-värde =, Undersökt värde = 7,35267 Undersökt frekvens =, , 6, 4, 2, och -Spektrum Om vi betraktar periodogrammet i Figur 2 visar detta en tydlig pik på frekvensen ( ),885 och ett småbrusigt utseende för övriga frekvenser. En analys i frekvensdomänen verkar i detta fall göra det lättare att hitta den dolda cosinusvågen i tidsserien i Figur 8. Walkers test förkastar H på %- nivån eftersom P-värdet är nära noll. I (), Spektrum, 8, 6, 4, 2,,,,25,5,75,,26,5,76 2, 2,26 2,5 2,76 3,2 Figur 2. och -spektrum för tidsserien i Figur 8. Vi har hitintills simulerat relativt "snälla" tidsserier med exempelvis konstant frekvens genom hela realiseringen. I verkligheten skulle man kunna tänka sig att även frekvensen uppvisar ett stokastiskt beteende vilket kommer att simuleras och undersökas nedan. Antag att periodlängden tillhör mängden {8, 9,,, 2} och att det är lika stor sannolikhet för vare periodlängd att inträffa. Antag vidare att tidsserien bildas genom att den första periodlängden slumpas ur ovanstående periodmängd och att när denna period är till ända så slumpas en ny periodlängd osv, tills en tidsserie med observationer skapats. Resultatet för de första observationerna för denna simulering visas i Figur 22. Om man omger denna våg med normalfördelat vitt brus - enligt tidigare - erhålls Figur 23. Stokastisk Säsong Stokastisk Säsong med Slump Stokastisk Säsong Stokastisk Säsong med Slump Tid Figur 22. Simulerad stokastisk våg med period {8, 9,,, 2} Tid Figur 23. Vågen i Figur 22 med tillägg av N(, )-brus. En analys i tidsdomänen - i form av ACF - presenteras i Figur 24 och 25 för observationer av tidsserierna i Figur 22 respektive Figur

26 Autokorrelation för SlumpSäsong Autokorrelation för SlumpSäsong med Brus Autokorrelation,,8,6,4,2, -,2 -,4 -,6 -,8 -, Autokorrelation,,8,6,4,2, -,2 -,4 -,6 -,8 -, Figur 24. ACF för tidsserien i Figur 22 byggd på obs Figur 25. ACF för tidsserien i Figur 23 byggd på obs. För den rena vågen med stokastisk period går det av Figur 24 utläsa ett visst säsongsmönster. När bruset läggs på är det av Figur 25 mycket svårt att hitta något bevis för ett mönster. Analysen i frekvensdomänen visas i Figur 26 och 27. Test Statistika = 66,937 P-värde =, Undersökt värde = 267,88 Undersökt frekvens =,6224 och -Spektrum Test Statistika = 9,332 P-värde =,443 Undersökt värde = 337,5383 Undersökt frekvens =,6224 och -Spektrum 3, 4, 25, 35, 3, 2, I (), Spektrum 5,, I (), Spektrum 25, 2, 5,, 5, 5,,,,,25,5,75,,26,5,76 2, 2,26 2,5 2,76 3,2,,25,5,75,,26,5,76 2, 2,26 2,5 2,76 3,2 Figur 26. och -spektrum för tidsserien i Figur 22 byggd på obs. Figur 27. och -spektrum för tidsserien i Figur 23 byggd på obs. Även i detta fall - med stokastisk säsong - visar det sig att periodogrammet är ett bättre verktyg än ACF för att upptäcka eventuella periodiciteter. Den största piken i Figur 26 (signifikant på %-nivån) svarar mot ω p = ( 2π 99 /) vilket motsvarar periodlängden, som approximativt är den förväntade säsongen. Vi ser på P-värdet - ovanför Figur 27 - att det var svårare att hitta säsongen när bruset lades på men testet ger ändå signifikans på 5%-nivån för samma periodlängd. Denna simuleringsstudie har visat på att analys i frekvensdomänen (periodogrammet) är att föredra framför analys i tidsdomänen (autokorrelationen) i sökandet efter ett okänt, sinusliknande säsongsmönster dolt i mycket brus. Vi är nu mogna att övergå till analysen av den "verkliga" tidsserien från Kassön. 26

27 5 Analys av tidsseriedata från Kassön Hela tidsserien omfattar sammanlagt 6387 observationer från år 4486 f Kr till år 9 e Kr Som tidigare nämnts är böran och slutet av mindre intresse än den mellanliggande tidsperioden varför endast perioden 4 f Kr till 7 e Kr kommer att omfattas av analysen. Aktuell period visas i Figur 28. Period MinMa MinMa År Figur 28. Tidsserie över årsvärden av minerogent material (+8) för perioden 4 f Kr till 7 e Kr. Genom att betrakta tidsserien med ögat kan vissa intressanta egenskaper noteras. Serien innehåller mycket brus. Nivån på serien (väntevärdet) ser ut att variera vilket är en avvikelse från stationaritet. En större nivåhöning sker omkring år 255 f Kr. Från denna nivå inleds en nedåtgående trend. Det intressanta är nu om det går att hitta påvisbara trender, säsongsmönster och övriga beroendestrukturer i denna långa tidsserie. Eftersom serien vid vissa tillfällen uppvisar tydliga karaktärsskiftningar är det lämpligt att dela in den i mindre bitar innan de statistiska verktygen i teoriavsnittet appliceras på datat. Bitindelningen har skett mer eller mindre subektivt utifrån en visuell betraktelse av tidsserien med hänsyn till ovanstående observerade egenskaper. De på detta vis utplockade perioderna är: ) 4 f Kr 3 f Kr 2) 3 f Kr 2 f Kr 3) 2 f Kr 256 f Kr 4) 255 f Kr 7 e Kr 27

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012 Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

Analys av egen tidsserie

Analys av egen tidsserie Analys av egen tidsserie Tidsserieanalys Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo 9 december 25 3 25 Antal solfläckar 2 15 1 5 5 1 15 2 25 3 Månad Inledning Vi har valt att betrakta

Läs mer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012 Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov

Läs mer

Finansiell statistik

Finansiell statistik Finansiell statistik Föreläsning 5 Tidsserier 4 maj 2011 14:26 Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

Homework Three. Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo. 28 november Time series analysis

Homework Three. Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo. 28 november Time series analysis Homework Three Time series analysis Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo 28 november 25 1 Vi ska här analysera en datamängd som består av medeltemperaturen månadsvis i New York mellan

Läs mer

Korrelation och autokorrelation

Korrelation och autokorrelation Korrelation och autokorrelation Låt oss begrunda uttrycket r = i=1 (x i x) (y i y) n i=1 (x i x) 2 n. i=1 (y i y) 2 De kvadratsummor kring de aritmetiska medelvärdena som står i nämnaren är alltid positiva.

Läs mer

TMS136. Föreläsning 4

TMS136. Föreläsning 4 TMS136 Föreläsning 4 Kontinuerliga stokastiska variabler Kontinuerliga stokastiska variabler är stokastiska variabler som tar värden i intervall av den reella axeln Det kan handla om längder, temperaturer,

Läs mer

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 4: Konfidensintervall (forts.) Föreläsning 4: Konfidensintervall forts. Johan Thim johan.thim@liu.se 3 september 8 Skillnad mellan parametrar Vi kommer nu fortsätta med att konstruera konfidensintervall och vi kommer betrakta lite olika

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Kontinuerliga fördelningar Uwe Menzel, 8 www.matstat.de Begrepp fördelning Hur beter sig en variabel slumpmässigt? En slumpvariabel (s.v.) har en viss fördelning, d.v.s.

Läs mer

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko. SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt

Läs mer

ARIMA del 2. Patrik Zetterberg. 19 december 2012

ARIMA del 2. Patrik Zetterberg. 19 december 2012 Föreläsning 8 ARIMA del 2 Patrik Zetterberg 19 december 2012 1 / 28 Undersöker funktionerna ρ k och ρ kk Hittills har vi bara sett hur autokorrelationen och partiella autokorrelationen ser ut matematiskt

Läs mer

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 10 27 november 2017 1 / 28 Idag Mer om punktskattningar Minsta-kvadrat-metoden (Kap. 11.6) Intervallskattning (Kap. 12.2) Tillämpning på

Läs mer

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, FÖR I/PI, FMS 121/2, HT-3 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Läs mer

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12 LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA21/9MA31, STN2) 212-8-2 kl 8-12 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd 6 poäng.

Läs mer

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18 LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA241/9MA341, STN2) 213-1-11 kl 14 18 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal

Läs mer

TMS136. Föreläsning 10

TMS136. Föreläsning 10 TMS136 Föreläsning 10 Intervallskattningar Vi har sett att vi givet ett stickprov kan göra punktskattningar för fördelnings-/populationsparametrar En punkskattning är som vi minns ett tal som är en (förhoppningsvis

Läs mer

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5 LÖSNINGAR TILL Matematisk statistik Tentamen: 29 7 kl 8 3 Matematikcentrum FMSF45 Matematisk statistik AK för D,I,Pi,F, 9 h Lunds universitet MASB3 Matematisk statistik AK för fysiker, 9 h. För tiden mellan

Läs mer

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 6 13 november 2017 1 / 29 Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer

Läs mer

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0 Avd. Matematisk statistik TENTAMEN I SF191, SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 1:A JUNI 216 KL 8. 13.. Kursledare: Thomas Önskog, 8-79 84 55 Tillåtna hjälpmedel: Formel- och tabellsamling i

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik KTH. Formelsamling i matematisk statistik Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Väntevärde, varians, standardavvikelse, kvantiler Uwe Menzel, 28 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Väntevärdet X : diskret eller kontinuerlig slumpvariable

Läs mer

Simulering. Introduktion. Exempel: Antag att någon kastar tärning

Simulering. Introduktion. Exempel: Antag att någon kastar tärning Simulering Introduktion Eempel: Antag att någon kastar tärning a) Vad är sannolikheten att på fyra kast få två seor? b) Vad är sannolikheten att på kast få mellan och 5 seor och där summan av de 5 första

Läs mer

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology September 21, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Uppgift 1. f(x) = 2x om 0 x 1

Uppgift 1. f(x) = 2x om 0 x 1 Avd. Matematisk statistik TENTAMEN I Matematisk statistik SF1907, SF1908 OCH SF1913 TORSDAGEN DEN 30 MAJ 2013 KL 14.00 19.00. Examinator: Gunnar Englund, 073 321 3745 Tillåtna hjälpmedel: Formel- och tabellsamling

Läs mer

Stokastiska Processer

Stokastiska Processer Kapitel 3 Stokastiska Processer Karakteristisk funktion: Den karakteristiska funktionen φ ξ : R n C för en R n -värd s.v. definieras för t R n. φ ξ (t) = E{e iπ(t ξ +...+t nξ n) } = E{e iπtt ξ } Den karakteristiska

Läs mer

Kap 2. Sannolikhetsteorins grunder

Kap 2. Sannolikhetsteorins grunder Kap 2. Sannolikhetsteorins grunder Olika händelser och deras mängbetäckningar Sats 2.7 Dragning utan återläggning av k element ur n (utan hänsyn till ordning) kan ske på ( n ) olika sätt k För två händelser

Läs mer

9. Konfidensintervall vid normalfördelning

9. Konfidensintervall vid normalfördelning TNG006 F9 09-05-016 Konfidensintervall 9. Konfidensintervall vid normalfördelning Låt x 1, x,..., x n vara ett observerat stickprov av oberoende s.v. X 1, X,..., X n var och en med fördelning F. Antag

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Faderns blodgrupp Sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Faderns blodgrupp Sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0 Avd. Matematisk statistik TENTAMEN I 5B1504 MATEMATISK STATISTIK GRUNDKURS FÖR E3 LÖRDAGEN DEN 30 AUGUSTI 2003 KL 08.00 13.00. Examinator: Gunnar Englund, tel. 790 7416. Tillåtna hjälpmedel : Formel- och

Läs mer

Hemuppgift 2 ARMA-modeller

Hemuppgift 2 ARMA-modeller Lunds Universitet Ekonomihögskolan Statistiska Institutionen STAB 13 VT11 Hemuppgift 2 ARMA-modeller 1 Inledning Denna hemuppgift är uppdelad i två delar. I den första ska ni med hjälp av olika simuleringar

Läs mer

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23 732G71 Statistik B Föreläsning 8 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23 Klassisk komponentuppdelning Klassisk komponentuppdelning bygger på en intuitiv

Läs mer

Regressions- och Tidsserieanalys - F8

Regressions- och Tidsserieanalys - F8 Regressions- och Tidsserieanalys - F8 Klassisk komponentuppdelning, kap 7.1.-7.2. Linda Wänström Linköpings universitet November 26 Wänström (Linköpings universitet) F8 November 26 1 / 23 Klassisk komponentuppdelning

Läs mer

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology April 27, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två numeriska

Läs mer

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att

Läs mer

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD 208-08-26 Sannolikhetsteori Följande gäller för sannolikheter: 0 P(A P(Ω = P(A

Läs mer

Avd. Matematisk statistik

Avd. Matematisk statistik Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 8:E JANUARI 2018 KL 14.00 19.00. Examinator: Thomas Önskog, 08 790 84 55. Tillåtna hjälpmedel: Formel- och tabellsamling

Läs mer

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016 SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 4 KONTINUERLIGA STOKASTISKA VARIABLER Tatjana Pavlenko 7 september 2016 PLAN FÖR DAGENS FÖRELÄSNING Repetition av diskreta stokastiska variabler. Väntevärde

Läs mer

Stokastisk geometri. Lennart Råde. Chalmers Tekniska Högskola och Göteborgs Universitet

Stokastisk geometri. Lennart Råde. Chalmers Tekniska Högskola och Göteborgs Universitet Stokastisk geometri Lennart Råde Chalmers Tekniska Högskola och Göteborgs Universitet Inledning. I geometrin studerar man geometriska objekt och deras inbördes relationer. Exempel på geometriska objekt

Läs mer

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H

Läs mer

Föreläsning 12: Repetition

Föreläsning 12: Repetition Föreläsning 12: Repetition Marina Axelson-Fisk 25 maj, 2016 GRUNDLÄGGANDE SANNOLIKHETSTEORI Grundläggande sannolikhetsteori Utfall = resultatet av ett försök Utfallsrum S = mängden av alla utfall Händelse

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Demonstration av laboration 2, SF1901

Demonstration av laboration 2, SF1901 KTH 29 November 2017 Laboration 2 Målet med dagens föreläsning är att repetera några viktiga begrepp från kursen och illustrera dem med hjälp av MATLAB. Laboration 2 har följande delar Fördelningsfunktion

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

LKT325/LMA521: Faktorförsök

LKT325/LMA521: Faktorförsök Föreläsning 2 Innehåll Referensfördelning Referensintervall Skatta variansen 1 Flera mätningar i varje grupp. 2 Antag att vissa eekter inte existerar 3 Normalfördelningspapper Referensfördelning Hittills

Läs mer

SF1911: Statistik för bioteknik

SF1911: Statistik för bioteknik SF1911: Statistik för bioteknik Föreläsning 6. TK 14.11.2016 TK Matematisk statistik 14.11.2016 1 / 38 Lärandemål Stokastiska modeller för kontinuerliga datatyper Fördelningsfunktion (cdf) Sannolikhetstäthetsfunktion

Läs mer

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) SF1901: Sannolikhetslära och statistik Föreläsning 9. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 21.02.2012 Jan Grandell & Timo Koski () Matematisk statistik 21.02.2012

Läs mer

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013 Föreläsning 11 Slumpvandring och Brownsk Rörelse Patrik Zetterberg 11 januari 2013 1 / 1 Stokastiska Processer Vi har tidigare sett exempel på olika stokastiska processer: ARIMA - Kontinuerlig process

Läs mer

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

TMS136. Föreläsning 13

TMS136. Föreläsning 13 TMS136 Föreläsning 13 Jämförelser mellan två populationer Hittills har vi gjort konfidensintervall och tester kring parametrar i EN population I praktiska sammanhang är man ofta intresserad av att jämföra

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

Sveriges bruttonationalprodukt Årsdata. En kraftig trend. Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs mätningarna vid vissa tidpunkter och med samma avstånd mellan

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar

Läs mer

Beskrivning av signaler i frekvensdomänen - sammanfattning

Beskrivning av signaler i frekvensdomänen - sammanfattning Beskrivning av signaler i frekvensdomänen - sammanfattning Bengt Carlsson Systems and Control Dept of Information Technology, Uppsala University January 21, 2010 Abstract Detta material ger en sammanfattning

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski SF1901: Sannolikhetslära och statistik Föreläsning 10. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 18.02.2016 Jan Grandell & Timo Koski Matematisk statistik 18.02.2016

Läs mer

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända Avd. Matematisk statistik TENTAMEN I SF90, SANNOLIKHETSTEORI OCH STATISTIK, TISDAGEN DEN 9:E JUNI 205 KL 4.00 9.00. Kursledare: Tatjana Pavlenko, 08-790 84 66 Tillåtna hjälpmedel: Formel- och tabellsamling

Läs mer

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5. February 6, 2018 1 Föreläsning VIII 1.1 Punktskattning Punktskattning av µ Vi låter {ξ 1, ξ 2,..., ξ n } vara oberoende likafördelade stokastiska variabler (med ett gemensamt µ). ξ =: µ är en punktskattning

Läs mer

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik Matematisk statistik KTH Formel- och tabellsamling i matematisk statistik Varterminen 2005 . Kombinatorik n = k n! k!n k!. Tolkning: n k mängd med n element. 2. Stokastiska variabler V X = EX 2 EX 2 =

Läs mer

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, HT2013 2014-02-07 Skrivtid: 13.00-18.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II Sannolikhetslära och inferens II Kapitel 4 Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar 1 Kontinuerliga slumpvariabler En slumpvariabel som kan anta alla värden på något intervall sägs

Läs mer

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004, TEN

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004, TEN TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF004, TEN 06-06-0 Hjälpmedel: Formler oh tabeller i statistik, räknedosa Fullständiga lösningar erfordras till samtliga uppgifter. Lösningarna skall vara

Läs mer

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik SF1901: Sannolikhetslära och statistik Föreläsning 5. Kovarians, korrelation, väntevärde och varians för summor av s.v.:er, normalfördelning (del 1) Jan Grandell & Timo Koski 15.09.2008 Jan Grandell &

Läs mer

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

Sveriges bruttonationalprodukt Årsdata. En kraftig trend. Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs mätningarna vid vissa tidpunkter och med samma avstånd mellan

Läs mer

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p) Avd. Matematisk statistik TENTAMEN I SF190 (f d 5B2501 ) SANNOLIKHETSLÄRA OCH STATISTIK FÖR - ÅRIG MEDIA MÅNDAGEN DEN 1 AUGUSTI 2012 KL 08.00 1.00. Examinator: Gunnar Englund, tel. 07 21 7 45 Tillåtna

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p) Avd. Matematisk statistik TENTAMEN I SF1901, SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 27:E OKTOBER 2014 KL 08.00 13.00. Kursledare: Tatjana Pavlenko, 08-790 84 66, Björn-Olof Skytt, 08-790 86 49.

Läs mer

Experimentella metoder, FK3001. Datorövning: Finn ett samband

Experimentella metoder, FK3001. Datorövning: Finn ett samband Experimentella metoder, FK3001 Datorövning: Finn ett samband 1 Inledning Den här övningen går ut på att belysa hur man kan utnyttja dimensionsanalys tillsammans med mätningar för att bestämma fysikaliska

Läs mer

0 om x < 0, F X (x) = c x. 1 om x 2.

0 om x < 0, F X (x) = c x. 1 om x 2. Avd. Matematisk statistik TENTAMEN I SF193 SANNOLIKHETSLÄRA OCH STATISTIK FÖR 3-ÅRIG Media TIMEH MÅNDAGEN DEN 16 AUGUSTI 1 KL 8. 13.. Examinator: Gunnar Englund, tel. 7974 16. Tillåtna hjälpmedel: Läroboken.

Läs mer

F9 SAMPLINGFÖRDELNINGAR (NCT

F9 SAMPLINGFÖRDELNINGAR (NCT Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion

Läs mer

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 4 7 november 2017 1 / 29 Idag Förra gången Viktiga kontinuerliga fördelningar (Kap. 3.6) Fördelningsfunktion (Kap. 3.7) Funktioner av stokastiska

Läs mer

F3 Introduktion Stickprov

F3 Introduktion Stickprov Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever

Läs mer

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06 Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06 Bengt Ringnér September 20, 2006 Inledning Detta är preliminärt undervisningsmaterial. Synpunkter är välkomna. 2 Väntevärde standardavvikelse

Läs mer

FÖRELÄSNING 8:

FÖRELÄSNING 8: FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data

Läs mer

Avd. Matematisk statistik

Avd. Matematisk statistik Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK, TORSDAGEN DEN 5:E APRIL 2018 KL 14.00 19.00. Examinator: Thomas Önskog, 08 790 84 55. Tillåtna hjälpmedel: Formel- och tabellsamling

Läs mer

Föreläsning 6: Spektralskattning: icke parametriska metoder. Leif Sörnmo 4 oktober 2009

Föreläsning 6: Spektralskattning: icke parametriska metoder. Leif Sörnmo 4 oktober 2009 Föreläsning 6: Spektralskattning: icke parametriska metoder Leif Sörnmo 4 oktober 2009 1 Metoder för spektralskattning icke-parametriska korrelogram, periodogram fönstring, medelvärdesbildning minimum-varians

Läs mer

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6. Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, 28-4-6 EXEMPEL (max och min): Ett instrument består av tre komponenter.

Läs mer

TMS136: Dataanalys och statistik Tentamen

TMS136: Dataanalys och statistik Tentamen TMS136: Dataanalys och statistik Tentamen 013-08-7 Examinator och jour: Mattias Sunden, tel. 0730 79 9 79 Hjälpmedel: Chalmersgodkänd räknare och formelsamling (formelsamling delas ut med tentan). Betygsgränser:

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad

Läs mer

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 11: Mer om jämförelser och inferens Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer

Läs mer

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Stas Volkov Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 1/20 Översikt Exempel Repetition Exempel Matematisk statistik

Läs mer

Lycka till!

Lycka till! Avd. Matematisk statistik TENTAMEN I 5B1503 STATISTIK MED FÖRSÖKSPLANERING FÖR K OCH B MÅNDAGEN DEN 25 AUGUSTI 2003 KL 14.00 19.00. Examinator: Gunnar Englund, 790 7416. Tillåtna hjälpmedel: Formel- och

Läs mer

MVE051/MSG Föreläsning 7

MVE051/MSG Föreläsning 7 MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel

Läs mer

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik SF9: Sannolikhetslära och statistik Föreläsning 3. Stokastiska variabler, diskreta och kontinuerliga Jan Grandell & Timo Koski 8.9.28 Jan Grandell & Timo Koski () Matematisk statistik 8.9.28 / 45 Stokastiska

Läs mer

Thomas Önskog 28/

Thomas Önskog 28/ Föreläsning 0 Thomas Önskog 8/ 07 Konfidensintervall På förra föreläsningen undersökte vi hur vi från ett stickprov x,, x n från en fördelning med okända parametrar kan uppskatta parametrarnas värden Detta

Läs mer

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL TENTAMEN I SF950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 010 KL 14.00 19.00 Examinator : Gunnar Englund, tel. 790 7416, epost: gunnare@math.kth.se Tillåtna hjälpmedel: Formel-

Läs mer

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN): Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF50: Matematisk statistik för L och V OH-bilder på föreläsning 7, 2017-11-20 EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Läs mer

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ Inledning till statistikteorin Skattningar och konfidensintervall för μ och σ Punktskattningar Stickprov från en population - - - Vi vill undersöka bollhavet men får bara göra det genom att ta en boll

Läs mer

Industriell matematik och statistik, LMA136 2013/14

Industriell matematik och statistik, LMA136 2013/14 Industriell matematik och statistik, LMA136 2013/14 7 Mars 2014 Disposition r Kondensintervall och hypotestest Kondensintervall Statistika Z (eller T) har fördelning F (Z en funktion av ˆθ och θ) q 1 α/2

Läs mer

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för

Läs mer

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:... Avd. Matematisk statistik EXEMPELTENTAMEN I SANNOLIKHETSTEORI OCH STATISTIK, Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik (utdelas vid tentamen). Tentamen består av två delar,

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:... Avd. Matematisk statistik TENTAMEN I SF9/SF94/SF95/SF96 SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 4:E OKTOBER 08 KL 8.00 3.00. Examinator för SF94/SF96: Tatjana Pavlenko, 08-790 84 66 Examinator för

Läs mer

8 Inferens om väntevärdet (och variansen) av en fördelning

8 Inferens om väntevärdet (och variansen) av en fördelning 8 Inferens om väntevärdet (och variansen) av en fördelning 8. Skattning av µ och Students T-fördelning Om σ är känd, kan man använda statistikan X µ σ/ n för att hitta konfidensintervall för µ. Om σ inte

Läs mer