2.1 Mikromodul: stokastiska processer

Relevanta dokument
DIGITAL SIGNALBEHANDLING

Stokastiska vektorer och multivariat normalfördelning

Stokastiska vektorer

Föreläsning 7: Punktskattningar

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Föreläsning 7: Punktskattningar

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

SF1901 Sannolikhetsteori och statistik I

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

SF1901: Sannolikhetslära och statistik

Föreläsning 7: Stokastiska vektorer

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Demonstration av laboration 2, SF1901

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

Föreläsning 7: Punktskattningar

SF1911: Statistik för bioteknik

Kurssammanfattning MVE055

SF1901: Sannolikhetslära och statistik

Kap 2. Sannolikhetsteorins grunder

Matematisk statistik för D, I, Π och Fysiker

Lektionsanteckningar 11-12: Normalfördelningen

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

Sannolikheter och kombinatorik

Matematisk statistik KTH. Formelsamling i matematisk statistik

Föreläsning 6, FMSF45 Linjärkombinationer

SF1901: Sannolikhetslära och statistik

Tentamen MVE302 Sannolikhet och statistik

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

Stokastiska processer med diskret tid

Sannolikhet och statistik XI

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Tentamen MVE301 Sannolikhet, statistik och risk

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Härledning av Black-Littermans formel mha allmänna linjära modellen

Föreläsning 5, FMSF45 Summor och väntevärden

TMS136. Föreläsning 4

Föresläsningsanteckningar Sanno II

Matematisk statistik TMS064/TMS063 Tentamen

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

TAMS79 / TAMS65 - vt TAMS79 / TAMS65 - vt Formel- och tabellsamling i matematisk statistik. TAMS79 / TAMS65 - vt 2013.

TMS136. Föreläsning 10

Stokastiska processer med diskret tid

Kovarians och kriging

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Föreläsning 5, Matematisk statistik Π + E

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Tentamen MVE301 Sannolikhet, statistik och risk

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Föreläsning 6, Matematisk statistik Π + E

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Formler och tabeller till kursen MSG830

Stokastiska signaler. Mediesignaler

SF1901: Sannolikhetslära och statistik

F13 Regression och problemlösning

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Statistiska metoder för säkerhetsanalys

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Matematisk statistik för B, K, N, BME och Kemister

Hur måttsätta osäkerheter?

FÖRELÄSNING 7:

Föreläsning 3: Konfidensintervall

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

TMS136: Dataanalys och statistik Tentamen

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Föreläsning 12: Linjär regression

Avd. Matematisk statistik

Grundläggande matematisk statistik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Tentamen i Beräkningsvetenskap II, 5.0 hp,

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Tentamen MVE301 Sannolikhet, statistik och risk

Laboration 2: Sannolikhetsteori och simulering

Formel- och tabellsamling i matematisk statistik

Tentamen MVE301 Sannolikhet, statistik och risk

2 x dx = [ x ] 1 = 1 ( 1 (1 0.9) ) 100 = /

Detta formelblad får användas under både KS2T och KS2D, samt ordinarie tentamen. x = 1 n. x i. with(stats): describe[mean]([3,5]); 4.

Föreläsning 4: Konfidensintervall (forts.)

SF1901 Sannolikhetsteori och statistik I

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

MVE051/MSG Föreläsning 14

Enkel och multipel linjär regression

Bengt Ringnér. September 20, Detta är föreläsningsmanus på lantmätarprogrammet LTH vecka 5 HT07.

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

5 Stokastiska vektorer 9. 6 Multipel regression Matrisformulering MK-skattning av A.3 Skattningarnas fördelning...

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Tentamen för kursen. Linjära statistiska modeller. 17 februari

FACIT: Tentamen L9MA30, LGMA30

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

Tenta i Statistisk analys, 15 december 2004

Transkript:

2. Mikromodul: stokastiska processer 9 2. Mikromodul: stokastiska processer 2.. Stokastiska variabler En stokastiskt variabel X beskrivs av dess täthetsfunktion p X (x), vars viktigaste egenskaper sammanfattas i dess första två s.k. moment: medelvärde och varians E(X) = xp X (x)dx x ( ) 2pX Var(X) = x E(X) (x)dx = E(X 2 ) ( E(X) ) 2 Normalfördelningen har x p X (x;µ,σ 2 ) = 2πσ 2 e (X µ)2 2σ 2, där parametrarna µ = E(X) och σ 2 = Var(X) beskriver hela täthetsfunktionen. Ett konfidensintervall med konfidensgrad 95% ges för normalfördelingen av µ ±.96σ, dvs. Prob( X µ <.96σ) = 0.95. I Matlab genereras ett normalfördelat slumptal av x=mu+sigma*randn(,). En vektor eller matris skapas av oberoende slumptal skapas av randn(n,m). Konfidensgraden för ett intervall kan verifieras numeriskt med >> x=randn(0000,); >> length(find(x<.96 & x>-.96))/0000 ans = 0.952 dvs. 95% av alla slumptal hamnar i intervallet [.96,.96]. Analytiskt kan sannolikheten Prob( X >.96) räknas ut med >> erfc(.96) ans = 0.0056 2..2 Stokastiska vektorer och kovarians En vektor X (dimension n ) av stokastiska variabler beskrivs på analogt sätt av en vektorvärd täthetsfunktion, t.ex. den multivariabla

0 Innehåll normalfördelningen p X (x;µ,p) = (2π) n det(p) e 0.5(X µ)t P (X µ). Väntevärde µ (n ) och kovarians P (n n) definieras av µ = E(X) = xp X (x)dx x P = Cov(X) = E [ (x µ X )(x µ X ) T] = (x µ X )(x µ X ) T p X (x)dx. x Kovariansen anger hur starkt kopplade slumptalen är till varandra. Om element P ij = 0 betyder det att elementen x i och x j är okorrelerade. Omvänt, om P ij > 0 så är x i och x j positivt korrelerade så ett om den ena är positiv så är den andra det sannolikt också. Konfidensintervall kan enkelt generaliseras till vektorer. Ett område med konfidensgrad 95% ges för normalfördelningen av {X : (X µ) T P (X µ) <.96}. En linjärtransformation Y = AX ger en ny stokastisk vektor Y (som kan vara längre eller kortare än X. Från definitionen härleds enkelt följande räkneregler för de första momenten: Y = AX µ Y = E(Y ) = AE(X) = Aµ X P Y = Cov(Y ) = ACov(X)A T = AP X A T. En normalfördelad vektor av slumptal kan genereras i Matlab med [U,S,V]=svd(P); Psqrt=U*sqrt(S); x=mu+psqrt*randn(n,); De första två raderna räknar ut en matriskvadratrot av P som definieras av P /2 P T/2 = P. SVD faktoriserar en godtycklig matris P = USV T, där U är unitär (dvs. U T U = UU T = I) och S är diagonal. I detta fall när P är symmetrisk och positivt semidefinit gäller att U = V och S ii 0. Från dessa egenskaper följer att kvadratrotsdefinitionen är uppfylld med konstruktionen P /2 = US /2.

2. Mikromodul: stokastiska processer Följande exempel illustrerar principerna för linjära avbildningar. 200 slumptal X från standardnormalfördelningen genereras först, och avbildas sedan linjärt på 200 stokastiska vektorer Y. X=randn(2,200); A=[ 0.5;0 ]; Y=A*X; figure() plot(x(,:),x(2,:),. ) figure(2) plot(y(,:),y(2,:),. ) Kovariansmatrisen ges av P = AIA T = ( ).25 0.5, 0.5 vilken illustreras av nivåkurvan i figur 2..b Härur följer t.ex. att Var(y ) = P =.25 och E(y y 2 ) = 0.5. Elementen y och y 2 är alltså positivt korrelerade, så om den ena är positiv så är den andra det också med stor sannolikhet. Den ellips som svarar mot 95% av alla punkter ritas med nedanstående beräkningar, där enhetscirkeln avbildas av samma transformation y = Ax och sedan skalas till önskad konfidensgrad. P=A*A phi=linspace(0,2*pi,00); x=[cos(phi);sin(phi)]; y=a*x; plot(.96*y(,:),.96*y(2,:), - ) Notera att den positiva korrelationen mellan y och y 2 kan ses på ellipsens form. 2..3 Stokastiska processer och kovariansfunktionen Om x[k] är en sekvens av stokastiska variabler är det en stokastisk process. Den stora skillnaden på en stokastisk vektor och en stokastisk process är att den senare oftast anses vara oändligdimensionell. I övrigt

2 Innehåll x 2 2.5 2.5 0.5 0 0.5.5 2 2.5 3 2 0 2 3 x (a) y 2 3 2 0 2 3 3 2 0 2 3 4 y (b) Figur 2. Tvådimensionella normalfördelade slumptal med väntevärde noll och kovariansmatris P = I respektive P = AA T. Ett konfidensområde svarande mot 95% av alla punkter är också markerat. definieras väntevärdesfunktionen och kovariansfunktionen (notera ordet funktion i dessa begrepp) analogt: m x [k] = E(x[k]) R xx [k,l] = E ( (x[k] m x [k])(x[l] m x [l]) ) Ser vi x som en vektor med element x[k], ges väntevärdet av en vektorn med element µ k = m[k] och kovariansen av matrisen P med element P kl = R xx [k,l]. Vi fokuserar på processer med medelvärde 0 (m x [k] = 0) som är stationära. Stationäritet definieras av att R xx [k,l] = R xx [k l], dvs. endast tidsskillnaden och inte absolut tid inverkar på kovariansfunktionen, och skriver R xx [l] = E(x[k]x[k l]). Om x tolkas som en vektor av längd N blir kovariansmatrisen R xx [0] R xx []... R xx [N ] R xx [ ] R xx [0]... R xx [N 2] Cov(x) =...... R xx [ N + ] R xx [ N + 2]... R xx [0] På grund av symmetrin i matrisen (kallas för Toeplitz-struktur), samt symmetrin R xx [ k] = R xx [k], räcker det med att specifiera första

2. Mikromodul: stokastiska processer 3 raden i denna matris. Notera att första raden sammanfaller med kovariansfunktionen för den stationära processen. Korskovariansfunktionen definieras analogt som R xy [l] = E(x[k]y[k l]). I motsats till kovariansfunktionen som alltid är symmetrisk gäller här att R yx [ l] = R xy [l] R xy [ l] = R yx [l]. Ett typexempel på stationär stokastisk process är filtrerat vitt brus. Vitt brus svarar mot en sekvens av oberoende slumptal x[k] med m x [k] = 0 och R xx [k] = δ[k]. Exempel: en sekvens y[k] genereras från vitt brus x[k] med följande rekursion y[k] = 0.8y[k ] + x[k]. Rekursionen kan utvecklas till y[k] = x[k] + 0.8x[k ] +... 0.8 l x[k l] +... Kausalitet ger att y[k] är oberoende av framtida x[k + l], så att korskovariansfunktionen blir { 0.8 l, l 0, R yx [l] = E(y[k]x[k l]) = 0, l < 0. På motsvarande sätt blir kovariansfunktionen for y[k] R yy [l] = E(y[k]y[k l]) = E ( (x[k] + 0.8x[k ] +... )( x[k l] + 0.8x[k l ] +...) ) = 0.8 l (0.8 2 ) i = 0.8 l 0.8 2 = 0.8 l 25 9 i= I Matlab kan exemplet testas med x=randn(0000,); y=filter([ 0],[ -0.8],x); Ryy=covf(y,20) k=0:9; plot(k,ryy, -,k,25/9*0.8.^k, -- ) vilket genererar Figur 2.2. 2.78 0.8 l

4 Innehåll 3 2.5 Skattad Sann 2 R yy [k].5 0.5 0 0 5 0 5 20 k Figur 2.2 Skattad och sann kovariansfunktion R yy[k].