TAMS79: Föreläsning 10 Markovkedjor

Relevanta dokument
Markovprocesser SF1904

Markovprocesser SF1904

Matematisk statistik för D, I, Π och Fysiker

Stokastiska processer

Markovprocesser SF1904

Markovprocesser SF1904

P(X nk 1 = j k 1,..., X n0 = j 0 ) = j 1, X n0 = j 0 ) P(X n0 = j 0 ) = etc... P(X n0 = j 0 ) ... P(X n 1

Markovprocesser SF1904

Markovkedjor. Patrik Zetterberg. 8 januari 2013

Markovprocesser SF1904

Grafer och grannmatriser

Markovprocesser SF1904

Markovprocesser SF1904

Exempel. Vi observerar vädret och klassificerar det i tre typer under en följd av dagar. vackert (V) mulet (M) regn (R)

Markovprocesser SF1904

Föreläsning 9, FMSF45 Markovkedjor

Tentamen i matematisk statistik, TAMS15/TEN (4h)

TENTAMEN I SF1904 MARKOVPROCESSER FREDAGEN DEN 17 AUGUSTI 2018 KL

TATA42: Föreläsning 5 Serier ( generaliserade summor )

Stokastiska processer och simulering I 24 maj

Fö relä sning 2, Kö system 2015

Egenvärden och egenvektorer

DEL I 15 poäng totalt inklusive bonus poäng.

b) Vad är sannolikheten att personen somnar i lägenheten? (4 p) c) Hur många gånger förväntas personen byta rum? (4 p)

19. Spektralsatsen Spektralsatsen SPEKTRALSATSEN

gränsvärde existerar, vilket förefaller vara en naturlig definition (jämför med de generaliserade integralerna). I exemplet ovan ser vi att 3 = 3 n n

Föreläsningsanteckningar Linjär Algebra II Lärarlyftet

Lösningsförslag till skrivningen i Vektorgeometri (MAA702) måndagen den 30 maj 2005

SKRIVNING I VEKTORGEOMETRI

Övningar. MATEMATISKA INSTITUTIONEN STOCKHOLMS UNIVERSITET Avd. Matematik. Linjär algebra 2. Senast korrigerad:

Stokastiska processer och simulering I 24 augusti

P =

UPPSALA UNIVERSITET Matematiska institutionen Styf. Exempeltenta med lösningar Programmen EI, IT, K, X Linjär algebra juni 2004

TENTAMEN I SF1904 MARKOVPROCESSER TISDAGEN DEN 29 MAJ 2018 KL

Matematisk statistik 9 hp, HT-16 Föreläsning 16: Markovkedjor

Tentamen i Linjär algebra (TATA31/TEN1) ,

1 Linjära ekvationssystem. 2 Vektorer

Tentamen i FMS180/MASC03 Markovprocesser

Vektorgeometri för gymnasister

. (2p) 2x + 2y + z = 4 y + 2z = 2 4x + 3y = 6

ax + y + 4z = a x + y + (a 1)z = 1. 2x + 2y + az = 2 Ange dessutom samtliga lösningar då det finns oändligt många.

LINKÖPINGS UNIVERSITET EXAM TAMS 15 / TEN 1

Lösningsförslag till skrivningen i Vektorgeometri (MAA702) Måndagen den 13 juni 2005

Föreläsningsanteckningar Linjär Algebra II Lärarlyftet

Matematisk statistik KTH. Formel- och tabellsamling i Matematisk statistik, grundkurs

Lösningar till utvalda uppgifter i kapitel 8

SKRIVNING I VEKTORGEOMETRI

Tentamen i Linjär algebra (TATA31/TEN1) ,

2x + y + 3z = 4 x + y = 1 x 2y z = 3

Vektorgeometri för gymnasister

Egenvärdesproblem för matriser och differentialekvationer

6. Matriser Definition av matriser 62 6 MATRISER. En matris är ett rektangulärt schema av tal: a 11 a 12 a 13 a 1n a 21 a 22 a 23 a 2n A =

Tentamen i Linjär algebra (TATA31/TEN1) ,

Determinanter, egenvectorer, egenvärden.

Övningar. c) Om någon vektor i R n kan skrivas som linjär kombination av v 1,..., v m på precis ett sätt så. m = n.

Egenvärden och egenvektorer. Linjär Algebra F15. Pelle

SF1624 Algebra och geometri Lösningsförslag till tentamen DEL A

** a) Vilka värden ska vara istället för * och **? (1 p) b) Ange för de tre tillstånden vilket som svarar mot 0,1,2 i figuren.

TMV142/186 Linjär algebra Z/TD

LÖSNINGAR TILL UPPGIFTER TILL RÄKNEÖVNING 1

Stokastiska vektorer och multivariat normalfördelning

Tentamen i Linjär algebra , 8 13.

DEL I. Matematiska Institutionen KTH. Lösning till tentamensskrivning på kursen Linjär algebra II, SF1604, den 17 april 2010 kl

SF1624 Algebra och geometri Tentamen med lösningsförslag onsdag, 11 januari 2017

SF1624 Algebra och geometri Lösningsförslag till tentamen Lördagen den 5 juni, 2010 DEL A

Diagonalisering och linjära system ODE med konstanta koe cienter.

Chalmers tekniska högskola Datum: kl Telefonvakt: Linnea Hietala MVE480 Linjär algebra S

LÖSNINGAR LINJÄR ALGEBRA LUNDS TEKNISKA HÖGSKOLA MATEMATIK

Föreläsn. anteckn. TMV206-VT13. Vecka 6-7. Egenvärden och Egenvektorer. Kap. 8-9

TATA42: Föreläsning 6 Potensserier

SKRIVNING I VEKTORGEOMETRI

SF1624 Algebra och geometri Tentamen Torsdag, 17 mars 2016

Material till kursen SF1679, Diskret matematik: Lite om kedjebråk. 0. Inledning

2s + 3t + 5u = 1 5s + 3t + 2u = 1 3s 3u = 1

Provräkning 3, Linjär Algebra, vt 2016.

1. (Dugga 1.1) (a) Bestäm v (3v 2u) om v = . (1p) and u =

Basbyten och linjära avbildningar

14. Minsta kvadratmetoden

Linjär algebra Föreläsning 10

Exempel :: Spegling i godtycklig linje.

SF1624 Algebra och geometri Lösningsförslag till tentamen DEL A

SKRIVNING I VEKTORGEOMETRI

tal. Mängden av alla trippel av reella tal betecknas med R 3 och x 1 x 2 En sekvens av n reella tal betecknas med (x 1, x 2,, x n ) eller

Moment 6.1, 6.2 Viktiga exempel Övningsuppgifter T6.1-T6.6

TENTAMEN I SF2937 (f d 5B1537) TILLFÖRLITLIGHETSTEORI TORSDAGEN DEN 14 JANUARI 2010 KL

DEL I. Matematiska Institutionen KTH. Lösning till tentamensskrivning på kursen Linjär algebra II, SF1604 för D, den 5 juni 2010 kl

TATM79: Föreläsning 6 Logaritmer och exponentialfunktioner

SF1624 Algebra och geometri Tentamen Onsdag, 13 januari 2016

TENTAMEN I SF1904 MARKOVPROCESSER FREDAGEN DEN 18 AUGUSTI 2017 KL

6.4. Linjära ekvationssytem och matriser

SF1624 Algebra och geometri Lösningsförslag till tentamen DEL A

Exempel :: Spegling i godtycklig linje.

Lite Linjär Algebra 2017

TMA 671 Linjär Algebra och Numerisk Analys. x x2 2 1.

Vektorgeometri för gymnasister

Föreläsn. anteckn. HT13. Vecka 6-7. Egenvärden och Egenvektorer. Slumpvandringar på Grafer. Kap. 8-9

TATA42: Föreläsning 10 Serier ( generaliserade summor )

A = (3 p) (b) Bestäm alla lösningar till Ax = [ 5 3 ] T.. (3 p)

LÖSNINGAR TILL LINJÄR ALGEBRA kl 8 13 LUNDS TEKNISKA HÖGSKOLA MATEMATIK. 1. Volymen med tecken ges av determinanten.

4x az = 0 2ax + y = 0 ax + y + z = 0

Transkript:

TAMS79: Föreläsning 0 Markovkedjor Johan Thim december 08 0. Markovkedjor Vi ska nu betrakta en speciell tidsdiskret diskret stokastisk process, nämligen Markovkedjan. Vi börjar med en definition Definition. En diskret Markovprocess {X n } n {0,,,...} med diskret tid kallas för en Markovkedja. Kravet på processen är att P ( ( X n = x n X 0 = x 0, X = x,..., X n = x n = P Xn = x n X n = x n för alla n och x 0, x,..., x n E. Markovkedja Med andra ord så har historian ingen betydelse för processen. Endast det tillstånd kedjan just nu befinner sig i har någon inverkan på framtiden. Om Markovkedjan har ett ändligt tillståndsrum E säger vi att Markovkedjan är ändlig. Vidare har kedjan ingångssannolikheter p j (0 = P (X 0 = E j för alla j 0. Funktionerna p j (n beskriver generellt sannolikhetsfördelningen for tiden n, dvs p j (n = P (X n = E j är sannolikheten att kedjan vid tiden n befinner sig i tillstånd E j. Vi kallar dessa sannolikheter för absoluta sannolikheter. Kedjan kallas tidshomogen om P ( X n+ = E j X n = E i = pij är konstant för alla n 0. Detta innebär att vi alltid har samma sannolikhet för övergångar mellan olika tillstånd i ett steg. Vi tänker oss p ij som sannolikheten att flytta oss från tillståndet E i till E j i ett steg. Från detta följer att vi fullständigt kan karaktärisera en tidshomogen Markovkedja utifrån övergångsmatrisen P = (p ij, P = p 00 p 0 p 0 p 0 p p p 0 p p.. där talet på rad i och kolonn j representerar övergångssannolikheten p ij att kedjan går från tillstånd E i till E j med ett steg. Denna matris har egenskapen att varje radsumma blir ett, dvs johan.thim@liu.se....,

att j p ij = för varje i. Matriser som har denna egenskap tillsammans med kravet att varje element i matrisen är en sannolikhet kallas för stokastiska matriser. Ett tillstånd E j som har p jj = kallar vi absorberande. Vi kommer att anta tidshomogenitet om inget annat anges. Ofta beskrivs Markovkedjor med diagram; vi listar några exempel tillsammans med respektive övergångsmatris. β ( β β P = β 0 α α α α / 0 P = 0 / / / 0 / 0 0 / / /.......... P = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0...... 0.......... 0. Övergångar av högre ordning För i, j, n 0 låter vi p ij (n = P ( X n+k = E j X k = E i, vilket är sannolikheten att med precis n steg förflytta sig från E i till E j på något sätt. Om kedjan är tidshomogen är detta uttryck oberoende av k, så vi kan lika gärna skriva p ij (n = P ( X n = E j X 0 = E i, i, j, n 0. Vi låter matrisen P (n = (p ij (n bestå av dessa sannolikheter. Hur hänger P (n ihop med övergångsmatrisen P? Övergångsmatris av ordning n Sats. För alla heltal n gäller att P (n = P n.

Beviset för satsen kan göras till exempel med induktion på n. Vi visar basfallet n = : p ij ( = P ( X = E j X 0 = E i = k = k P ( X = E j X = E k, X 0 = E i P ( X = E k X 0 = E i P ( X = E j X = E k P ( X = E k X 0 = E i = k p kj ( p ik (, vilket är elementet på rad i och kolonn j i matrisen P. Med samma teknik kan man visa att P (n = P P (n, så det sökta resultatet följer från induktionsaxiomet. Chapman-Kolmogorov Sats. Om m, n 0 gäller att P (m + n = P (mp (n = P m+n. 0. Sannolikhetsfördelningar Om vi vet ingångssannolikheterna p j (0 och övergångsmatrisen P för en tidshomogen Markovkedja, kan vi direkt beskriva fördelningen av sannolikheter efter ett godtyckligt antal steg n genom ekvationen p(n = p(0p n, n 0, där vi låter p(n vara radvektorn (p 0 (n, p (n, p (n,... för n = 0,,,.... Observera att p(0 är radvektorn med ingångssannolikheter. Allmänt kallar vi en vektor π = (, π, π,... för en sannolikhetsvektor om k π k = och π k 0 för alla k. Stationär fördelning Definition. Låt π vara en sannolikhetsvektor. Om π uppfyller ekvationen π = πp kallar vi π för en stationär fördelning. En stationär fördelning π uppfyller π = πp, vilket medför att om vi låter vektorn p(0 av ingångssannolikheter ges av p(0 = π, så erhåller vi p(n = p(0p n = πp n = π för alla n. Därav ordet stationär. Asymptotisk fördelning Definition. Om lim p(n = π för någon sannolikhetsvektor π som inte beror på ingångssannolikheterna (vektorn p(0, så säger vi att π är kedjans asymptotiska n fördelning. Asymptotisk fördelning vs. stationär fördelning Om en tidshomogen Markovkedja har en asymptotisk fördelning π så fås denna genom att lösa ekvationen π = πp.

En asymptotisk fördelning är alltså en stationär fördelning. Varför? Eftersom p(n = p(0p n π enligt antagande (asymptotisk fördelning existerar, kan vi i gränsvärde erhålla p(0p n+ = (p(0p n P π = πp då n. Observera att motsatsen inte gäller. En stationär fördelning behöver inte vara den asymptotiska fördelningen. Med α, β (0,, låt en Markovkedja ha övergångsmatrisen P = ( β β α α. Finn alla stationära fördelningar och bestäm (om den finns den asymptotiska fördelningen. Lösning: Vi börjar med att skriva ut ekvationen π = πp : = ( β + π α, = π = β + π ( α, = + π, π = α α + β, β α + β, där vi utnyttjat att + π = (annars får vi oändligt många lösningar. Lösningen är entydig så det finns bara en stationär fördelning, så om en asymptotisk fördelning existerar måste den sammanfalla med vektorn ovan. Så hur visar vi att en asymptotisk fördelning existerar? Ett sätt är att helt enkelt räkna ut gränsvärdet. Det visar sig ganska bökigt att räkna ut P, P,... (testa, så vi använder lite linjär algebra. Man kan nästan gissa att egenvärdena till P ges av λ = och λ = α β. Lös annars sekularekvationen det(p λi = 0. Motsvarande egenvektorer kan beräknas till v = s ( och ( β v = s α, s R \ {0}. Vi skapar en transformationsmatris T med v och v som kolonner. Matrisen T och dess invers ges av ( β T = och T = ( α β. α α + β Vi diagonaliserar P genom P = T DT där D är diagonalmatrisen med egenvärdena på diagonalen. Då erhåller vi ( n 0 P n = (T DT n = T D n T = T T 0 α β = ( α + β( α β n β β( α β n α + β α α( α β n β + α( α β n α + β ( α β α β, n, eftersom α β <. Alltså måste ( p(n = p(0p n π = α α+β β α+β, n, 4

oberoende av ingångssannolikheten p(0. Detta är alltså den asymptotiska fördelningen π. Detta är en ganska lång beräkning för att komma fram till att den stationära fördelning i detta fall är den asymptotiska. Det finns många satser som garanterar existens av asymptotiska fördelningar. En av dessa (utan bevis är följande. Existens av asymptotisk fördelning Sats. Om man i en ändlig kedja kan finna ett n > 0 så att alla element i någon kolonn av matrisen P n är positiva, så existerar en asymptotisk fördelning. I exemplet ovan kan vi alltså direkt säga att en asymptotisk fördelning existerar, och eftersom kedjan bara har en stationär fördelning måste denna även vara den asymptotiska! 0.4 Vidare klassificering av Markovkedjor Vi kallar ett tillstånd E j tillgängligt från tillstånd E i om p ij (n > 0 för något n 0; vi skriver E i E j. Om både E j E i och E i E j säger vi att tillstånden kommunicerar och skriver E i E j. Kommunikation är en ekvivalensrelation på mängden av alla tillstånd. Med detta menar vi att (i E i E i för alla tillstånd E i ; (ii E i E j medför att E j E i ; (iii Om E i E j och E j E k så gäller att E i E k. En ekvivalensrelation på en mängd delar in mängden i så kallade ekvivalensklasser. Vi säger att två tillstånd som kommunicerar med varandra tillhör samma klass. En Markovkedja där alla tillstånd kommunicerar med varandra (vi har endast en klass kallas irreducibel. Finns det flera klasser kallar vi kedjan reducibel. Låt f (n ii vara sannolikheten att kedjan efter n steg för första gången sedan starten i E i åter igen befinner sig i E i. Vi låter f ii = n= f (n ii vara sannolikheten att kedjan någon gång återvänder till tillstånd E i. Om f ii = kallar vi tillståndet E i beständigt och om f ii < kallas E i obeständigt. Om ett tillstånd är obeständigt finns en positiv sannolikhet f ii att kedjan aldrig återvänder till E i. Varje tillstånd i en Markovkedja är alltså beständigt eller obeständigt. Om E i är beständigt, låt den stokastiska variabeln T i vara antalet steg innan kedjan återvänder till E i. Om E(T i = n= nf (n ii < (det förväntade antalet steg är ändligt kallar vi E i för positivt beständigt. Om E(T i = kallas tillståndet noll-beständigt. Det är även sant att dessa beständighetsegenskaper för tillstånd måste delas av hela klasser i en Markovkedja. Om ett tillstånd i klassen till exempel är positivt beständigt så är alla tillstånd i klassen det. 5

Låt P = ( 0 0 0 vara övergångsmatrisen för kedjan X n. Rita upp Markovkedjan och klassificera alla tillstånd. Beräkna alla stationära fördelningar och den asymptotiska fördelningen (om den existerar. Lösning: Figur: / / 0 / / / Vi undersöker nu vilka tillstånd som är beständiga. Först ut är E 0 : f 00 = n= Tillståndet är obeständigt. Vi fortsätter med E : f = n= f (n 00 = + = 4 9 f (n = 0 + + + + = 9 k=0 ( k = 6. Även E är obeständigt. Om vi tittar närmare på E ser vi att tillståndet är absorberande (och därmed beständigt; f =. Detta tillstånd är även positivt beständigt (självklart. Vi löser ekvationen π = πp för att hitta stationära vektorer: + π = = π + π + π = π + π + π = = 0 π = 0 π = Inte så förvånande resultat med tanke på att tillstånd två är absorberande. I matrisen P är alla element i kolonn tre skilda från noll, så enligt satsen ovan existerar en asymptotisk fördelning, som måste vara den unika stationära lösningen vi fann ovan. 6

Låt P = ( 0 0 0 4 4 0 vara övergångsmatrisen för kedjan X n. Visa att P är en övergångsmatris, rita upp Markovkedjan och klassificera alla tillstånd. Bestäm alla stationära fördelningar och finn den asymptotiska fördelningen om denna existerar. Lösning: Eftersom alla rader summerar till ett och alla element ligger i [0, ] så är P en stokastisk matris, och därmed en övergångsmatris för en Markovkedja. Vilken? Vi ritar en figur: / / 0 /4 /4 Vi undersöker nu vilka tillstånd som är beständiga. Först ut är E 0 : f 00 = f (n 00 = + 0 + 4 + 0 + 4 4 + 0 + 4 4 4 + n= = + ( k = 8 4 + 8 4 =. k=0 Eftersom termer i en geometrisk serie avtar så snabbt, så följer det även att E(T 0 = n= nf (n 00 <. Tillståndet E 0 är alltså positivt beständigt. Vi fortsätter med E : f = f (n = 0 + 4 + 4 + 4 + 4 + n= = 4 + ( k = 4 + 8 =. k= På samma sätt som ovan så avtar termerna i den geometriska serien så snabbt att E(T = n= nf (n <. Tillståndet E är alltså positivt beständigt. Det visar sig att f blir numeriskt likadan (betrakta figuren ovan så även detta tillstånd är positivt beständigt. Alltså samma för alla tillstånd. Är denna kedja irreducibel? 7

För att hitta alla stationära tillstånd löser vi ekvationssystemet π = πp, dvs + π = π 4 0 = 7 + π 4 = π π = π + π + π = π = 7 π = 7 Eftersom till exempel P har hela kolonn ett skild från noll så vet vi att en asymptotisk fördelning existerar, och denna måste vara den stationära fördelningen ovan (eftersom det bara finns en. Låt X n vara en oändlig Markovkedja med tillstånden E 0, E, E,... och övergångssannolikheterna p i0 = för i och p (i+ i,i+ = för i 0. Övriga p (i+ ij = 0. Avgör om E 0 är beständigt. Lösning: 4 0 4 4 Vi ser att f ( 00 = 0 och att för n, f (n 00 = n k = n k n k= = n (n! n! n! n! n k= (k (k + k k = n n n = n(n. = (n 4 n n n n För att räkna ut f 00 delar vi upp f (n 00 i partialbråk och utnyttjar att summan blir en teleskopsumma: f 00 = n= = lim k f (n 00 = n(n = =. n= ( k Tillståndet E 0 blir alltså obeständigt! n= ( n = n lim k 8 k n= ( n n

Låt X n vara den oändliga Markovkedjan med följande tillståndsdiagram: 0 a a a Om a k = 6 k π för k =,,,..., klassificera tillståndet E 0. Vi ser att f (n 00 = a n om n och att f ( 00 = 0. Vi undersöker om E 0 är beständigt: n= f (n 00 = a n = 6 π n= n= n = enligt välkänd matematisk formel. Tillståndet är alltså beständigt. Vidare, n= nf (n 00 = 6 π n= n 6 ˆ dx =. π x Alltså är E 0 noll-beständigt! Vad hade hänt om a k = 90 k 4 π? Man kan visa att 4 n= nollbeständigt? Faktiskt så blir det inte så eftersom n 4 = π4 90, så E 0 är beständigt. Blir det n= ˆ n dx <. (x + Om a k = Ck α för lämplig konstant C > 0, vart går gränsen på α för att E 0 skall vara positivt beständig? 9