Matematisk statistik för D, I, Π och Fysiker Föreläsning 9 Johan Lindström 16 oktober 2018 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 1/26 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 2/26 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 3/26
Resultat 2018-10-15 17:20 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 4/26 Exempel Tiden det tar att betjäna en kund vid station A är en stokastisk variabel med väntevärde 8.06 minuter och standardavvikelse 4 minuter. Vid station B tar det i genomsnitt 5.25 minuter att betjäna en kund och standardavvikelsen är 1.75. A) Beräkna sannolikheten att det tar mer än 435 minuter att betjäna 50 kunder vid station A. B) Beräkna sannolikheten att det går snabbare att betjäna 50 kunder vid A än 80 kunder vid B. Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 5/26 Processer Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 6/26
Processer En stokastisk process {X(t), t T} är en följd av stokastiska variabler, en slumpmässig funktion av t. För ett fixt t är X(t) en stokastisk variabel. Beroende på vilka värden X(t) och t kan anta har vi (minst) följande fyra kombinationer med exempel: Tid Process Diskret Kontinuerlig Diskret (F9) (FMSF15/MASC03) Kontinuerlig Stationära stokastiska Prissättning av derivat (FMSF10/MASC04) (FMSN25/MASM24) Tidsserieanalys Finansiell statistik (FMSN45/MASM17) (FMSN60/MASM18) Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 7/26 Processer (Kap. 7.4a) En poissonprocess med intensiteten λ är en diskret s.p. med kontinuerlig tid {X(t), t 0} med följande egenskaper: 1. Antalet händelser i icke överlappande intervall är oberoende (oberoende ökningar). 2. X(t) Po (λ t) 3. X(t) X(s) Po (λ(t s)), 0 < s < t, (stationära ökningar). 4. Tiden Y mellan ökningarna är Y Exp (λ). Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 8/26 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 9/26
(Stencil 11.3) En markovkedja, {X n, n = 0, 1, 2,...}, är en diskret stokastisk process med diskret tid. De värden processen antar kallas tillstånd och betecknas E i eller bara i. En markovkedja uppfyller Markovvillkoret P (X n+1 = i n+1 X n = i n, X n 1 = i n 1,..., X 0 = i 0 ) = =P (X n+1 = i n+1 X n = i n ) dvs sannolikheten att nästa värde skall vara i n+1 beror bara på nuvarande värde. Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 10/26 (Stencil 11.3a) Sannolikheterna p ij = P (X n+1 = j X n = i) kallas övergångssannolikheter och är slh. att gå från tillstånd i till j i ett steg. Man brukar samla dem i en övergångsmatris p 11 p 12 P = p 21 p 22..... där t.ex p 21 är slh att gå från tillstånd 2 till 1. Eftersom processen alltid måste gå till något tillstånd är radsummorna i P alltid 1. Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 11/26 Symmetrisk slumpvandring 7 6 5 4 X(n) 3 2 1 0 1 2 0 20 40 60 80 100 tid, n Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 12/26
en och övergångssannolikheterna kan illustreras med en modellgraf. 0.6 0.1 0.2 0.7 0.6 0.4 0 P = 0.1 0.2 0.7 0.3 0 0.7 1 2 3 0.4 0.7 0.3 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 13/26 av högre ordning (Stencil 11.3b) Sannolikheten att gå från tillstånd i till j i exakt m steg kallas övergångssannolikheterna av ordning m: p (m) ij = P(X n+m = j X n = i) Övergångsmatris av ordning m ges av P (m) = P m. Sambandet P (m+n) = P m P n kallas Chapman-Kolmogorovs sats. Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 14/26 Exempel Vad är P (X 2 = 2 X 0 = 1) i Markovkedjan nedan? 0.6 0.1 0.2 0.7 0.6 0.4 0 P = 0.1 0.2 0.7 0.3 0 0.7 1 2 3 0.4 0.7 0.3 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 15/26
Absoluta sannolikheter (Stencil 11.3c) Sannolikheterna att kedjan är i tillstånd i vid tiden n p (n) i = P(X n = i) = p Xn (i) kan samlas i en sannolikhetsvektor (radvektor) p (n) = (p (n) 1, p(n) 2,...) Initialfördelning eller startvektor ges av p (0) Satsen om total sannolikhet och Chapman-Kolmogorovs sats ger p (1) = p (0) P p (2) = p (1) P = p (0) P (2) p (n) = p (n 1) P = p (0) P (n) Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 16/26 Beständiga Kommunicerande Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 17/26 Beständiga Kommunicerande (Stencil 11.4a) Låt Återvända till tillstånd i f ii (n) = P för första gången efter n steg Då blir sannolikheten att någon gång återvända till tillstånd i f ii = f ii (j) j=1 Om f ii = 1 sägs tillstånd i vara beständigt. Om f ii < 1 sägs tillstånd i vara obeständigt. Ett beständigt är ett tillstånd som vi någon gång återkommer till med har sannolikhet 1. Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 18/26
Beständiga Kommunicerande (Stencil 11.4a) Om p (r) ij > 0 för något r = 1, 2,... sägs tillstånd i kommunicera med tillstånd j. Om både p (r) ij > 0 och p (r) ji tillstånden tvåsidigt. > 0 så kommunicerar Om två tillstånd kommunicerar tvåsidigt är antingen båda tillstånden beständiga eller båda obeständiga. Om alla tillstånd kommunicerar tvåsidigt med varandra kallas Markovkedjan irreducibel, annars kallas den reducibel. Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 19/26 Beständiga Kommunicerande Exempel 1. I följande, vilka tillstånd är beständiga/obeständiga? 2. Är kedjorna reducibla/irreducibla? 0.5 0 0.5 0 0.3 0 0.7 P 1 = 1 0 0 P 2 = 0 0.2 0 0.8 0.7 0 0.3 0 0.75 0.25 0 0 0.8 0 0.2 0.5 0.2 0.3 0 P 3 = 0 0.2 0 0.8 0 0 1 0 0.5 0.5 0 0 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 20/26 Beständiga Kommunicerande (Stencil 11.4) Låt π = (π 1, π 2,...) vara en sannolikhetsvektor. Om p (0) = π = p (n) = π, n = 1, 2,... kallas π en stationär fördelning. Eftersom p (1) = p (0) P ges samtliga stationära fördelningar av lösningarna till ekvationssystemet π = πp under bivilkor πi = 1, 0 <π i < 1 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 21/26
Beständiga Kommunicerande Asymptotisk fördelning (Stencil 11.4) Om p (n) π för varje val av startvektor p (0) är π en asymptotisk fördelning. Om det existerar en asymptotisk fördelning så är den densamma som den enda stationära fördelningen. Sats: För en markovkedja med ändligt antal tillstånd gäller Det finns ett r > 0 så att alla element i någon kolonn i matrisen P (r) är > 0 Den asymptotiska fördelningen existerar Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 22/26 Beständiga Kommunicerande Exempel Asymptotisk fördelning 1. I följande, vad är de stationära fördelningarna? 2. Har kedjorna en asymptotisk fördelning? 0.5 0 0.5 0 0.3 0 0.7 P 1 = 1 0 0 P 2 = 0 0.2 0 0.8 0.7 0 0.3 0 0.75 0.25 0 0 0.8 0 0.2 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 23/26 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 24/26
12 038 studenters väg genom LTH (1993-2006). % 1 2 3 4 5 6 7 8 9 Ex Av?? Ut Uh 1 0.29 89.8 0.01 0.02 3.87 2.70 3.32 2 5.34 78.9 0.04 2.83 5.15 0.01 7.72 3 0.01 9.16 83.7 0.30 0.81 2.94 3.06 4 0.01 0.02 8.69 76.4 0.22 0.01 0.02 0.98 2.86 0.32 10.5 5 12.2 79.6 0.44 0.02 0.05 0.27 2.12 0.73 4.55 6 0.01 17.7 63.6 0.42 0.05 0.53 0.27 3.41 6.64 7.43 7 0.01 0.03 21.9 68.3 0.26 3.30 0.01 3.24 1.28 1.64 8 0.03 0.03 19.7 50.6 16.2 0.02 9.72 1.50 2.19 9 0.05 0.02 0.02 42.2 38.7 0.03 18.2 0.14 0.67 Ex 100 Av 100?? 0.10 0.26 0.28 0.29 0.43 0.49 0.56 0.84 1.60 1.99 1.75 90.9 0.03 0.47 Ut 0.14 1.44 5.91 14.8 23.2 5.23 0.07 4.33 43.3 1.58 Uh 0.64 1.96 3.56 2.92 9.15 4.58 5.23 1.50 1.05 0.34 5.81 13.6 0.48 49.2 1 9: Terminsregistrerad på aktuell termin. Ex: Examen, Av: Anmält avbrott,??: Försvunnit, Ut: Utlandsstudier, Uh: Studieuppehåll Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 25/26 PageRank (Brin & Page sent 1990-tal) PageRank kan ses som en model för användarbeteende. Vi antar att en slumpmässig web-användare börjar på en slumpmässig sida och klickar runt, använder aldrig back och börjar på en ny slumpmässig sida när användaren är uttråkad. Fråga: Ranka web-sidor efter betydelse? Anta att sidans betydelse ges av: 1. Antalet länkar till sidan 2. Hur viktiga sidorna som länkarna kommer från är 3. Vikta ner länkar från sidor som länkar till många sidor x k = (1 p) j länkar till k x j n j + p Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 26/26