STOCKHOLMS UNIVERSITET LÖSNINGAR MATEMATISKA INSTITUTIONEN Stokastiska processer och simulering I Avd. Matematisk statistik 24 maj 2016 Lösningar Stokastiska processer och simulering I 24 maj 2016 9 14 Basdel Uppgift 1 Låt X i }= storleken på skolklasserna (oberoende och likafördelade) och N= antal skolklasser/dag (oberoende av storleken på klasserna). Totala antalet besökande elever ges av S = N i=1 X i. N Bin(n = 9, p = 2/3) så att E[N] = np = 6 och Var(N) = np(1 p) = 2. Väntevärde och varians av X i är givna direkt i uppgiften. [ N ] a) Vi har E [S N=n] = E i=1 X i N=n [X i } likafördelade ] = ne[x 1 ] och därmed E [S N] = NE[X 1 ]. = [X i } oberoende av N] = E [ n i=1 X i] = Upprepad betingning ger E[S] = E[E[S N]] = E[NE[X 1 ]] = E[N]E[X 1 ] = 6 30 = 180. ( N ) b) Vi har Var (S N=n) = Var i=1 X i N=n = [X i } oberoende av N] = Var ( n i=1 X i) = [X i } oberoende och likafördelade ] = nvar(x 1 ) och därmed Var (S N) = NVar(X 1 ). Betingade variansformeln ger Var(S) = Var(E[S N]) + E[Var(S N)] = Var(NE[X 1 ]) + E[NVar(X 1 )] = Var(N)(E[X 1 ]) 2 + E[N]Var(X 1 ) = 2 30 2 + 6 25 = 1950. Uppgift 2 a) i) Eftersom bilarnas färger är oberoende av varandra så är ankomsten av svarta bilar också en Poissonprocess med parameter λ s = 0.7λ = 1.4 bilar/minut. Tiden tills den första svarta bilen dyker upp är då Exp(λ s ). ii) Ankomsten av vita bilar är också en Poissonprocess med intensitet λ v = 0.3λ = 0.6 och den är oberoende av processen enligt vilken vita bilar anländer. Det handlar då om konkurrerande händelser med exponentialfördelad tid och vi får P(första bilen är svart) = λ s λ s+λ s = 0.7. Not: Detta kan också inses direkt då det är just 70% chans att en godtycklig bil är svart och den första bilen är också en godtycklig bil.
Stokastiska processer och simulering I, 24 maj 2016 2 iii) Givet att vi vet hur många bilar som anlänt så är dessa händelser oberoende och likformigt fördelade på det intervall under vilket vi observerat dem. Vi får därför P(4 svarta under första minuten} 3 vita under de sista 4 minutrarna}) = ( 1 5 )4 ( 4 5 )3. iv) Även om vi vet hur många svarta bilar kalle räknade till så säger detta inte något om hur många vita bilar som anlände eftersom det rör sig om två oberoende Poissonprocesser. Antalet vita bilar under t = 5 minuter blir alltså Poissonfördelat med parameter λ = λ v t = 0.6 5 = 3. v) Vi vet att det kom 7 bilar, att sannolikheten för att en bil är svart är 70% oberoende av färgen på de andra bilarna. Vi känner igen antalet svarta bilar som en Binomialfördelning med parametrar n = 7 och p = 0.7. b) i) Bilarna ( kunder ) anländer enligt en Poissonprocess med intensitet och tiden att passera krockstället ( kassan ) är exponentiell med väntevärde 20 sekunder (=1/3 minut). Detta känner vi igen som en M/M/1-kö med parametrar λ=2 och µ= 1 1/3 =3. Detta är ett exempel på en födelse-/dödsprocess. λ=2 0 1 2 μ=3 λ=2 λ=2 λ=2...... μ=3 μ=3 ii) Vi ställer enklast upp balansekvationer vid de streckade linjerna i figuren. Dvs ekvationerna får formen λp n = µp n+1 för n = 0, 1,... Vi sätter in den i uppgiften ( ) n ( ) ( ) n+1 ( ) givna lösningen P n = λ µ 1 λ µ och P n+1 = λ µ 1 λ µ i balansekvationen och ser direkt att lösningen satisfierar ekvationen. Dessutom ser vi att lösningen är en geometrisk fördelning med parameter p = 1 λ/µ och därmed vet vi att n=0 P n = 1, vilket säkerställer att lösningen är en fördelning. iii) Det är minst 1 bil som väntar på att få passera krockstället då processen befinner sig i tillstånd 2 eller högre vilket är komplementhändelsen till att att processen befinner sig i tillstånd 0 eller 1. Då har vi P( minst 1 bil väntar på att passera krockstället ) = 1 P( 0 eller 1 bilar i M/M/1-kön ) = 1 P 0 P 1 = 1 (1 λ µ ) λ µ (1 λ µ ) = ( λ µ )2 = ( 2 3 )2. i Uppgift 3 i) Vi ser att laboranten påstår att han simulerat fram en övergång från tillstånd 4 till tillstånd 2 (X 2 och X 3 ), men enligt koden så går man alltid till tillstånd 3 från tillstånd 4 så något har blivit fel och rapporten kan inte godkännas.
Stokastiska processer och simulering I, 24 maj 2016 3 ii) P = 0 1/5 0 1/5 3/5 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 1 iii) Det finns två klasser. Den första klassen består av tillstånd 1, 2, 3, 4} och är transient med period 2. Den andra klassen består av det absorberande tillståndet 5}. (För godkänt svar krävs också kortfattad motivering.) iv) Låt P (m) ij = P(X n+m =j X n =i). Notera att n inte behövs tack vare tidshomogeniteten. Om vi placerar elementen P (m) ij i matrisform så kan vi beräkna dessa som P (m) = P m, dvs genom att upphöja övergångsmatrisen till m. Vi ska nu beräkna P (X 9 =j X 7 =2) för alla j S. Vi söker alltså rad 2 i matrisen P 2. Denna rad blir 0, 1/5, 0, 1/5, 3/5} (för j = 1, 2, 3, 4, 5}). v) Det finns en transient klass och ett absorberande tillstånd. När m går mot oändligheten så kommer sannolikheten för att processen befinner sig i det absorberande tillståndet att gå mot 1 och sannolikheten att befinna sig i något av de transienta tillstånden att gå mot 0. Låt P j = lim m P (m) ij, j 1, 2, 3, 4, 5} vara den asymptotiska fördelningen. Vi får P 5 = 1 och övriga P j = 0. Not: Det finns alltså en gränsfördelning trots att kedjan är reducibel och den transienta klassen är periodisk! (10 p) Uppgift 4 a) Låt Z vara antalet personer som värvas av en enskild deltagare. Låt µ = E[Z]. Förgreningsprocess kan fortsätta i all evighet om µ > 1. I detta fall får vi E[Z] = 0 p 0 + 2 p 2 = 2α. Villkoret µ > 1 ger α > 1/2. För att p 0 och p 1 ska vara korrekta sannolikheter så måste dock också gälla att α 1 och därmed får vi svaret α (1/2, 1]. Vi kan beräkna sannolikheten p att spelet fortsätter i all evighet som p = 1 π 0, där π 0 är sannolikheten att förgreningsprocessen dör ut. π 0 är den minsta icke-negativa lösningen till ekvationen π 0 = k=0 πk 0 p k, eller i detta fall π 0 = (1 α) + (π 0 ) 2 α. Denna andragradsekvation har två lösningar, där den ena alltid är 1 och den andra är 1 α α π 0 = 1 då α [0, 1/2] 1 α α då α (1/2, 1]. Vi får och därmed får vi p = 0 då α [0, 1/2] 2α 1 α då α (1/2, 1]. b) För den som startar spelet blir förväntad vinst allt som denne får in från de personer han har värvat. Eftersom väntevärdet är en linjär operator kan vi betrakta varje generation för sig och behöver inte ta hänsyn till att det finns ett beroende mellan efterföljande generationer. Förväntad storlek på varje generation n är mu n. Den som startade spelet
Stokastiska processer och simulering I, 24 maj 2016 4 (generation 0) kommer att få in 1000µ från de han har värvat (generation 1). Men av det generation 2 betalar till generation 1 kommer ju också hälften att gå till generation 0. Det tillkommer därför 1000µ 2 1 2 från generation 2, 1000µ3 ( 1 2 )2 från generation 3 och så vidare. Totala vinsten blir V 0 = n=0 1000µn+1 ( 1 2 )n = 1000µ n=0 µn ( 1 2 )n = 1000 µ 1 µ, då µ < 2 2 och den blir oändlig om µ 2. Vi har ju också att µ = 2α och får 1000 2α V 0 = 1 α då α [0, 1). då α = 1 Låt V j vara förväntad vinst för en person i generation j 1 i spelet. Eftersom varje gren av spelet är oberoende så kommer varje annan person i spelet att få V 0 från de han har värvat, men får bara behålla hälften. Dessutom måste han betala 1000 kr i avgift för att få gå med i spelet. Därmed blir vinsten för var och en av de andra 1000 2α 1 V j = 1 α då α [0, 1), då α = 1 oberoende av j. Not 1: Observera att detta blir en förlust då α [0, 1/2). Not 2: Pyramidspel kan konstrueras på många olika sätt och detta är bara ett exempel. Uppgift 5 a) Simuleringen kan utföras med hjälp av inversa transformmetoden. Den går till enligt följande: 1. Vi bestämmer först fördelningsfunktionen utifrån den givna täthetsfunktionen f(x) = 2x. Vi får F (x) = x 2 då x [0, 1]. 2. Vi söker inversen F 1 (u) genom att sätta u = F (x) och lösa ut x. Vi får x = F 1 (u) = u för u [0, 1]. 3. Vi definierar nu det stokastiska talet X = F 1 (U) = U. Enligt teorin i boken så kommer X att ha den önskade fördelningen F (x). 4. Simuleringen går alltså till så att vi först simulerar fram ett likformigt fördelat tal U och sedan tar vi roten ur det. Detta är vårt svar! b) (4 p) 1. Först antar vi att vi har tillgång till två slumptal U 1 och U 2. Vi simulerar två stycken tal X 1 och X 2 enligt metoden som redovisades i uppgift (a). Eftersom Y = maxx 1, X 2 } så tar vi nu helt enkelt det största av våra två tal X 1 och X 2 vilket blir vårt simulerade värde för Y. 2. Om vi bara har tillgång till ett likformigt fördelat slumptal behöver vi göra på något annat sätt. Vi söker fördelningsfunktionen för Y. Vi har F Y (y) = P(Y y) =
Stokastiska processer och simulering I, 24 maj 2016 5 P(maxX 1, X 2 } y) = P(X 1 y, X 2 y) = [oberoende] = P(X 1 y)p(x 2 y) = y 4 för y [0, 1]. Inversa transformmetoden ger oss nu Y = (U) 1/4 och då räcker det alltså med bara ett likformigt fördelat slumptal. (6 p) Uppgift 6 Vi studerar först hur lång tid en spelomgång tar. Varje enskilt spel tar en exponentialfördelad tid oberoende av alla andra spel och med förväntad speltid 1 minut. Detta känner vi igen som en Poissonprocess med parameter λ s = 60 per timme. Spelet avbryts dock vid den första vinsten som sker med sannolikhet 0.1. Vi kan se processen som genererar vinster som en oberoende Poissonprocess med parameter λ v = 0.1 60 = 6. En sådan process har exponentialfördelad tid till första händelsen (vinst). Nu kan vi betrakta hela spelprocessen som en Markovprocess i kontinuerlig tid. Låt tillståndsrummet vara S = 0, 1, 2} där vi räknar hur många personer som just nu befinner sig i systemet. Personer anländer till systemet med intensitet λ = 6 och med hänsyn tagen till att maskinerna är oberoende och att personer som anländer då båda är upptagna går därifrån utan att spela så får vi nedanstående figur: λ=6 λ=6 0 1 2 μ 1 =6 μ 2 =2 6=12 Då tillståndrummet är ändligt och kedjan är irreducibel så existerar en gränsfördelning. Denna kan beräknas genom att lösa systemet av balansekvationer tillsammans med villkoret att alla sannolikheter ska summera till 1. Vi får ekvationssystemet 6P 0 = 6P 1 6P 1 = 12P 2, P 0 + P 1 + P 2 = 1 vilket har lösningen P 0 = 2 5 P 1 = 2 5 P 2 = 1 5 Alla som anländer då systemet är i tillstånd 0 eller 1 kommer att spela och det innebär att 4/5 av alla som anländer kommer att spela, vilket svarar mot 4 5 6 = 24 5 per timme. Vi kan räkna på detta sätt därför att vi vet att personer som anländer enligt en Poissonprocess ser tidsmedelvärden (principen kallas PASTA på engelska). Hur mycket tjänar nattklubben på varje person som spelar? Alla lämnar systemet efter att ha vunnit 100 kr. Frågan är hur mycket de har förlorat för att nå dit! Eftersom de förlorar och vinner varje enskilt spel med sannolikhet 0.1 och slutar vid vinst så kommer antalet spel att vara ffg-fördelat och förväntat antal spel blir då 1 0.1 = 10. I varje spel satsas 20 kr och förväntad insats per spelomgång blir alltså 200 kr. Skillnaden mellan satsade pengar och utbetald vinst utgör nattklubbens förtjänst och blir i detta fall 100 kr per spelomgång.
Stokastiska processer och simulering I, 24 maj 2016 6 Vi ser alltså att det i snitt spelar 24 5 personer per timme och att var och en av dem genererar en förväntad vinst på 100 kr till nattklubben. Nattklubbens förväntade vinst på de två spelmaskinerna blir alltså 24 5 100 = 480 kr per timme. (10 p) /KS