Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course, 7,5 ECTS, Autumn 2008) 1 Några speciella Sannolikhetsfördelningar Kap. 6 Diskreta Kontinuerliga Kap. 7 & 9 Sannolikhetsfördelningar Sannolikhetsfördelningar Sannolikhetsfördelningar Bernoulli Binomial Hypergeometriska Poisson Likformig Normal Standard Normal Exponential 2

Kontinuerliga Sannolikhetsfördelningar En kontinuerlig stokastisk variabel kan anta alla värden inom ett intervall på den reella talaxeln (intervallet kan ha oändlig utsträckning). tjocklek (eng. thickness) av ett föremål tid för att utföra ett uppgift temperatur längd Dessa kan anta vilket värde som helst (inom rimliga intervall) beroende på hur korrekt man vill mäta. Fördelningsfunktionen, F(x) Fördelningsfunktionen, F(x), för ett kontinuerlig stokastisk variabel X ger sannolikheten att X inte är större än x. F(x) = P(X x) Låt a och b vara två möjliga värde av X, så att a < b. Sannolikheten att X ligger mellan a och b är P(a < X < b) = F(b) F(a)

Täthetsfunktionen, f(x) Täthetsfunktionen, f(x), för ett kontinuerlig stokastisk variabel är ett funktion med följande egenskaper: 1. f(x) > 0 for alla värde av x 2. Ytan under täthetsfunktionen f(x) över alla möjliga värde av X är like med 1.0 3. Sannolikheten att X ligger mellan två värde är just ytan under kurvan av täthetsfunktionen, f(x), mellan de två värdena. 4. Fördelningsfunktionen, F(x 0 ), är ytan under täthetsfunktionen, f(x), mellan den minsta värden och x 0 : F(x = 0 0) f(x)dx xm där x m är den minsta värden av stokastiska variabeln X. x Sannolikhet som yta under f(x) Den färgade (röd) yta under kurvan ger sannolikheten att hitta ett värde på X mellan a och b (sannolikheten att den stokastiska variabeln ligger mellan a och b ) f(x) P ( a x b) = P ( a < x < b) Observera att p(x = a) = 0, P(X = b) = 0. Ytan över en punkt är lika med 0. a b x

Väntevärde och varians för kontinuerliga stokastiska variabler Väntevärde: X = E(X) = xmax xf ( x) dx xmin Varians: xmax 2 2 2 X = E[(X X) ] = (x X) xmin f ( x) dx Linjära funktioner av stokastiska variabler Låt W = a + bx, där X har väntevärde X och varians X 2, och låt a and b vara konstanter. Då gäller att: Väntevärde för W: = E(a varians för W: W + bx) = a + b X Standardavvikelsen för W: = Var(a + bx) = b 2 2 2 W X W = b X

Ett speciell fall av linjära funktioner Ett viktigt linjär funktion av X är: = X X X kallas för den Standardiserade stokastisk variabeln och har väntevärde 0 och varians 1. Likformigfördelningen Sannolikehtsfördelningar Kontinuerliga Sannolikehtsfördelningar Likformig Normal Standard Normal Exponentiell

Likformigfördelningen Likformigfördelningen är sannolikhetsfördelningen där alla möjliga värden av stokastiska variabeln har samma (lika) sannolikhet. f(x) Ytan under den likformig täthetsfunktionen är 1.0 x min x max x Likformig täthetsfunktionen f(x) = 1, b a 0 a x b annars där f(x) = värdet av täthetsfunktionen för när X = x a = minsta värdet för X b = högsta värdet för X

Likformigfördelning: egenskaper För ett stokastisk variabel X som är likformigfördelad mellan a och b (där a < b) gäller: Väntevärde a + b = E( X ) = 2 Varians 2 (b - a) = Var( X ) = 12 2 Likformigfördelning: exempel Om stokastiska variabeln X är likformigfördelad inom intervallet 2 x 6, då gäller att 1 f(x) = 6-2 =.25 for 2 x 6 f(x).25 a + b 2+ 6 = = 2 2 X = 4 2 6 x 2 2 2 X = (b - a) = 12 (6-2) = 12 1.333

Normalfördelningen Sannolikehtsfördelningar Kontinuerliga Sannolikehtsfördelningar Likformig Normal Standard Normal Exponentiell Normalfördelningen Bell Shaped Symmetrisk Medelvärde, median och typvärde är lika Läge bestäms av medelvärdet µ Spridning bestäms av standardavvikelsen σ Teoretisk kan X anta värde inom oändligt intervall: - till + f(x) µ σ Medelvärde = Median = Typvärde x

Normalfördelningen (fort.) Normalfördelningen kan användas för att approximera sannolikhetsfördelningar av andra stokastiska variabler. sannolikhetsfördelningen för stickprovsmedelvärde närmar sig normalfördelning när stickprovstorleken ökar Beräkning av sannolikheter är direkt och elegant Används för att modellera flera verkliga datamaterial för beslutunderlag inom många tillämpningsområden. Normalfördelningen (forts.) Genom att variera parametrarna µ och σ får vi olika normalfördelningar

Normalfördelningen: form f(x) Ändring av µ flyttar kurvan till höger eller vänster. σ Ändring av σ ökar eller minskar spridningen. µ x En stokastisk variabel X som är normalfördelad med medelvärde 2 2 µ och varians betecknas X ~ N(, ) Normalfördelningen: täthetsfunktionen Täthetsfunktionen för normalfördelning med 2 medelvärde och varians är: f(x) = 1 2 exp σ 1 2 x 2 där e = den matematisk konstanten (approxim. 2.71828) π = den matematisk konstanten (approxim. 3.14159) µ = populationsmedelvärdet σ = populations standardavvikelsen x = värde på den kontinuerlig stokastisk variabel, < x <

Normalfördelningen: fördelningsfunktionen (Kumulativ)fördelningsfunktionen för normalfördelning med medelvärde och 2 varians är: F(x0) = P(X x0) f(x) P(X x0 ) 0 x 0 x Normalfördelningen: att hitta sannolikheter P(a < X < b) = P(a < X < µ ) + P( µ < = P(X < b) P(X < a) = F(b) F(a) X < b) a µ b x

Att hitta sannolikheter (forts.) F(b) = P(X < b) a µ b x F(a) = P(X < a) a µ b x P(a < X < b) = F(b) F(a) a µ b x Standardiserade Normalfördelningen Varje normalfördelning med givet medelvärde och varians kan transformeras till den Standardiserade normalfördelningen,, med medelvärde 0 och varians 1. ~ N(01), f() 1 0 Transformationen av X till görs genom att subtrahera medelvärdet från X och dividera skillnaden med standardavvikelsen: X µ = σ

Standardiserade Normalfördelningen: exempel Om X är normalfördelade med medelvärde 100 och standardavvikelse 50, då motsvarar X = 200 till X 200 100 = = = 50 2.0 Detta betyder att X = 200 är två standardavvikelser över medelvärdet. X = 0 är två standardavvikelser under medelvärdet X = 150 är ett standardavvikelser över medelvärdet X = -250 är 1.5 standardavvikelser under medelvärdet Osv. Jämföra X- och -enheter 100 0 200 X 2.0 (µ = 100, σ = 50) (µ = 0, σ = 1) Observera att formen på fördelningen har inte ändrats: endast nivån (eng. scale) har ändrats. Vi kan beskriva (uttrycka) problemet i den originella enheter (X) eller i den standardiserade enheter ().

Att hitta sannolikheter f(x) a µ b µ P(a < X < b) = P < < σ σ b µ a µ = F F σ σ a µ b x a µ σ 0 b µ σ Sannolikheter som yta under kurvan f(x). Den totala ytan under kurvan är 1.0, och kurvan är symmetrisk, så att hälften är över medelvärdet och hälften under. f(x) P( < X < µ) = 0.5 P(µ < X < ) = 0.5 0.5 0.5 µ P( < X < ) = 1.0 X

Att läsa sannolikheter från standard normal tabellen (LLL, tabell A3, sid. A13) Standardiserade normal tabellen i LLL ger ytan mellan 0 och ett specificerade -värde. För ett givet -värde a, tabellen visar P(0 < < a ) (ytan under kurvan mellan 0 och a) P(0 < < a) 0 a Att läsa sannolikheter från standard normal tabellen (forts.) Exempel: P(0 < < 2.00) =.4772.4772 0 2.00

Att läsa sannolikheter från standard normal tabellen (forts.) För att hitta sannolikheter för negativa -värden, utnyttjar vi faktumet att fördelningen är symetrisk:.9772 Exempel: P( < -2.00) = P( > 2.00) = 1-0.9772 = 0.0228.0228 0 2.00.9772.0228-2.00 0 Allmän procedur för att hitta sannolikheter För att hitta P(a < X < b) när X är normalfördelad med givet medelvärde µ och standardavvikelse σ: Rita den normala kurvan i X-enheter Transformera X-värdena till -värden Använd tabellen för för att läsa sannolikheterna

Hitta sannolikheterna: exempel Anta att X är normalfördelad med medelvärde 8.0 och standardavvikelse 5.0 Vad är P(X < 8.6)? 8.0 8.6 X Hitta sannolikheter: exempel (forts.) X är normalfördelad med medelvärde 8.0 och standardavvikelse 5.0. P(X < 8.6) =? X µ 8.6 8.0 = = = 0.12 σ 5.0 µ = 8 σ = 5 µ = 0 σ = 1 8 8.6 X 0 0.12 P(X < 8.6) P( < 0) + P(0 < < 0.12) = 0.5 + P(0 < < 0.12)

Hitta sannolikheter: exempel (forts.) Standardiserade Normal Sannolikhetstabellen z P(0 < < z) P(X < 8.6) = 0.5 + P(0 < < 0.12) = 0.5 + 0.0478 = 0.5478 P(0 < < 0.12) = 0.0478.10.0398.11.0438.12.0478.13.0517 0.00 0.12 Sannolikheter i övre svansen X är normalfördelad med medelvärde 8.0 och standardavvikelse 5.0 Beräkna P(X > 8.6) 8.0 8.6 X

Sannolikheter i övre svansen P(X > 8.6) =? P(X > 8.6) = P( > 0.12) = 1.0 - P( 0.12) = 1.0-0.5478 = 0.4522 1.000 0.5478 1.0-0.5478 = 0.4522 0 0.12 0 0.12 Att hitta X-värde för givet sannolikhet 1. Hitta -värdet för den givna sannolikheten 2. Konvertera till X-enheter enligt nedan: X = µ + σ

Att hitta X-värde för givet sannolikhet Exempel: X är normalfördelad med medelvärde 8.0 och standardavvikelse 5.0 Hitta X värdet som har endast 20% av alla värden under sig (mindre än).20? 8.0? 0 X Exempel (forts.) 1. Hitta -värdet för den kände sannolikheten: Standardiserade normal sannolikhetstabellen z P(0 < < z).82.2939.83.2967 Ett -värde på -0.84 har 20% av ytan i den undre svansen..20.80.84.2995 = 0.30.85.3023? 8.0-0.84 0 X

Exempel (forts.) 2. Konvertera till X-enheter : X = µ + σ = = 8.0 + ( 0.84)5.0 3.80 20% av värdena i fördelningen med medelvärde 8.0 och standardavvikelse 5.0 är mindre än 3.80 Approximera Binomialfördelning med Normalfördelning Vi minns egenskaper av Binomialfördelning: n oberoende försök Sannolikheten för success i varje försök = P. Stokastisk variabel X: X i =1 om i:e försök är success X i = 0 om i:e försök är failure E(X) = µ = np Var(X) = σ 2 = np(1- P)

Approximera Binomialfördelning med Normalfördelning Formen på Binomialfördelningen är approximativt normal om n är stor Hur stor är stor? (n > 20) eller np(1 P) > 9 Då kan vi standardisera från Binomialfördelning till standard normalfördelning enligt = X E(X) Var(X) = X np np(1 P) Approximera Binomialfördelning med Normalfördelning Låt X vara # successes från n oberoende försök med sannolikheten för success = P i varje försök. Om np(1 - P) > 9, kan vi approximera P(a<X<b) med P(a < X < b) = P a np np(1 P) b np np(1 P)

Approximera Binomialfördelning med Normalfördelning: Exempel 40% av alla väljare stödjer valsedel A. Vad är sannolikheten att mellan 76 and 80 väljare visar stöd till valsedel A i ett stickprov av n = 200? E(X) = µ = np = 200(0.40) = 80 Var(X) = σ 2 = np(1 P) = 200(0.40)(1 0.40) = 48 ( Obs: np(1 P) = 48 > 9 ) 76 80 P(76 X 80) P < < = 200(0.4)(1 0.4) = P( 0.58 < < 0) = F(0) F( 0.58) = 0.5000 0.2810 = 0.2190 80 80 200(0.4)(1 0.4) Approximera Poissonfördelning med Normalfördelning Kan göras på liknande sätt som i approximation av Binomialfördelning med normalfördelning: Kom ihåg: E(X) = = λ Var(X) = 2 = λ = λ så att (under vissa villkor) Exempel? X - µ = X - λ = λ ~ N (0,1)

Exponentiellfördelningen Kontinuerliga Sannolikhetsfördelningar Sannolikhetsfördelningar Likformig Normal Exponentiell Exponentiellfördelningen Används för att modellera tidslängden mellan två förekomster av ett händelse (tid mellan ankomst) Exempel: Tid mellan ankomst av lastbåtar till ett kaj (hamn) Tid mellan transaktioner på ett Bankomat Tid mellan telefon till the växel

Exponentiellfördelningen Täthetsfunktionen för ett exponentiellfördelat stokastiskvariabel T (t > 0) är f(t) = e t for t > 0 där λ är genomsnittlig # förekomster (ankomst) per tidsenhet t är tidsenheter till nästa ankomst e = 2.71828 T ~ exp(λ ) Exponentiellfördelningen (forts..) Kumulativ fördelningsfunktionen (sannolikheten att T är lika eller mindre än t): F(t) = 1 e t Väntevärde: E(T) = 1 Varians: Var(T) = 1 2

Exponentiellfördelningen: Exempel Kunder anländer till ett servicestation i genomsnitt tempo på 15 kunder per timme. Vad är sannolikheten att tiden mellan två (på varandra efterföljande) kunder är mindre än 3 minuter? λ = 15 per timme 3 minuter är.05 timmar P(T <.05) = 1 e - λ t = 1 e -(15)(.05) = 0.5276 Sannolikheten är 52.76% att tiden mellan anländning av två kunder är mindre än 3 minuter. Fler kontinuerliga fördelningar (som kommer senare under kursens gång) Sannolikehts-fördelningar Kontinuerliga Sannolikehtsfördelningar Student s t-fördelning Chi-Square fördelning F-fördelning Likformig Normal Standard Normal Exponentiell