Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Relevanta dokument
Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

TMS136. Föreläsning 4

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Lektionsanteckningar 11-12: Normalfördelningen

4 Diskret stokastisk variabel

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

SF1911: Statistik för bioteknik

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Kap 2. Sannolikhetsteorins grunder

Statistik 1 för biologer, logopeder och psykologer

Föreläsning G60 Statistiska metoder

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Kap 3: Diskreta fördelningar

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

MVE051/MSG Föreläsning 7

Introduktion till statistik för statsvetare

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik KTH. Formelsamling i matematisk statistik

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Våra vanligaste fördelningar

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning 3. Sannolikhetsfördelningar

Grundläggande matematisk statistik

SF1901: Sannolikhetslära och statistik

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Formel- och tabellsamling i matematisk statistik

modell Finansiell statistik, vt-05 Modeller F5 Diskreta variabler beskriva/analysera data Kursens mål verktyg strukturera omvärlden formellt

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

8. NÅGRA SPECIELLA KONTINUERLIGA SANNOLIKHETSFÖRDELNINGAR

4. Stokastiska variabler

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

SF1901: Sannolikhetslära och statistik

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen MVE301 Sannolikhet, statistik och risk

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

TMS136. Föreläsning 7

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Grundläggande matematisk statistik

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

Stokastiska signaler. Mediesignaler

Föreläsning 12: Repetition

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

Hur måttsätta osäkerheter?

F3 Introduktion Stickprov

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

ÖVNINGSUPPGIFTER KAPITEL 9

Exempel för diskreta och kontinuerliga stokastiska variabler

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

Statistiska metoder för säkerhetsanalys

Samplingfördelningar 1

Föreläsning 4, Matematisk statistik för M

Föreläsning 8 för TNIU23 Integraler och statistik

Mer om slumpvariabler

Föreläsning 5, Matematisk statistik Π + E

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik

4.1 Grundläggande sannolikhetslära

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Formler och tabeller till kursen MSG830

Föreläsning 4: Konfidensintervall (forts.)

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

Detta formelblad får användas under både KS2T och KS2D, samt ordinarie tentamen. x = 1 n. x i. with(stats): describe[mean]([3,5]); 4.

TMS136. Föreläsning 5

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Repetitionsföreläsning

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

FÖRELÄSNING 7:

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

1.1 Diskret (Sannolikhets-)fördelning

Matematisk statistik TMS064/TMS063 Tentamen

Tentamen LMA 200 Matematisk statistik,

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Tentamen MVE301 Sannolikhet, statistik och risk

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Demonstration av laboration 2, SF1901

Veckoblad 3. Kapitel 3 i Matematisk statistik, Dahlbom, U.

Tentamen MVE301 Sannolikhet, statistik och risk

SF1901: Sannolikhetslära och statistik

Kurssammanfattning MVE055

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

bli bekant med summor av stokastiska variabler.

Föreläsning 2, FMSF45 Slumpvariabel

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Tentamen MVE302 Sannolikhet och statistik

Monte Carlo-metoder. Bild från Monte Carlo

SF1901 Sannolikhetsteori och statistik I

Tentamen MVE302 Sannolikhet och statistik

Transkript:

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course, 7,5 ECTS, Autumn 2008) 1 Några speciella Sannolikhetsfördelningar Kap. 6 Diskreta Kontinuerliga Kap. 7 & 9 Sannolikhetsfördelningar Sannolikhetsfördelningar Sannolikhetsfördelningar Bernoulli Binomial Hypergeometriska Poisson Likformig Normal Standard Normal Exponential 2

Kontinuerliga Sannolikhetsfördelningar En kontinuerlig stokastisk variabel kan anta alla värden inom ett intervall på den reella talaxeln (intervallet kan ha oändlig utsträckning). tjocklek (eng. thickness) av ett föremål tid för att utföra ett uppgift temperatur längd Dessa kan anta vilket värde som helst (inom rimliga intervall) beroende på hur korrekt man vill mäta. Fördelningsfunktionen, F(x) Fördelningsfunktionen, F(x), för ett kontinuerlig stokastisk variabel X ger sannolikheten att X inte är större än x. F(x) = P(X x) Låt a och b vara två möjliga värde av X, så att a < b. Sannolikheten att X ligger mellan a och b är P(a < X < b) = F(b) F(a)

Täthetsfunktionen, f(x) Täthetsfunktionen, f(x), för ett kontinuerlig stokastisk variabel är ett funktion med följande egenskaper: 1. f(x) > 0 for alla värde av x 2. Ytan under täthetsfunktionen f(x) över alla möjliga värde av X är like med 1.0 3. Sannolikheten att X ligger mellan två värde är just ytan under kurvan av täthetsfunktionen, f(x), mellan de två värdena. 4. Fördelningsfunktionen, F(x 0 ), är ytan under täthetsfunktionen, f(x), mellan den minsta värden och x 0 : F(x = 0 0) f(x)dx xm där x m är den minsta värden av stokastiska variabeln X. x Sannolikhet som yta under f(x) Den färgade (röd) yta under kurvan ger sannolikheten att hitta ett värde på X mellan a och b (sannolikheten att den stokastiska variabeln ligger mellan a och b ) f(x) P ( a x b) = P ( a < x < b) Observera att p(x = a) = 0, P(X = b) = 0. Ytan över en punkt är lika med 0. a b x

Väntevärde och varians för kontinuerliga stokastiska variabler Väntevärde: X = E(X) = xmax xf ( x) dx xmin Varians: xmax 2 2 2 X = E[(X X) ] = (x X) xmin f ( x) dx Linjära funktioner av stokastiska variabler Låt W = a + bx, där X har väntevärde X och varians X 2, och låt a and b vara konstanter. Då gäller att: Väntevärde för W: = E(a varians för W: W + bx) = a + b X Standardavvikelsen för W: = Var(a + bx) = b 2 2 2 W X W = b X

Ett speciell fall av linjära funktioner Ett viktigt linjär funktion av X är: = X X X kallas för den Standardiserade stokastisk variabeln och har väntevärde 0 och varians 1. Likformigfördelningen Sannolikehtsfördelningar Kontinuerliga Sannolikehtsfördelningar Likformig Normal Standard Normal Exponentiell

Likformigfördelningen Likformigfördelningen är sannolikhetsfördelningen där alla möjliga värden av stokastiska variabeln har samma (lika) sannolikhet. f(x) Ytan under den likformig täthetsfunktionen är 1.0 x min x max x Likformig täthetsfunktionen f(x) = 1, b a 0 a x b annars där f(x) = värdet av täthetsfunktionen för när X = x a = minsta värdet för X b = högsta värdet för X

Likformigfördelning: egenskaper För ett stokastisk variabel X som är likformigfördelad mellan a och b (där a < b) gäller: Väntevärde a + b = E( X ) = 2 Varians 2 (b - a) = Var( X ) = 12 2 Likformigfördelning: exempel Om stokastiska variabeln X är likformigfördelad inom intervallet 2 x 6, då gäller att 1 f(x) = 6-2 =.25 for 2 x 6 f(x).25 a + b 2+ 6 = = 2 2 X = 4 2 6 x 2 2 2 X = (b - a) = 12 (6-2) = 12 1.333

Normalfördelningen Sannolikehtsfördelningar Kontinuerliga Sannolikehtsfördelningar Likformig Normal Standard Normal Exponentiell Normalfördelningen Bell Shaped Symmetrisk Medelvärde, median och typvärde är lika Läge bestäms av medelvärdet µ Spridning bestäms av standardavvikelsen σ Teoretisk kan X anta värde inom oändligt intervall: - till + f(x) µ σ Medelvärde = Median = Typvärde x

Normalfördelningen (fort.) Normalfördelningen kan användas för att approximera sannolikhetsfördelningar av andra stokastiska variabler. sannolikhetsfördelningen för stickprovsmedelvärde närmar sig normalfördelning när stickprovstorleken ökar Beräkning av sannolikheter är direkt och elegant Används för att modellera flera verkliga datamaterial för beslutunderlag inom många tillämpningsområden. Normalfördelningen (forts.) Genom att variera parametrarna µ och σ får vi olika normalfördelningar

Normalfördelningen: form f(x) Ändring av µ flyttar kurvan till höger eller vänster. σ Ändring av σ ökar eller minskar spridningen. µ x En stokastisk variabel X som är normalfördelad med medelvärde 2 2 µ och varians betecknas X ~ N(, ) Normalfördelningen: täthetsfunktionen Täthetsfunktionen för normalfördelning med 2 medelvärde och varians är: f(x) = 1 2 exp σ 1 2 x 2 där e = den matematisk konstanten (approxim. 2.71828) π = den matematisk konstanten (approxim. 3.14159) µ = populationsmedelvärdet σ = populations standardavvikelsen x = värde på den kontinuerlig stokastisk variabel, < x <

Normalfördelningen: fördelningsfunktionen (Kumulativ)fördelningsfunktionen för normalfördelning med medelvärde och 2 varians är: F(x0) = P(X x0) f(x) P(X x0 ) 0 x 0 x Normalfördelningen: att hitta sannolikheter P(a < X < b) = P(a < X < µ ) + P( µ < = P(X < b) P(X < a) = F(b) F(a) X < b) a µ b x

Att hitta sannolikheter (forts.) F(b) = P(X < b) a µ b x F(a) = P(X < a) a µ b x P(a < X < b) = F(b) F(a) a µ b x Standardiserade Normalfördelningen Varje normalfördelning med givet medelvärde och varians kan transformeras till den Standardiserade normalfördelningen,, med medelvärde 0 och varians 1. ~ N(01), f() 1 0 Transformationen av X till görs genom att subtrahera medelvärdet från X och dividera skillnaden med standardavvikelsen: X µ = σ

Standardiserade Normalfördelningen: exempel Om X är normalfördelade med medelvärde 100 och standardavvikelse 50, då motsvarar X = 200 till X 200 100 = = = 50 2.0 Detta betyder att X = 200 är två standardavvikelser över medelvärdet. X = 0 är två standardavvikelser under medelvärdet X = 150 är ett standardavvikelser över medelvärdet X = -250 är 1.5 standardavvikelser under medelvärdet Osv. Jämföra X- och -enheter 100 0 200 X 2.0 (µ = 100, σ = 50) (µ = 0, σ = 1) Observera att formen på fördelningen har inte ändrats: endast nivån (eng. scale) har ändrats. Vi kan beskriva (uttrycka) problemet i den originella enheter (X) eller i den standardiserade enheter ().

Att hitta sannolikheter f(x) a µ b µ P(a < X < b) = P < < σ σ b µ a µ = F F σ σ a µ b x a µ σ 0 b µ σ Sannolikheter som yta under kurvan f(x). Den totala ytan under kurvan är 1.0, och kurvan är symmetrisk, så att hälften är över medelvärdet och hälften under. f(x) P( < X < µ) = 0.5 P(µ < X < ) = 0.5 0.5 0.5 µ P( < X < ) = 1.0 X

Att läsa sannolikheter från standard normal tabellen (LLL, tabell A3, sid. A13) Standardiserade normal tabellen i LLL ger ytan mellan 0 och ett specificerade -värde. För ett givet -värde a, tabellen visar P(0 < < a ) (ytan under kurvan mellan 0 och a) P(0 < < a) 0 a Att läsa sannolikheter från standard normal tabellen (forts.) Exempel: P(0 < < 2.00) =.4772.4772 0 2.00

Att läsa sannolikheter från standard normal tabellen (forts.) För att hitta sannolikheter för negativa -värden, utnyttjar vi faktumet att fördelningen är symetrisk:.9772 Exempel: P( < -2.00) = P( > 2.00) = 1-0.9772 = 0.0228.0228 0 2.00.9772.0228-2.00 0 Allmän procedur för att hitta sannolikheter För att hitta P(a < X < b) när X är normalfördelad med givet medelvärde µ och standardavvikelse σ: Rita den normala kurvan i X-enheter Transformera X-värdena till -värden Använd tabellen för för att läsa sannolikheterna

Hitta sannolikheterna: exempel Anta att X är normalfördelad med medelvärde 8.0 och standardavvikelse 5.0 Vad är P(X < 8.6)? 8.0 8.6 X Hitta sannolikheter: exempel (forts.) X är normalfördelad med medelvärde 8.0 och standardavvikelse 5.0. P(X < 8.6) =? X µ 8.6 8.0 = = = 0.12 σ 5.0 µ = 8 σ = 5 µ = 0 σ = 1 8 8.6 X 0 0.12 P(X < 8.6) P( < 0) + P(0 < < 0.12) = 0.5 + P(0 < < 0.12)

Hitta sannolikheter: exempel (forts.) Standardiserade Normal Sannolikhetstabellen z P(0 < < z) P(X < 8.6) = 0.5 + P(0 < < 0.12) = 0.5 + 0.0478 = 0.5478 P(0 < < 0.12) = 0.0478.10.0398.11.0438.12.0478.13.0517 0.00 0.12 Sannolikheter i övre svansen X är normalfördelad med medelvärde 8.0 och standardavvikelse 5.0 Beräkna P(X > 8.6) 8.0 8.6 X

Sannolikheter i övre svansen P(X > 8.6) =? P(X > 8.6) = P( > 0.12) = 1.0 - P( 0.12) = 1.0-0.5478 = 0.4522 1.000 0.5478 1.0-0.5478 = 0.4522 0 0.12 0 0.12 Att hitta X-värde för givet sannolikhet 1. Hitta -värdet för den givna sannolikheten 2. Konvertera till X-enheter enligt nedan: X = µ + σ

Att hitta X-värde för givet sannolikhet Exempel: X är normalfördelad med medelvärde 8.0 och standardavvikelse 5.0 Hitta X värdet som har endast 20% av alla värden under sig (mindre än).20? 8.0? 0 X Exempel (forts.) 1. Hitta -värdet för den kände sannolikheten: Standardiserade normal sannolikhetstabellen z P(0 < < z).82.2939.83.2967 Ett -värde på -0.84 har 20% av ytan i den undre svansen..20.80.84.2995 = 0.30.85.3023? 8.0-0.84 0 X

Exempel (forts.) 2. Konvertera till X-enheter : X = µ + σ = = 8.0 + ( 0.84)5.0 3.80 20% av värdena i fördelningen med medelvärde 8.0 och standardavvikelse 5.0 är mindre än 3.80 Approximera Binomialfördelning med Normalfördelning Vi minns egenskaper av Binomialfördelning: n oberoende försök Sannolikheten för success i varje försök = P. Stokastisk variabel X: X i =1 om i:e försök är success X i = 0 om i:e försök är failure E(X) = µ = np Var(X) = σ 2 = np(1- P)

Approximera Binomialfördelning med Normalfördelning Formen på Binomialfördelningen är approximativt normal om n är stor Hur stor är stor? (n > 20) eller np(1 P) > 9 Då kan vi standardisera från Binomialfördelning till standard normalfördelning enligt = X E(X) Var(X) = X np np(1 P) Approximera Binomialfördelning med Normalfördelning Låt X vara # successes från n oberoende försök med sannolikheten för success = P i varje försök. Om np(1 - P) > 9, kan vi approximera P(a<X<b) med P(a < X < b) = P a np np(1 P) b np np(1 P)

Approximera Binomialfördelning med Normalfördelning: Exempel 40% av alla väljare stödjer valsedel A. Vad är sannolikheten att mellan 76 and 80 väljare visar stöd till valsedel A i ett stickprov av n = 200? E(X) = µ = np = 200(0.40) = 80 Var(X) = σ 2 = np(1 P) = 200(0.40)(1 0.40) = 48 ( Obs: np(1 P) = 48 > 9 ) 76 80 P(76 X 80) P < < = 200(0.4)(1 0.4) = P( 0.58 < < 0) = F(0) F( 0.58) = 0.5000 0.2810 = 0.2190 80 80 200(0.4)(1 0.4) Approximera Poissonfördelning med Normalfördelning Kan göras på liknande sätt som i approximation av Binomialfördelning med normalfördelning: Kom ihåg: E(X) = = λ Var(X) = 2 = λ = λ så att (under vissa villkor) Exempel? X - µ = X - λ = λ ~ N (0,1)

Exponentiellfördelningen Kontinuerliga Sannolikhetsfördelningar Sannolikhetsfördelningar Likformig Normal Exponentiell Exponentiellfördelningen Används för att modellera tidslängden mellan två förekomster av ett händelse (tid mellan ankomst) Exempel: Tid mellan ankomst av lastbåtar till ett kaj (hamn) Tid mellan transaktioner på ett Bankomat Tid mellan telefon till the växel

Exponentiellfördelningen Täthetsfunktionen för ett exponentiellfördelat stokastiskvariabel T (t > 0) är f(t) = e t for t > 0 där λ är genomsnittlig # förekomster (ankomst) per tidsenhet t är tidsenheter till nästa ankomst e = 2.71828 T ~ exp(λ ) Exponentiellfördelningen (forts..) Kumulativ fördelningsfunktionen (sannolikheten att T är lika eller mindre än t): F(t) = 1 e t Väntevärde: E(T) = 1 Varians: Var(T) = 1 2

Exponentiellfördelningen: Exempel Kunder anländer till ett servicestation i genomsnitt tempo på 15 kunder per timme. Vad är sannolikheten att tiden mellan två (på varandra efterföljande) kunder är mindre än 3 minuter? λ = 15 per timme 3 minuter är.05 timmar P(T <.05) = 1 e - λ t = 1 e -(15)(.05) = 0.5276 Sannolikheten är 52.76% att tiden mellan anländning av två kunder är mindre än 3 minuter. Fler kontinuerliga fördelningar (som kommer senare under kursens gång) Sannolikehts-fördelningar Kontinuerliga Sannolikehtsfördelningar Student s t-fördelning Chi-Square fördelning F-fördelning Likformig Normal Standard Normal Exponentiell