Jörgen Säve-Söderbergh

Relevanta dokument
SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

4 Diskret stokastisk variabel

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

SF1901: Sannolikhetslära och statistik

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

SF1901: Sannolikhetslära och statistik. Mer om Approximationer

Kap 2. Sannolikhetsteorins grunder

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

SOS HT Slumpvariabler Diskreta slumpvariabler Binomialfördelning. Sannolikhetsfunktion. Slumpförsök.

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

1.1 Diskret (Sannolikhets-)fördelning

4. Stokastiska variabler

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

4.1 Grundläggande sannolikhetslära

Centrala gränsvärdessatsen (CGS). Approximationer

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

Våra vanligaste fördelningar

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Föreläsning 8, Matematisk statistik Π + E

Matematisk statistik 9 hp Föreläsning 8: Binomial- och Poissonfördelning, Poissonprocess

Statistik 1 för biologer, logopeder och psykologer

SF1901: Sannolikhetslära och statistik

Kap 3: Diskreta fördelningar

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

modell Finansiell statistik, vt-05 Modeller F5 Diskreta variabler beskriva/analysera data Kursens mål verktyg strukturera omvärlden formellt

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

F9 SAMPLINGFÖRDELNINGAR (NCT

TMS136. Föreläsning 7

Föreläsning 12: Repetition

Grundläggande matematisk statistik

SF1901: Sannolikhetslära och statistik

1.1 Diskret (Sannolikhets-)fördelning

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Föreläsning G70 Statistik A

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

4.2.1 Binomialfördelning

TMS136. Föreläsning 4

Samplingfördelningar 1

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen

bli bekant med summor av stokastiska variabler.

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

1 Föreläsning IV; Stokastisk variabel

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Grundläggande matematisk statistik

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

Föreläsning 6, Repetition Sannolikhetslära

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik för B, K, N, BME och Kemister

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

Kapitel 5 Multivariata sannolikhetsfördelningar

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Matematisk statistik KTH. Formelsamling i matematisk statistik

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

Lektionsanteckningar 11-12: Normalfördelningen

Oberoende stokastiska variabler

Tentamen i matematisk statistik (92MA31, STN2) kl 08 12

Stokastiska Processer F2 Föreläsning 1: Repetition från grundkursen

Formel- och tabellsamling i matematisk statistik

Avd. Matematisk statistik

SF1901 Sannolikhetsteori och statistik I

MVE051/MSG Föreläsning 7

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik

Veckoblad 3. Kapitel 3 i Matematisk statistik, Dahlbom, U.

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Exempel för diskreta och kontinuerliga stokastiska variabler

SF1901 Sannolikhetsteori och statistik I

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Matematisk statistik, LMA 200, för DAI och EI den 25 aug 2011

Detta formelblad får användas under både KS2T och KS2D, samt ordinarie tentamen. x = 1 n. x i. with(stats): describe[mean]([3,5]); 4.

Avd. Matematisk statistik

Matematisk statistik för D, I, Π och Fysiker

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Problemdel 1: Uppgift 1

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Övning 1 Sannolikhetsteorins grunder

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

SF1901 Sannolikhetsteori och statistik I

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson,

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

SVANTE JANSON OCH SVANTE LINUSSON

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

Tentamen den 11 april 2007 i Statistik och sannolikhetslära för BI2

Matematisk statistik för D, I, Π och Fysiker

F10 Problemlösning och mer om konfidensintervall

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Kolmogorovs Axiomsystem Kolmogorovs Axiomsystem Varje händelse A tilldelas ett tal : slh att A inträar Sannolikheten måste uppfylla vissa krav: Kolmog

Transkript:

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 8 Binomial-, hypergeometrisk- och Poissonfördelning Exakta egenskaper Approximativa egenskaper Jörgen Säve-Söderbergh

Binomialfördelningen Denition Om en stokastisk variabel X har sannolikhetsfunktionen p X (k) = ( ) n p k (1 p) n k, (k = 0, 1,..., n) 0 < p < 1, k då säges X ha en binomialfördelning. Beteckning: X bin (n, p). n oberoende försök. Varje försök kan antingen lyckas eller misslyckas. Sannolikheten för lyckat försök är p. X räknar antalet lyckade försök.

Binomialfördelning användning av indikatorvariabler Variabeln X kan uppfattas som en summa av oberoende stokastiska variabler. Denition Deniera I i som { I i = 1 om försök nr i lyckas 0 om försök nr i misslyckas Dessa stokastiska variabler kallas indikatorvariabler. X = I 1 + I 2 + + I n X = I 1 + I 2 + + I n bin (n, p).

Binomialfördelning - varje term är Bernoullifördelad Varje indikator (i detta sammanhanget) följer en s.k. Bernoullifördelning I i bin (1, p). k 0 1 P (I i = k) 1 p p E (I i ) = 1 p + 0 (1 p) = p E ( ) Ii 2 = 1 2 p + 0 2 (1 p) = p Var (I i ) = E ( ) Ii 2 (E (Ii )) 2 = p p 2 = p (1 p)

Binomialfördelning väntevärde och varians X = I 1 + I 2 + + I n. E (X ) = E (I 1 + I 2 + + I n ) = E (I 1 ) + + E (I n ) = p + p + + p = np Var (X ) = Var (I 1 + I 2 + + I n ) = Var (I 1 ) + + Var (I n ) = p (1 p) + p (1 p) + + p (1 p) = np (1 p) Eftersom försöken är oberoende så är de s.v. U i oberoende, vilket betyder att samtliga kovarianser är noll. Theorem Om X bin (n, p) är E (X ) = np och Var (X ) = np (1 p).

Binomialfördelningen Additionssatsen Theorem Om X bin (n 1, p) och Y bin (n 2, p), X och Y oberoende, då är X + Y bin (n 1 + n 2, p). Betrakta en följd av oberoende försök som genomförs i två omgångar med n 1 respektive n 2 försök. Eftersom X = I 1 + I 2 + + I n (en summa av oberoende s.v.) kan vi tillämpa centrala gränsvärdessatsen. För oberoende X i med E (X i ) = µ och Var (X i ) = σ 2 uttalar CGS att n i=1 X i AsN ( nµ, σ n )

Binomialfördelningen P (a < X b) = Φ (b) Φ (a) För oberoende I i med E (I i ) = p och Var (I i ) = p (1 p) uttalar CGS att X = n I i AsN i=1 ( np, ) np (1 p). P (a < X b) = P ( a np np (1 p) < X np np (1 p) ( ) ( ) b np a np Φ Φ. np (1 p) np (1 p) ) b np np (1 p) För tillfredsställande approximation krävs np (1 p) > 10.

Binomialfördelningen varför göra halv-korrektion? P (a < X b) Φ ( ) ( ) b + 1/2 np a + 1/2 np Φ np (1 p) np (1 p)

Binomialfördelningen normalapproximation Example Singla slant ettusen gånger. Vad är sannolikheten att få er än 530 krona?

Binomialfördelningen approximation med Poissonfördelningen Låt och låt n p = µ n (µ = np) lim n ( n )p k (1 p) n k = µk k k! e µ Se boken för bevis. Approximationen fungerar väl om p 0.10 och n 10.

Binomialfördelningen approximation med Poissonfördelningen Kasta två tärningar 180 gånger. Hur stor är sannolikheten att antalet gånger man får dubbelsexa överstiger 3 men ej 8?

Hypergeometrisk fördelning idé och notation Urna med N element. Det nns endast två sorters element i urnan. Element av typ A och element som är icke A. Det (absoluta) antalet A-element är A. Antalet icke A-element är N A. A = Np p = A N (p är det relativa antalet A-element)

Hypergeometrisk fördelning idé och notation Vi ska ta ut n element ur urnan med N element. Vad är sannolikheten att det nns k stycken A element bland de n vi har tagit ut? Vi gör (nästan) binomialförsök; varje element är ju ett A-element eller icke. Vi drar elementen UTAN ÅTERLÄGGNING. Då nns det ett beroende mellan utfallen av dragningarna. Antalet A-element bland de n dragningarna kallar vi X. X är hypergeometriskt fördelad.

Hypergeometrisk fördelning denition N element i en population (urna) A = Np, p är relativa frekvensen av A-element N A = N Np = N (1 p) Denition Låt relativa frekvensen av A-element i en population av N element vara p. Om n element uttas slumpmässigt utan återläggning har antalet A-element X följande sannolikhetsfunktion p X (k) = ( Np k )( N(1 p) n k ( N n) ) k antar alla heltal som uppfyller 0 k Np, samt 0 n k N (1 p). Beteckning: X Hyp (N, n, p) (som inte nns i boken)

Hypergeometrisk fördelning om urnan innehåller oändligt många element N Approximation med binomialfördelningen lim N ( Np k )( N(1 p) n k ) ( N n) = ( ) n p k (1 p) n k k där p = A N Om vi tar ett litet antal element i förhållande till (den stora) populationen, så spelar uttagningen utan återläggning en mycket liten roll. Om n N < 0.10 kan X approximeras med en binomialfördelning.

Hypergeometrisk fördelning approximation med binomialfördelningen En person har 25 blåa slipsar och 75 slipsar i andra färger. Då han skall åka på semester väljer han slumpmässigt ut 5 slipsar som han lägger i resväskan. Vad är sannolikheten att minst två av slipsarna i resväskan är blåa?

Hypergeometrisk fördelning väntevärde och varians Theorem För en hypergeometriskt fördelad stokastisk variabel X gäller att E (X ) = np, Var (X ) = N n np (1 p) N 1 Faktorn d 2 n = N n N 1 kallas korrektionsfaktorn för ändlig population. Variansen kan skrivas Var (X ) = d 2 n np (1 p).

Hypergeometrisk fördelning approximation med normalfördelning Om variansen uppfyller Var (X ) = d 2 n np (1 p) 10. och X Hyp (N, n, p) så kan vi använda normalfördelningen P (X x) = Φ x + 1 np 2. np (1 p) N n N 1 Halvkorrektion ger bättre resultat.

Hypergeometrisk fördelning approximation med normalfördelning Hos en grossist nns 100 blåa slipsar och 300 slipsar i andra färger. En försäljare väljer på måfå ut 100 slipsar som han skall försöka sälja? Vad är sannolikheten att han får minst 20 blåa slipsar.

Poissonfördelningen Denition Om en stokastisk variabel X har en sannolikhetsfunktion enligt p X (k) = e µ µ k, k = 0, 1,... k! säges X vara Poissonfördelad. Beteckning: X Po (m).

Poissonfördelningen Theorem Om X Po (µ), så gäller att E (X ) = µ Var (X ) = µ D (X ) = µ. Bevis. E (X ) = k=0 k e µ µ k k! = me µ k=1 = me µ j=0 = k=1 µ k 1 (k 1)! µ j j! = me µ e µ = µ k e µ µ k k!

Poissonfördelningen summor av Poissonfördelade stokastiska variabler är Poissonfördelade Theorem Om X Po (µ 1 ) och Y Po (µ 2 ), där X och Y är oberoende, så är X + Y Po (µ 1 + µ 2 ). Gäller generellt för godtyckligt många variabler.

Poissonfördelningen approximation med normalfördelningen Låt X Po (µ), där µ är ett naturligt tal. Enligt additionssatsen kan vi skriva X som X = V 1 + V 2 + + V µ, där V i är oberoende och V i Po (1).... för oberoende X i som har E (X i ) och Var (X i ) = σ 2 uttalar CGS att n i=1 X i AsN ( ne (X i ), σ n )... Nu har vi µ st. variabler som antas vara oberoende. V i Po (1), i = 1,..., µ E (V i ) = 1 och Var (V i ) = 1

Poissonfördelningen approximation med normalfördelningen X = V 1 + V 2 + + V µ E (X ) = E (V 1 + + V µ ) = E (V 1 ) + + E (V µ ) = µ 1 = µ Var (X ) = Var (V 1 + + V µ ) = Var (V 1 )+ +Var (V µ ) = µ 1 = µ Alltså har summan väntevärdet µ och variansen µ. Enligt CGS X = µ V i AsN (µ, µ), i=1 när µ är tillräckligt stort... Approximationen ok om µ > 15.