Kap 3: Diskreta fördelningar

Relevanta dokument
Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

4 Diskret stokastisk variabel

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

Veckoblad 3. Kapitel 3 i Matematisk statistik, Dahlbom, U.

1.1 Diskret (Sannolikhets-)fördelning

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

4.1 Grundläggande sannolikhetslära

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

SF1901: Sannolikhetslära och statistik

1.1 Diskret (Sannolikhets-)fördelning

Grundläggande matematisk statistik

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

1 Föreläsning IV; Stokastisk variabel

4.2.1 Binomialfördelning

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Oberoende stokastiska variabler

SOS HT Slumpvariabler Diskreta slumpvariabler Binomialfördelning. Sannolikhetsfunktion. Slumpförsök.

Lektionsanteckningar 11-12: Normalfördelningen

Statistik 1 för biologer, logopeder och psykologer

Föreläsning G70 Statistik A

SF1901: Sannolikhetslära och statistik

Tentamen LMA 200 Matematisk statistik,

Jörgen Säve-Söderbergh

Matematisk statistik, LMA 200, för DAI och EI den 25 aug 2011

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

Våra vanligaste fördelningar

FÖRELÄSNING 3:

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Föreläsning 3. Sannolikhetsfördelningar

Övning 1 Sannolikhetsteorins grunder

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

SF1901: Sannolikhetslära och statistik. Mer om Approximationer

Tentamen LMA 200 Matematisk statistik,

TMS136. Föreläsning 4

Formel- och tabellsamling i matematisk statistik

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

modell Finansiell statistik, vt-05 Modeller F5 Diskreta variabler beskriva/analysera data Kursens mål verktyg strukturera omvärlden formellt

Samplingfördelningar 1

Exempel för diskreta och kontinuerliga stokastiska variabler

Kap 2. Sannolikhetsteorins grunder

Föreläsning 6, Repetition Sannolikhetslära

F9 SAMPLINGFÖRDELNINGAR (NCT

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

Introduktion till statistik för statsvetare

4. Stokastiska variabler

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del I

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Kapitel 5 Multivariata sannolikhetsfördelningar

SF1901: Sannolikhetslära och statistik

Stokastiska Processer F2 Föreläsning 1: Repetition från grundkursen

Repetitionsföreläsning

Tentamen i Matematisk statistik Kurskod S0001M

SF1901 Sannolikhetsteori och statistik I

Centrala gränsvärdessatsen (CGS). Approximationer

Matematisk statistik KTH. Formelsamling i matematisk statistik

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

LMA522: Statistisk kvalitetsstyrning

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Mer om slumpvariabler

Lösningsförslag till Tillämpad matematisk statistik LMA521, Tentamen

Några extra övningsuppgifter i Statistisk teori

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Grundläggande matematisk statistik

LMA521: Statistisk kvalitetsstyrning

TMS136. Föreläsning 7

FÖRELÄSNING 7:

Tentamen den 11 april 2007 i Statistik och sannolikhetslära för BI2

FÖRELÄSNING 8:

Svar till gamla tentamenstal på veckobladen

MVE051/MSG Föreläsning 7

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Repetition och förberedelse. Sannolikhet och sta.s.k (1MS005)

Föreläsning G60 Statistiska metoder

LMA521: Statistisk kvalitetsstyrning

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

Detta formelblad får användas under både KS2T och KS2D, samt ordinarie tentamen. x = 1 n. x i. with(stats): describe[mean]([3,5]); 4.

Tentamen LMA 200 Matematisk statistik, data/elektro

Stokastiska signaler. Mediesignaler

Grundläggande matematisk statistik

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

Grundläggande matematisk statistik

Kurssammanfattning MVE055

Svar till gamla tentamenstal på veckobladen

Föreläsning 8, Matematisk statistik Π + E

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

LMA522: Statistisk kvalitetsstyrning

Diskreta slumpvariabler

Tentamen i Matematisk statistik Kurskod S0001M

Laboration med Minitab

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Transkript:

Kap 3: Diskreta fördelningar Sannolikhetsfördelningar Slumpvariabler Fördelningsfunktion Diskreta fördelningar Likformiga fördelningen Binomialfördelningen Hypergeometriska fördelningen Poisson fördelningen 1

Exempel 1 Möjliga Resultat 1:a 2:a 3:a Antalet krona 1 T T T 0 2 T T H 1 3 T H T 1 4 T H H 2 5 H T T 1 6 H T H 2 7 H H T 2 8 H H H 3 Antar att vi är intresserad av antalet kronor som visas vid tre kastningar av ett mynt. Antalet möjliga utfall är: 2*2*2 8 H: krona T: klave ξantal krona vid tre kastningar av ett mynt 2

Exempel 1 forts Antalet krona x Sannolikheten av Utfall p(x) 0 1/8 0.125 1 3/8 0.375 Sannolikhets Histogram for for x 2 3/8 0.375 3 1/8 0.125 Totalt 8/8 1.000 3

Exempel 2 Kasta 2 tärningar och låt: ξ summan av antal prickar vid 2 tärningskast x p(x) 2 1/36 3 2/36 4 3/36 5 4/36 6 5/36 7 6/36 8 5/36 9 4/36 10 3/36 11 2/36 12 1/36 4

Slumpvariabler s.v. En slumpvariabel (stokastisk variabel) är en numerisk beskrivning av utfallet vid ett slumpmässigt försök Diskret s.v. antar heltalsvärden Kontinuerlig s.v. som kan anta alla värden i något intervall (behandlas separat i nästa kapitel) Vi kommer att använda grekiska bokstäver (ofta ξ eller η) för att beteckna slumpvariabler och små bokstäver för att beteckna värden på slumpvariabler P(ξx)p(x) betyder alltså sannolikheten att slumpvariabeln ξ antar värdet x (observerat värde) 5

Exempel 3 Ex: I fallet med tärningskast: P(ξ1)1/6 På samma sätt gäller att P(ξ2)P(ξ3) P(ξ6)1/6 Detta kan sammanfattas med: P(ξx)1/6 Så vi säger att ξ: antalet prickar är en slumpvariabel 6

Sannolikhetsfördelningar Den modell som visar vilka värden en s.v. kan anta och sannolikheterna för dessa värden brukar kallas för variabelns sannolikhetsfördelning Sannolikhetsfördelningen p(x) för en diskret s.v. ξ definieras som p(x) P(ξx) P(ξ antar värdet x) Sannolikheten för ett utfall måste alltid vara mellan 0 och 1 Sannolikhetens summa är 1 Ex 3.2, sid 74 7

Fördelningsfunktion För en diskret stokastisk variabel ξ är fördelningsfunktionen F(x k ) P(ξ < x k ) p(x i ) Ex: Tärningskast x 1 <x 2 <x 3 < <x k <x k+1 < F(3) P(ξ < 3) P(ξ1)+P(ξ2)+P(ξ3) F(x) är en trappfunktion som växer från 0 till 1 Ex 3.5, sid 78 Sats 3 A, Ex 3.6 8

Väntevärde och varians Sannolikhetsfördelningar för olika s.v. kan skilja sig åt på många sätt. De kan t.ex. ha olika Lägesmått: väntevärde Spridningsmått: varians eller standardavvikelse 9

Väntevärde (medelvärde) Ett mått på en fördelnings läge är det förväntade värdet, eller väntevärdet. Om variabeln är diskret definieras variabelns väntevärde av ( ξ ) μ x p( x ) x p x ) + x p ( x ) +... x p ( x ) E i i + i 1 ( 1 2 2 n n Ex: x 0 1 2 3 p(x) 1/8 3/8 3/8 1/8 1 3 3 1 Väntevärdet blir: E( ξ ) xi p( xi ) 0. + 1. + 2. + 3 1, 5 8 8 8 8 Ex 3.13, sid 94 10

Varians Som mått på spridning används ofta variansen eller standardavvikelsen. Om variabeln är diskret definieras variansen av V 2 2 2 ( ξ ) σ E( ξ μ ) ( x μ ) p( x) Enkel sätt att beräkna variansen V 2 2 2 2 ( ξ ) E ( ξ ) μ x p( x) μ i i Standardavvikelsen för en stokastisk variabel definieras som σ Ex 3.15, sid 99 V ( ξ ) i i 11

Räkneregler för väntevärden och varianser Låt a och b vara konstanter och ξ och η slumpvariabler. Om η a + bξ E(a) a E(bξ) be(ξ) E(η) E(a+bξ) a+be(ξ) V(a) 0 V(bξ) b 2 V(ξ) V(η) V(a+bξ) b 2 V(ξ) 12

Likformig Fördelning Ω { 1, 2, 3,..., N } P(ξx) 1/N F(x) x/n E(ξ) x(1/n) (N+1)/2 Var(ξ) (N2-1)/12 Fördelningens parameter 13

Binomialfördelning Varje sannolikhetsproblem som innehåller följande egenskaper 1. Ett bestämt antal n försök skall utföras 2. Varje försök kan antingen lyckas eller misslyckas 3. Sannolikheten P(enskilt försök lyckas) är konstant 4. Den n försöken lyckas respektive misslyckas oberoende av varandra 14

Binomialfördelningen Om ett slumpförsök uppfyller de fyra punkterna och vi låter ξ : vara antalet lyckade försök så har slumpvariabeln ξ sannolikhetsfördelningen P( ξ x) n C x p x (1 p) n x n! x!( n x)! p x (1 p) n x för x 0,1,2,... n. där n C x n! x!( n x)! och n! n( n 1)( n 2)...(2)1och 0! 1. 15

Binomialfördelningen ξ: antalet lyckade försök eller individer med viss egenskap i stickprovet n: stickprovet p: sannolikheten att en viss händelse skall inträffa vid ett försök n och p kallas för binomialfördelningens parameter När vi vill tala om att en variabel ξ är binomialfördelad med parametrarna n och p använder vi ξ är Bin(n, p) 16

Exempel Låt ξ vara antal krona i n kast med ett mynt Sannolikheten att få krona i ett kast är p0.5 Tänkbara utfall är x0,1,..n Vilka sannolikheter är kopplade till dessa utfall? Det beskrivs av Binomialfördelningen Bin(n, p0.5) 17

Exempel Du kastar en tärning 60 gånger Vad är sannolikheten att få högst åtta ettor Låt ξ: antalet ettor vid 60 kast Att ξ är binomialfördelad följer av att 1. Det är på förhand bestämt att 60 kast skall göras, n60 2. Varje kast antingen ge en etta eller inte ge en etta 3. Sannolikheten är konstant 1/6 att få en etta 4. Att de olika försöken är oberoende är klart så länge tärningen kastas från någorlunda hög höjd 18

Exempel forts n 60 p 1/6 ξ är Bin(n60, p1/6) P(ξ 8)? P( ξ 8) 8 x 0 60 C x p x (1 p) 60 x 8 x 0 60! x!(60 x)! 1 6 5 ()() 6 6 60 x 0.312 Beräkna själv och Kolla! 19

Väntevärdet och Variansen Väntevärdet: E(ξ)np Variansen: V(ξ)np(1-p) Ex: med tärningskast 60 gånger så har vi följande väntevärde och varians E(ξ) 60.(1/6) 10 V(ξ) 60.(1/6)(1-1/6) 50/6 20

Binomial-tabeller Att beräkna sannolikheter för binomialfördelade slumpvariabler innebär ofta att långa summeringar måste utföras. Sådant går bra om en dator med lämplig programvara finns tillgänglig Om inte så är fallet brukar tabeller över binomialsannolikheter finnas att tillgå En sådan tabell finns längs bak i boken 21

Ex: Antal pojkar i en fembarnsfamilj ξ antal pojkar Anta att varje barns kön bestäms oberoende av tidigare födslar och att sannolikheten för pojke är p0.5 Då är ξ binomialfördelat Bin(n5; p0.5) 22

De olika sannolikheterna blir P(ξ5) 5 C 5 p 5 (1-p) 0 1/32 (fem pojkar) P(ξ4) 5 C 4 p 4 (1-p) 1 5/32 (fyra pojkar) P(ξ3) 5 C 3 p 3 (1-p) 2 10/32 (tre pojkar) P(ξ2) 5 C 2 p 2 (1-p) 3 10/32 (två pojkar) P(ξ1) 5 C 1 p 1 (1-p) 4 5/32 (en pojke) P(ξ0) 5 C 0 p 0 (1-p) 5 1/32 (ingen pojke) Beräkna P(ξ 1) och P(ξ 3) med hjälp av tabellen 23

Hypergeometriska fördelningen Vi har en urna med 12 kulor, varav 4 vita och 8 svarta Om dragningarna sker med återläggning är antalet vita kulor ξ: Bin(4; 1/3) Men om dragningarna inte sker med återläggning beskrivs sannolikheten med en annan fördelning den s.k Hypergeometriska 24

Hypergeometriska fördelningen Sannolikheten att få ξ2 vita kulor i fyra dragningar utan återläggning är P ( ξ 2) 4 C 12 2 8 C C 4 2 P(få 2 vita bland 4 valda) Välj 2 kulor bland de 4 vita Välj de resterande 2 bland de 8 svarta Välj 4 bland 12 25

Generell formel för Hypergeometriska fördelningen Där: ( P( ξ x) C )( N1 x N N1 n x N: populationsstorlek (8 svarta och 4 vita kulor 12) N1: element av en viss egenskap (4 vita kulor) n: stickprov (4 dragningar) x: element av en viss egenskap i stickprovet (2 vita kulor) N C n C ) Vi säger att ξ är hypergeometriskt fördelad 26

Alternativ form Ibland får man veta att andelen element med en viss egenskapen är p (4/12 i vårt exempel) Då blir N1Np och (N-N1)N(1-p) Formeluttrycket skrivs då P( ξ ( x) Np C Vi säger att ξ är Hyp(n, p, N) Ex. 3.7, sid 83 x )( N N ( 1 p) n x C n C ) 27

Väntevärdet och variansen Hypergeometriska fördelningen har följande väntevärde och varians Väntevärdet E(ξ) np Variansen V(ξ) np(1-p)((n-n)/(n-1)) 28

Approximation Ibland kan man approximera en hypergeometrisk fördelning med en binomialfördelning utan att göra alltför stort fel Allmänt gäller att om N är stort och kvoten n/n är liten Tumregel n/n< 0.10 så kan man göra följande approximation: Ex. 3.10, sid 87 ( N1C x)( N N1 N C n C n x ) x nc xp (1 p) n x 29

Exempel I en urna finns 1000 kulor av vilka 30% är vita och resten svarta Man väljer (och utan återläggning) 10 kulor ur urnan Vad är sannolikheten att man får 4 vita kulor Lösning: Då N är stort som 1000 och man bara väljer ut 10 kulor så ändras inte sammansättningen av svarta och vita kulor nämnvärt när man väljer ut en kula i taget Vi kan approximativt säga att i varje dragning finns 30% vita kulor Vi tänker oss då att vi gör 10 oberoende upprepningar, där p 0.3 i varje dragning ξ är Bin(n10, p0.30) Beräkna själv! 30

Poissonfördelningen Poissonfördelningen uppkommer när man vill studera antal gånger en speciell händelse inträffar inom en given tidsperiod Ex: om det i genomsnitt kommer 3 bilar till en korsning varje minut, hur stor är sannolikheten att det under en viss minut kommer, säg 5 bilar? Poissonfördelningen kan också användas om sannolikheten för lyckat försök är liten och (mycket) stort antal försök Ex: antalet insjuknade i ovanlig sjukdom, dödsfall pga. viss olyckshändelse etc. 31

Poissonfördelningen Så här kan vi beskriva poissonfördelningen på ett matematiskt sätt P ( ξ x) x λ e x! λ Där: µ: genomsnittliga antalet händelser under tidsintervallet x: antalet lyckade e: konstant 2,71828 Vi säger att ξ är Po(λ) 32

Väntevärdet och variansen Poissonfördelningen har följande väntevärde och varians E(ξ) np λ V(ξ) np λ E(ξ) V(ξ) λ 33

Exempel En telefonväxel som tar emot i genomsnitt 3 samtal per minut Vad är sannolikheten för 1) En minut utan samtal? Lösning: Låt ξantal samtal per minut ξ är Po(λ3) P( ξ 0) 3 0 e 0! 3 e 3 0.049787 34

Exempel forts 2) Två eller fler samtal på en minut? Lösning: P ( ξ > 1) 1 P ( ξ 1) 1 P ( ξ 0 ) P ( ξ 1) 1 3 0 e 1! 3 3 1 e 1! 3 1 0.0498 0.1494 0.8008 Poissonsannolikheter kan också beräknas med hjälp av tabeller 35

Sammanfattning Binomial: Dragning med återläggning, samma sannolikhet för lyckat utfall varje gång Hypergeometrisk: Dragning utan återläggning, olika sannolikhet varje gång Poisson: Liten sannolikhet för gynnsamt utfall och (mycket) stort antal försök Approximationer, fig. 3.7, sid 87 36