1.1 Diskret (Sannolikhets-)fördelning

Relevanta dokument
1.1 Diskret (Sannolikhets-)fördelning

1 Föreläsning IV; Stokastisk variabel

4 Diskret stokastisk variabel

Kap 3: Diskreta fördelningar

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

SF1901 Sannolikhetsteori och statistik I

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Våra vanligaste fördelningar

SF1901: Sannolikhetslära och statistik

4.1 Grundläggande sannolikhetslära

Jörgen Säve-Söderbergh

Veckoblad 3. Kapitel 3 i Matematisk statistik, Dahlbom, U.

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Övning 1 Sannolikhetsteorins grunder

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

1 Föreläsning I, Mängdlära och elementär sannolikhetsteori,

4.2.1 Binomialfördelning

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

Statistik 1 för biologer, logopeder och psykologer

SF1901: Sannolikhetslära och statistik

Stokastiska Processer F2 Föreläsning 1: Repetition från grundkursen

Lektionsanteckningar 11-12: Normalfördelningen

SF1901 Sannolikhetsteori och statistik I

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Grundläggande matematisk statistik

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

4. Stokastiska variabler

1 Föreläsning V; Kontinuerlig förd.

Grundläggande matematisk statistik

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Föreläsning G70 Statistik A

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

7. NÅGRA SPECIELLA DISKRETA SANNOLIKHETSFÖRDELNINGAR

Matematisk statistik - Slumpens matematik

FÖRELÄSNING 3:

7. NÅGRA SPECIELLA DISKRETA SANNOLIKHETSFÖRDELNINGAR

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Föreläsning 12: Repetition

MVE051/MSG Föreläsning 7

Tentamen LMA 200 Matematisk statistik,

Exempel för diskreta och kontinuerliga stokastiska variabler

Tentamen i Matematisk statistik Kurskod S0001M

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

TMS136. Föreläsning 4

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

SF1901 Sannolikhetsteori och statistik I

Introduktion till statistik för statsvetare

Oberoende stokastiska variabler

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

modell Finansiell statistik, vt-05 Modeller F5 Diskreta variabler beskriva/analysera data Kursens mål verktyg strukturera omvärlden formellt

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Betingning och LOTS/LOTV

Matematisk statistik, LMA 200, för DAI och EI den 25 aug 2011

Tentamen i Dataanalys och statistik för I den 28 okt 2015

Tentamen LMA 200 Matematisk statistik,

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

TMS136. Föreläsning 7

Lösningsförslag till Tillämpad matematisk statistik LMA521, Tentamen

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning 5, FMSF45 Summor och väntevärden

Matematisk statistik för D, I, Π och Fysiker

Laboration med Minitab

Övning 1. Vad du ska kunna efter denna övning. Problem, nivå A

Kap 2. Sannolikhetsteorins grunder

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

Föreläsning 2, FMSF45 Slumpvariabel

Föreläsning 5, Matematisk statistik Π + E

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Hur måttsätta osäkerheter?

Några extra övningsuppgifter i Statistisk teori

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Problemdel 1: Uppgift 1

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

FACIT: Tentamen L9MA30, LGMA30

SOS HT Slumpvariabler Diskreta slumpvariabler Binomialfördelning. Sannolikhetsfunktion. Slumpförsök.

1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt , 2.5

Fö relä sning 1, Kö system vä ren 2014

Matematisk statistik för B, K, N, BME och Kemister

1. Du slår en tärning två gånger. Låt A vara händelsen att det första kastet blir en sexa och låt B vara händelsen att summan av kasten blir sju.

Konvergens och Kontinuitet

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Formel- och tabellsamling i matematisk statistik

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

TAMS79: Föreläsning 6. Normalfördelning

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Mer om slumpvariabler

Transkript:

Föreläsning III. Diskret (Sannolikhets-)fördelning Med diskret menas i matematik, att något antar ett ändligt antal värden eller uppräkneligt oändligt med värden e.vis {, 2, 3,...}. Med fördelning menas ur sannolikheterna fördelas mellan olika utfall... Likformig fördelning E 3. I eempel. har vi sannolikheterna för alla utfalll, 2, 3, 4, 5, (poäng vid ett tärningskast). Man talar då om en likformig fördelning, alla utfall har samma sannolikhet. Vi inför nu en stokastisk variabel, ξ, (läses i ). För att förskorta ned teten/förklaringen av en tp av utfall används en sådan variabel. Låt ξ =antal poäng vid ett kast med en tärning. Händelsen A =antal poäng 4 kan då skrivas A = {ξ 4} med motsvarande sannolikhet P (ξ 4) = 4 = 2 3. Vi går ett steg till och inför en frekvens- eller sannolikhetsfunktion f() := P (ξ = ). Det följer att f() =, =, 2, 3, 4, 5,. Vi sätter f() = 0 för övriga (heltals)värden på. Vi kan dessutom rita = f() tillsamman med fördelningsfunktionen F () := P (ξ ). Frekvensfunktion Fördelningsfunktion Man skriver att ξ Likf() ξ tillhör klassen av likformig fördelningar med parameter. E 3.2 I eempel.2 har vi summann av två tärningskast poäng. Låt η ( eta ) vara summans poäng. Det är klart att η antar värdena 2, 3,..., 2 med olika sannolikheter. Vi har att, med P (η = ) =: f(), frekvensfunktionen för η. P (η = 2) = f(2) = 3, P (η = 3) = f(3) = 2 3 etc. P.s.s. kan man låta η, betda summan av tre tärningskasts poäng och rita motsvarande frekvensfunktion.

8 7 3 8 Frekvensfunktion för summan av två tärningskast. Frekvensfunktion för summan av tre tärningskast. 0. 4 24 Frekvensfunktion för summan av fra tärningskast. Det är tpiskt för en fördelningsfunktion, att den är väande mot : Mer eakt lim f() =. I eempel.2 är fördelning inte likformig, eftersom på utfallsrummet Ω = {2, 3, 4,..., 2} är sannolikheterna olika...2 Binomialfördelning E 3.3 (E 2.2) Vid fiske med kastspö är sannolikheten att få napp (fiskfångst) p vid varje kast. Karin kastar n gånger. Vad där sannolikheten att hon får eakt napp (fiskar)? Antag att händelsen varje kast är oberoende. Sökt sannolikhet P (A), där A är händelsen att få napp eat gånger av när ( ) n P (A) = p ( p) n, = 0,, 2,... n. Med ξ =antal fångade fiskar vid n kast kan vi skriva ( ) n P (ξ = ) = f() = p ( p) n, = 0,, 2,... n. Man säger att ξ är binomialfördelad med parametrar n och p. Detta skrivs kort ξ Bin(n, p). 2

Binomialfördelning föreligger då man gör n obeoende försök med samma sannolikhet p för lckat utfall vid varje försök. Binomialfördelning handlar om dragning med återläggning och utan hänsn till inbördes ordning. 0.4 0 4 Μ 0.8 Frekvensfunktionens graf där P (ξ = ) = f() = ( 4 ) p ( p) 4 och ξ Bin (4, 0.2), d.v.s. p = 0.2. Väntevärdet E(ξ) = µ = n p = 4 0.2 = 0.8 är utsatt...3 Hpergeometrisk fördelning E 3.4 Vid en kvalitetskontroll av N = 000 ckelramar, räknar man att det är fel/defekt på r := 50 ramar. Man gör kontrollen genom att välja ut och kontrollera n = 30 ramar. Vad är sannolikheten att eakt 2 ramar av dessa utvalda är defekta? Vi får en relativ felfrekvens på p := r = 5%. Den tolkar vi som sannolikheten N att en slumpvist val ram är defekt. Vi kan inför den stokastisk variabel ξ =antal defekta ramar bland de n valda. Vi söker alltså sannolikheten P (ξ = 2) =: f(2). P (ξ = 2) = g ( 50 ) ( m = 2 000 50 ) 30 2 ) 0.2 = 2%. ( 000 30 Denna stokastiska variabel ξ är Hpergeometrisk fördelad med parametrar N, n och p (eller r). Detta skrivs ξ Hp(N, n, p). Hpergeometrisk fördelning handar om dragning utan återläggning och utan hänsn till inbördes ordning av de n slumpmässigt valda av N. Frekvensfunktionen i eemplet ovan är ( 50 ) ( 000 50 ) 30 P (ξ = ) = f() := ). ( 000 30 Förutom dessa tre fördelningar finns ett antal andra, några fler som går att förklara och några som inte kan förklaras lätt. 3

..4 Geometrisk fördelning E 3.5 För fiskaren kan frågan vara: Vad är sannolikheten att jag får napp f.f.g. vid kast (nummer)? Vi antar att fiskelckan är oberoende kast för kast. V låter η =antal kast tills fiskaren får napp f.f.g. Antag att det sker vid kast nr. Vi får sannolikheten och frekvensfunktionen till P (η = ) = f() = ( p) p. Fördelningen kallas geometrisk fördelning. η Geo(p). p p p p p E 3. För fiskaren kan frågan vara: Vad är sannolikheten att jag får napp f.a.g. (för andra gången) vid kast (nummer)? Vi antar att fiskelckan, som ovan, är oberoende kast för kast. V låter η 2 =antal kast tills fiskaren får napp f.f.g. Antag att det sker vid kast nr. Det betder att napp erhåll f.f.g. vid något av de första ( kasten. ) Det sker alltså på ett av de första kasten. Vi kan skriva =. Vi får sannolikheten och frekvensfunktionen till P (η 2 = ) = f() = ( p) 2 p. Fördelningen kallas negativ bimomialfördelning med parametrar och p. η 2 Neg(, p). -p -p p -p p - I figuren inträffar det första lckade kastet (d.v.s. napp) vid det tredje kastet. Övning: Hur ser frekvensfunktionen för att få det n :e lckade kastet vid kast nummer? E 3.7 För de anförda fördelningarna måste gälla att summan över alla sannolikheter =. P (ξ = ) =. alla utfall Binomialfördelning: ξ Bin(n, p): n ( ) n p ( p) n = (p + ( p)) n =. =0 Geometrisk fördelning: η Geo(p): ( p) p = p ( p) =. = 4

..5 Indikatorvariabel E 3.8 I ett spel går det ut på att få flest poäng. Det går till så att två eller fler kastar tärning. Man får poäng för tärningspoängen eller 4 och noll poäng för övriga tärningspoäng (2,3,5,). Vi inför händelsen/mängden A = {, 4} och således A c = {2, 3, 5, }. Som stokastisk variabel inför vi en indikatorvariabel, som I = I A. Den skall vara sådan att den antar värdet, om utfallet hamnar i A och 0, om utfallet hamnar i A c. P (I = ) = p = 3 P (I = 0) = ( p) = 2 3 () Definition En speciell stokastisk variabel är indikatorvariabeln I = I A. Denna variabel antar bara två värden: I = eller 0 med sannolikheten p för värdet, d.v.s. P (I = ) = p och således måste P (I = 0) = p. Man kan se indikatorvariabeln som en variabel som beskriver lckat () med sannolikheten p och misslckat (0) med sannolikheten p... Summor av indikatorvariabler Låt I, I 2,..., I n vara n oberonde likafördelade indikatorvariabler. Vi skall beskriva fördelningen ξ = n k= Den kan anta alla heltalsvärden mellan 0 och n. Vad är sannolikheten att ξ = k för ett k = 0,, 2, 3,..., n? Det betder att k stcken antar värdet och övriga n k antar värdet 0. En sådan sekvens har sannolikheten I k. P (I = I 2 = 0.. I n = ) Med precis k ettor och n k nollor. P.g.a. oberoende och att vi har snitt (och) får vi p ( p)... p = p k ( p) n k ( ) n för en sekvens med k ettor. Det finns sådana sekvenser (med k ettor). k Sannolikheten P (ξ = k) är alltså ( n P (ξ = k) = k ) p k ( p) n k, k = 0,, 2,..., n (2) 5

d.v.s. ξ är binomialfördelad med parametrar (n, p). Vi verifierar att totala sannolikheten är : n ( ) n p k ( p) n k = (p + ( p)) n = n =. k k=0..7 Poissonfördelning Tpiska händelser som brukar vara Poissonfördelade är antal utfall som inträffar slumpmässigt i tiden under ett givet tidsintervall med en viss intensitet, λ =antal/tidsenhet. E 3.9 Låt den stokastisk variabeln ξ var antal inkommande telefonsamtal som inkommer till en väel under ett 2 minuter långt tidsintervall. Det är en fördelning som oftast kan betraktas som en Poissonfördelning. Definition 2 Om ξ Po(λ) betder, per definition, att P (ξ = ) = e λ λ, = 0,, 2,... (3)! E 3.0 Låt den stokastisk variabeln ξ vara antal inkommande telefonsamtal till Chalmers väel (tel.nr 772 000) med λ = 3 (=antal inkommande samtal under ett tvåminuters intervall)och att ξ är Poissonfördelad. (a) Beräkna sannolikheten att det kommer in eakt ett samtal under ett tvåminutersintervall. (b) Beräkna sannolikheten att det kommer in minst två samtal under ett tvåminutersintervall. (a) Sannolikheten att det kommer in eakt ett samtal på en tvåminutersperiod är P (ξ = ) = e 3 3! = 0.49. (b) Sannolikheten att det kommer in minst två samtal på en tvåminutersperiod är P (ξ 2) = e 3 3!. För att undvika beräkna summan, beräknar vi sannolikheten genom att betrakta komplementhändelsen. ( ) 3 P (ξ 2) = P (ξ ) = e 3 0 0! + 3 = 0.80! =2

..8 Väntevärde Väntevärdet för en fördelning är ett lägesmått, dess tngdpunkt på aeln. E 3. Vilket medelvärde/genomsnitt får man när man kastar en tärning n gånger? Vi får antingen utfallet, 2, 3, 4, 5 eller med sannolikheten för varje utfall f() =. Väntevärdet av kast med en tärning är medelvärdet + 2 + 3 + 4 + 5 + = 3.5 Vi kan se = P (ξ = ) för =, 2, 3, 4, 5, och skriva medelvärdet som P (ξ = ). = Medelvärdet, kallas i sannolikhetseorin väntevärde eller eller förväntat värde och definieras som nedan för en stokastisk variabel, ξ. Detta motsvarar medelvärde för ett observerat stickprov. E(ξ) := Ω P (ξ = ) = µ. (4) Med beteckningen P (ξ = ) = f(), en frekvensfunktion kan väntevärdet skrivas E(ξ) = Ω f() = µ. (5) E 3.2 För de presenterade fördelningarna ger vi nu deras väntevärden. Fördelning Likf (N) Bin (n, p) Hp (N, n, p) Geo (p) Po (λ) Väntevärde N + 2 n p n p p λ 7

Väntevärdet för ξ Bin (n, p) är alltså E(ξ) = n p(= µ) E 3.3 För 25 kast med en tärning fick man följande observerade värden: 4 2 2 5 3 3 5 4 4 3 5 3 3 3 2 3 3 5 2 2 4 4 5 4 5 4 2 4 3 5 5 () med frekvenser, respektive relativa frekvenser (undre raderna) 2 3 4 5 0 9 8 8 9 0.2 0.2 0.8 0. 0. 0.8 Vi ser att de relativa frekvenserna ligger nära värdet = 0...., sannolikheten för att få utfallen =, 2, 3, 4, 5,. För medelvärdet av alla 50 utfallen behövs först hela poängsumman, som är 0 + 2 + 9 3 + 8 4 + 8 5 + 9 = 75 med medelvärde = 75 50 = 3.5. Det givetvis en tillfällighet att medelvärdet är lika med väntevärdet men medelvärdet skiljer sig i allmänhet mcket från väntevärdet. I figuren på sidan 3 är väntevärdet µ = E(ξ) = 4 0.2 = 0.8 utsatt. värdet= 0.8 är alltså tngdpunktens koordinat för grafen...9 Varians och standardavvikelse Dessa mått är de två spridningsmått som används inom matematisk statistik. Begreppen används i två betdelser. Dels har vi en observerad variant, där vi använder de observerade värdena. Den observerade variansen är summan av de kvadratiska avstånden från medelvärdet. Motsvarende standardavvikelse s är roten ur variansen, d.v.s. varianen är s 2. Definition 3 Varians V (ξ) och standardavvikelse σ > 0 för en stokastisk variabel diskret fördelning med sannolikhetsfunktion f() = P (ξ = ), och väntevärde E(ξ) = µ definieras som V (ξ) = σ 2 = ( µ) 2 f(). (7) 8

Dessa två spridningsmått är mast intressanta då man jämför två, säg standardavvikelser från två liknande fördelnngar, se nästa eempel. Standardavvikelse ser lite annorlunda ut när dens skall beräkna ur observerade värden E 3.4 Det finns en form för variansen, som är lite enklare. Vi härleder den. Vi kommer ihåg att f() =, f() = µ samt ( µ) 2 = 2 2µ + µ 2. V (ξ) = 2 f() 2µ f() + µ 2 f() = = 2 f() 2µ 2 + µ 2 = 2 f() µ 2. E 3.5 (a) Beräkna väntevärde, varians och standardavvikelse för ξ Likf(). (b) En tärning med lite ovanlig form beskrivs med den stok. var. ξ och tabellen 2 3 4 5 P (ξ = ) /8 /8 /4 /4 /8 /8 Beräkna väntevärde, varians och standardavvikelse för ξ och jämför med (a). Försök ge en förklaring! Undersök om det verkligen är en sannolikhetsfördelning! (a) Väntevärde µ = ( + 2 + 3 + 4 + 5 + ) = 7 2 = 3.5. Varians V (ξ) = σ 2 = ( ) 2 7 (2 +2 2 +... 5 2 + 2 ) =... = 35 35 2 2 och σ = 2.7. (b) För denna tärning är väntevärdet E(ξ ) = µ = 8 ( + 2 + 5 + ) + 4 (3 + 4) = 7 2 D.v.s. samma väntvärde som för en vanlig tärning. Variansen är V (ξ ) = σ 2 = 8 (2 +2 2 +5 2 + 2 )+ 4 (32 +4 2 ) = 29 2 ( 7 2 ) 2 = 9 4 och σ =.5. Vi ser att båda fördelningarna har samma väntevärde men att ξ har mindre standardavvikelse än ξ (vanlig tärning). Vad beror det på? För ξ är sannolikheterna mer koncentrerade till väntevärdet, alltså en mindre spridning. 9

4 Slutligen adderar vi värdena av frekvensfunktionen: 8 + 8 + 4 + 4 + 8 + 8 =... = d.v.s. det är en sannolikhetsfördelning. 0