1.1 Diskret (Sannolikhets-)fördelning

Relevanta dokument
1.1 Diskret (Sannolikhets-)fördelning

1 Föreläsning IV; Stokastisk variabel

4 Diskret stokastisk variabel

Kap 3: Diskreta fördelningar

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Våra vanligaste fördelningar

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

4.2.1 Binomialfördelning

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik

Jörgen Säve-Söderbergh

Veckoblad 3. Kapitel 3 i Matematisk statistik, Dahlbom, U.

Stokastiska Processer F2 Föreläsning 1: Repetition från grundkursen

Övning 1 Sannolikhetsteorins grunder

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

4.1 Grundläggande sannolikhetslära

4. Stokastiska variabler

1 Föreläsning I, Mängdlära och elementär sannolikhetsteori,

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Tentamen i Dataanalys och statistik för I den 28 okt 2015

Statistik 1 för biologer, logopeder och psykologer

SF1901: Sannolikhetslära och statistik

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

SF1901 Sannolikhetsteori och statistik I

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

Föreläsning 12: Repetition

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Exempel för diskreta och kontinuerliga stokastiska variabler

Oberoende stokastiska variabler

Kap 2. Sannolikhetsteorins grunder

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

Betingning och LOTS/LOTV

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Tentamen LMA 200 Matematisk statistik,

FÖRELÄSNING 3:

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning G70 Statistik A

Föreläsning 5, FMSF45 Summor och väntevärden

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

1 Föreläsning V; Kontinuerlig förd.

Tentamen LMA 200 Matematisk statistik,

7. NÅGRA SPECIELLA DISKRETA SANNOLIKHETSFÖRDELNINGAR

Matematisk statistik, LMA 200, för DAI och EI den 25 aug 2011

SOS HT Slumpvariabler Diskreta slumpvariabler Binomialfördelning. Sannolikhetsfunktion. Slumpförsök.

Grundläggande matematisk statistik

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Föreläsning 2, FMSF45 Slumpvariabel

7. NÅGRA SPECIELLA DISKRETA SANNOLIKHETSFÖRDELNINGAR

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

TMS136. Föreläsning 4

Övning 1. Vad du ska kunna efter denna övning. Problem, nivå A

Matematisk statistik för D, I, Π och Fysiker

SF1901 Sannolikhetsteori och statistik I

Lösningsförslag till Tillämpad matematisk statistik LMA521, Tentamen

modell Finansiell statistik, vt-05 Modeller F5 Diskreta variabler beskriva/analysera data Kursens mål verktyg strukturera omvärlden formellt

FACIT: Tentamen L9MA30, LGMA30

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt , 2.5

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

Matematisk statistik - Slumpens matematik

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

Föreläsning 5, Matematisk statistik Π + E

Övningstentamen i kursen Statistik och sannolikhetslära (LMA120)

SF1901: Sannolikhetslära och statistik. Mer om Approximationer

Problemdel 1: Uppgift 1

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Tentamen i Matematisk statistik Kurskod S0001M

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Satsen om total sannolikhet och Bayes sats

TENTAMEN I MATEMATISK STATISTIK 19 nov 07

Diskreta slumpvariabler

Övning 1(a) Vad du ska kunna efter denna övning. Problem, nivå A. Redogöra för begreppen diskret och kontinuerlig stokastisk variabel.

TMS136. Föreläsning 7

Sannolikheter och kombinatorik

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Konvergens och Kontinuitet

Matematisk statistik för B, K, N, BME och Kemister

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Fördelningsfunktionen för en kontinuerlig stokastisk variabel. Täthetsfunktionen för en kontinuerlig och en diskret stokastisk variabel.

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Tentamen den 11 april 2007 i Statistik och sannolikhetslära för BI2

Kurssammanfattning MVE055

Tentamen i Matematisk statistik Kurskod S0001M

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

6. Flerdimensionella stokastiska variabler

Lektionsanteckningar 11-12: Normalfördelningen

FÖRELÄSNING 8:

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

Transkript:

Föreläsning III. Diskret (Sannolikhets-fördelning Med diskret menas i matematik, att något antar ett ändligt antal värden eller uppräkneligt oändligt med värden e.vis {, 2, 3,...}. Med fördelning menas ur sannolikheterna fördelas mellan olika utfall. E 3. I eempel. har vi sannolikhterna för alla utfalll, 2, 3, 4, 5, 6 6 (poäng vid ett tärningskast. Man talar då om en likformig fördelning, alla utfall har samma sannolikhet. Vi inför nu en stokastisk variabel, ξ, (läses i. För att förskorta ned teten/förklaringen av en tp av utfall används en sådan variabel. Låt ξ =antal poäng vid ett kast med en tärning. Händelsen A =antal poäng 4 kan då skrivas A = {ξ 4} med motsvarande sannolikhet P (ξ 4 = 4 6 = 2 3. Vi går ett steg till och inför en frekvens- eller sannolikhetsfunktion f( := P (ξ =. Det följer att f( =, =, 2, 3, 4, 5, 6. 6 Vi sätter f( = 0 för övriga (heltalsvärden på. Vi kan dessutom rita = f( tillsamman med fördelningsfunktionen F ( := P (ξ. 6 6 Frekvensfunktion Fördelningsfunktion Man skriver att ξ Likf(6. Det är tpiskt för en fördelningsfunktion, att den är väande mot : Mer eakt lim F ( =. I eempel.2 är fördelning inte likformig, eftersom på utfallsrummet Ω = {2, 3, 4,..., 2} är sannolikheterna olika. E 3.2 (E 2.2 Vid fiske med kastspö är sannolikheten att få napp (fiskfångst p vid varje kast. Karin kastar n gånger. Vad där sannolikheten att hon får eakt napp (fiskar? Antag att varje kasts utfall är oberoende.

Sökt sannolikhet P (A, där A är händelsen att få napp eat gånger av när P (A = p ( p n, = 0,, 2,... n. Med ξ =antal fångade fiskar vid n kast kan vi skriva P (ξ = = f( = p ( p n, = 0,, 2,... n. Man säger att ξ är binomialfördelad med parametrar n och p. Detta skrivs kort ξ Bin(n, p. Binomialfördelning föreligger då man gör n obeoende försök med samma sannolikhet p för lckat utfall vid varje försök. Binomialfördelning handlar om dragning med återläggning och utan hänsn till inbördes ordning. E 3.3 I eempel.2 har vi summan av två tärningskast poäng. Låt ξ vara summans poäng. Det är klart att ξ antar värdena 2, 3,..., 2 med olika sannolikheter. Vi har att, med P (ξ = =: f( P (ξ = 2 = f(2 = 2, P (ξ = 3 = f(3 = 36 36 etc. P.s.s. kan vi ta ξ, som summan av tre tärsningskasts poäng och rita den frekvensfunktionen. 6 8 7 3 8 Frekvensfunktion för summan av två tärningskast. Frekvensfunktion för summan av tre tärningskast. 0. 4 24 Frekvensfunktion för summan av fra tärningskast. 2

E 3.4 Vid en kvalitetskontroll av N = 000 ckelramar, räknar man med att det är fel/defekt på r := 50. Man gör kontrollen genom att välja ut och kontrollera n = 30 ramar. Vad är sannolikheten att eakt 2 ramar är defekta? Vi får en relativ felfrekvens på p := r = 5%. Det tolkar vi som sannolikheten N att en slumpvist val ram är defekt. Vi kan inför den stokastisk variabel ξ =antal defekta ramar bland de n utvalda. Vi söker alltså sannolikheten P (ξ = 2. P (ξ = 2 = g ( 50 m = 2 000 50 30 2 0.26 = 26%. ( 000 30 Denna stokastiska variabel ξ är Hpergeometrisk fördelad med parametrar N, n och p (eller r. Detta skrivs ξ Hp(N, n, p. Hpergeometrisk fördelning handar om dragnng utan återläggning och utan hänsn till inbördes ordning av de n valda av N. Förutom dessa tre fördelningar finns ett antal andra, några som går att förklara och några som inte kan förklaras lätt. E 3.5 För fiskaren kan frågan vara: Vad är sannolikheten att jag får napp f.f.g. vid kast (nummer? Vi ana att fickelkan är oberoende kast för kast. V låter η =antal kast tills fiskaren får napp f.f.g. Antag att det sker vid kast nr. Vi söker sannolikheten P (η = = f( = ( p p. Fördelningen kallas geometrisk fördelning. η Geo(p. E 3.6 För de anförda fördelningarna måste gälla att summan över alla sanolikheter =. P (ξ = =. alla utfall Binomialfördelning: ξ Bin(n, p: n =0 Geometrisk fördelning: η Geo(p: p ( p n = (p + ( p n =. ( p p = p ( p =. = 3

E 3.7 Fiskaren bestämmer sig att fiska till dess att två fiskar fångas. Det betder alltså napp f.a.g. (med sannolikheten för napp = p = 0.2, vid ett givet kast. Antag att antal kast är = 4, tills dess fångst fås för andra gången. Vad är sannolikheten P (η = 4? En sekvens kan då vara ( p ( p p... ( p ( p p = p 2 ( p 2. }{{} kast ( Det första nappet sker en gång av kast och alltså på = med = 4. Alltså är sannolikheten 3( 0.2 2 0.2 2 = 0.0768 8%. sätt Vad är sannolikheten att få napp för n:e gången vid kast nummer? Det är med ett utvidgat resonemang av eemplet ovan, ( P (η = n = ( p n p n ( n Man säger att η är negativt binomialfördelad med parametrar n och p. Vi kan skriva om binomialkoefficienten som ( = {( ( n = n } = n (. n E 3.8 Antal långtradare som per halvtimme som passerar Tingstadstunneln är i snitt 8.5 =: λ. Man vet att detta antal, ζ, är poissonfördelat. Det betder att ζ Po(λ och sannolikhet- eller frekvensdfunktionen är P (ζ = = f( = e λ λ, = 0,, 2,...! (a Vad är sannolikheten att det kommer eakt 8 långtradare under en halvtimme? (b P.s.s. men minst 5. (c Visa att f( =. =0 4

(a Sannolikheten att det kommer eakt 8 långtradare under en halvtimme är f(8 = e 8.5 8.5 8 = 0.37508... = 0.4. 8! (b P.s.s. men minst 5: ( P (ζ 5 = P (ζ 4 = F (4 = e 8.5 + 8.5 + 8.52 2 + 8.53 6 + 8.54 = 0.925636 0.93. 24 (c Visa att... f( = e λ =0 =0 λ! = e λ e λ =. E 3.9 Bland ett parti brädor om 000 stcken, väljs ut för kontroll. Om dessa är korrekta, godkänns hela partiet. Om fler än en är defekt kasseras partiet. Om eat en av de utvalda är defekt går kontrollen över i en andra fas. Då väljs tterligare 0 ut och partiet godkänns bara om alla dessa är korrekta. Vad är sannolikheten att partet godkänns, om det innehåller 30 defekta? En sannolikhet som erhålls är p = 30 = 0.03. Låt ξ =antal defekta bland 000 de först valda och η =antal defekta av de senare 0 valda. Sökt sannolikhet kan då skrivas P (ξ = 0 (ξ = η = 0 som kan skrivas P (ξ = 0 (ξ = η = 0 = {disjunkta} = P (ξ = 0 + P (ξ = η = 0 = P (ξ = 0 + P (η = 0 ξ = P (ξ =. De stokastiska variablerna är hpergeometriskt fördelade och vi observerar att för η är N = 980, antal defekta 29 och att vi drar 0 korrekta av 980 29 = 95 brädor. ξ Hp(000,, 0.03 och η Hp ( 980, 9, 980 29. De inblandade sannolikheterna är P (ξ = 0 = P (ξ = = P (η = 0 ξ = = ( 970 30 0, ( 000 ( 970 ( 000 ( 95 ( 980 0 9 30 och 0 29 0. 5

Sökt sannolikhet, d.v.s. sannolikhteten att partiet godkänns är alltså ( 970 30 0 + ( 000 ( 95 0 29 0 ( 980 0 ( 970 9 30 0.793 0.8. ( 000 På miniräknare brukar det finnas knappar för binomialkoefficient för permutation P (n,. och Den största binomialkoefficienten ligger innanför miniräknarens talområde och är ( 000 = 3.4 0 4..2 Varians och standardavvikelse Emedan väntevärdet µ =: E(ξ = P (ξ = är ett lägesmått, är variansen V (ξ = σ 2 (och standardavvikelsen σ ett spridningsmått. Det definieras om V (ξ = ( µ 2 P (ξ =. (2 E 3.0 Beräkna variansen och standardavvikelsen för ξ Likf(N med N = 6. Det är samma fördelning (tärningskast, som i e.. och e 3.. Vi fick Vi förenklar först (2. E(ξ = µ = 7 (= 3.5. 2 V (ξ = ( 2 2µ+µ 2 f( = 2 f( 2µ f(+µ 2 = 2 f( µ 2. I fallet med e. (och e 3. får vi V (ξ = 6 = 2 6 49 4 =... = 35 2.9 och σ.7 2 För varians för de andra fördelningar hänvisas till boken eller formelsamlingen. 6

.3 Summor av stok. variabler E 3. En diskret fördelning med stokastisk variabel η ges av P (ξ = = 0.2 P (ξ = 2 = 0.5 P (ξ = 3 = 0.3 (a Beräkna sannolikheten P (ξ 2. (b Beräkna väntevärdet E(ξ och sätt ut det på en talael, tillsammans med utfallen. (c Beräkna väntevärdet av aξ + b..3. Indikatorvariabel E 3.2 I ett spel går det ut på att få flest poäng. Det går till så att två eller fler kastar tärning. Man får poäng för tärningspoängen eller 4 och noll poäng för övriga tärningspoäng (2,3,5,6. Vi inför händelsen/mängden A = {, 4} och således A c = {2, 3, 5, 6}. Som stokastisk variabel inför vi en indikatorvariabel, som I = I A. Den skall vara sådan att den antar värdet, om utfallet hamnar i A och 0, om utfallet hamnar i A c. P (I = = p = 3 P (I = 0 = ( p = 2 3 (3 Definition En speciell stokastisk variabel är indikatorvariabeln I = I A. Denna variabel antar bara två värden: I = eller 0 med sannolikheten p för värdet, d.v.s. P (I = = p och således måste P (I = 0 = p. Man kan se indikatorvariabeln som en variabel som beskriver lckat ( med sannolikheten p och misslckat (0 med sannolikheten p..3.2 Summor av indikatorvariabler Låt I, I 2,..., I n vara n oberonde likafördelade indikatorvariabler. Vi skall beskriva fördelningen ξ = n k= Den kan anta alla heltalsvärden mellan 0 och n. Vad är sannolikheten att ξ = k för ett k = 0,, 2, 3,..., n? I k. 7

Det betder att k stcken antar värdet och övriga n k antar värdet 0. En sådan sekvens har sannolikheten P (I = I 2 = 0.. I n = Med precis k ettor och n k nollor. P.g.a. oberoende och att vi har snitt (och får vi p ( p... p = p k ( p n k för en sekvens med k ettor. Det finns sådana sekvenser (med k ettor. k Sannolikheten P (ξ = k är alltså ( n P (ξ = k = k k=0 p k ( p n k, k = 0,, 2,..., n (4 Vi verifierar att totala sannolikheten är : n p k ( p n k = (p + ( p n = n =. k.4 Approimation mellan fördelningar Betrakta en hpergeometrisk fördelning Hp(N, n, p. Om N är mcket större än n, d.v.s. om n N blir det ingen större skillnad mellan dragning utan återläggning och dragning med återläggning, alltså ingen större skillnad mellan hpergeometrisk och binomialfördelning. Då gäller approimationen (5. Man kan alltså approimera en hpergeometrisk fördelning med en binomialfördelning utan att göra alltför stort fel: ( ( Np N( p n ( N n p ( p n. (5 Tumregel: n/n < 0.. E 3.3 I eempel 3.9 har vi n/n = 30/000 = 0.03 < 0.. Vi beräknar P (ξ = med approimationen (5. p = 0.03 och n =, som ger att ( P (ξ = 0.03 0.97 9 0.336 att jämföra med 0.34, som erhålls i eempel 3.9. Nu kan hpergeoemetrisk fördelning approimeras med Poissonfördelning, om n > 0, p + n/n < 0. (6 8

E 3.4 Beräkna P (ξ = m.h.a. Poissonapproimation. n = > 0, p + n/n = 0.03 + 0.02 < 0. Alltså går Poissonapproimation bra. E(ξ = λ = n p = 0.6 = P (ξ = e 0.6 0.6! = 0.329... 0.33 9