SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Relevanta dokument
SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Jörgen Säve-Söderbergh

4 Diskret stokastisk variabel

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Kap 3: Diskreta fördelningar

SF1901 Sannolikhetsteori och statistik I

1.1 Diskret (Sannolikhets-)fördelning

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

4.1 Grundläggande sannolikhetslära

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

SF1901: Sannolikhetslära och statistik

1.1 Diskret (Sannolikhets-)fördelning

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

Statistik 1 för biologer, logopeder och psykologer

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

TMS136. Föreläsning 4

Övning 1 Sannolikhetsteorins grunder

SF1901 Sannolikhetsteori och statistik I

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

modell Finansiell statistik, vt-05 Modeller F5 Diskreta variabler beskriva/analysera data Kursens mål verktyg strukturera omvärlden formellt

Exempel för diskreta och kontinuerliga stokastiska variabler

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

SF1901 Sannolikhetsteori och statistik I

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

4.2.1 Binomialfördelning

Föreläsning 3. Sannolikhetsfördelningar

SF1901: Sannolikhetslära och statistik

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

SOS HT Slumpvariabler Diskreta slumpvariabler Binomialfördelning. Sannolikhetsfunktion. Slumpförsök.

Introduktion till statistik för statsvetare

Kap 2. Sannolikhetsteorins grunder

Grundläggande matematisk statistik

MVE051/MSG Föreläsning 7

Satsen om total sannolikhet och Bayes sats

4. Stokastiska variabler

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik

Stokastiska signaler. Mediesignaler

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

Föreläsning 6, Repetition Sannolikhetslära

Föreläsning 8, Matematisk statistik Π + E

Statistiska metoder för säkerhetsanalys

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

Våra vanligaste fördelningar

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

FACIT: Tentamen L9MA30, LGMA30

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

Väntevärde och varians

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Matematisk statistik för D, I, Π och Fysiker

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

SF1901: SANNOLIKHETSTEORI OCH FLERDIMENSIONELLA STOKASTISKA STATISTIK VARIABLER. Tatjana Pavlenko. 8 september 2017

SF1911: Statistik för bioteknik

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Grundläggande matematisk statistik

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Föreläsning 2, FMSF45 Slumpvariabel

Föreläsning 5, Matematisk statistik Π + E

Formel- och tabellsamling i matematisk statistik

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

TMS136. Föreläsning 7

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

1 Föreläsning IV; Stokastisk variabel

Avd. Matematisk statistik

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Föreläsning 2, Matematisk statistik för M

Lektionsanteckningar 11-12: Normalfördelningen

FÖRELÄSNING 3:

bli bekant med summor av stokastiska variabler.

Några extra övningsuppgifter i Statistisk teori

Föreläsning 12: Repetition

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 5, FMSF45 Summor och väntevärden

TENTAMEN I STATISTIKENS GRUNDER 1

Föreläsning G70 Statistik A

Stokastiska Processer F2 Föreläsning 1: Repetition från grundkursen

Veckoblad 3. Kapitel 3 i Matematisk statistik, Dahlbom, U.

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

Grundläggande matematisk statistik

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

SF1901: Sannolikhetslära och statistik. Mer om Approximationer

F9 SAMPLINGFÖRDELNINGAR (NCT

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

Mer om slumpvariabler

Övning 1. Vad du ska kunna efter denna övning. Problem, nivå A

Matematisk statistik för B, K, N, BME och Kemister

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik 9 hp Föreläsning 8: Binomial- och Poissonfördelning, Poissonprocess

Transkript:

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler Jörgen Säve-Söderbergh

Stokastisk variabel Singla en slant två gånger. Ω = {Kr Kr, Kr Kl, Kl Kr, Kl Kl} Antag att P (Kr) = 6 10 = 60%. Låt X = antal kronor Utfall Kr Kr Kr Kl Kl Kr Kl Kl X 2 1 1 0 X är en funktion från utfallsrummet till {0, 1, 2}. En sådan funktion kallas en stokastisk variabel. P (X = 2) = P (Kr Kr) = P (Kr) P (Kr) = 6 10 6 = 36 10 100 = 0.36

Stokastisk variabel Utfall Kr Kr Kr Kl Kl Kr Kl Kl X 2 1 1 0 P (X = 1) = P (Kr Kl) = P (Kr) P (Kl) = 6 10 4 = 24 10 100 = 0.24 P (X = 1) = P (Kl Kr) = 0.24 P (X = 0) = P (Kl Kl) = P (Kl) P (Kl) = 4 10 4 = 16 10 100 = 0.16 Utfallen av myntet i varje kast är oberoende av varandra. Det har vi utnyttjat i beräkningarna ovan. Vi har beräknat sannolikhetsfunktionen

Diskreta stokastisk variabel En stokastisk variabel är diskret om den kan anta ett ändligt eller uppräkneligt oändligt antal olika värden. Storheterna p X (x) = P (X = x) x = a 1, a 2,... där a 1, a 2,... är de (uppräkneligt många) tänkbara värdena som X kan anta, kallas sannolikhetsfunktionen. Antal kronor då vi singlar en slant två gånger. x 0 1 2 p X (x) 0.16 0.48 0.36

Fördelningsfunktion För att ange hur en stokastisk variabel varierar kan man alltid ange fördelningsfunktionen. Denition Funktionen F X (x) = P (X x), < x < kallas fördelningsfunktionen för den stokastiska variabeln X. I vårt exempel nns sannolikhet i 0, 1 och 2. I x = 1 har vi F X (1) = P (X 1) = p X (0) + p X (1) = 0.16 + 0.48 = 0.64 I x = 2 har vi F X (2) = P (X 2) = p X (0) + p X (1) + p X (2) = 0.16 + 0.48 + 0.36 = 1.00

Sannolikhets- och fördelningsfunktionen för antal kronor vid två kast med mynt

Fördelningsfunktionens egenskaper Theorem Fördelningsfunktionen F X (x) för en stokastisk variabel X uppfyller { 0 då x (1) F X (x) 1 då x + (2) F X (x) är en växande funktion av x. (3) F X (x) är kontinuerlig till höger för varje x. Theorem Om a b så gäller P (a < X b) = F X (b) F X (a).

Att beräkna sannolikheter I heltalspunkter k = 0, 1... kan fördelningsfunktionen beräknas enligt F X (k) = p X (j) j k Sannolikhetsfunktionen kan beräknas ur fördelningsfunktionen enligt { FX (0) om k = 0 p X (k) = F X (k) F X (k 1) annars

Att beräkna sannolikheter - se upp med olikheter men b P (a < X b) = p X (k) k=a+1 b P (a X b) = p X (k) k=a

Likformig fördelning Denition Om den stokastiska variabeln X har sannolikhetsfunktionen p X (k) = 1 m, k = 1, 2,..., m säges X vara likformigt fördelad över {1, 2,..., m}.

Tvåpunktsfördelning. (Specialfall:Bernoullifördelningen) Denition Om den stokastiska variabeln X antar endast två värden a och b med sannolikheterna p och q = 1 p, säges X vara tvåpunktsfördelad. Med andra ord p X (a) = p, p X (b) = 1 p. Om a = 1 och b = 0 säges X vara Bernoulli-fördelad. Bernoulli-fördelningen är modell för slumpmässiga försök som antingen (X = 1) lyckas eller misslyckas (X = 0).

För-första-gången-fördelning Denition Om den stokastiska variabeln X har sannolikhetsfunktionen p X (k) = (1 p) k 1 p, k = 1, 2,..., där, 0 < p < 1, säges X vara för-första-gången-fördelning. X ffg (p). Vi gör oberoende försök som antingen lyckas med sannolikheten p eller misslyckas (1 p). Försöken upprepas ända tills ett försök lyckas. Låt X beteckna antalet slumpmässiga försök som vi måste genomföra. Då är X för-första-gången-fördelad. Ex: Repeated throws of dice until we get a six; on the blackboard.

Binomialfördelning Denition Om den stokastiska variabeln X har sannolikhetsfunktionen ( ) n p X (k) = p k (1 p) n k, (k = 0, 1,..., n) 0 < p < 1, k säges X vara binomialfördelad. Betecknas X bin (n, p). Betrakta ett slumpmässigt försök som upprepas n gånger. Utfallen av försöken anses vara oberoende och varje försök kan antingen lyckas med sannolikheten p eller misslyckas med sannolikheten 1 p. Låt X räkna antalet lyckade försök bland de n försöken. Vad är sannolikheten att vi erhåller k lyckade försök, dvs P (X = k)? I denna situation är X bin (n, p). Ex. Number of sixes in 20 independent throws, on the blackboard.

Binomialfördelning vilken påverkan har sannolikheten för lyckat försök p? n=5 p=0.1 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0 1 2 3 4 5 k

Binomialfördelning vilken påverkan har sannolikheten för lyckat försök p? n=5 p=0.5 0.05 0.10 0.15 0.20 0.25 0.30 0 1 2 3 4 5 k

Binomialfördelning vilken påverkan har sannolikheten för lyckat försök p? n=5 p=0.9 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0 1 2 3 4 5 k

Binomialfördelning Antag att i genomsnitt var tionde bil som passerar förbi Rialaavfarten på E18 kör för fort och att olika bilar håller oberoende hastigheter (dvs vi antar t ex att det inte nns köbildningar). En polis mäter hastigheten på 15 bilar. a) Vad är sannolikheten att exakt tre bilar kör för fort? (Svar: 0.1285) b) Vad är sannolikheten att åtminstone tre bilar kör för fort? (Svar: 0.1841)

Poisson-fördelning Denition Om en s.v. X sannolikhetsfunktionen p X (k) = e µ µ k, k = 0, 1,... k! säges X vara Poisson-fördelad. Beteckning: X Po (µ). Används för att modellera sällsynta händelser. Antag att X bin (n, p) där antalet oberoende försök n är stort och sannolikheten p att lyckas i varje försök är liten. Betrakta µ = np som är lagom. Då ges antalet lyckade försök approximativt av en s.v. som är Poissonfördelad med µ = np. Detta kallas ibland små talens lag. Approximationen är rimlig om p < 0.1 och n > 10.

Använd Poisson-fördelningen för att approximera binomial-fördelningen Vad händer om vi bryter mot tumregeln ovan?... p < 0.1 och n > 10... Antag att X bin (25, 0.2) n > 10 är ok, men p = 0.2 > 0.1, sannolikheten är inte tillräckligt liten. µ = np = 25 0.2 = 5 X Po (5)

Använd Poisson-fördelningen för att approximera binomial-fördelningen Approximeringen fungerar dåligt för de lägre värdena.

Använd Poisson-fördelningen för att approximera binomial-fördelningen Hur ser det ut om vi nästan uppfyller tumregeln?... p < 0.1 och n > 10... Antag nu att X bin (50, 0.1) n > 10 är ok och p = 0.1 = 0.1, sannolikheten ligger på randen av det möjliga, enligt vår tumregel. µ = np = 50 0.1 = 5 Ännu en gång X Po (5)

Använd Poisson-fördelningen för att approximera binomial-fördelningen Detta går bättre, men inte riktigt bra. (För högt p?)

Poisson-fördelningen µ = 0.5 m=0.5 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0 1 2 3 4 k

Poisson-fördelningen µ = 1.0 m=1.0 0.0 0.1 0.2 0.3 0 1 2 3 4 5 6 k

Poisson-fördelningen µ = 2.0 m=2.0 0.00 0.05 0.10 0.15 0.20 0.25 0 2 4 6 8 k

Väntevärde och varians för diskreta stokastiska variabler Vi önskar sammanfatta informationen i fördelningen för en diskret stokastisk variabel genom några tal. Ett lägesmått ges av Denition Väntevärdet för diskreta stokastiska variabler m X = E (X ) = kp X (k) samtliga k Väntevärdet kan tolkas som tyngdpunkten för fördelningen.

Väntevärde och varians för diskreta stokastiska variabler En mera allmän formel är Theorem Låt X vara en stokastisk variabel, g (x) en reellvärd funktion och Y = g(x ). Då är E (Y ) = all k g (k) p X (k) Y = g(x ) är en stokastisk variabel.

Väntevärde och varians för diskreta stokastiska variabler Två vanliga spridningsmått är variansen och standardavvikelsen. Denition Antag att en diskret stokastisk variabel X har väntevärdet E (X ) = m. Då denieras variansen för X av ) σ 2 = E ((X m) 2 = (k m) 2 p X (k) k Standardavvikelsen D(X ) för en stokastisk variabel X är kvadratroten ur variansen, d.v.s D(X ) = V (X )