Föreläsning 3. Sannolikhetsfördelningar

Relevanta dokument
Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Föreläsning 7. Statistikens grunder.

4.1 Grundläggande sannolikhetslära

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

SF1901: Sannolikhetslära och statistik

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

TMS136. Föreläsning 4

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Statistik 1 för biologer, logopeder och psykologer

Formel- och tabellsamling i matematisk statistik

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Föreläsning 2, FMSF45 Slumpvariabel

Kap 3: Diskreta fördelningar

SF1901 Sannolikhetsteori och statistik I

Mer om slumpvariabler

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Grundläggande matematisk statistik

Exempel för diskreta och kontinuerliga stokastiska variabler

Diskreta slumpvariabler

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

4.2.1 Binomialfördelning

SF1901 Sannolikhetsteori och statistik I

Grundläggande matematisk statistik

Repetitionsföreläsning

Lektionsanteckningar 11-12: Normalfördelningen

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

4 Diskret stokastisk variabel

Kapitel 5 Multivariata sannolikhetsfördelningar

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

Kap 2. Sannolikhetsteorins grunder

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Föreläsning G60 Statistiska metoder

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

FÖRELÄSNING 4:

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Föreläsning 4, Matematisk statistik för M

SF1901: Sannolikhetslära och statistik

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Grundläggande matematisk statistik

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

DATORÖVNING 2: SIMULERING

Övning 1 Sannolikhetsteorins grunder

Statistiska metoder för säkerhetsanalys

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Matematisk statistik KTH. Formelsamling i matematisk statistik

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

SOS HT Slumpvariabler Diskreta slumpvariabler Binomialfördelning. Sannolikhetsfunktion. Slumpförsök.

Grundläggande matematisk statistik

Slumpvariabler och sannolikhetsfördelningar

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Föreläsning G70 Statistik A

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Summor av slumpvariabler

Föreläsning 2, Matematisk statistik för M

Repetition och förberedelse. Sannolikhet och sta.s.k (1MS005)

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

FÖRELÄSNING 8:

Matematisk statistik för D, I, Π och Fysiker

FÖRELÄSNING 7:

Föreläsning 6, Repetition Sannolikhetslära

Föreläsning 7: Punktskattningar

Föreläsning 8, Matematisk statistik Π + E

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

Våra vanligaste fördelningar

FÖRELÄSNING 3:

Några extra övningsuppgifter i Statistisk teori

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik 9 hp Föreläsning 8: Binomial- och Poissonfördelning, Poissonprocess

Föreläsning 7: Punktskattningar

SF1901: Sannolikhetslära och statistik

Jörgen Säve-Söderbergh

SF1901: Sannolikhetslära och statistik

Introduktion till statistik för statsvetare

F3 Introduktion Stickprov

Tentamen i Tillämpad Matematik och statistik för IT-forensik. Del 2: Statistik 7.5 hp

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen

1.1 Diskret (Sannolikhets-)fördelning

SF1901: Sannolikhetslära och statistik. Mer om Approximationer

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

1 Stokastiska processer. 2 Poissonprocessen

F10 Problemlösning och mer om konfidensintervall

Föreläsning 5, Matematisk statistik Π + E

SF1901: Sannolikhetslära och statistik

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

SF1901: SANNOLIKHETSTEORI OCH FLERDIMENSIONELLA STOKASTISKA STATISTIK VARIABLER. Tatjana Pavlenko. 8 september 2017

Kurssammanfattning MVE055

Transkript:

Föreläsning 3. Sannolikhetsfördelningar Jesper Rydén Matematiska institutionen, Uppsala universitet jesper.ryden@math.uu.se 1MS008, 1MS777 vt 2016

Slumpvariabel? Resultatet av ett slumpmässigt försök utgörs av ett enda tal. Definition. En slumpvariabel är en funktion definierad på ett utfallsrum. Alltså: till varje utfall relateras ett tal. Till varje utfall finns ordnat en sannolikhet (som tidigare). Slumpvariabler betecknas vanligen med versaler i slutet av alfabetet: X, Y, S, T, U etc.

Två typer av slumpvariabler DISKRET. Lämplig modell för slumpförsök av typen hur många.... Viktiga exempel: Binomial, Poisson. KONTINUERLIG. Lämplig modell för slumpmässiga fenomen som anses variera kontinuerligt (längd, tid, kraft... ). Viktiga exempel: normalfördelning, exponentialfördelning.

Exempel på användning DISKRET fördelning. Inför en slumpvariabel X = Antalet studenter som klarar en viss tenta. Av intresse att beräkna, exempelvis P(Y 50), P(Y = 63). KONTINUERLIG fördelning. Inför en slumpvariabel Y = Kraften som krävs för att knäcka ett objekt. Av intresse att beräkna, t.ex. P(Y > 10), P(2.5 < Y < 5). Vitalt att känna till för att kunna beräkna sannolikheterna ovan: Hur tilldelas sannolikheter, med andra ord, vilken är fördelningen av sannolikheter, eller sannolikhetsfördelningen i en situation?

Diskreta slumpvariabler

Diskret fördelning: exempel Situation. Vid en industri tillverkas varje dag 3 motorer, färdiga för leverans. Innan leverans sker kontroll, och om fel hittas går enheten tillbaka för justering. Slumpvariabel. Av intresse för kvalitet: antalet felaktiga motorer. Vi inför X = Antalet felaktiga motorer vid en veckas produktion. Möjliga värden på X, dvs. utfallsrummet: S = {0, 1, 2, 3}. Fördelning. Från tidigare analyser vet man att P(X = 0) = 0.65, P(X = 1) = 0.20, P(X = 2) = 0.10, P(X = 3) = 0.05.

Sannolikhetsfördelningen Sannolikhetsfördelningen ges alltså av sannolikhetsfunktionen p(x) enligt 0.65, x = 0, 0.20, x = 1, p(x) = P(X = x) = 0.10, x = 2, 0.05, x = 3. Detta kan även visualiseras. Notera att x p(x) = 1. 0.6 0.5 0.4 0.3 0.2 0.1 0 0 1 2 3

Beräkning av sannolikheter Med hjälp av sannolikhetsfunktionen kan sannolikheter av intresse beräknas, exempelvis (a) Sannolikheten för exakt två felaktiga, P(X = 2). (b) Sannolikheten för minst två felaktiga, P(X 2). (c) Sannolikheten för minst en felaktig, P(X 1). Räkningar på tavlan.

AKTIVERING! En slumpvariabel X har fördelning enligt sannolikhetsfunktionen nedan. Beräkna P(X 3), P(3 < X 4). Bildkälla: sodahead.com p(x) 0.0 0.2 0.4 0.6 0.8 1.0 0 1 2 3 4 5 x

Två vanliga diskreta fördelningar Vi studerar nu närmare två vanligt förekommande diskreta fördelningar: Binomialfördelningen Poissonfördelningen

Binomialsannolikheter Bakgrund. Utför n oberoende upprepningar av ett slumpmässigt delförsök. Sannolikhet. Låt A vara en händelse som inträffar i delförsöket med sannolikhet p. Sannolikheten att A inträffar exakt x gånger (utav n): ( ) n P(A) = p x (1 p) n x x där och x! = x(x 1) 1. ( ) n = x n! x!(n x)! Härledning med hjälp av kombinatorik.

Binomialfördelningen Sannolikhetsfunktionen för en binomialfördelad slumpvariabel X ges av ( ) n p(x) = P(X = x) = p x (1 p) n x, x = 0, 1, 2,..., n x Beteckning: X Bin(n, p). Här är n och p så kallade parametrar.

Exempel. Ex. 1. Antag att X Bin(2, 0.1). Då gäller ( ) 2 P(X = 0) = p(0) = 0.1 0 0.9 2 = 1 1 0.81 = 0.81, 0 ( ) 2 P(X = 1) = p(1) = 0.1 1 0.9 1 = 2 0.1 0.9 = 0.18 1 och P(X 1) = P(X = 0) + P(X = 1) = 0.81 + 0.18 = 0.99. Ex. 2. En bonde sår 10 frön vilka gror oberoende av varandra. Sannolikheten för varje enskilt frö att gro upp till en planta uppges vara 0.95. Beräkna sannolikheten att minst nio frön gror upp. Räkningar på tavlan.

Fyrisån svämmar över! År 1900 innebar stora vårflöden. Figuren visar situationen vid Skolgatan i april, 1900. Bildkälla: www.smhi.se

AKTIVERING! Sannolikheten för översvämning under en månad uppges vara 0.05. Översvämningar anses vara statistiskt oberoende, månader emellan. Vi studerar nu slumpvariabeln Y = Antalet månader med översvämning under ett år. Bildkälla: sodahead.com (a) Ange fördelningen för Y. (b) Beräkna sannolikheten för minst en översvämning under ett år. (c) Utifrån svenska förhållanden, är antagandet om oberoende rimligt? Varför (inte)?

Poissonfördelningen Sannolikhetsfunktionen för en Poissonfördelad slumpvariabel X med parameter m > 0 ges av Beteckning: p(x) = e m mx, x = 0, 1, 2,... x! X Po(m) Här finns en parameter, nämligen m. Användningsområde: situationer där man räknar sällsynta händelser.

Små talens lag Det finns ett samband mellan binomial- och Poissonfördelningen, giltigt under premisserna nedan. Antag att ett försök utförs n oberoende gånger. Sannolikheten p att lyckas i varje försök är liten. Antalet lyckade försök X, fördelning: X Bin(n, p). Approximativt: X Po(n p) Rimlig approximation (tumregel): p < 0.1, n > 10

Exempel Antalet värmeböljor i Uppsala under ett år anses följa en Poissonfördelning med parameter m = 1.2. Beräkna sannolikheten att det under ett år inträffar minst 2 värmeböljor. Bildkälla: nyttigt.eu

Kommentar I en forskningsrapport registrerades antalet årliga värmeböljor under perioden 1840-2012. Fördelningen, baserat på data över heltalen 0, 1,..., 5, kan ses i stolpdiagrammet till vänster.

Kontinuerliga slumpvariabler

Kontinuerliga slumpvariabler Sannolikheter fördelas på ett intervall I med gränser n och u som kan vara oändliga. Viktigt hjälpmedel är här täthetsfunktionen f X (x). Sannolikheter beräknas som integraler: P(a < X b) = b a f X (x) dx. Det gäller att I f X (x) dx = u n f X (x) dx = 1. Täthetsfunktionen är alltid positiv.

Exempel Slumpvariabeln X har täthetsfunktionen f (x) = 4x 3, 0 x 1. Beräkna P(0.4 < X < 0.8), P(X > 0.62). Räkningar på tavlan.

Exempel på fördelningar Vi studerar nu närmare några vanligt förekommande kontinuerliga fördelningar: Likformig fördelning Exponentialfördelning Normalfördelning

Likformig fördelning Alternativt namn: rektangelfördelning. Täthetsfunktionen ges av f X (x) = 1 b a, a x b. Kodbeteckning: X Re(a, b), där a och b är parametrar.

AKTIVERING! En slumpvariabel Y är fördelad enligt Y Re( 0.5, 0.5), se täthetsfunktionen nedan. Beräkna sannolikheten P(Y > 0). 1 0.8 Bildkälla: sodahead.com 0.6 0.4 0.2 0 1 0.5 0 0.5 1

Exponentialfördelningen Täthetsfunktionen ges här av där a > 0 är en parameter. Kodbeteckning: X Exp(a). f X (x) = 1 a e x/a, x 0, Exponentialfördelningar modellerar ofta väntetider (ankomster, livslängder, regentlängder (!),... )

Exponentialfördelningen Täthetsfunktioner för olika parameterval (a = 0.5, a = 1, a = 2). 2 1.8 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 a=0.5 a=1 a=2 0 0 2 4 6 8 10

Bildkälla: hardwaresecrets.com Exempel Antag att väntetiden (sekunder) mellan ankommande mejl till en server beskrivs av en exponentialfördelning med parametern a = 10. Detta tolkas som att i medeltal är väntetiden 10 sekunder (nästa föreläsning). Beräkna sannolikheten att det dröjer mellan 20 och 30 sekunder mellan ankomster av mejl.

Normalfördelningen Täthetsfunktionen ges av f (x) = 1 σ /2σ2 e (x µ)2, < x < 2π Två parametrar: µ och σ. Kodbeteckning: X N(µ, σ 2 ). Parametrarna µ och σ har speciella tolkningar och kallas väntevärde resp. standardavvikelse.

Normalfördelningen: täthetsfunktioner Tre täthetsfunktioner: N(0, 0.4 2 ), N(0, 1), N(0, 2.5 2 ). 1 0.9 0.8 σ=0.4 σ=1 σ=2.5 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 6 4 2 0 2 4 6

Egenskaper hos sannolikheter Normalfördelningen har egenskapen att P(µ σ X µ + σ) P(µ 2σ X µ + 2σ) P(µ 3σ X µ + 3σ). = 0.6826,. = 0.9544,. = 0.9974. Detta gäller för alla värden på µ och σ. Beräkning av sannolikheter, integrering av tätheter som tidigare nämnts? För normalfördelningsberäkningar används tabeller eller dator. Speciellt viktigt är fallet med µ = 0 och σ = 1, den s.k. standardiserade normalfördelningen.