Diskreta slumpvariabler

Relevanta dokument
Mer om slumpvariabler

Problemlösning. Måns Thulin. Uppsala universitet Statistik för ingenjörer 30/ /16

FÖRELÄSNING 3:

SF1901 Sannolikhetsteori och statistik I

4.1 Grundläggande sannolikhetslära

Föreläsning 3. Sannolikhetsfördelningar

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

DATORÖVNING 2: SIMULERING

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

4 Diskret stokastisk variabel

Summor av slumpvariabler

Statistik 1 för biologer, logopeder och psykologer

Summor av slumpvariabler

4.2.1 Binomialfördelning

Sannolikhetsteori. Måns Thulin. Uppsala universitet Statistik för ingenjörer 23/ /14

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Kap 3: Diskreta fördelningar

Grundläggande matematisk statistik

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Några extra övningsuppgifter i Statistisk teori

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

SF1901: Sannolikhetslära och statistik

F10 Problemlösning och mer om konfidensintervall

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

1. Du slår en tärning två gånger. Låt A vara händelsen att det första kastet blir en sexa och låt B vara händelsen att summan av kasten blir sju.

1.1 Diskret (Sannolikhets-)fördelning

SOS HT Slumpvariabler Diskreta slumpvariabler Binomialfördelning. Sannolikhetsfunktion. Slumpförsök.

Föreläsning G70 Statistik A

FÖRELÄSNING 4:

Kapitel 5 Multivariata sannolikhetsfördelningar

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

1.1 Diskret (Sannolikhets-)fördelning

Slumpvariabler och sannolikhetsfördelningar

Diskussionsproblem för Statistik för ingenjörer

Föreläsning 6, Repetition Sannolikhetslära

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

F9 Konfidensintervall

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik

Exempel för diskreta och kontinuerliga stokastiska variabler

Storräkneövning: Sannolikhetslära

Våra vanligaste fördelningar

Repetition och förberedelse. Sannolikhet och sta.s.k (1MS005)

Föreläsning G60 Statistiska metoder

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

F14 Repetition. Måns Thulin. Uppsala universitet Statistik för ingenjörer 6/ /15

Statistiska metoder för säkerhetsanalys

Kap 2. Sannolikhetsteorins grunder

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

Övning 1 Sannolikhetsteorins grunder

7. NÅGRA SPECIELLA DISKRETA SANNOLIKHETSFÖRDELNINGAR

4. Stokastiska variabler

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Föreläsning 7. Statistikens grunder.

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Introduktion till statistik för statsvetare

Tentamen i Matematisk statistik Kurskod S0001M

Jörgen Säve-Söderbergh

Föreläsning 2, FMSF45 Slumpvariabel

SF1901: Sannolikhetslära och statistik. Mer om Approximationer

TMS136. Föreläsning 4

FÖRELÄSNING 8:

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Veckoblad 3. Kapitel 3 i Matematisk statistik, Dahlbom, U.

Föreläsning 2, Matematisk statistik för M

Repetitionsföreläsning

Introduktion till statistik för statsvetare

Sannolikhetslära. 19 februari Vad är sannolikheten att vinna om jag köper en lott?

Lotto, ett skicklighetsspel!

1 Stokastiska processer. 2 Poissonprocessen

Kap 2: Några grundläggande begrepp

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

TAMS65 - Föreläsning 6 Hypotesprövning

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Formel- och tabellsamling i matematisk statistik

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

SF1901: Sannolikhetslära och statistik

Föreläsning 4, Matematisk statistik för M

Mer om konfidensintervall + repetition

TENTAMEN I STATISTIKENS GRUNDER 1

LMA522: Statistisk kvalitetsstyrning

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

Grundläggande matematisk statistik

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Föreläsning 7: Punktskattningar

TAMS65 - Föreläsning 6 Hypotesprövning

Grundläggande matematisk statistik

Gamla tentamensuppgifter i stokastik

Transkript:

1/20 Diskreta slumpvariabler Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 28/1 2013

2/20 Dagens föreläsning En maskin gör fel ibland! En man berättar att han har minst en dotter! En bläckfisk slår världen med häpnad! Hajar attackerar! Telefoner ringer! Preussiska soldater sparkas ihjäl av sina hästar!

3/20 Kort repetition: sannolikhetslära Låt A och B vara två händelser. P(A B) = P(både A och B inträffar) P(A B) = P(minst en av A och B inträffar) = P(A) + P(B) - P(A B) P(A ) = P(A inte inträffar) = 1 - P(A) Om A och B inte kan inträffa samtidigt så är de oförenliga: P(A B)=0. Om A och B är oberoende så är P(A B) = P(A) P(B) Oberoende och oförenliga är inte samma sak! Allmänt gäller att P(A B) = P(A) P(B A) Betingad sannolikhet: P(B A) = P(A B)/P(A)

4/20 Kort repetition: sannolikhetslära exempel Maskinen som gör fel ibland En maskin tillverkar elektroniska komponenter. Sannolikheten att en komponent är defekt beror på om den senast tillverkade komponenten var det. Om den senaste komponenten inte var defekt så är sannolikheten att nästa komponent är defekt 1/10. Givet att den förra komponenten var defekt så är sannolikheten 1/5. Man startar maskinen för dagen (nollställd). Vad är sannolikheten att den andra komponenten som tillverkas under dagen är defekt? Pappan med minst en dotter En man berättar stolt för oss att han har två barn och att minst en av dem är en dotter. Givet den informationen, vad är sannolikheten att han har två döttrar?

5/20 Diskreta slumpvariabler En slumpvariabel, ofta betecknad X, är ett tal som beskriver utfallet av ett försök vars resultat inte är givet på förhand. Exempel: Man slår en tärning. X =antalet ögon. Man undersöker 100 komponenter. X =antalet defekta komponenter. Man mäter hållfastheten för ett material. X =den uppmätta hållfastheten. Slumpvariabeln X är diskret om den bara kan anta speciella värden på den skala som används normalt bara heltalsvärden. Diskreta slumpvariabler beskriver ofta antal. Sannolikheten att X antar olika värden bestäms av dess fördelning. Fördelningen beskrivs av sannolikhetsfunktionen p(k) = P(X = k).

6/20 Likformig fördelning Låt X vara antalet ögon när man slår en vanlig balanserad tärning. Möjliga värden på X är 1, 2, 3, 4, 5 och 6 och P(X = 1) = P(X = 2) = P(X = 3) = P(X = 4) = P(X = 5) = P(X = 6) = 1 6. Sannolikhetsfunktionen p(k) = P(X = k) = 1/6 för k = 1, 2,..., 6. Allmänt gäller att om X är en slumpvariabel som kan anta värdena 1, 2,..., n och p(k) = P(X = k) = 1 n för k = 1, 2,..., n så sägs X vara likformigt (diskret) fördelad.

7/20 Bläckfisken Paul: tipsoraklet Den synska bläckfisken Paul tippade 8 rätt av 8 möjliga i fotbolls-vm 2010. Vad är sannolikheten att lyckas med det? Paul tippade även fotbolls-em 2008 och hade då 4 rätt av 6 möjliga. Totalt hade han alltså 12 rätt av 14 möjliga. Vad är sannolikheten för att ha minst 12 av 14 rätt?

Kvalitetskontroll Ett företag får en leverans av flera tusen elektroniska komponenter. De vill utföra en kvalitetskontroll och undersöker därför 50 av de mottagna komponenterna. De skickar tillbaka leveransen om minst 5 av de undersökta komponenterna är defekta. Vad är sannolikheten att de skickar tillbaka leveransen om andelen defekta komponenter i hela leveransen är 2 %? Om andelen är 10 %? 8/20

Binomialfördelning Antag att ett försök upprepas n oberoende gånger och att händelsen A vid varje tillfälle inträffar med sannolikhet p. Exempel: man singlar slant 10 gånger. A= klave. Då är n = 10 och p = 1/2. Låt X vara antalet gånger som händelsen A inträffar. Då är ( ) n p(k) = P(X = k) = p k (1 p) n k k för k = 0, 1, 2,..., n. X sägs vara binomialfördelad med parametrar n och p. Kodbeteckning: X Bin(n, p). Se tärningsexempel på tavlan! 9/20

10/20 Mer om binomialfördelningen Kafferastegenskapen: om X Bin(n, p) och Y Bin(m, p) är oberoende och Z = X + Y så är Z Bin(n + m, p). Tolkning: antag att vi utför ett försök där sannolikheten för händelsen A hela tiden är p och att vi räknar antalet gånger som A inträffar. Om vi först utför n försök och sedan tar en kaffepaus innan vi utför ytterligare m försök så är det sammanlagda antalet gånger som A inträffat fortfarande binomialfördelat.

Åter till bläckfisken Paul: tipsoraklet Den synska bläckfisken Paul tippade 8 rätt av 8 möjliga i fotbolls-vm 2010. Vad är sannolikheten att lyckas med det? Paul tippade även fotbolls-em 2008 och hade då 4 rätt av 6 möjliga. Totalt hade han alltså 12 rätt av 14 möjliga. Vad är sannolikheten för att ha minst 12 av 14 rätt? Paul avled i oktober 2010 (av naturliga orsaker). Han hade fyllt fem år i lördags. 11/20

Sällsynta händelser Antag att X Bin(n, p), att p är litet och att n är stort. Det vill säga: antag att vi räknar hur många gånger en sällsynt händelse inträffar under en förhållandevis lång tidsperiod. Man kan visa att då är P(X = k) = ( n )p k (1 p) n k (np)k e np. k k! Tumregel: approximationen är rimlig om p < 0.1 och n > 10. 12/20

13/20 Sällsynta händelser Kan följande händelser modelleras som Bin(n, p) med litet p och stort n? Antalet samtal till en telefon under ett dygn. Antalet anrop till en server under ett dygn. Antalet kunder som anländer till en butik under en minut. Antalet jordbävningar i Japan under ett år. Antalet bilolyckor i Uppland under ett år. Antalet driftstopp på ett pappersbruk under en månad. Antalet hajattacker mot människor i Florida under ett år. Antalet mål i en fotbollsmatch. Antalet soldater i den preussiska armén som sparkas ihjäl av sina hästar under ett år på 1800-talet.

14/20 Poissonfördelning För modellering av sällsynta händelser så används ofta Poissonfördelningen. Låt X vara antalet gånger som en sällsynt händelse inträffar under en tidsperiod. X sägs vara Poissonfördelad med parameter m om för k = 0, 1, 2,... Kodbeteckning: X Po(m). p(k) = P(X = k) = mk k! e m Vi kan tolka parametern m som det genomsnittliga antalet sällsynta händelser under tidsperioden. Se hajattacksexempel på tavlan!

Sprickor i betongblock Poissonfördelningen kan även användas för händelser som är utspridda i rummet istället för i tiden. Antalet sprickor per m 3 i ett betongblock (av en viss typ) är Poissonfördelat med i genomsnitt 0.1 sprickor per m 3. Hur stor är sannolikheten att ett 5 m 3 stort block innehåller som mest 2 sprickor? Se tavlan! 15/20

16/20 Poissonfördelning: Wayne Gretzky Poissonfördelningen har även använts för slumpmodellering i sportens värld. Den kanadensiska hockeyspelaren Wayne Gretzky spelade 696 NHL-matcher för Edmonton Oilers och gjorde under den perioden 1669 poäng (mål+assist): Antal poäng 0 1 2 3 4 5 6 7 8 9 Antal matcher 69 155 171 143 79 57 14 6 2 0 I genomsnitt gjorde han 1669/696 2.39 poäng per match. Låt X =antal poäng Wayne Gretzky gör på en match. Är X Po(2.39)?

Poissonfördelning: Wayne Gretzky Relativa frekvenser för poäng och sannolikheter för Po(2.39): Wayne Gretzky avslutade sin spelarkarriär 1999. 17/20

18/20 Födelsedagsproblemet Vi är ungefär 110 personer i rummet och året har 365 dagar. Vi antar att sannolikheten att två givna personer fyller samma dag är 1/365. Vad är sannolikheten att det finns två personer i det här rummet som har samma födelsedag?

19/20 Fördelningsfunktion Man är ofta intresserad av sannolikheter av typen P(X k). Av den anledningen så har man infört begreppet fördelningsfunktion. Fördelningsfunktionen för slumpvariabeln X är F (k) = P(X k). För diskreta slumpvariabler som kan anta värdena 0, 1, 2,..., k (och eventuellt större värden än k) gäller det att Allmänt gäller att F (k) = k p(i). i=0 P(a < X b) = F (b) F (a).

20/20 Sammanfattning Diskreta slumpvariabler. Binomialfördelning: antalet gånger en händelse (som inträffar med sannolikhet p) inträffar när samma försök upprepas n oberoende gånger. Poissonfördelning: antalet gånger som en sällsynt händelse inträffar under en tidsperiod. Fördelningfunktion F (k) = P(X k). På nästa föreläsning ska vi diskutera kontinuerliga slumpvariabler.