Sannolikhetslära. 1 Enkel sannolikhet. Grunder i matematik och logik (2015) 1.1 Sannolikhet och relativ frekvens. Marco Kuhlmann

Relevanta dokument
Institutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014).

händelsen som alltid inträffar. Den tomma mängden representerar händelsen som aldrig inträffar.

Kombinatorik och sannolikhetslära

1 Föreläsning I, Mängdlära och elementär sannolikhetsteori,

Kap 2: Några grundläggande begrepp

Sannolikhetslära. 1 Grundläggande begrepp. 2 Likformiga sannolikhetsfördelningar. Marco Kuhlmann

1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt , 2.5

Matematisk statistik - Slumpens matematik

Introduktion till sannolikhetslära. Människor talar om sannolikheter :

Föreläsning 2. Kapitel 3, sid Sannolikhetsteori

F2 SANNOLIKHETSLÄRA (NCT )

Föreläsning 1, Matematisk statistik Π + E

TAMS79: Föreläsning 1 Grundläggande begrepp

Grundläggande matematisk statistik

Reliability analysis in engineering applications

Utfall, Utfallsrummet, Händelse. Sannolikhet och statistik. Utfall, Utfallsrummet, Händelse. Utfall, Utfallsrummet, Händelse

Sannolikhetsteori. Måns Thulin. Uppsala universitet Statistik för ingenjörer 23/ /14

TMS136. Föreläsning 2

TMS136. Föreläsning 2

3 Grundläggande sannolikhetsteori

Föreläsning 1, Matematisk statistik för M

S0007M Statistik2: Slumpmodeller och inferens. Inge Söderkvist

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 2 HT07

Matematisk statistik 9hp för: C,D,I, Pi

Matematisk statistik 9 hp för I, Pi, C, D och fysiker Föreläsning 1: Introduktion och Sannolikhet

Finansiell statistik, vt-05. Sannolikhetslära. Mängder En mängd är en samling element (objekt) 1, 2,, F2 Sannolikhetsteori. koppling till verkligheten

Kolmogorovs Axiomsystem Kolmogorovs Axiomsystem Varje händelse A tilldelas ett tal : slh att A inträar Sannolikheten måste uppfylla vissa krav: Kolmog

{ } { } En mängd är en samling objekt A = 0, 1. Ex: Mängder grundbegrepp 5 C. Olof M C = { 7, 1, 5} M = { Ce, Joa, Ch, Je, Id, Jon, Pe}

Matematisk Statistik och Disktret Matematik, MVE051/MSG810, VT19

SF1901: Sannolikhetslära och statistik

Statistikens grunder HT, dagtid Statistiska institutionen

(N) och mängden av heltal (Z); objekten i en mängd behöver dock inte vara tal. De objekt som ingår i en mängd kallas för mängdens element.

SF1901: SANNOLIKHETSTEORI OCH STATISTIK GRUNDLÄGGANDE SANNOLIKHETSTEORI, BETINGAD SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko.

TMS136. Föreläsning 1

Föreläsning 1. Grundläggande begrepp

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 1

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

F3 SANNOLIKHETSLÄRA (NCT ) För komplementhändelsen A till händelsen A gäller att

Sannolikhetsbegreppet

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Statistisk slutledning (statistisk inferens): Sannolikhetslära: GRUNDLÄGGANDE SANNOLIKHETSLÄRA. Med utgångspunkt från ett stickprov

Grundläggande matematisk statistik

TMS136. Föreläsning 1

Statistik 1 för biologer, logopeder och psykologer

7-1 Sannolikhet. Namn:.

7-2 Sammansatta händelser.

Föreläsning G70, 732G01 Statistik A

Mängder. 1 Mängder. Grunder i matematik och logik (2015) 1.1 Grundläggande begrepp. 1.2 Beskrivningar av mängder. Marco Kuhlmann

SF1901: SANNOLIKHETSTEORI OCH GRUNDLÄGGANDE SANNOLIKHETSTEORI, STATISTIK BETINGADE SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko.

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

SF1911: Statistik för bioteknik

Slumpförsök för åk 1-3

Övning 1 Sannolikhetsteorins grunder

Aktiviteten, (Vad är mina chanser?), parvis, alla har allt material,

Sannolikhetslära. 19 februari Vad är sannolikheten att vinna om jag köper en lott?

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik för D, I, Π och Fysiker. Matematisk statistik slumpens matematik. Tillämpningar för matematisk statistik.

Föreläsning 12: Repetition

Kapitel 1. betecknas detta antal med n(a). element i B; bet. A B. Den tomma mängden är enligt överenskommelsen en delmängd. lika; bet. A = B.

Anna: Bertil: Cecilia:

Uppgifter 6: Kombinatorik och sannolikhetsteori

Kapitel Test 1 sidan sid 56 ff... 7 Blandade Uppgifter Totalt har högt blodtryck. 85 % av 80 st =68 dricker alkohol.

Matematisk statistik

Sannolikhetslära till pdf.notebook. May 04, Sannolikhetslära.

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 1, OCH ÖVNING 2, SAMT INFÖR ÖVNING 3

Probabilistisk logik 1

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift

Satsen om total sannolikhet och Bayes sats

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

SF1901: Sannolikhetslära och statistik

Betingad sannolikhet och oberoende händelser

Föreläsning 1: Introduktion

SF1901: SANNOLIKHETSTEORI OCH STATISTIK GRUNDLÄGGANDE SANNOLIKHETSTEORI, KORT OM BESKRIVANDE STATISTIK. Tatjana Pavlenko.

1 Mätdata och statistik

Experimentera i sannolikhet från teoretisk sannolikhet till data

FMS012/MASB03: Matematisk statistik 9.0 hp för F+fysiker Föreläsning 1: Sannolikhet

FÖRELÄSNING 3:

Kapitel 2. Grundläggande sannolikhetslära

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Uppsala universitet Institutionen för lingvistik och filologi. Grundbegrepp: Mängder och element Delmängder

Introföreläsning i S0001M, Matematisk statistik LP3 VT18

Vad kan hända? strävorna

SF1911: Statistik för bioteknik

STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar

MATEMATIK ARBETSOMRÅDET LIKABEHANDLING Kränkande handlingar, nätmobbning, rasism och genus

Introföreläsning i S0001M Matematisk statistik Läsperiod 2, HT 2018

SF1901: Övningshäfte

Föreläsning 1: Tal, mängder och slutledningar

14.1 Diskret sannolikhetslära

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

15.1 Mer om betingad sannolikhet

Statistiska metoder för säkerhetsanalys

Transkript:

Marco Kuhlmann Detta kapitel behandlar grundläggande begrepp i sannolikhetsteori: enkel sannolikhet, betingad sannolikhet, lagen om total sannolikhet och Bayes lag. 1 Enkel sannolikhet Den klassiska sannolikhetsteorin, som började utvecklas på 1600-talet, har sitt ursprung i tillämpningar på hasardspel. De frågor som man ville ha svar på var av typen Är det gynnsamt (skulle man vinna i längden på) att, vid jämna odds, slå vad om att man vid fyra kast med en tärning får minst en sexa? Detta specifika problem kallas även för De Mérés problem. 1 Din tur 1 Hur du skulle intuitivt svara på frågan? Hur skulle du kunna gå tillväga för att lösa problemet? 1.1 Sannolikhet och relativ frekvens Låt oss försöka att lösa detta problem empiriskt. I Figur 1 ser vi utdatan från ett program som kastar fyra tärningar åt oss och håller koll på antalet i sammanhanget gynnsamma utfall, dvs. antalet gånger där man kastat minst en sexa vid fyra kast. Programmet skriver även ut den relativa frekvensen av de gynnsamma utfallen: andelen som de gynnsamma utfallen har bland alla utfall. Som vi ser så ligger denna andel på 60% efter tio försök. Sannolikhetsteorin utvecklades för att man ville kunna förutsäga framtiden baserat på empiriska erfarenheter. Det hela bygger på antagandet att den relativa frekvensen av en given händelse (såsom att kasta minst en sexa vid fyra kast) så småningom stabiliseras kring ett värde. Detta värde kallas för händelsens sannolikhet. Sannolikheten för en händelse A skrivs P(A). Det gäller att 0 P(A) 1. P(A) = 0 innebär att händelse A aldrig inträffar och P(A) = 1 att den alltid inträffar. (Figur 1 visar att sannolikheten för ett gynnsamt utfall ligger någonstans mellan aldrig och alltid.) 1 Efter Antoine Gombaud (1607 1684), som kallades Chevalier de Méré (även om han inte var riddare). 1(9)

Försök Tärningskast Gynsamma Rel. frekvens 1 3 3 4 3 0 0.000000 2 4 5 1 6 1 0.500000 3 4 4 3 5 1 0.333333 4 2 3 5 5 1 0.250000 5 5 5 6 2 2 0.400000 6 6 4 5 2 3 0.500000 7 5 5 3 5 3 0.428571 8 4 6 6 3 4 0.500000 9 2 6 5 2 5 0.555556 10 4 2 6 1 6 0.600000 Figur 1: Experiment utifrån De Mérés problem Det är viktigt att förstå att en händelses sanna sannolikhet kan inte observeras; den kan bara skattas. (I det experiment som vi körde i Figur 1 observerade vi relativa frekvenser, inte sannolikheter.) Din tur 2 Är skattningen efter tio försök i Figur 1 pålitlig? 1.2 Utfall, händelser och sannolikhet För att lösa De Mérés problem med hjälp av sannolikhetsteorin börjar vi med en förenklad fråga: Är det gynnsamt att, vid jämna odds, slå vad om att man vid ett kast med en tärning får en sexa? Svaret på denna fråga är lätt. När man kastar en tärning finns det sex möjliga utfall: Tärningen kan visa en etta, en tvåa, en trea, en fyra, en femma eller en sexa. Mängden av alla möjliga utfall vid ett tärningskast eller ett annat experiment kallas för utfallsrum och betecknas med den grekiska bokstaven U. I det här fallet har vi alltså U = {1, 2, 3, 4, 5, 6} Vid jämna odds finns det alltså bara ett gynnsamt utfall (man kastar en sexa), men fem stycken ogynnsamma utfall (man kastar något annat). Det är alltså inte gynnsamt att slå vad om att man får en sexa. Din tur 3 Hur måste man argumentera om man istället är intresserad i frågan om det är gynnsamt att slå vad om att man vid ett kast med en tärning får ett jämt tal? 2(9)

Svar: Om man istället är intresserad av händelsen man kastar ett jämt tal så finns det tre gynnsamma utfall: en tvåa, en fyra och en sexa. Det föregående exemplet illustrerar skillnaden mellan begreppen utfall och händelse: Varje kast med tärningen kommer att ge exakt ett tal som utfall; men vissa relevanta händelser, t.ex. talet är jämnt ({2, 4, 6}) och talet är större än 3 ({4, 5, 6}), kan bara beskrivas som kombinationer av sådana utfall. Allmänt definierar man därför en händelse som en mängd utfall. En händelse är därför en delmängd till utfallsrummet. Och hela utfallsrummet utgör den händelse som alltid inträffar. Sannolikheten för en händelse A kan räknas ut på detta sätt, om alla utfall är lika sannolika: P(A) = antal utfall som leder till A antal möjliga utfall = A (Kom ihåg att notationen X betecknar kardinaliteten eller storleken hos X.) T.ex. vid tärningskast (med vanliga typen av tärning): {2, 4, 6} P(talet är jämnt) = P({2, 4, 6}) = = 3/6 = 0,5 {1, 2, 3, 4, 5, 6} {1, 2, 3, 4, 6} P(talet är inte 5) = P({1, 2, 3, 4, 6}) = = 5/6 0,833 {1, 2, 3, 4, 5, 6} P(talet är 7) = P( ) = {1, 2, 3, 4, 5, 6} = 0/6 = 0 P(talet är inte 7) = P({1, 2, 3, 4, 5, 6}) = Din tur 4 Vad för sorts händelser är och U? {1, 2, 3, 4, 5, 6} {1, 2, 3, 4, 5, 6} = 6/6 = 1 Svar: Den tomma mängden representerar omöjlighet : Det finns inget som helst utfall som kan leda till denna händelse; dess sannolikhet är 0. Den fullständiga mängden representerar nödvändighet : Alla möjliga utfall leder till denna händelse; dess sannolikhet är 1. Nu kan vi gå tillbaka till De Mérés problem. Din tur 5 Vilket utfallsrum får man för De Mérés problem? Vilken storlek har detta rum? Vilken händelse är man intresserad av? Hur stor är sannolikheten för den händelsen? Svar: Det nya utfallsrummet består av alla följder (tupler) av fyra tärningskast. Detta utfallsrum har kardinalitet 6 4 = 1296. Alltså: = 1296. Händelsen som är aktuell i De Mérés fall är den att få en följd som innehåller minst en sexa. Men det är inte så lätt att räkna ut sannolikheten för denna händelse En ganska dum 3(9)

U A Figur 2: Diagrammet visar att A c = U A = U A. metod vore att gå igenom alla följder (tupler) av fyra tärningskast och räkna hur många som innehåller minst en sexa, men det skulle vara ganska jobbigt och vi skulle riskera att räkna fel. Vi kan dessbättre tänka på ett smartare sätt för att räkna ut antalet utfall som leder till händelsen minst en sexa! Ett begrepp som är mycket användbart i samband med De Mérés problem är begreppet komplementhändelse. Med komplementhändelsen till en händelse A menas händelsen att A inte inträffar. Eftersom varje händelse är en mängd är komplementhändelsen till A helt enkelt komplementmängden till A, relativt till universum U. Det är inte svårt att se att sannolikheten för komplementhändelsen till en händelse A är P(A c ) = 1 P(A) På samma sätt får man P(A) = 1 P(A c ). Din tur 6 Kan du bevisa detta? Svar: Mängden A c kan skrivas som U A. Enligt definitionen av sannolikhet gäller då att P(A c ) = P(U A) = U A När man ritar ett Venn-diagram som i Figur 2 ser man att U A = U A. Men eftersom A U har man U A = A. Med detta: P(A c ) = U A = U A = A = A = 1 P(A) Det som gör begreppet komplementhändelsen användbart i samband med De Mérés problem är att det är mycket lättare att räkna ut storleken på komplementhändelsen till minst en sexa på fyra kast än händelsen själv. Din tur 7 Vad är komplementhändelsen, hur stor är respektive mängd och hur sannolikt är komplementhändelsen? 4(9)

Svar: Komplementhändelsen är ingen sexa på fyra kast ; dess storlek är 5 4 = 625; och sannolikheten för komplementhändelsen är då 625/1296 = 48,2%. Med detta vet vi alltså att sannolikheten att få minst en sexa på fyra kast (vilket är komplementhändelsen till komplementhändelsen, så att säga) är P(A) = 1 P(A c ) = 1 625 1296 51,8% Detta betyder att man har större chans att vinna än att förlora när man slår vad om att man vid fyra kast med en tärning får minst en sexa. 5(9)

A B Figur 3: Illustration av den betingade sannolikheten P(A B). 2 Betingad sannolikhet Definition 1 Låt A, B vara händelser. Den betingade sannolikheten för A givet B är P(A B) = A B B För att se att denna definition är en generalisering av vår tidigare definition av sannolikhet kan man notera att man får den vanliga (enkla) sannolikheten genom att sätta B = U: P(A U) = A U = A = P(A) Sammanhanget mellan enkel sannolikhet och betingad sannolikhet kan beskrivas så att man zoomar in på en delmängd av utfallen, nämligen dem som är förenliga med B. Dessa händelser blir det nya utfallsrummet. Detta illustreras i Figur 3. Om vi antar att sannolikheten för en händelse är proportionerlig till dess andel av arean så har vi P(A) = 4/16. Om vi nu vet att B har inträffat så har sannolikheten för A höjts rejält till P(A B) = A B B = 2 4. Definition 2 Två händelser A och B kallas oberoende om P(A B) = P(A)P(B). Sannolikheten P(A B) beräknas även om vi inte vet att A och B är oberoende: Lemma 1 För alla händelser A, B gäller att P(A B) = P(A B)P(B). Bevis. Vi börjar med produkten P(A B)P(B), tillämpar definition av betingad och enkel sannolikhet och kortar bråktalet: P(A B)P(B) = A B B B A B B A B = = = P(A B) B 6(9)

U P(A 1 ) P(A 2 ) A 1 A 2 P(B A 1 ) P(B c A 1 ) P(B A 2 ) P(B c A 2 ) A 1 B A 1 B c A 2 B A 2 B c Figur 4: Träddiagram för problem där A 1 A 2 = U och A 1 A 2 =. Om man kombinerar definition av oberoende händelser med Lemma 1 ser man att P(A B) = P(A) om A och B är oberoende. Den betingade sannolikheten för A givet B inte är större än den enkla sannolikheten för A; händelsen B händer har ingen påverkan på A. 3 Lagen om total sannolikhet Din tur 8 Hur räknar man ut P(A B)? Svar: Genom att använda oss av räknereglerna för kardinalitet får vi P(A B) = A B = A + B A B = P(A) + P(B) P(A B) Definition 3 Två händelser A 1, A 2 kallas disjunkta om A 1 A 2 =. Din tur 9 Hur räknar man ut P(A B)? om A och B är disjunkta? Svar: Då gäller P(A B) = 0 och P(A B) = P(A) + P(B) P(A B) = P(A) + P(B). När man har problem med två disjunkta händelser A 1, A 2 sådana att A 1 A 2 = U och en tredje händelse B (som inte behöver vara disjunkt till A 1 eller A 2 ) kan man visualisera det genom att rita ett träddiagram som i Figur 4. Man tänker sig att man startar i rotnoden (längst upp). Eftersom A 1 A 2 = U så måste antingen A 1 eller A 2 hända. Eftersom A 1 och A 2 är disjunkta kan antingen endast en av dessa hända: antingen A 1 (med sannolikhet P(A 1 )) eller A 2 (med sannolikhet P(A 2 )). Oberoende av vilken händelse som inträffar kan antingen B 7(9)

hända eller så händer B c, komplementet till B. Nu finns det fyra olika fall; exakt ett av dessa fall måste inträffa: A 1 B A 1 B c A 2 B A 2 B c Lagen om total sannolikhet säger att man kan beräkna sannolikheten för B genom att plussa ihop sannolikheterna för de två fall som kan leda till B: Lemma 2 (Lagen om total sannolikhet) Låt A 1, A 2 vara händelser sådana att A 1 A 2 = U och A 1 A 2 =. Då gäller följande för alla händelser B: P(B) = P(B A 1 ) + P(B A 2 ) = P(A 1 )P(B A 1 ) + P(A 2 )P(B A 2 ) Bevis. P(B) = P(B U) (eftersom B U) = P(B (A 1 A 2 )) (eftersom A 1 A 2 = U) = P((B A 1 ) (B A 2 )) (de Morgan) = P(B A 1 ) + P(B A 2 ) (eftersom A 1 A 2 = ) = P(A 1 )P(B A 1 ) + P(A 2 )P(B A 2 ) (Lemma 1) 4 Bayes lag Det finns många situationer då vi är intresserade i P(B A) men då vi bara har tillgång till P(A B). Bayes lag låter en vända på en betingad sannolikhet. Lemma 3 (Bayes lag) Låt A, B vara händelser. Då gäller P(B A) = P(A B)P(B) P(A) Bevis. Vi tillämpar Lemma 1 på två sätt: P(A B) = P(B A) P(A) P(A B) = P(A B) P(B) Nu sätter vi de båda termer till höger om likhetstecknet lika med varandra och dela med P(A) respektive P(B). Då får vi: P(B A) = P(A B) P(B) P(A) P(A B) = P(B A) P(A) P(B) 8(9)

Din tur 10 Vi har följande information: Meningit orsakar feber i 80% av alla fall. Meningit har en prevalens på 0,15%. 1 av 100 människor lider av feber. En läkare träffar en patient med feber. Hur sannolikt är det att denna patient har meningit? Från Bayes lag får vi: P(meningit feber) = P(feber meningit)p(meningit) P(feber) = 0,8 0,0015 0,01 = 0,12 9(9)