SF1901: Sannolikhetslära och statistik

Relevanta dokument
SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

SF1911: Statistik för bioteknik

Grundläggande matematisk statistik

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Föreläsning 2. Kapitel 3, sid Sannolikhetsteori

Matematisk statistik - Slumpens matematik

Kombinatorik och sannolikhetslära

SF1901: SANNOLIKHETSTEORI OCH GRUNDLÄGGANDE SANNOLIKHETSTEORI, STATISTIK BETINGADE SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko.

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik

händelsen som alltid inträffar. Den tomma mängden representerar händelsen som aldrig inträffar.

SF1901: SANNOLIKHETSTEORI OCH STATISTIK GRUNDLÄGGANDE SANNOLIKHETSTEORI, BETINGAD SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko.

Sannolikhetsbegreppet

Utfall, Utfallsrummet, Händelse. Sannolikhet och statistik. Utfall, Utfallsrummet, Händelse. Utfall, Utfallsrummet, Händelse

SF1901: SANNOLIKHETSTEORI OCH STATISTIK GRUNDLÄGGANDE SANNOLIKHETSTEORI, KORT OM BESKRIVANDE STATISTIK. Tatjana Pavlenko.

SF1914/SF1916: SANNOLIKHETSTEORI OCH GRUNDLÄGGANDE SANNOLIKHETSTEORI, STATISTIK KORT OM BESKRIVANDE STATISTIK. Tatjana Pavlenko.

Kolmogorovs Axiomsystem Kolmogorovs Axiomsystem Varje händelse A tilldelas ett tal : slh att A inträar Sannolikheten måste uppfylla vissa krav: Kolmog

F2 SANNOLIKHETSLÄRA (NCT )

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift

Föreläsning 1, Matematisk statistik Π + E

Introduktion till sannolikhetslära. Människor talar om sannolikheter :

Matematisk statistik 9hp för: C,D,I, Pi

Matematisk statistik 9 hp för I, Pi, C, D och fysiker Föreläsning 1: Introduktion och Sannolikhet

1 Föreläsning I, Mängdlära och elementär sannolikhetsteori,

{ } { } En mängd är en samling objekt A = 0, 1. Ex: Mängder grundbegrepp 5 C. Olof M C = { 7, 1, 5} M = { Ce, Joa, Ch, Je, Id, Jon, Pe}

SF1901: Sannolikhetslära och statistik

TAMS79: Föreläsning 1 Grundläggande begrepp

Kap 2: Några grundläggande begrepp

Kapitel 2. Grundläggande sannolikhetslära

Grundläggande matematisk statistik

1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt , 2.5

Föreläsning 1: Introduktion

Kapitel 2. Grundläggande sannolikhetslära

Statistisk slutledning (statistisk inferens): Sannolikhetslära: GRUNDLÄGGANDE SANNOLIKHETSLÄRA. Med utgångspunkt från ett stickprov

SF1901: SANNOLIKHETSTEORI OCH GRUNDLÄGGANDE SANNOLIKHETSTEORI, STATISTIK KORT OM BESKRIVANDE STATISTIK. Tatjana Pavlenko.

Sannolikhetslära. 1 Enkel sannolikhet. Grunder i matematik och logik (2015) 1.1 Sannolikhet och relativ frekvens. Marco Kuhlmann

SF1901: Sannolikhetslära och statistik

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 2 HT07

Föreläsning 1, Matematisk statistik för M

Föreläsning 1: Introduktion

Matematisk Statistik och Disktret Matematik, MVE051/MSG810, VT19

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 1

Bearbetning och Presentation

TMS136. Föreläsning 1

3 Grundläggande sannolikhetsteori

Föreläsning 1: Introduktion

Sannolikhetsteori. Måns Thulin. Uppsala universitet Statistik för ingenjörer 23/ /14

Föreläsning G70, 732G01 Statistik A

Matematisk statistik för D, I, Π och Fysiker. Matematisk statistik slumpens matematik. Tillämpningar för matematisk statistik.

SF1911: Statistik för bioteknik

SF1901: Sannolikhetslära och statistik. Mer om Approximationer

Föreläsning 1. Grundläggande begrepp

Institutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014).

KOMBINATORIK. Exempel 1. Motivera att det bland 11 naturliga tal finns minst två som slutar på samma

Statistik 1 för biologer, logopeder och psykologer

S0007M Statistik2: Slumpmodeller och inferens. Inge Söderkvist

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

Statistikens grunder HT, dagtid Statistiska institutionen

Matematisk statistik fo r B, K, N, BME och Kemister. Matematisk statistik slumpens matematik. Beskriva Data Florence Nightingale.

TMS136. Föreläsning 2

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

TMS136. Föreläsning 1

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER OM χ 2 -TEST OCH LIKNANDE. Jan Grandell & Timo Koski

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Matematisk statistik for B, K, N, BME och Kemister. Matematisk statistik slumpens matematik. Beskriva Data Florence Nightingale. Forel.

Övning 1 Sannolikhetsteorins grunder

F9 SAMPLINGFÖRDELNINGAR (NCT

MA2047 Algebra och diskret matematik

Något om kombinatorik

732G70, 732G01 Statistik A 7hp

SF1901: Sannolikhetslära och statistik

F3 SANNOLIKHETSLÄRA (NCT ) För komplementhändelsen A till händelsen A gäller att

Sannolikhetslära. 1 Grundläggande begrepp. 2 Likformiga sannolikhetsfördelningar. Marco Kuhlmann

Valfritt läromedel för kurs Matematik B Exempel: Räkna med Vux B, Gleerups förlag. Tag kontakt med examinator om du har frågor

S0005M. Stokastiska variabler. Notes. Notes. Notes. Stokastisk variabel (slumpvariabel) (eng: random variable) Mykola Shykula

SF1901 Sannolikhetsteori och statistik I

Betingad sannolikhet och oberoende händelser

Finansiell statistik, vt-05. Sannolikhetslära. Mängder En mängd är en samling element (objekt) 1, 2,, F2 Sannolikhetsteori. koppling till verkligheten

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

S0005M, Föreläsning 2

TMS136. Föreläsning 2

MATEMATIK ARBETSOMRÅDET LIKABEHANDLING Kränkande handlingar, nätmobbning, rasism och genus

Sannolikheter och kombinatorik

Grundläggande matematisk statistik

13.1 Matematisk statistik

7-1 Sannolikhet. Namn:.

Experimentera i sannolikhet från teoretisk sannolikhet till data

Reliability analysis in engineering applications

SF1901: Sannolikhetslära och statistik

Slumpförsök för åk 1-3

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Föreläsning G70 Statistik A

Lösningar och lösningsskisser

Transkript:

SF1901: Sannolikhetslära och statistik Föreläsning 1. Jan Grandell & Timo Koski 19.01.2016 Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 1 / 70

Många tänker på tabeller 1 när de hör ordet statistik. Här avses dock med statistik läran om hur man från observationer eller analyser under osäkerhet drar slutsatser och beskriver dessa slutsatser på ett korrekt sätt. 1 Florence Nightingale (i bilden till höger) var även en framstående statistiker, tabellen till vänster har uppfunnits av henne Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 2 / 70

Lärandemål: aritmetiskt medelvärde, standardavvikelse, relativ frekvens utfall, utfallsrum, händelse, omöjlig (tom) händelse union av två händelser, snitt av två händelser komplementhändelse, De Morgans regler sannolikhet (snl), räknereglerna för sannolikhet Ex. på snl: antalet gynnsamma fall totalantalet fall, kombinatorik Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 3 / 70

En studie från Google Inc. (2011) Errors in dynamic random access memory (DRAM) are a common form of hardware failure in modern compute clusters. Failures are costly both in terms of hardware replacement costs and service disruption. In this we analyze measurements of memory errors in Google s fleet of commodity servers over a period of 2.5 years. The collected data covers multiple vendors, DRAM capacities and technologies, and comprises many millions of DIMM (= Dual In-line Memory Module) days. The goal is to answer questions such as the following: How common are memory errors in practice? What are their statistical properties? How are they affected by external factors, such as temperature and utilization, and by chip-specific factors, such as chip density, memory technology and DIMM age? Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 4 / 70

En studie från Google Inc. (2011) Frequency of errors: The average number of correctable errors (CEs) per year per DIMM (left), the fraction of DIMMs that see at least one CE in a given year (middle) and the fraction of DIMMs that see at least one uncorrectable error (UE) in a given year (right). Platforms C, D, and F use SECDED, while platforms A, B, and E rely on error protection based on chipkill. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 5 / 70

Tabell: ogrupperade data Man undersökte 35 tändsticksaskar och noterade för varje ask hur många tändstickor den innehöll. Följande värden (x i,i = 1,...,35) erhölls: 51 52 49 51 52 51 53 52 48 52 50 53 49 50 51 53 51 52 50 51 53 53 55 50 49 53 50 51 51 52 48 53 50 49 51 Detta är ett exempel på ogrupperade data och VARIATION. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 6 / 70

Hur många tändstickor tillverkas i Sverige? Varje dag tillverkar Swedish Match cirka 5 miljoner tändsticksaskar, vilket motsvarar omkring 250 miljoner tändstickor. Ställer man askarna på varandra, räcker en minuts produktion till en pelare högre än Eiffeltornet i Paris. Lägger man askarna på rad på E4:an, räcker en dags produktion från Jönköping till Stockholm. Stickornas sammanlagda längd skulle räcka till Australien. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 7 / 70

Frekvenser En stor ogrupperad datamängd är svår att överskåda. Resultatet i exemplet ovan kan sammanfattas i en frekvenstabell av grupperade data. absoluta frekvenserna f i för de olika förekommande värdena de relativa frekvenserna p i = f i /n. (Här avser i = 1 lägsta klassen, i = 2 nästa klass o.s.v..) n = antalet data (=35). Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 8 / 70

Frekvenstabell: grupperade data Table : Frekvenstabell för antal tändstickor i tändsticksaskar. Klass Absolut Relativ frekvens frekvens (%) i f i 100p i 48 2 5.7 49 4 11.4 50 6 17.1 51 9 25.7 52 6 17.1 53 7 20.0 54 0 0.0 55 1 2.9 S:a 35 100.0 Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 9 / 70

Stolpdiagram (Variation) Större åskådlighet får man genom ett stolpdiagram med de relativa frekvenserna p i inritade. p i 0.3 0.2 0.1 48 49 50 51 52 53 54 55 Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 10 / 70

Lägesmått (Variation) Låt allmänt x 1,...,x n vara de data som skall bearbetas. Som lägesmått används ofta (aritmeriska) medelvärdet x = 1 n n j=1 x j = x 1+x 2 + +x n. n I exemplet blir 35 j=1 x j = 1789 och x = 1789/35 = 51.1143. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 11 / 70

Spridningsmått (Variation) Som spridningsmått används ofta (stickprovs)variansen s 2 = 1 n 1 eller (stickprovets) standardavvikelse s = 1 n 1 n j=1 n j=1 (x j x) 2 (x j x) 2, Kvadratrotsutdragningen motiveras av att samma enhet då erhålles som för de givna värdena. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 12 / 70

Spridningsmått: räkneformel I kursens formelsamling hittar man s 2 = 1 n 1 n j=1 (x j x) 2 ( n ) = 1 xj 2 n x 2 n 1 j=1 I exemplet blir 35 j=1xj 2 = 91533 och x 2 = 2612.7 och standardavvikelsen blir s = (91533 35 2612.67) 1.62. 1 34 Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 13 / 70

Sambandsmått: kovarians och korrelationskoefficient Med kovariansen mellan x- och y-värdena i en datamängd (x 1,y 1 ),(x 2,y 2 )...,(x n,y n ) menas c xy = 1 n 1 n i=1 och med korrelationskoefficienten menas (x i x)(y i ȳ) r = c xy s x s y, där s x och s y är stickprovsstandardavvikelserna för x- respektive y-data. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 14 / 70

BOXPLOT för tändsticksdata 55 54 53 52 51 50 49 48 1 51 52 49 51 52 51 53 52 48 52 50 53 49 50 51 53 51 52 50 51 53 53 55 50 49 53 50 51 51 52 48 53 50 49 51 Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 15 / 70

BOXPLOT a.k.a box-and-whisker diagram A boxplot is a graph of a data set that consists of a line from the minimum value to the maximum value and a box with lines drawn at the first quartile Q 1, the median and the third quartile Q 3 55 MAXIMUM 54 53 52 Q3 51 50 MEDIAN Q1 49 48 MINIMUM 1 Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 16 / 70

BOXPLOT första kvartilen Q 1 = 25% av värdena ligger under, medianen = mittpunkten, 50 % ligger under, the tredje kvartilen Q 3 = 75% ligger under 55 MAXIMUM 54 53 52 Q3 51 50 MEDIAN Q1 49 48 MINIMUM 1 Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 17 / 70

New York Times 2009: Big Data statistics... uses powerful computers and sophisticated mathematical models to hunt for meaningful patterns and insights in vast troves of data. The applications are as diverse as improving Internet search and online advertising, culling gene sequencing information for cancer research and analyzing sensor and location data to optimize the handling of food shipments. mathematical model = sannolikhetsmodell (slumpmodell) Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 18 / 70

Sannolikhet? Sannolikheten för händelsen 50 antalet tändstickor i en ask 53 p 50 +p 51 +p 52 +p 53 = 0.171+0.257+0.171+0.20 0.80 p i 0.3 0.2 0.1 48 49 50 51 52 53 54 55 Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 19 / 70

Sannolikhet Vi skriver sannolikheten för händelsen 50 antalet tändstickor i en ask 53 P (50 antalet tändstickor i en ask 53 ) = 0.80 Detta är en sannolikhet som baserar sig på observationer. On inget ändras i produktionsprocessen förväntar vi oss att om vi får en ny tänsticksask och checkar antalet tändstickor i den, så har vi 80% chans att händelsen 50 antalet tändstickor i en ask 53 inträffar. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 20 / 70

Sannolikhet: empirisk Sannolikheten Pr (50 antalet tändstickor i en ask 53 ) = 0.80 baserade sig på 35 tändsticksaskar. De relativa frekvenserna kommer att ändras vi kollar nya tändsticksaskar, men de kommer att stabilisera sig. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 21 / 70

Googles data säger att en given minnesmodul har approximativt 8%s sannolikhet för att bli drabbad av ett fel under ett givet år. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 22 / 70

All platforms the top 20% of DIMMs with errors make up over 94% of all observed errors. The shape of the distribution curve provides evidence that it follows a power-law distribution (?). Intuitively, the skew in the distribution means that a DIMM that has seen a large number of errors is likely to see more errors in the future. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 23 / 70

Sannolikhet Vi postulerar att det finns ett tal som kallas sannolikheten för en händelse. Därmed menas helt enkelt att man tilldelar varje händelse ett visst tal. Om händelsen är A, betecknas talet med P(A), sannolikheten för A. (P som i Probability.) Beträffande talet P(A) gäller allmänt, att man söker välja det så att den relativa frekvensen vid ett någorlunda stort antal försök kommer i närheten av P(A). Om vi säger att P(A) = 0.80 kan vi ge detta uttalande den påtagliga men samtidigt vaga frekvenstolkningen: Vid ett stort antal försök blir den relativa frekvensen av händelsen A nog ungefär lika med 0.80. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 24 / 70

Slumpförsök Vi betraktar nu slumpförsök medelst allmänna beteckningar Varje möjligt resultat ω av ett slumpförsök kallas ett utfall, eller ett elementärt utfall. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 25 / 70

Slumpförsök Vi betraktar nu slumpförsök medelst allmänna beteckningar Varje möjligt resultat ω av ett slumpförsök kallas ett utfall, eller ett elementärt utfall. Mängden av alla utfall, eller resultat, kallar vi utfallsrummet och betecknar det med Ω. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 25 / 70

Slumpförsök Vi betraktar nu slumpförsök medelst allmänna beteckningar Varje möjligt resultat ω av ett slumpförsök kallas ett utfall, eller ett elementärt utfall. Mängden av alla utfall, eller resultat, kallar vi utfallsrummet och betecknar det med Ω. En händelse A är en mängd av utfall, dvs en delmängd av Ω, A Ω. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 25 / 70

Ofta kan valet av utfallsrum bero på situationen eller den fråga vi vill studera. Exempel: Ω= de fem miljoner tändsticksaskarna producerade under en given dag. Ω= de 35 miljoner tändsticksaskarna producerade under en sjudagars period. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 26 / 70

Exempel: tärningskast Slumpförsok: kast av en tärning. Utfall: ω = antalet ögon Ω = {etta, tvåa, trea, fyra, femma, sexa } Exempel på en händelse A = udda antal ögon = {etta, trea, femma }. Vi säger att händelsen A inträffar, om vi kastar en tärning (=genomför ett slumpförsok) och får etta eller trea eller femma. (Slut på exemplet.) Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 27 / 70

Venndiagram Definition Mängden av alla utfall, eller resultat, kallar vi utfallsrummet och betecknar det med Ω. Ω ω Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 28 / 70

Venndiagram Definition En händelse A är en mängd av utfall, dvs en delmängd av Ω, A Ω. Ω Α Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 29 / 70

Venndiagram; två händelser Ω Α Β Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 30 / 70

Händelser A B Låt oss nu anta att vi är intresserade av två händelser A och B definierade på samma försök. Här är några exempel på vad som kan inträffa, och hur vi matematiskt kan uttrycka detta: Exempel A inträffar, A A och B inträffar eller A snitt B inträffar, A B Ω = {etta, tvåa, trea, fyra, femma, sexa } A = udda antal ögon = {etta, trea, femma }. B = {femma, sexa }, A B = {femma }. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 31 / 70

Venndiagram A B Ω Β 01 000 111 000 111 0000 1111 0000 1111 00000 11111 00000 11111 00000 11111 00000 11111 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 00000 11111 0000 1111 000 111 000 111 Α Α B Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 32 / 70

Händelser A B A eller B inträffar eller A union B inträffar, A B Obs! A B betyder att minst en av A eller B inträffar, så A B kan mycket väl inträffa. I matematik betyder eller och/eller! Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 33 / 70

Händelser A B A B betyder att minst en av A eller B inträffar Exempel Ω = {etta, tvåa, trea, fyra, femma, sexa } A = udda antal ögon = {etta, trea, femma }. B = {femma, sexa }, A B = {etta, trea, femma, sexa }. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 34 / 70

Venndiagram A B Ω Α Β A B Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 35 / 70

Händelser A A inträffar inte, A. Exempel Ω = {etta, tvåa, trea, fyra, femma, sexa } A = udda antal ögon = {etta, trea, femma }. A = { tvåa, fyra, sexa }=jämnt antal ögon. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 36 / 70

Venndiagram A Ω A A* Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 37 / 70

tomma mängden Om A och B utesluter varandra, dvs. omöjligt kan inträffa samtidigt, så säger vi att A och B är disjunkta eller oförenliga, dvs. A B = där är tomma mängden eller den omöjliga händelsen. Ω = Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 38 / 70

tomma mängden A och B utesluter varandra, dvs. omöjligt kan inträffa samtidigt. Exempel Ω = {etta, tvåa, trea, fyra, femma, sexa } A = {etta, trea, femma }. B = { fyra, sexa }, A B =. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 39 / 70

Venndiagram; A B = Ω Α Β Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 40 / 70

De Morgans regler Sats A (B C) = (A B) (A C) A (B C) = (A B) (A C) Sats (A B) = A B Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 41 / 70

De Morgans regler (A B) = A B Exempel Ω = {etta, tvåa, trea, fyra, femma, sexa } A = {etta, trea, femma }. B = {femma, sexa }, A B = { femma } (A B) = {etta, tvåa, trea, fyra, sexa } A B = {tvåa, fyra, sexa } {etta, tvåa, trea, fyra } = {etta, tvåa, trea, fyra, sexa } Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 42 / 70

Drill på Venndiagram Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 43 / 70

Drill på Venndiagram a) Vilket diagram svarar mot Q R? b) Vilket diagram svarar mot P Q R? c) Vilket diagram svarar mot Q R P? d) Vilket diagram svarar mot P Q? e) Vilket diagram svarar mot P R Q? f) Vilket diagram svarar mot (P Q) R? g) Vilket diagram svarar mot Q (P R)? Svaren på nästa slajd: Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 44 / 70

a) Diagram C b) Diagram E c) Diagram B d) Diagram A e) Diagram D f) Diagram F g) Diagram D Varför har e) och g) samma svar? Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 45 / 70

Händelser Har vi många händelser kan vi, precis som med summa- och produkt-tecken, använda ett förkortat skrivsätt: n A i = A 1 A 2... A n och 1 n A i = A 1 A 2... A n 1 Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 46 / 70

Slumpförsök: tärningskast och P(A) Låt oss säga att vi kastar en tärning, och är intresserade av händelsen {vi får en sexa}. Alla håller nog med om att, om det är en just tärning, att den sannolikheten är 1 6. Symboliskt kan vi skriva A = {vi får en sexa} och P(A) = 1 6. Är det överhuvudtaget meningsfullt att tala om sannolikheter, och om så är fallet, hur skall man tolka dessa? Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 47 / 70

Slumpförsök: relativa frekvenser Vi skall tolka detta som att om man kastar tärningen många gånger, så blir den relativa frekvensen 6or ungefär 1 6. Allmänt sett, om vi har ett försök och en händelse A och gör försöket n gånger, så gäller f n (A) = antalet gånger A inträffar n P(A) då n växer. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 48 / 70

Kolmogorovs axiomsystem (1933): Ett sannolikhetsmått P är en funktion av händelser, sådan att: (a) 0 P(A) 1; Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 49 / 70

Kolmogorovs axiomsystem (1933): Ett sannolikhetsmått P är en funktion av händelser, sådan att: (a) 0 P(A) 1; (b) P(Ω) = 1 Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 49 / 70

Kolmogorovs axiomsystem (1933): Ett sannolikhetsmått P är en funktion av händelser, sådan att: (a) 0 P(A) 1; (b) P(Ω) = 1 (c) om A 1,A 2,... är disjunkta händelser, så gäller ( ) P A i = 1 1 P(A i ). Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 49 / 70

Kolmogorovs axiomsystem (1933): Ett sannolikhetsmått P är en funktion av händelser, sådan att: (a) 0 P(A) 1; (b) P(Ω) = 1 (c) om A 1,A 2,... är disjunkta händelser, så gäller ( ) P A i = 1 1 P(A i ). (a) och (b) kan ses som en kalibrering så att P stämmer med intuitionen (det blir lättare då) och (c) (som är det viktiga axiomet) betyder att P är ett mått. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 49 / 70

Kolmogorovs axiomsystem: ett specialfall Om A 1,A 2,... är disjunkta händelser, så gäller ( ) P A i = 1 1 P(A i ). Ett specialfall: Betrakta A och B sådana att A B =, då fås P(A B) = P (A)+P (B) Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 50 / 70

Regler för sannolikhetskalkyl (1) Sats P(A ) = 1 P(A). Bevis. Vi ska ge ett mycket formellt bevis, för att illustrera axiomsystemet: Eftersom A och A disjunkta och A A = Ω, så fås enligt (c) och (b) ovan P(A)+P(A ) = P(Ω) = 1 P(A ) = 1 P(A). Följdsats P( ) = 0. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 51 / 70

Regler för sannolikhetskalkyl (2) Sats P(A B) = P(A)+P(B) P(A B). Bevis. Satsen följer med hjälp av Venn-diagram, och observationen att P(A)+P(B) mäter A B två gånger. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 52 / 70

Regler för sannolikhetskalkyl (3) Om A B =, så fås P(A B) = P( ) = 0, dvs. Detta följer av det ovan visade P(A B) = P(A)+P(B). Sats P(A B) = P(A)+P(B) P(A B). Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 53 / 70

Den klassiska sannolikhetsdefinitionen Antag att Ω består av m (möjliga) elementarutfall ω 1,...,ω m, var och en med samma sannolikhet att inträffa, dvs P(ω k ) = 1 m k = 1,...,m. Betrakta en händelse A, A Ω. Antag att A innehåller g (gynnsamma) elementarutfall. Då gäller P(A) = g m. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 54 / 70

Den klassiska sannolikhetsdefinitionen Problemet med den klassiska sannolikhetsdefinitionen, i mera komplicerade situationer, är att hitta en uppdelning av Ω i lika sannolika elementarutfall och att beräkna m och g. I många de flesta situationer är det inte alls möjligt att göra detta. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 55 / 70

Kombinatoriska grundbegrepp För att beräkna m och g behöver vi några kombinatoriska grundbegrepp. Vi inleder med en s.k. multiplikationsprincip. Sats Om en åtgärd kan utföras på n 1 och en annan (nästa) åtgärd kan utföras på n 2 sätt, så finns det n 1 n 2 sätt att utföra de båda åtgärderna. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 56 / 70

Kombinatoriska grundbegrepp Enligt multiplikationsprincipen finns det n k olika sätt att plocka ut k st. av n st. föremål om varje föremål som har plockats ut stoppas tillbaka och om vi tar hänsyn till i vilken ordning de plockas ut. Exempel Antalet PIN-koder = 10 4 = 10000. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 57 / 70

Enligt multiplikationsprincipen finns det n k olika sätt att plocka ut k st. av n st. föremål om varje föremål som har plockats ut stoppas tillbaka och om vi tar hänsyn till i vilken ordning de plockas ut. Exempel Föremålen är,,, dvs. n = 3. Vi tar k = 2.,,,,,,,,. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 58 / 70

Kombinatoriska grundbegrepp: permutation n st. föremål kan permuteras eller ordnas på n! = n (n 1)...2 1 olika sätt. 0! = 1 Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 58 / 70

Kombinatoriska grundbegrepp: permutation n st. föremål kan permuteras eller ordnas på n! = n (n 1)...2 1 utläses: n fakultet olika sätt. 0! = 1 Exempel n = 3, 3! = 6.,,,,,. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 59 / 70

Kombinatoriska grundbegrepp: permutation n (n 1)...(n k +1) kallas kallas antalet permutationer av k element bland n (=antalet sätt at välja k element bland n utan återläggning och med hänsyn till ordningen). Vi har n! n (n 1)...(n k +1) = (n k)! Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 60 / 70

Kombinatoriska grundbegrepp: permutation n (n 1)...(n k +1) kallas kallas antalet permutationer av k element bland n (=antalet sätt at välja k element bland n utan återläggning och med hänsyn till ordningen). Vi har n! n (n 1)...(n k +1) = (n k)! Exempel n = 3, k = 2.,,,,,. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 61 / 70

Kombinatoriska grundbegrepp: binomialkoefficienterna Låt x vara antalet sätt att att plocka ut k st. av n st. föremål om vi ej tar hänsyn till i vilken ordning de plockas ut. Då gäller enligt multiplikationsprincipen att n (n 1)...(n k +1) }{{} k utan återläggning och med ordning = k! }{{} antalet sätt att ordna k element n (n 1)...(n k +1) n! 1 x = = k! (n k)! k! x Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 62 / 70

Kombinatoriska grundbegrepp: binomialkoefficienterna Vi ger beteckningen x = ( n k ). Alltså: Det finns ( ) n = k n! k!(n k)! olika sätt att plocka ut k st. av n om vi ej tar hänsyn till i vilken ordning de plockas ut. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 63 / 70

Kombinatoriska grundbegrepp: binomialkoefficienterna Vi ger beteckningen x = ( n k ). Alltså: Det finns ( ) n = k n! k!(n k)! olika sätt att plocka ut k st. av n om vi ej tar hänsyn till i vilken ordning de plockas ut. Exempel n = 3, k = 2.,,. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 64 / 70

Två urnmodeller: Dragning utan återläggning I en urna finns kulor av två slag: v vita och s svarta. Drag n kulor ur urnan slumpmässigt och så att en kula som dragits inte stoppas tillbaka. dvs dragning utan återläggning. Sätt A = Man får k vita kulor i urvalet. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 65 / 70

Två urnmodeller: Dragning utan återläggning Välj Ω: Alla uppsättningar om n kulor utan hänsyn till ordning. Då fås: ( ) ( )( ) v +s v s m = och g = n k n k och således P(A) = (v k )( s n k ) ( v+s n ). Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 66 / 70

Två urnmodeller: Dragning med återläggning Samma modell som i fallet med dragning utan återläggning, men kulorna stoppas tillbaka igen efter det att man observerat dess färg, och urnan skakas om för nästa dragning. Välj Ω: Alla uppsättningar om n kulor med hänsyn till ordning: m = (v +s) n. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 67 / 70

Två urnmodeller: Dragning med återläggning Antag att vi valt ut k vita och n k svarta kulor. Dessa kan placeras på ( n k ) platser: v v v v Antal sätt att välja ut k vita = v k. Antal sätt att välja ut n k svarta = s n k. Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 68 / 70

Två urnmodeller: Dragning med återläggning Detta ger g = ( n k )vk s n k och således får vi P(A) = (n k )vk s n k (v +s) n = ( )( ) n v k ( ) s n k. k v +s v +s Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 69 / 70

Kolmogorov 2 2 A.N.Kolmogorov, 1903-1987 Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 70 / 70