SF1911: Statistik för bioteknik

Relevanta dokument
SF1901: Sannolikhetslära och statistik

SF1911: Statistik för bioteknik

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

F2 SANNOLIKHETSLÄRA (NCT )

Matematisk statistik - Slumpens matematik

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Introduktion till sannolikhetslära. Människor talar om sannolikheter :

1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt , 2.5

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

1 Föreläsning I, Mängdlära och elementär sannolikhetsteori,

Grundläggande matematisk statistik

TMS136. Föreläsning 2

SF1901: Sannolikhetslära och statistik

händelsen som alltid inträffar. Den tomma mängden representerar händelsen som aldrig inträffar.

TMS136. Föreläsning 1

Matematisk statistik 9 hp för I, Pi, C, D och fysiker Föreläsning 1: Introduktion och Sannolikhet

Sannolikhetslära. 1 Enkel sannolikhet. Grunder i matematik och logik (2015) 1.1 Sannolikhet och relativ frekvens. Marco Kuhlmann

Matematisk statistik 9hp för: C,D,I, Pi

Föreläsning 1, Matematisk statistik Π + E

Föreläsning 2. Kapitel 3, sid Sannolikhetsteori

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

Utfall, Utfallsrummet, Händelse. Sannolikhet och statistik. Utfall, Utfallsrummet, Händelse. Utfall, Utfallsrummet, Händelse

Kap 2: Några grundläggande begrepp

Föreläsning 1, Matematisk statistik för M

Kolmogorovs Axiomsystem Kolmogorovs Axiomsystem Varje händelse A tilldelas ett tal : slh att A inträar Sannolikheten måste uppfylla vissa krav: Kolmog

Sannolikhetsbegreppet

TMS136. Föreläsning 2

Sannolikhetsteori. Måns Thulin. Uppsala universitet Statistik för ingenjörer 23/ /14

S0005M, Föreläsning 2

S0007M Statistik2: Slumpmodeller och inferens. Inge Söderkvist

S0005M. Stokastiska variabler. Notes. Notes. Notes. Stokastisk variabel (slumpvariabel) (eng: random variable) Mykola Shykula

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

Chapter 2: Random Variables

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 1

Föreläsning 1. Grundläggande begrepp

F ξ (x) = f(y, x)dydx = 1. We say that a random variable ξ has a distribution F (x), if. F (x) =

Preschool Kindergarten

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik

Reliability analysis in engineering applications

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

TMS136. Föreläsning 1

TAMS79: Föreläsning 1 Grundläggande begrepp

Matematisk statistik för D, I, Π och Fysiker. Matematisk statistik slumpens matematik. Tillämpningar för matematisk statistik.

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift

{ } { } En mängd är en samling objekt A = 0, 1. Ex: Mängder grundbegrepp 5 C. Olof M C = { 7, 1, 5} M = { Ce, Joa, Ch, Je, Id, Jon, Pe}

Styrteknik: Binära tal, talsystem och koder D3:1

Kombinatorik och sannolikhetslära

Calculate check digits according to the modulus-11 method

SF1901: SANNOLIKHETSTEORI OCH GRUNDLÄGGANDE SANNOLIKHETSTEORI, STATISTIK BETINGADE SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko.

Statistikens grunder HT, dagtid Statistiska institutionen

Institutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014).

EXTERNAL ASSESSMENT SAMPLE TASKS SWEDISH BREAKTHROUGH LSPSWEB/0Y09

Matematisk Statistik och Disktret Matematik, MVE051/MSG810, VT19

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 15 August 2016, 8:00-12:00. English Version

Isometries of the plane

SF1901: SANNOLIKHETSTEORI OCH STATISTIK GRUNDLÄGGANDE SANNOLIKHETSTEORI, BETINGAD SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko.

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Statistisk slutledning (statistisk inferens): Sannolikhetslära: GRUNDLÄGGANDE SANNOLIKHETSLÄRA. Med utgångspunkt från ett stickprov

Sannolikhetslära. 1 Grundläggande begrepp. 2 Likformiga sannolikhetsfördelningar. Marco Kuhlmann

Webbregistrering pa kurs och termin

Hur fattar samhället beslut när forskarna är oeniga?

Discovering!!!!! Swedish ÅÄÖ. EPISODE 6 Norrlänningar and numbers Misi.se

Grundläggande matematisk statistik

Föreläsning G70, 732G01 Statistik A

Tentamen MMG610 Diskret Matematik, GU

STORSEMINARIET 3. Amplitud. frekvens. frekvens uppgift 9.4 (cylindriskt rör)

BOENDEFORMENS BETYDELSE FÖR ASYLSÖKANDES INTEGRATION Lina Sandström


1. Compute the following matrix: (2 p) 2. Compute the determinant of the following matrix: (2 p)

Föreläsning 1: Introduktion

FÖRBERED UNDERLAG FÖR BEDÖMNING SÅ HÄR

Föreläsning 1: Introduktion

samhälle Susanna Öhman

Examples on Analog Transmission

Wittgenstein for dummies Eller hur vi gör det obegripliga begripligt. Västerås 15 februari 2017

3 Grundläggande sannolikhetsteori

Rastercell. Digital Rastrering. AM & FM Raster. Rastercell. AM & FM Raster. Sasan Gooran (VT 2007) Rastrering. Rastercell. Konventionellt, AM

Grafisk teknik IMCDP IMCDP IMCDP. IMCDP(filter) Sasan Gooran (HT 2006) Assumptions:

Information technology Open Document Format for Office Applications (OpenDocument) v1.0 (ISO/IEC 26300:2006, IDT) SWEDISH STANDARDS INSTITUTE

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 2 HT07

7-1 Sannolikhet. Namn:.

F3 SANNOLIKHETSLÄRA (NCT ) För komplementhändelsen A till händelsen A gäller att

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER OM χ 2 -TEST OCH LIKNANDE. Jan Grandell & Timo Koski

Finansiell statistik, vt-05. Sannolikhetslära. Mängder En mängd är en samling element (objekt) 1, 2,, F2 Sannolikhetsteori. koppling till verkligheten

Module 6: Integrals and applications

Adding active and blended learning to an introductory mechanics course

MATEMATIK ARBETSOMRÅDET LIKABEHANDLING Kränkande handlingar, nätmobbning, rasism och genus

Föreläsning 1: Introduktion

Make a speech. How to make the perfect speech. söndag 6 oktober 13

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 31 May 2016, 8:00-12:00. English Version

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 17 August 2015, 8:00-12:00. English Version

1. Varje bevissteg ska motiveras formellt (informella bevis ger 0 poang)

Module 1: Functions, Limits, Continuity

12.6 Heat equation, Wave equation

Kurskod: TAMS11 Provkod: TENB 28 August 2014, 08:00-12:00. English Version

Materialplanering och styrning på grundnivå. 7,5 högskolepoäng

SF1901: SANNOLIKHETSTEORI OCH STATISTIK GRUNDLÄGGANDE SANNOLIKHETSTEORI, KORT OM BESKRIVANDE STATISTIK. Tatjana Pavlenko.

Health café. Self help groups. Learning café. Focus on support to people with chronic diseases and their families

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 12 november 2005, kl

Transkript:

SF1911: Statistik för bioteknik Föreläsning 3. TK 3.11.2017 TK Matematisk statistik 3.11.2017 1 / 53

Probability: What is it? Probability is a number between 0 and 1 that predicts the (relative) frequency of an event. a p. 302 a John Ringo: Fundamental Genetics, Cambridge University Press, 2004, TK Matematisk statistik 3.11.2017 2 / 53

Probability = 1 a certain event, Probability = 1/2 equal chance (perfectly random), Probability =0 an impossible event TK Matematisk statistik 3.11.2017 3 / 53

Probability: What is it? The empirical probability: the histogram of the matchbox data in previous lectures. We assume that nothing changes radically (in the industrial production of matches). The probability of the event 50 the number of matches in a box 53 is taken as the relative frequency of 50 the number of matches in a box 53. TK Matematisk statistik 3.11.2017 4 / 53

Frekvenstabell: grupperade data Table: Frekvenstabell för antal tändstickor i tändsticksaskar. Klass Absolut Relativ frekvens frekvens x n(x) f X (x) = n(x)/35 48 2 0.057 49 4 0.114 50 6 0.171 51 9 0.257 52 6 0.171 53 7 0.20 54 0 0.0 55 1 0.029 S:a 35 100.0 TK Matematisk statistik 3.11.2017 5 / 53

Probability:empirical probability Assume that there is no systematic change in the future industrial production of matchboxes. Then the probability of the event 50 the number of matches in a box 53 is f X (50) + f X (51) + f X (52) + f X (53) = 0.171 + 0.257 + 0.171 + 0.20 0.80 Use the current relative frequencies as probability. p i 0.3 0.2 0.1 48 49 50 51 52 53 54 55 TK Matematisk statistik 3.11.2017 6 / 53

Probability:empirical probability We write now the probability of the event 50 the number of matches in a box 53 sannolikheten för händelsen as P (50 the number of matches in a box 53 ) = 0.80 Then, of course, the probability of a simple event like for example the number of matches in a box = 53 is its relative frequency P ( the number of matches in a box = 53 ) = f X (3) = 0.20 TK Matematisk statistik 3.11.2017 7 / 53

Probability: empirical probability The probability of the event 50 the number of matches in a box 53 P (50 the number of matches in a box 53 ) = 0.80 This is a probability based on observed data. If we assume that nothing changes, that if we receive a new matchbox and check the number of matches in it, there is 80% chance of the event 50 the number of matches 53 occurring. TK Matematisk statistik 3.11.2017 8 / 53

Probability: empirical probability The probability P (50 the number of matches in a box 53 ) = 0.80 was based on checking 35 boxes. The relative frequencies will change if we observe new boxes, but they will stabilize. Here 0.80 is our prediction of the frequency of this event. TK Matematisk statistik 3.11.2017 9 / 53

Probability: theoretical TK Matematisk statistik 3.11.2017 10 / 53

Probability: classical probability To each of the four sides of a tetrahedron there is assigned one of the letters a,t,c,g. All letters are used. We call this the DNA die. We toss the die in the air and note the side that it falls on. a t c g TK Matematisk statistik 3.11.2017 11 / 53

Probability: classical What is the probability of the event a in one toss? All the sides of the tetrahedron are of equal area, and the tetrahedron is balanced. We can freely exchange the letters between the sides and yet we have the same die. The situation is such that we assign the probabilities P(a) = P(t) = P(c) = P(g) = 1 4 to the four possible outcomes of a single toss. In other words, all outcomes of the toss of the die are equally likely. TK Matematisk statistik 3.11.2017 12 / 53

Probability: classical P(a) = P(t) = P(c) = P(g) = 1 4 Then 1/4 is the prediction of the frequency of any nucleotide in a long sequence of tosses of the die. This was based on reasoning about symmetry, not on observed data. TK Matematisk statistik 3.11.2017 13 / 53

Probability: classical We toss the die in the air several times and note the side that side that it falls on. Clearly we can thus produce a random DNA sequence. Such a sequence would seem to lack value for biotechnology. Disregarding that for the moment, we might ask what is the probability of observing the sequence caagt in five tosses of the die, or what is the probability of the event caagt in five tosses. One answer to this question is found in the sequel. a t c g TK Matematisk statistik 3.11.2017 14 / 53

Den klassiska sannolikhetsdefinitionen: det allmänna fallet Antag att vi har m möjliga elementära utfall ω 1,..., ω m, var och en med samma sannolikhet att inträffa, dvs P(ω k ) = 1 m k = 1,..., m. Betrakta en händelse A, A {ω 1,..., ω m }. Antag att A innehåller g (gynnsamma) utfall. Då gäller P(A) = g m. TK Matematisk statistik 3.11.2017 15 / 53

Slumpförsök: tärningskast och P(A) Låt oss säga att vi kastar en tärning, och är intresserade av händelsen {vi får en sexa}. Om det är en hederlig tärning, är den sannolikheten 1 6. Symboliskt kan vi skriva A = {vi får en sexa} och P(A) = 1 6. TK Matematisk statistik 3.11.2017 16 / 53

SANNOLIKHETSKALKYL: allmänna räkneregler för P(A) TK Matematisk statistik 3.11.2017 17 / 53

Slumpförsök (random trial) Allmänna beteckningar Mängden av alla utfall, eller resultat, kallar vi utfallsrummet och betecknar det med Ω. En händelse A är en mängd av utfall, dvs en delmängd av Ω, A Ω. TK Matematisk statistik 3.11.2017 18 / 53

Valet av utfallsrum beror på situationen eller den fråga vi vill studera. Exempel: Ω= de fem miljoner tändsticksaskarna producerade under en given dag. Ω= de 35 miljoner tändsticksaskarna producerade under en sjudagars period. TK Matematisk statistik 3.11.2017 19 / 53

Venndiagram Definition Mängden av alla utfall, eller resultat, kallar vi utfallsrummet och betecknar det med Ω. Ω TK Matematisk statistik 3.11.2017 20 / 53

Venndiagram Definition En händelse A är en mängd av utfall, dvs en delmängd av Ω, A Ω. Ω Α TK Matematisk statistik 3.11.2017 21 / 53

Venndiagram; två händelser Ω Α Β TK Matematisk statistik 3.11.2017 22 / 53

Händelser A B A och B definierade på samma försök. Här är några exempel på vad som kan inträffa, och hur vi matematiskt kan uttrycka detta: Exempel A inträffar, A A och B inträffar eller A snitt B inträffar, A B Ω = {etta, tvåa, trea, fyra, femma, sexa } A = udda antal ögon = {etta, trea, femma }. B = {femma, sexa }, A B = {femma }. TK Matematisk statistik 3.11.2017 23 / 53

Venndiagram A B Ω Β 000 111 000 111 0000 1111 0000 1111 00000 11111 00000 11111 00000 11111 00000 11111 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 00000 11111 0000 1111 000 111 000 111 Α Α B TK Matematisk statistik 3.11.2017 24 / 53

Händelser A B A eller B inträffar eller A union B inträffar, A B Obs! A B betyder att minst en av A eller B inträffar, så A B kan mycket väl inträffa. I matematik betyder eller och/eller! TK Matematisk statistik 3.11.2017 25 / 53

Händelser A B A B betyder att minst en av A eller B inträffar Exempel Ω = {etta, tvåa, trea, fyra, femma, sexa } A = udda antal ögon = {etta, trea, femma }. B = {femma, sexa }, A B = {etta, trea, femma, sexa }. TK Matematisk statistik 3.11.2017 26 / 53

Venndiagram A B Ω Α Β A B TK Matematisk statistik 3.11.2017 27 / 53

Händelsen A c A inträffar inte, A c. (A c ) c = A. Exempel Kast av en tärning Ω = {etta, tvåa, trea, fyra, femma, sexa } A = udda antal ögon = {etta, trea, femma }. A c = { tvåa, fyra, sexa }=jämnt antal ögon. TK Matematisk statistik 3.11.2017 28 / 53

Exempel Ω = {a, t, c, g} A = {a, t}. A c = {c, g}. TK Matematisk statistik 3.11.2017 29 / 53

Venndiagram A c A A c Ω TK Matematisk statistik 3.11.2017 30 / 53

tomma mängden Om A och B utesluter varandra, dvs. omöjligt kan inträffa samtidigt, så säger vi att A och B är disjunkta eller oförenliga, dvs. A B = där är tomma mängden eller den omöjliga händelsen. Ω c = TK Matematisk statistik 3.11.2017 31 / 53

tomma mängden A och B utesluter varandra, dvs. omöjligt kan inträffa samtidigt. Exempel Ω = {etta, tvåa, trea, fyra, femma, sexa } A = {etta, trea, femma }. B = { fyra, sexa }, A B =. TK Matematisk statistik 3.11.2017 32 / 53

Venndiagram; A B = Ω Α Β TK Matematisk statistik 3.11.2017 33 / 53

De Morgans regler Sats A (B C ) = (A B) (A C ) A (B C ) = (A B) (A C ) Sats (A B) c = A c B c TK Matematisk statistik 3.11.2017 34 / 53

De Morgans regler (A B) c = A c B c Exempel Ω = {etta, tvåa, trea, fyra, femma, sexa } A = {etta, trea, femma }. B = {femma, sexa }, A B = { femma } (A B) c = {etta, tvåa, trea, fyra, sexa } A c B c = {tvåa, fyra, sexa } {etta, tvåa, trea, fyra } = {etta, tvåa, trea, fyra, sexa } TK Matematisk statistik 3.11.2017 35 / 53

X = {x 1, x 2,..., x n } med n datapunkter i Ω. n(x) = antalet gånger x förekommer i X. Den relativa frekvensen är f X (x) = n(x) n. Observera att f X (x) = 0 om x inte återfinns bland X. Om A Ω, så är P X (A) = de olika f X (x) x A den relativa frekvensen av A eller den empiriska sannolikheten för A (m.a.p. X ). där f X (x) beräknats utifrån X. TK Matematisk statistik 3.11.2017 36 / 53

Då gäller följande: a) 0 P X (A) 1. b) P X (X ) = 1. c) Om A och B inte innehåller gemensamma värden (är disjunkta), så är P X (A B) = P X (A) + P X (B). TK Matematisk statistik 3.11.2017 37 / 53

Vi tar de ovanstående egenskaperna hos empirisk sannolikhet som allmänna räkneregler: En sannolikhet P är en funktion av händelser, sådan att: (a) 0 P(A) 1; (b) P(Ω) = 1 (c) om A och B är disjunkta händelser, d.v.s. A B =, så gäller P(A B) = P(A) + P(B). (a) och (b) kan ses som en kalibrering så att P stämmer med intuitionen från relativa frekvenser. TK Matematisk statistik 3.11.2017 38 / 53

Räkneregler för sannolikhetskalkyl (1) Sats P(A c ) = 1 P(A). Bevis. Ett mycket formellt bevis, för att illustrera kalkyler enligt (a)-(c) ovan: Eftersom A och A c disjunkta och A A c = Ω, så fås enligt (c) och (b) ovan P(A) + P(A c ) = P(Ω) = 1 P(A c ) = 1 P(A). Då gäller P( ) = 0. TK Matematisk statistik 3.11.2017 39 / 53

Regler för sannolikhetskalkyl (2) Sats P(A B) = P(A) + P(B) P(A B). Bevis. Satsen följer med hjälp av Venn-diagram, och observationen att P(A) + P(B) mäter A B två gånger. TK Matematisk statistik 3.11.2017 40 / 53

Regler för sannolikhetskalkyl (3) Om A B =, så fås P(A B) = P( ) = 0, dvs. P(A B) = P(A) + P(B). Detta följer av det ovan visade Sats P(A B) = P(A) + P(B) P(A B). TK Matematisk statistik 3.11.2017 41 / 53

Example The DNA die again, the events A 1 = {a, t}, A 2 = {c} are mutually exclusive. Also the events {a} and {t} are mutually exclusive. Thus the additive law together with the theoretical probability model from the above gives P(A 1 ) = P({a, t}) = P (a or t) = P(a) + P(t) = 1 4 + 1 4 = 1 2 The additive law gives also P (A 1 A 2 ) = P(A 1 ) + P(A 2 ) = 1 2 + 1 4 = 3 4 TK Matematisk statistik 3.11.2017 42 / 53

In the figure we have 14 (abstract) peas: nine have white flowers, five have red flowers, six have yellow pods, eight have green pods. We compute with classical probability. TK Matematisk statistik 3.11.2017 43 / 53

What is P(green pods or white flowers )? TK Matematisk statistik 3.11.2017 44 / 53

green pods or white flowers means green pods or white flowers or both it is wrong to add to the 8 peas with green pods the 9 peas with white flowers, because then you have counted 5 of the peas twice. P(green pods or white flowers ) = 12 14 = 6 7 TK Matematisk statistik 3.11.2017 45 / 53

In the example above this gives P (A B) = P(A) + P(B) P(A B) P(green pods or white flowers ) = P(green pods ) + P( white flowers ) P(green pods and white flowers ) = 8 14 + 9 14 5 14 = 12 14 = 6 7 TK Matematisk statistik 3.11.2017 46 / 53

Probability: independent events We say that A and B are independent events if P (A B) = P(A) P(B). TK Matematisk statistik 3.11.2017 47 / 53

Example I en stor population har 4% celiaki, d.v.s gluteinintolerans. Du plockar på måfå och oberoende av varandra två individer, a och b. Låt oss beteckna utfallen så att t.ex (1, 0) svarar mot att individ a har celiaki och b har inte o.s.v.. Då är utfallsrummet Vi har att P(1) = 0.04, P(0) = 0.96 Ω = {(0, 0), (1, 0), (0, 1), (1, 1)} (0,1) (0,0) B (1,1) A (1,0) TK Matematisk statistik 3.11.2017 48 / 53

Example a) Vad är sannolikheten för att både a och b har celiaki? Svar: Vi sätter A = {(1, 0), (1, 1)} (d.v.s alla utfallen, där a har celiaki) och B = {(0, 1), (1, 1)} (d.v.s alla utfallen, där b har celiaki). Den sökta sannolikheten är p.g.a. oberoendet P(A B) = P((1, 1)) = P(1)P(1) = 0.04 0.04 = 0.0016. TK Matematisk statistik 3.11.2017 49 / 53

Example continued P(1) = 0.04, P(0) = 0.96 Ω = {(0, 0), (1, 0), (0, 1), (1, 1)} b) Vad är sannolikheten för att minst en har celiaki? Svar 1: Den sökta sannolikheten är P(A B) = P(A) + P(B) P(A B). P(A) = P((1, 0)) + P((1, 1)) = P(1)P(0) + P(1)P(1) = 0.04 0.96 + 0.0016 = 0.04 Vi har att P(B) = P(A). Den sökta sannolikheten är p.g.a. oberoendet P(A B) = 0.04 + 0.04 0.0016 = 0.0784. TK Matematisk statistik 3.11.2017 50 / 53

Example continued Svar 2: (A B) c = A c B c = {(0, 0)}. Den sökta sannolikheten är P(A B) = 1 P((0, 0)) = 1 0.96 0.96 = 0.0784. TK Matematisk statistik 3.11.2017 51 / 53

Example continued c) Ingen har celiaki? Svar: P((0, 0)) = P(0)P(0) = 0.9216 eller P((0, 0)) = 1 P(A B) = 1 0.0784 = 0.9216. d) Precis en av a och b har celiaki? Svar: Med mängdoperationer svarar händelsen precis en av a och b har celiaki mot (A B c ) (A c B), en union av två disjunkta händelser. Detta ger P((0, 1)) + P((1, 0)) = P(0)P(1) + P(1)P(0) = 2 0.04 0.96 = 0.0768 TK Matematisk statistik 3.11.2017 52 / 53

Probability: classical The probability of the event caagt in five tosses. We assume independent tosses of the DNA die. P(caagt) = P(c) P(a) P(a) P(g) P(t) = 1 4 1 4 1 4 1 4 1 4 = 1 4 5 = 0.0009. a t c g TK Matematisk statistik 3.11.2017 53 / 53