3. Matematisk statistik 3.. Grundläggande begrepp I den här föreläsningen kommer vi att definiera och exemplifiera ett antal begrepp som sedan kommer att följa oss genom hela kursen. Det är därför av största vikt att memorera dem och lära sig vad de står för. Med ordet statistik kan menas dels data eller uppgifter som ofta sammanställs i numerisk form, vanligen i tabeller eller diagram som vetenskapen om hur dessa uppgifter skall samlas in, analyseras och presenteras. som vetenskapen, som en del av den tillämpade matematiken, där man studerar slumpmässiga förändringar. Grundläggande för statistik som en vetenskap är sannolikhetslära, som den största delen av kursen kommer att handla om. Exempel. Från filen heartstat.txt saxar vi dessa två rader 44 4 24 80 40 70 254 65 78 86 84 0 35 5 0 70 4 74 240 209 85 98 84 0 data från två av totalt 200 män, med variabler enligt tabellen nedan: Ålder när testerna startades 2 Utbildning (=Hög... 5=Låg) 3 Systoliskt blodtryck (övre trycket) 4 Diastoliskt blodtryck (undre trycket) 5 Systoliskt blodtryck 0 år senare 6 Diastoliskt blodtryck 0 år senare 7 Kolesterol 8 Kolesterol 0 år senare 9 Längd i cm 0 Vikt i kg Håkan Strömberg KTH Syd
3.. MATEMATISK STATISTIK Puls (slag/minut) 2 =Har haft hjärtinfarkt, 0=Har ej haft hjärtinfarkt Frågan är nu hur vi kan presentera och analysera dessa uppgifter. Finns det några samband? Även om vi aldrig kan bevisa dessa samband, kan vi kanske påstå att de till ett viss sannolikhet är sanna. 3..2 Medelvärde Låt n beteckna antalet observationer i ett material, där x,x 2,...x n är observationernas värden. Det aritmetiska medelvärdet, m, bestäms då, som alla redan känner till, genom x = n x i n medelvärdet tillhör kategorin lägesmått i= 3..3 Median Ett annat välkänt lägesmått är median md, som definieras som det mittersta värdet i ett material efter att det sorterats i storleksordning. Detta fungerar bra då antalet observationer n, är udda. Då däremot n är jämt bestämmer man md genom medelvärdet av de två mittersta observationerna. Exempel 2. Bestäm genom huvudräkning m och md för 4,7,3,0,6,5,9,, 5 md = 5 liksom m = 5. Att de lika är här en tillfällighet. Hos,2,002 är md = 2 och m = 335. Skillnad så det räcker! 3..4 Variationsbredd Variationsbredden tillhör kategorin spridningsmått R, som också är det enklaste i denna kategori. Helt enkelt skillnaden mellan det största och minsta observationsvärdet. 3..5 Varians Till de vanligaste spridningsmått en hör varians som definieras s 2 = n n (x i x) 2 i= Håkan Strömberg 2 KTH Syd
Man summerar alltså kvadraterna på skillnaden mellan observationsvärdena och medelvärdet. Om observationsvärdena ligger nära medelvärdet är variansen mindre än om de är utspridda på båda långt från medelvärdet. Varför man dividerar med n i stället för n får bli en hemlighet så länge. 3..6 Standardavvikelse Om observationsvärdena mäts i cm, variansen dimensionen cm 2, vilket kan kännas lite märkligt. Av den anledningen så definieras spridningsmåttet standardavvikelsen som s = n (x i x) n 2 I och med detta får vi ett mått i samma dimension som observationsvärdena. Exempel 3. Om man ska skriva ett program som bestämmer variansen s 2 för ett material kan man först tro att man måste går igenom observationerna två gånger. Första gången för att bestämma medelvärdet och andra för att till slut bestämma variansen. Men... n i= (x i x) 2 = n ( i= x 2 i 2x i x + x 2) = n i= x2 i 2x n i= x i + n x 2 = n i= x2 i 2x nx + n x2 = n i= x2 i n ( n i= x i) 2 Vår nya och effektivare formel för varians får alltså följande utseende ( s 2 = n x 2 i n n ) 2 x i n i= Så här kommer funktionen att ta sig ut i C: i= double varians(double a[ ],int n){ 2 double s=0,ks=0; 3 int i; 4 for(i=0;i<n;i++){ 5 s+=a[i]; 6 ks+=a[i] a[i]; 7 } 8 return (ks s s/n)/(n ); 9 } i= 3..7 Frekvenstabell Genom en frekvenstabell får man en klarare överblick av en serie observationsvärden än över själva listan av värden. Denna tabell över absoluta frekvenser Längd (y i ) 57 60 63 65 68 70 73 75 78 80 83 85 88 Antal (f i ) 3 4 2 35 26 27 26 22 9 9 6 Håkan Strömberg 3 KTH Syd
3.. MATEMATISK STATISTIK innehåller precis lika mycket information som denna tabell över rådata, speciellt då ordning här saknar betydelse 78 85 73 73 73 78 73 70 68 70 75 73 68 88 65 88 78 75 75 68 80 75 75 75 78 80 73 70 73 85 75 70 80 78 73 73 80 75 75 70 73 68 68 65 73 75 85 80 83 78 65 75 80 70 73 78 70 73 75 57 68 70 78 73 68 70 70 65 70 70 75 88 70 68 75 73 78 75 70 68 78 78 65 68 70 70 68 70 63 83 75 78 88 65 75 63 60 75 60 73 70 78 75 70 73 80 80 80 75 80 83 65 70 80 78 80 80 78 85 88 70 85 68 80 68 65 68 70 73 78 68 83 68 68 73 73 65 70 80 78 70 80 75 80 75 70 80 78 78 85 78 85 80 75 68 70 65 68 70 75 70 73 70 83 83 80 68 65 75 70 73 80 60 83 80 78 78 85 70 73 68 63 75 73 78 83 70 78 70 73 75 83 85 63 73 78 70 78 88 70 Om vi betecknar de k olika observationsvärdena med y i i =... k och antalet förekomster av detta med f i i =... k kan vi skriva en ny formel för medelvärdet m = n k f i y i i= Vi kan också skriva formeln för varians med hjälp av y i och f i. Speciellt om vi använder oss av den senare effektiva formeln ( s 2 = n f i y 2 i n n ) 2 f i y i n i= Ibland presenterar man en frekvenstabell med relativa frekvenser uttryckta i procent Längd 57 60 63 65 68 70 73 75 78 80 83 85 88 Rel frekv 0.5.5 2.0 5.5 0.5 7.5 3.0 3.5 3.0.0 4.5 4.5 3.0 Det största värdet f i i en frekvenstabell kallas typvärde. i= 3..8 Stolpdiagram En frekvenstabell kan framställas grafiskt som ett stolpdiagram Var och en av de k olika y i observationsvärdena ger upphov till en stolpe med en höjd som motsvarar dess f i 3..9 Klassindelning Antalet olika observationsvärden, y i, vi exemplifierat med ovan, har hela tiden varit litet. Då antalet olika observationsvärden ökar, ökar också frekvenstabellens längd och antalet stolpar i stolpdiagrammet. Troligtvis minskar samtidigt f i och vi får en mängd korta stolpar. För att behålla överblicken tvingas man då slå samman flera observationsvärden till en klass. Man kallar detta att klassindela materialet. Samtidigt måste man då vara medveten Håkan Strömberg 4 KTH Syd
35 30 25 20 5 0 5 57606365687073757880838588 Figur 3.: En frekvenstabell i grafisk form om att man tappar information. En klass har två klassgränser, som utgör ett intervall. Talet i mitten av intervallet kallas klassmitt. Bestämmer man sig för för många klasser närmar man sig den situation som fick en att lämna stolpdiagrammet. För få klasser däremot innebär att för mycket information går förlorad. 3..0 Histogram När man presenterar data genom ett histogram, får man en uppfattning om både medelvärde och spridning. Stapelns höjd bestäms av antalet män med längden i intervallet 60 50 40 30 20 0 60 65 70 75 80 85 90 Figur 3.2: Längden hos 200 män [x...x + 5]. Antalet intervall i vilket materialet indelas avgör graden av användbarhet. 200 50 00 50 50 00 50 200 Figur 3.3: Ett intervall är förstås meningslöst Håkan Strömberg 5 KTH Syd
3.. MATEMATISK STATISTIK 35 30 25 20 5 0 5 60 65 70 75 80 85 Figur 3.4: Ett intervall per cm visar att mätningarna inte gjorts speciellt noggrant, eftersom flera intervall är tomma. 3.. Kvartiler 0.5 0.4 0.3 0.2 0. -0. -3-2 - 0 2 3 Kartil Kartil 4 Figur 3.5: Kvartilerna delar ett sorterat datamaterial i fyra lika delar. En fjärdedel av observationerna är mindre än första kvartilen Q (undre kvartilen) och tre fjärdedelar är mindre än den tredje kvartilen Q3 (övre kvartilen). Den andra kvartilen är samma sak som medianen (md) Maple Med funktionen histogram kan man ordna histogram i Maple with(stats); with(stats[statplots]); data:=[...]; histogram(data,color=cyan,numbars=6,area=) numbars anger antalet intervall. Problem. Konstruera två serier med vardera 5 observationsvärden, där md = m men där serierna ändå är olika. Håkan Strömberg 6 KTH Syd
Problem 2. Med hjälp av with(randomtools); langd:=generate(list(distribution(normal(80,2)),200)); kan man generera normalfördelade slumptal med medelvärdet 80 och standardavvikelsen 2. Upprätta ett histogram med 0 röda staplar som presenterar resultatet. Svar. with(randomtools); langd:=generate(list(distribution(normal(80,2)),200)); histogram(langd,color=red,numbars=0,area=) Håkan Strömberg 7 KTH Syd
4.2. DISKRET SANNOLIKHETSLÄRA 4.2 Diskret sannolikhetslära 4.2. Utfallsrum och händelser Vi ska här studera slumpmässiga försök med ändligt många utfall, resultat. Mängden av utfall kallas försökets utfallsrum. Varje delmängd av utfallsrummet kallas en händelse. Exempel. A) Försöket att kasta en tärning har sex utfall, vilka vi kan beteckna,2,3,4,5,6. Utfallsrummet är mängden U = {,2,3,4,5,6} Här är några exempel på händelser och beskrivningar av dem: a) {6} man får en sexa b) {5,6} man får en femma eller en sexa c) {,3,5} man får ett udda poängantal d) {,2,3,4,5} man får inte en sexa B) Försöket att kasta två häftstift har fyra utfall. Exempelvis kan det första häftstiftet lägga sig med spetsen uppåt och det andra med spetsen nedåt. Detta utfall kan vi beteckna U och N, och utfallsrummet blir: Som exempel på händelser väljer vi: {UU,UN,NU,NN} {UU} båda stiften lägger sig med spetsen uppåt {UN,NU} de båda stiften lägger sig på olika sätt Håkan Strömberg 8 KTH Syd
4.2.2 Sannolikheter Exempel 2. En tärning, som inte är massiv utan har asymmetriskt placerade hålrum, har sidorna märkta a,b,c,d,e och f. Att kasta denna tärning på golvet från en viss höjd är ett slumpmässigt försök med utfallsrummet {a, b, c, d, e, f}. Försöket utfördes 500 gånger, och de relativa frekvenserna för de sex utfallen bestämdes efter 0, 20, 30,..., 500 kast. Efter 500 kast var resultaten följande: (N = 500) 0.6 a b c d e f f 22 68 40 48 6 7 f/v 0.442 0.336 0.080 0.096 0.02 0.034 0.5 0.4 0.3 0.2 0. 00 200 300 400 500 Figur 4.6: Figur 8.30 visar hur de relativa frekvenserna stabiliserades då antalet försök växte. De olika utfallen kan tillordnas vissa sannolikheter. Som approximationer till dessa använder vi (i brist på längre försöksserier) de relativa frekvenserna i tabellen på föregående sida, avrundade till två decimaler: Utfall a b c d e f Sannolikhet 0.44 0.34 0.08 0.0 0.0 0.03 Observera att dessa sannolikheter ligger i intervallet [0,] och har summan. Nu kan vi beräkna sannolikheten för en godtycklig händelse i försöket. Som exempel väljer vi A = {a,b,c} det vill säga händelsen att antingen sidan a, sidan b eller sidan c kommer upp. I försöksserien var relativa frekvensen för denna händelse 22 + 68 + 40 500 0.44 + 0.34 + 0.08 = 0.86 Vi tillordnar därför händelsen A sannolikheten 0.86, det vill säga summan av sannolikheterna för de utfall a, b och c som händelsen består av. Håkan Strömberg 9 KTH Syd
4.2. DISKRET SANNOLIKHETSLÄRA Vi betraktar nu allmänt ett slumpmässigt försök med ändligt många utfall Dessa utfall tillordnar vi vissa sannolikheter u,u 2,...,u n p,p 2,...,p n Sannolikheterna skall vara tal i intervallet [0,], och de skall ha summan : 0 p k p + p 2 +... + p n = Att sannolikheterna skall uppfylla dessa villkor är naturligt. Som approximationer till sannolikheterna kan vi nämligen liksom i exemplet använda de olika utfallens relativa frekvenser i en lång försöksserie, och dessa relativa frekvenser är ju tal i intervallet [0,] och har summan. Sannolikheterna p,p 2,...,p n kallas försökets elementarsannolikheter. Med hjälp av dem kan man definiera sannolikheten för vilken som helst händelse A i försöket. Denna sannolikhet betecknas P(A) och definieras på följande sätt: P(A) är summan av elementarsannolikheterna för alla utfallen i händelsen A. Om till exempel A = {u 2,u 3,u 5,u 7 }, så är alltså P(A) = p 2 + p 3 + p 5 + p 7 4.2.3 Likformig sannolikhetsfördelning För att bestämma elementarsannolikheterna i ett försök måste man i allmänhet utföra försöket ett stort antal gånger och bestämma relativa frekvenserna för de olika utfallen. I vissa försök, särskilt sådana som har med hasardspel att göra, finns det dock en sådan symmetri mellan utfallen att man omedelbart kan sluta sig till att samtliga elementarsannolikheter är lika. Sådana försök sägs ha likformig sannolikhetsfördelning. Antag att ett försök med n utfall har likformig sannolikhetsfördelning. Eftersom elementarsannolikheterna är lika och har summan, så är var och en av dem lika med n. Sannolikheten P(A) för en händelse A är summan av elementarsannolikheterna för utfallen i händelsen. Om A består av g utfall så gäller alltså P(A) = g n = g n Sannolikheten är alltså lika med kvoten av antalet för händelsen gynnsamma utfall och totala antalet utfall. Då sannolikhetsläran började utvecklas i mitten av 600-talet, använde man denna beskrivning som definition av en händelses sannolikhet, och den kallas därför den klassiska sannolikhetsdefinitionen. Observera att den endast kan användas för försök som har likformig sannolikhetsfördelning. Håkan Strömberg 0 KTH Syd
Exempel 3. Andersson har en rutig keps, Pettersson en prickig och Lundström en blommig. De tre kepsarna, som för övrigt är lika, ligger på en hylla i en mörk korridor. Andersson, Pettersson och Lundström tar på måfå var sin keps. Vilken är sannolikheten att ingen får rätt keps? Lösning: De tre kepsarna kan lämpligen betecknas med ägarnas initialer, det vill säga med A,P och L. Som utfall kan man välja de sex permutationerna APL,ALP,PAL,PLA,LAP,LPA där bokstäverna i en permutation i ordning anger vilken keps Andersson, Pettersson respektive Lundström får. Tydligen får ingen rätt keps i två av dessa utfall, nämligen PLA och LAP. Den sökta sannolikheten är alltså: g n = 2 6 = 3 Om ett försök har ett litet antal utfall, så kan talen g och n bestämmas genom att man liksom i ovanstående exempel skriver upp samtliga utfall. Om antalet utfall är någorlunda stort, så får man däremot använda sig av formler från kombinatoriken. Exempel 4. Ur en kortlek dras på måfå fem kort. Vilken är sannolikheten att alla fem är? Lösning: En kortlek innehåller som bekant 52 kort varav 3 är. Försöket att dra 5 kort bland 52 har ( 52 5) = 2598960 utfall. Om de fem korten alla skall vara, så måste de väljas bland de 3 -korten i leken, vilket kan ske på ( 3 5) = 287 sätt. Den sökta sannolikheten är alltså: ( 3 ( 5) 3 2 0 9 52 ) = 52 5 50 49 48 = 33 66640 2000 5 4.2.4 Egenskaper hos sannolikheter Antag att ett slumpmässigt försök har utfallsrummet U = {u,u 2,u 3,...,u n } Sannolikheten för en händelse A är summan av elementarsannolikheterna för de utfall A består av. Eftersom samtliga elementarsannolikheter är icke-negativa och har summan, så gäller 0 P(A) Varje delmängd av utfallsrummet, alltså även den tomma mängden och U självt, är en händelse. är försökets omöjliga händelse (inget utfall inträffar), och U är försökets säkra händelse (något av utfallen inträffar). Man inser omedelbart att P( ) = 0 P(U) =. Om A och B är händelser, så är A B och A B händelser. Håkan Strömberg KTH Syd
4.2. DISKRET SANNOLIKHETSLÄRA Exempel 5. Antag att Då är och A = {u,u 2,u 3,u 4 } B = {u 3,u 4,u 5,u 6,u 7 } A B = {u,u 2,u 3,u 4,u 5,u 6,u 7 } A B = {u 3,u 4 } Om elementarsannolikheterna betecknas p,p 2,p 3,...,p n så gäller P(A B) = p + p 2 + p 3 + p 4 + p 5 + p 6 + p 7 = (p + p 2 + p 3 + p 4 ) + (p 3 + p 4 + p 5 + p 6 + p 7 ) (p 3 + p 4 ) = = P(A) + P(B) P(A B) A B är händelsen A eller B, det vill säga A eller B eller eventuellt både A och B inträffar A B är händelsen A och B, det vill säga både A och B inträffar. Med samma resonemang som i exemplet kan man visa att följande formel gäller: Den kallas sannolikhetslärans additionssats. P(A B) + P(A) + P(B) P(A B) Om A B = så sägs händelserna A och B vara uteslutande. I detta fall har A och B inget gemensamt utfall, och de kan alltså inte inträffa samtidigt. I ett tärningskast är till exempel de båda händelserna att få en sexa och att få ett udda poängantal uteslutande, ty det finns inget utfall som gör att båda händelserna inträffar. Eftersom P(A B) = P( ) = 0, så förenklas additionssatsen i fallet med uteslutande händelser till P(A B) = P(A) + P(B) Med komplementhändelsen A till en händelse A menas den händelse, som består av alla de utfall i U som inte tillhör A. Komplementhändelsen A är alltså den händelse som består i att A inte inträffar. Eftersom A och A inte har något gemensamt utfall och tillsammans omfattar alla utfallen i U, så gäller: P(A) + P( A) = P(A A) = P(U) =, P( A) = P(A) Exempel 6. Vid kast med en symmetrisk tärning har händelsen att få en sexa sannolikheten /6. Komplementhändelsen att inte få en sexa har sannolikheten 6 = 5 6 Håkan Strömberg 2 KTH Syd
Exempel 7. Man kastar samtidigt en röd och en svart tärning. Beräkna sannolikheterna för följande händelser: A en sexa på den röda tärningen B en sexa på den svarta tärningen C minst en sexa D ingen sexa Lösning: Som utfallsrum väljs mängden av alla talpar (r,s) där r och s anger poängantalet på den röda respektive svarta tärningen. Denna mängd består av 36 element, och dessa kan åskådliggöras med de vita rutorna i figur 4.7. Vi antar att alla elementarsannolikheterna är /36. Figur 4.7: Händelserna A, B och A B består av 6,6 respektive utfall, och alltså gäller: P(A) = P(B) = 6 36 = 6 P(A B) = 36 Händelsen minst en sexa innebär en sexa på endera eller båda tärningarna. Alltså är C = A B, och P(C) = P(A B) = P(A) + P(A) P(A B) = 6 + 6 36 = 36 Händelsen ingen sexa är komplementhändelse till minst en sexa. Alltså är D = C, och P(D) = P( C) = P(C) = 36 = 25 36 Definition. Två händelser A och B sägs vara disjunkta om de inte kan inträffa samtidigt. Sats. Multiplikationsprincipen. Om man skall göra k operationer, varvid den första kan utföras på n sätt, den andra på n 2 sätt och så vidare, så är totala antalet sätt att göra de k opertaionerna n n 2 n 3... n Håkan Strömberg 3 KTH Syd
4.2. DISKRET SANNOLIKHETSLÄRA Figur 4.8: 4.2.5 Urnmodellen Vi tänker oss en urna innehållande v vita och s svarta kulor. Efter blandning dras n kulor, en i taget, och färgen noteras. Hur stor är sannolikheten att man får x vita kulor? Svaret beror på om vi använder oss av återläggning Dragning utan återläggning Sannolikheten att man får x vita kulor är (v )( s ) x n x ) ( v+s n Exempel 8. Ur en urna med 3 vita och 4 svarta kulor drar man två kulor utan återläggning. Beräkna sannolikheten att man får en kula av varje färg. Händelse A. )( 4 ) P(A) = ( 3 ( 7 ) = 4 7 2 Exempel 9. Ur ett parti om 0 apparater tar man ut 3 apparater. Beräkna sannolikheten att det bland de uttagna finns 0,,2,3 stycken med fabrikationsfel, om det i hela partiet finns 4 felaktiga apparater. 3 felaktiga 2 felaktiga felaktig 0 felaktiga ( 7 )( 3 0 ( 3) 0 ) = 20 3 ( 7 )( 3 2) ( 0 ) = 2 20 3 ( 7 )( 3 2 ) ( 0 ) = 63 20 3 ( 7 )( 3 3 0) ( 0 ) = 35 20 3 Håkan Strömberg 4 KTH Syd
Dragning med återläggning Sannolikheten att man får x vita kulor är ( n x Använder vi beteckningarna p = framöver )( v v + s v v+s och q = ( n x ) x ( ) s n x v + s s v+s ) p x q n x får vi ett uttryck som återkommer Exempel 0. Ur en urna med 3 vita och 4 svarta kulor drar man två kulor med återläggning. Beräkna sannolikheten att man får en kula av varje färg. Händelse A. ( ) 2 3 P(A) = 4 2 = 24 7 7 49 Exempel. Adam kastar en boll mot ett mål. Sannolikheten att han ska träffa är 4. Hur många kast måste han göra för att sannolikheten för minst en träff ska vara p > 0.9? Sannolikheten för ingen träff efter n kast är ( n p = 0 )( 4 ) 0 ( ) 3 n 4 p är den eftersökta sannolikheten, minst en träff Svar: 9 kast Antal kast 2 5 7 8 9 p 0.25 0.4375 0.762695 0.86656 0.899887 0.92495 Exempel 2. Vid genomgång av den närmaste släkten kom Adam fram till att 5% av släktingarna var rödhåriga (A). Dessutom fick han fram att 48% var kvinnor (B). Bestäm sannolikheten att en slumpmässigt vald släkting är en icke rödhårig man Först bestämmer vi sannolikheten för både rödhårig och kvinna P(A B). P(A B) = P(A) + P(B) P(A B) P(A B) = 0.05 + 0.48 0.05 0.48 = 0.506 Komplementhändelsen är P(A B) = 0.506 = 0.494 Exempel 3. Vid tillverkning av en viss typ av byggelement kan två slags fil A och B uppkomma hos de tillverkade enheterna. Man vet att P(A) = 0., P(B) = 0.2 och P(A B) = 0.05. Beräkna sannolikheten att en tillverkad enhet har a) åtminstone något av felen b) felet A men inte felet B c) felet B men inte felet A d) exakt ett av felen e) inget av felen Med hjälp av ett Venn-diagram får vi enkelt svar på frågorna Håkan Strömberg 5 KTH Syd
4.2. DISKRET SANNOLIKHETSLÄRA Figur 4.9: 4.2.6 Oberoende och icke oberoende händelser Exempel 4. Ett försök består i att man samtidigt kastar en tändsticksask och ett mynt. Vi gör följande antaganden: A är händelsen plånsida på asken, P(A) = 0.2. B är händelsen klave på myntet, P(B) = 0.5. Om man utför detta försök n gånger, där n är ett stort tal, så bör A inträffa i ungefär 0.2n kast. Eftersom händelsen plånsida på asken inte rimligtvis kan påverka händelsen klave på myntet, så bör i dessa 0.2n kast händelsen B inträffa ungefär 0.5 0.2n gånger. Händelsen A B, det vill säga både plånsida och klave, har därför en relativ frekvens på 0.5 0.2. Det är då rimligt att anta att Om för två händelser A och B gäller att P(A B) = 0.2 0.5 = P(A)P(B) P(A B) = P(A)P(B) så sägs händelserna vara oberoende. Exemplet ovan visar att denna definition stämmer med vår intuitiva uppfattning om att två händelser är oberoende. Tre eller flera händelser sägs vara oberoende, om varje snitt av två eller flera av händelserna har en sannolikhet, som är lika med produkten av sannolikheten för de händelser som ingår i snittet. Exempel 5. Fyra symmetriska tärningar kastas på en gång. Vilken är sannolikheten att man får åtminstone en sexa? Lösning: Låt A,B,C och D beteckna händelserna att tärning nr,2,3 respektive 4 inte ger en sexa. Dessa händelser är oberoende, och var och en av dem har sannolikheten 5/6. Händelsen A B C D är komplementhändelse till händelsen åtminstone en sexa, varför den sökta sannolikheten är: ( ) 5 4 P(A B C D) = P(A)P(B)P(C)P(D) = 0.58 6 Håkan Strömberg 6 KTH Syd
Figur 4.0: 4.2.7 Betingad sannolikhet Om A och B är händelser och om P(A) > 0 så kallas kvoten P(B A) = P(A B) P(A) för den betingade sannolikheten för B om A har inträffat. Antag att A och B är två händelser, som i figur 4.0, som har ett utfallsrum U, (A B) med n = 7 utfall. Antag också att sannolikhetsfördelningen är likformig. Händelserna A B och A består av 4 respektive 0 utfall, så gäller: P(A B) = 4 7 = 0 7 4 0 = P(A) 4 0 Om vi inför beteckningen P(A B) = 4/0, så kan detta skrivas: P(A B) = P(A)P(A B) P(A B) är kvoten av antalet utfall i A, vid vilka även B inträffar, och totala antalet utfall i A. Man kallar därför P(A B) den betingade sannolikheten för B då A inträffat. Även om sannolikhetsfördelningen inte är likformig kan man definiera P(A B) så att likheten ovan gäller. En jämförelse med formeln P(A B) = P(A)P(B) visar att händelserna A och B är oberoende, om och endast om P(A B) = P(B). För snitt av tre eller flera händelser gäller analoga formler. Så till exempel är P(A B C) = P(A)P(A B)P(AB C) där P(AB C) är den betingade sannolikheten för C, då A och B inträffat. Exempel 6. Ur en kortlek väljer man på måfå ut tre kort. Vilken är sannolikheten att alla tre är? Lösning: Låt A, B och C beteckna händelserna att det första, andra respektive tredje valda kortet är ett. Då är P(A) = 3/52. Då A inträffat finns det 5 kort i leken, och 2 av dessa är. Alltså är P(A B) = 2/5. På samma sätt inses att P(AB C) = /50. Den sökta sannolikheten är alltså: P(A B C) = 3 52 2 5 50 = 850 0.03 Håkan Strömberg 7 KTH Syd
4.2. DISKRET SANNOLIKHETSLÄRA Exempel 7. En församling innehåller 6 socialister och 4 borgerliga ledamöter. Man väljer slumpmässigt 5 personer till en styrelse. Vad är sannolikheten att man får en styrelse med borgerlig majoritet? Låt A i betyda att det väljs i borgare. A 3,A 4 och A 5 är disjunkta händelser. P(borgerlig majoritet) = P(A 3 ) + P(A 4 ) + P(A 5 ) = ( 4 )( 6 ( 4 )( 6 ( 4 )( 6 3 P(A 3 ) + P(A 4 ) + P(A 5 ) = ( 2) 4 30 + ( ) 5 30 + ( 0) 30 ) = 5) 5) 3 26 0.433 5 Exempel 8. Ett varuparti om 00 enheter innehåller 6 stycken defekta. En köpare tar på måfå (utan återläggning) ut 5 enheter och undersöker dem. Köparen accepterar partiet om högst en enhet i urvalet är defekt. Vilken är sannolikheten att köparen accepterar partiet? Sannolikheten att händelse A, köparen accepterar partiet, är ) P(A) = g ( 94 ( 5) + 94 6 4)( n = ) 0.972 ( 00 5 4.2.8 Maple I de flesta av dagens laborationsuppgifter gäller det att simulera slumpmässiga försök till det behöver vi slumptal, ibland heltal i ett givet intervall och ibland flyttal x i intervallet 0 x < Bland uppgifterna finner du klassiska sannolikhetsproblem, som alla kan lösas teoretiskt. Ibland går dock teorin utanför denna kurs och ibland är den mer elementär. Detta spelar nu ingen roll eftersom du ska lösa problemen genom simulering med hjälp av C eller Maple Meningen är att du på det sättet ska upptäcka att simulering är ett kraftfullt verktyg där man ofta kommer mycket nära sanningen. Det finns nämligen gott om andra problem där man är helt utlämnad till datorsimuleringar på grund av att en teoretisk lösning är för komplicerad eller omöjlig. roll := rand(..6); roll(); Ska vi till exempel kasta en tärning deklarerar vi en rad liknande den första ovan. För att generera ett tärningskast anropar vi funktionen roll(). Kommandot rand kan ta emot ett intervall mellan vilka slumptalen ska ligga. Anger man enbart ett tal som parameter slumptal:=rand(n) får man ett tal i intervallet 0...n. När vi vill ha ett flyttal x i intervallet 0 x <. Genom att Håkan Strömberg 8 KTH Syd
slump := evalf(rand(000000000)/000000000); slump(); 0.06989630 Vill man ha en slumpmässig permutation av elementen i en lista använder man randperm. with(combinat) randperm([$..52]); [2,7,5,40,25,38,37,39,26,4,4,20,52,6,27,28,8,44,2,35, 47,5,2,32,8,49,23,,5,33,0,45,42,9,6,36,30,3,48,29,,7,43,4,24,22,50,9,46,34,3,3] randperm([3,6,9,32]); [6,32,3,9] När man anropar en av funktionerna ovan kan man inte förutsäga vilket resultat som kommer att erhållas. Ibland när man utvecklar simuleringsprogram, som inte riktigt fungerar som de ska kan det vara frustrerande att vid varje körning få olika serier av slumptal. Vill man använda samma serie kan man ordna det med hjälp av randomize. Se exemplet nedan. Seed:=randomize(); Seed := 768748 rand(); 284656786337 rand(); 79537833285 randomize(seed); 768748 rand(); 284656786337 Så gör man i C Satsen a=rand()%00 tilldelar a ett slumpmässigt heltal i intervallet 0...99. Ett tärningskast t erhålles till exempel genom t=rand()%6+. I några av uppgifterna är det mera lämpligt att arbeta med slumptal s, 0 s <. Dessa kan till exempel skapas genom satsen a=(float)rand()/32768; Talet 32768 är valt så därför att i de flesta C-miljöer är 32767 det största slumptal man kan få genom rand(). För att olika körningar av ditt program ska ha chansen att ge olika resultat kan du använda funktionen srand(time(0)), som du ska se till att den exekveras endast en gång under körningen. Placera den lämpligen som första sats i programmet. Håkan Strömberg 9 KTH Syd
4.2. DISKRET SANNOLIKHETSLÄRA Blandning av vektor i C I några av uppgifterna behöver man blanda talen i en array. För detta lämnar vi här en funktion som sköter jobbet. Genom att först placera talen till 52 i arrayen lek och sedan anropa blanda har en blandning av kortleken åstadkommits. #include <stdio.h> 2 #include <conio.h> 3 void blanda(int a[ ],int n){ 4 int k,tmp,plats; 5 for(k=0;k<n;k++){ 6 plats=rand()%(n k)+k; 7 tmp=a[k]; 8 a[k]=a[plats]; 9 a[plats]=tmp; 0 } } Problem 3. Ett kort dras ur en kortlek, och man antecknar kortets färg. Detta försöks utfallsrum kan skrivas: {,,, } Beskriv i ord följande händelser: a { } b {, } c {,, } Problem 4. Vi kastar en tärning. Skriv upp de händelser som består i att man får a 3 poäng b inte 3 poäng c minst 3 poäng d högst 3 poäng Problem 5. Man kastar tre häftstift a Skriv upp detta försöks utfallsrum med användande av beteckningarna U och N b Skriv upp den händelse som består i att alla tre stiften lägger sig på samma sätt. c Skriv upp den händelse som består i att två stift lägger sig med spetsen uppåt och ett med spetsen nedåt. Problem 6. Att tippa en fotbollsmatch på en stryktipskupong är ett slumpmässigt försök vars utfallsrum kan skrivas {, X, 2}. Skriv på lämpligt sätt upp utfallsrummet till försöket att tippa två av matcherna på kupongen. Håkan Strömberg 20 KTH Syd
Problem 7. Att gissa fyra gåtor är ett slumpmässigt försök som exempelvis har utfallet FRRF, det vill säga man gissar fel på första gåtan, rätt på den andra och så vidare a Hur många utfall har detta försök? b Skriv upp händelsen att man gissar rätt på precis tre av gåtorna. Problem 8. Att välja ut två kort ur en väl blandad kortlek är ett slumpmässigt försök. a Hur många utfall har detta försök? b I hur många av utfallen är båda korten äss? c I hur många av utfallen är det första kortet ett äss men inte det andra? Problem 9. Antag att elementarsannolikheterna vid kast med en inte alldeles symmetrisk tärning är följande: Utfall 2 3 4 5 6 Sannolikhet 0.5 0.6 0.6 0.7 0.8 0.8 Beräkna sannolikheterna för följande händelser: a A = {5,6}, antingen en femma eller en sexa b B = {, 2, 3} högst poängantalet 3 c C = {,2,3,4,5} inte en sexa Problem 0. En hand i bridge består av 3 kort. Att räkna antalet äss i en sådan hand är ett försök med följande utfall och elementarsannolikheter Utfall 0 2 3 4 Sannolikhet 0.304 0.439 0.23 0.04 0.003 Beräkna sannolikheten för att en slumpvis given hand har a åtminstone ett äss, det vill säga,2,3 eller 4 äss b minst 2 äss c mer än 2 äss. Problem. Antag att en person spelar bridge en kväll varje vecka och i genomsnitt 5 partier per kväll. Ungefär hur många gånger under ett år bör det inträffa att han får en hand med a 4 äss b minst 3 äss c inget äss Bestäm sannolikheterna för dessa händelser med hjälp av elementarsannolikheterna i föregående uppgift. Håkan Strömberg 2 KTH Syd
4.2. DISKRET SANNOLIKHETSLÄRA Problem 2. Antalet trafikolyckor under en vecka på en viss väg kan betraktas som utfall av ett slumpmässigt försök. Antag att man efter en längre tids studium av olycksfrekvensen på vägen kommit fram till följande sannolikheter: Antal olyckor 0 2 3 4 5 Sannolikhet 0.25 0.35 0.24 0. 0.04 0.0 Beräkna sannolikheten för att det under en vecka inträffar: a högst en olycka b åtminstone en olycka c högst två olyckor d mer än två olyckor Problem 3. Bland bokstäverna a, b, c och d utväljs slumpmässigt först en bokstav och sedan en av de tre återstående. Detta försök har 2 utfall som alla antas ha elementarsannolikheten /2. a Skriv upp utfallen b Bestäm sannolikheten för att a kommer med bland de två valda bokstäverna Problem 4. Följande tabell ger frekvenser för antalet mål i de 528 allsvenska fotbollsmatcherna under åren 959 962: Antal mål 0 2 3 4 5 6 7 8 9 0 Frekvens 23 59 02 05 79 58 50 25 8 5 4 Använd dessa frekvenser till att bestämma sannolikheter för de olika antalen mål. Ange sannolikheterna med två decimaler. Bestäm sedan sannolikheten för att det i en allsvensk fotbolls-match skall bli: a 0-0 b högst tre mål c minst sju mål Problem 5. Man kastar en symmetrisk tärning. Beräkna sannolikheterna för följande händelser: a en sexa b en femma eller en sexa c inte en sexa d ett jämnt poängantal Problem 6. Ett kort dras ur en vanlig kortlek. Vilken är sannolikheten att man får a ett äss b ett c ett klätt kort, det vill säga kung, dam eller knekt Håkan Strömberg 22 KTH Syd
Problem 7. Försöket att kasta ett mynt har två utfall, som vi kan beteckna k krona och g gubbe. Skriv upp utfallsrummet för det försök som består i att myntet kastas a två gånger b tre gånger. Problem 8. Ett symmetriskt mynt kastas två gånger. Beräkna sannolikheterna för följande händelser: a krona båda gångerna b krona en gång och gubbe en gång Problem 9. Ett symmetriskt mynt kastas tre gånger. Beräkna sannolikheterna för följande händelser: a krona alla tre gångerna b krona två gånger och gubbe en gång Problem 20. Beräkna antalet utfall i det försök som består i att en tärning kastas a två gånger b tre gånger. Använd multiplikationsprincipen Problem 2. En symmetrisk tärning kastas två gånger. Beräkna sannolikheten för följande händelser: a två sexor b en sexa och en femma c poängsumman 0 d minst poängsumman 0 Problem 22. Ur en kortlek dras på måfå två kort. Vilken är sannolikheten att båda blir? Problem 23. En burk innehåller 5 kulor, av vilka 2 är röda och 3 gröna. Man tar på måfå två kulor ur burken. Beräkna sannolikheterna för följande händelser: a två röda kulor b två gröna kulor c en kula av varje färg Problem 24. a Vad är det för fel i följande resonemang? Om två symmetriska tärningar kastas, så kan poängsumman bli något av talen 2,3,4,...,2. Antalet möjliga utfall är alltså, och sannolikheten för poängsumman 2 är alltså /. b Vilken är den rätta sannolikheten för poängsumman 2? Håkan Strömberg 23 KTH Syd
4.2. DISKRET SANNOLIKHETSLÄRA Problem 25. Två kort dras på måfå ur en kortlek. Vilken är sannolikheten för att ett av korten är äss? Problem 26. En bilhandlare har 0 bilar i lager. Av dessa är 6 felfria och 4 behäftade med mindre fel. En firma köper två av bilarna (utan att närmare undersöka dem). Vilken är sannolikheten att båda bilarna är felfria? Problem 27. På en parkeringsplats finns 7 platser. Tre bilar ställer sig på slumpmässigt valda platser. Beräkna sannolikheten för att alla bilarna kommer intill varandra, om de sju parkeringsplatserna ligger a i rad b i ring. Problem 28. En symmetrisk tärning kastas tre gånger. Vilken är sannolikheten för att man får mer än 5 poäng sammanlagt? Problem 29. Ett bokverk består av delarna... 4. De fyra böckerna ställs slumpvis upp efter varandra på en hylla. Vilken är sannolikheten för att a böckerna kommer i rätt ordning b ingen bok kommer på sin rätta plats? Problem 30. I en mörk garderob ligger tre par skor buller om buller. Man tar på måfå ut tre skor. Vilken är sannolikheten för att två av dessa skor tillhör samma par? Problem 3. En symmetrisk tärning kastas två gånger. a Vilken är sannolikheten för händelsen båda kasten ger samma poängantal? b Ange komplementhändelsen och dess sannolikhet. Problem 32. En symmetrisk tärning kastas tre gånger. Vilken är sannolikheten för att åtminstone två av kasten ger samma poängantal? (Komplementhändelsen är alla tre kasten ger olika poängantal. Visa med multiplikationsprincipen att antalet gynnsamma utfall för denna händelse är 6 5 4 Problem 33. I en burk finns 5 röda och 4 gröna kulor. Man väljer på måfå ut 3 av kulorna. Beräkna sannolikheten för att man får åtminstone en grön kula. (Beräkna först sannolikheten för komplementhändelsen alla tre kulorna är röda. På hur många sätt kan de 3 kulorna väljas bland de 9 kulorna respektive bland de 5 röda kulorna?) Problem 34. Man väljer slumpmässigt ut en elev i en viss årskurs och tittar på betygen i matematik och fysik. Vi antar att händelsen femma i matematik (A) har sannolikheten 0.07 femma i fysik (B) har sannolikheten 0.06, femma i båda ämnena (A B) har sannolikheten 0.04. Beräkna sannolikheterna för följande händelser: a Åtminstone en femma i de båda ämnena (A B). Håkan Strömberg 24 KTH Syd
b Ingen femma. (Komplementhändelse till föregående händelse.) c Femma i det ena men inte i det andra ämnet. Problem 35. På en viss tillverkad enhet kan två olika fel uppträda. Sannolikheten för att en slumpvis utvald enhet har det ena, det andra eller båda dessa fel är 0.008, 0.05 respektive 0.003. Beräkna sannolikheten för: a minst ett fel b inget fel c exakt ett fel. Problem 36. Ur en väl blandad kortlek dras slumpvis 3 kort. Vilken är sannolikheten att bland dessa 3 kort finns a hjärter äss b spader äss c båda dessa äss d åtminstone ett av dessa två äss e inget av de två essen f det ena av de två essen men inte det andra? Problem 37. I en klass finns 20 elever, av vilka 5 är flickor. Vid ett förhör får 4 slumpvis utvalda elever redovisa sina kunskaper. Vilken är sannolikheten att bland dessa fyra finns a ingen flicka b åtminstone en flicka? Problem 38. En vanlig kortlek består som bekant av fyra färger med 3 kort i varje färg. Om man slumpvis väljer ut fyra kort ur leken, vilken är då sannolikheten att man får åtminstone två kort av samma färg? (Beräkna först sannolikheten för komplementhändelsen, det vill säga att man får ett kort av varje färg.) Problem 39. Ur en vanlig kortlek utväljs slumpvis 3 kort (en hand i bridge). Vilken är sannolikheten att man får åtminstone ett äss? Problem 40. I ett lotteri med 00 lotter utlottas 3 vinster. Vilken är sannolikheten att en person, som köpt 5 lotter, får åtminstone en vinst? Problem 4. När man kastar en viss tändsticksask är sannolikheten att den lägger sig på plånsida 0.2. Två sådana askar kastas samtidigt. Vilken är sannolikheten att a båda b ingen c exakt en lägger sig på en plånsida Problem 42. Man kastar tre häftstift. För varje stift är sannolikheten att det lägger sig med spetsen uppåt 0.6. Beräkna sannolikheten för att alla tre stiften lägger sig Håkan Strömberg 25 KTH Syd
4.2. DISKRET SANNOLIKHETSLÄRA a med spetsen uppåt b med spetsen nedåt c på samma sätt Problem 43. Ur en kortlek väljer man på måfå ut två kort. a Vilken är sannolikheten att båda är hjärterkort? b Vilken är sannolikheten att båda korten har samma färg? Problem 44. Antag att sannolikheten att ett paket med skruvar innehåller åtminstone en felaktig skruv är 0.02. Vilken är sannolikheten att det i fyra sådana paket inte, finns någon enda felaktig skruv? (Räkna först ut sannolikheten för att ett paket är felfritt) Problem 45. Två skyttar skjuter var sitt skott mot ett mål. Antag att deras träffsannolikheter är 0.3 och 0.6. Vilken är sannolikheten att minst en av dem träffar målet? (Beräkna först sannolikheten för komplementhändelsen, det vill säga att båda skjuter bom) Problem 46. Utanför en affär finns det 5 parkeringsplatser för kunder. Var och en av platserna är under affärstid ledig i genomsnitt 3 minuter per timme. Uppskatta sannolikheten att man vid ett tillämpat besök i affären finner åtminstone en av de fem parkeringsplatserna ledig. (Sannolikheten att en viss plats är ledig är 3/60. Beräkna först sannolikheten för att alla fem platserna är upptagna) Problem 47. En apparat är sammansatt av tre komponenter och fungerar endast om samtliga tre komponenter är felfria. Vilken är sannolikheten för att apparaten inte fungerar, om sannolikheterna för fel i de tre komponenterna är 2.0%, 3.5% och 4.2%? Felen antas vara oberoende av varandra. Problem 48. En symmetrisk tärning kastas fyra gånger. Vilken är sannolikheten att alla fyra kasten ger olika poängantal? Problem 49. Beräkna sannolikheten att man får minst en dubbelsexa vid 24 kast med två tärningar. Problem 50. Hur många gånger behöver man kasta en symmetrisk tärning för att ha en sannolikhet på minst 0.99 för att få åtminstone en sexa? Svar 2. a) Man får ett hjärter b) Man får ett rött kort c) Man får inte ett hjärter Svar 3. a) {3} b) {,2,4,5,6} c) {3,4,5,6} d) {,2,3} Svar 4. a) {UUU, NUU, UNU, UUN, UNN, NUN, NNU, NNN} c) {NUU, UNU, UUN} Svar 5. {,x,2,x,xx,x2,2,2x,22} Svar 6. a) 2 4 = 6 b) {FRRR,RFRR,RRFR,RRRF} Svar 7. a) ( 52 2) = 326 b) ( 4 2) = 6 c) 92 Ässet kan väljas på 4 sätt och det andra kortet på 48 sätt. Svar 8. a) 0.36 b) 0.47 c) 0.82 Svar 9. a) 0.696 b) 0.257 c) 0.044 b) {UUU, NNN} Håkan Strömberg 26 KTH Syd
Svar 0. a) 2 b) 34 c) 237 Sannolikheterna är 0.003, 0.044 och 0.304. Multiplicera dessa med antalet partier, det vill säga med 52 5 Svar. a) 0.60 b) 0.75 c) 0.84 d) 0.6 Svar 2. a) ab,ac,ad,ba,bc,bd,ca,cb,cd,da,db,dc b) /2 Svar 3. Sannolikheterna är 0.04, 0., 0.9, 0.20, 0.5, 0., 0.0, 0.05, 0.03 a) 0.04 b) 0.54 c) 0.0 Svar 4. a) 6 b) 3 c) 5 6 d) 2 Svar 5. a) 4 52 = b) 3 3 52 = c) 2 4 5 = 3 3 Svar 6. a) {kk, kg, gk, gg} b) {kkk, gkk, kgk, kkg, kgg, gkg, ggk, ggg} Svar 7. a) 4 b) 2 Svar 8. a) 8 b) 3 8 Svar 9. a) 6 2 = 36 b) 6 3 = 26 Svar 20. a) 36 d) 6 36 = 6 ( 3 Svar 2. ( 2) 52 ) = 7 2 Svar 22. a) b) 2 36 = 8 ( 5 2) = 0. b) ( 3 2) c) 3 36 =, gynnsamma utfall:(6 + 4,5 + 5,4 + 6) 2 ( 5 ) = 0.3 c) 2 ( 3 5 = 0.6 2 2) Svar 23. a) Utfallen är inte lika sannolika b) 36 Svar 24. Svar 25. 5 ( 52 ) = 2 26 2 ( 6 2) ( 0 ) = 3 2 Svar 26. a) 5 ( 7 ) = 7 3 b) 7 ( 7 ) = 5 3 0 Svar 27. 6 3 = 5 08 0.046. Gynnsamma utfall : (6+6+6), (5+6+6),(6+5+6),(6+6+5),(4+6+6),(6+4+6),(6+6+4), (5 + 5 + 6),(5 + 6 + 5),(6 + 5 + 5) Svar 28. a) 4! = 24 3 4 Svar 29. ( 6 = 0.6. 3) b) 9 4! = 3 8 Håkan Strömberg 27 KTH Syd
4.2. DISKRET SANNOLIKHETSLÄRA Ett par kan tas ut på 3 sätt, och den tredje skon kan sedan väljas på 4 sätt Svar 30. a) 6 36 = 6 b) Kasten ger olika poängantal, sannolikheten är 5 6 Svar 3. 6 5 4 6 3 = 4 9 ( 5 Svar 32. ( 3) 9 ) = 37 42 3 Svar 33. a) 0.07 + 0.06 0.04 = 0.09 b) 0.09 = 0.9 c) 0.03 + 0.02 = 0.05 Svar 34. a) 0.020 b) 0.980 c) 0.07 Svar 35. a) ) 4 c) ( 50 ( 52 3 b) 4 ) = 7, 3 kort kan väljas på ( 52 3) sätt. Om hjärter äss och spader äss är med, så kan de övriga korten väljas på ( 50 ) sätt d) 4 + 4 7 = 5 e) 9 24 34 4 f) ( 5 Svar 36. a) ( 4) 20 ) = 9 9 0.28 b) 323 323 0.72 4 Svar 37. 34 ( 52 4) 0.89 Svar 38. Svar 39. ) ( 48 3 ( 52 3 ( 97 5) ) 0.70 ( 00 ) 0.4 5 ( 4 ) ( + 7 4 ) = 3 7 34 Svar 40. a) 0.2 2 = 0.04 b) 0.8 2 = 0.64 c) 0.04 0.64 = 0.32 Svar 4. a) 0.6 3 = 0.26 b) 0.4 3 = 0.064 c) 0.26 + 0.064 = 0.28 Svar 42. a) 3 52 2 5 = 7 Svar 43. 0.98 4 0.92 Svar 44. 0.7 0.4 = 0.72 ( ) 57 5 Svar 45. 0.23 60 b) 4 7 Svar 46. 0.980 0.965 0.958 0.094 eller 9.4% 6 5 4 3 Svar 47. 6 4 = 5 8 ( ) 35 24 Svar 48. 0.49 36 ( ) 5 n Svar 49. 0.99 ger n 26 6 Håkan Strömberg 28 KTH Syd
5.3 Mer om betingad sannolikhet Exempel. En vanlig tärning kastas Låt A = tärningen visar Låt B = tärningen visar ett udda poängantal Bestäm P(A). Bestäm P(A B), det vill säga: Hur stor är sannolikheten att man kastat en :a när man får reda på att tärningen visar ett udda antal ögon? Lösning: P(A) = 6 P(A B) = P(A B) P(B) = 3 När vi vet att B har inträffat ökar sannolikheten för att A ska inträffa. Exempel 2. En tärning kastas 2 gånger. Låt A = första tärningen visar 5 Låt B = andra tärningen visar 2 Bestäm P(B) och P(B A) Lösning: P(B) = 6 P(B A) = P(A B) P(B) Vi vet nu att P(B) = P(B A). Det faktum att vi vet att A inträffat, påverkar inte sannolikheten för B. A och B är oberoende händelser. Exempel 3. Två tärningar kastas. = 36 6 = 6 Låt A = ögonsumman är udda Låt B = ögonsumman 9 Låt C = ögonsumman 7 a) Är A och B oberoende?. b) Är A och C oberoende? Håkan Strömberg 29 KTH Syd
5.3. MER OM BETINGAD SANNOLIKHET Figur 5.: Lösning a):. Svar: NEJ Lösning b):. Svar: NEJ P(A) = 8 36 P(B) = 30 36 P(A B) = 6 36 P(A)P(B) = 8 36 30 36 = 25 36 P(C) = 2 36 P(A C) = 2 36 P(A)P(C) = 8 36 2 36 = 7 24 Exempel 4. Om ett inbrott äger rum en natt ringer tjuvlarmet med sannolikheten 0.99. Om inget inbrott görs ringer larmet med sannolikheten 0.02. Antag att sannolikheten är 0.00 att ett inbrott inträffar en viss natt. En natt ringer tjuvlarmet. Vad är den betingade sannolikheten att ett inbrott skett? Lösning: Låt A = inbrott har skett, B = larmet går. P(A B) = P(A B) P(B) = P(A)P(B A) P(B) = 0.00 0.99 0.00 0.99 + 0.999 0.02 0.047 Exempel 5. På en arbetsplats skadades % av personalen under ett år. 60% av de skadade var män. 30% av de anställda var kvinnor. Vilket kön löper störst skaderisk och hur stor är denna risk? Håkan Strömberg 30 KTH Syd
Lösning: Givet P(skadad man) = P(man skadad) P(man) P(skadad) = 0.0 P(man skadad) = 0.6 P(kvinna skadad) = 0.4 P(man) = 0.7 P(kvinna) = 0.3 = P(skadad) P(man skadad) P(man) P(skadad kvinna) = P(skadad)P(kvinna skadad) P(kvinna) = = 0.0 0.4 0.3 0.0 0.6 0.7 0.0333 0.00857 Exempel 6. För två oberoende händelser A och B gäller att P(A) = 0.05,P(B) = 0.0. En person påstår att P(A B) = 0.5. Är detta rätt eller fel? Lösning: P(A B) = P(A) + P(B) P(A B) A och B oberoende P(A B) = P(A)P(B). P(A B) = P(A) + P(B) P(A)P(B) = 0.55 + 0.0 0.05 0. = 0.45 Personen hade fel! Exempel 7. Adam lägger tre kort i en hatt. Kort är rött på båda sidorna, kort 2 är vitt på båda sidorna och kort 3 är rött på ena sidan och vitt på andra. Bertil drar ett kort och tittar på den ena sidan som är röd. Vad är sannolikheten att den andra sidan är röd? Vanlig men FELAKTIG Lösning: Vi har en röd sida. Det utesluter kort 2. Bertil har alltså dragit något av de övriga korten. Om Bertil dragit kort är baksidan röd med sannolikheten. Om Bertil dragit kort 3 är baksidan röd med sannolikheten 0. P(Baksidan röd Framsidan röd) = 2 + 2 0 = 2 KORREKT Lösning Vi tittar på någon av de tre röda sidorna, var och en med sannolikheten 3. P(Baksidan röd Framsidan röd) = 3 + 3 + 3 0 = 2 3 Exempel 8. Antag att varje komponent i systemen nedan (figur 5.2), fungerar med sannolikheten p och att komponenterna fungerar oberoende av varandra. Vad är sannolikheten att systemen fungerar? Lösning: P(A) = p p = p 2 P(B) = P( B) = ( p) 2 = ( 2 + p 2 2p) = 2p p 2 P(C) = p P(B) = 2p 2 p 3 Håkan Strömberg 3 KTH Syd
5.3. MER OM BETINGAD SANNOLIKHET Figur 5.2: Exempel 9. Ett slumpmässigt försök kan ofta ses som en upprepning av n likadana delförsök, där händelserna i dessa delförsök är oberoende. Vi säger att vi gör n oberoende upprepningar av ett delförsök. Vad är sannolikheten att få exakt 3 ettor vid ett kast med 5 tärningar? Lösning: De 5 kasten är oberoende. Låt A = en etta erhålls vid ett kast med en tärning. Låt A 3 = exakt tre ettor vid kast med fem tärningar. P(A 3 ) = ( 5 3 )( 6 ) 3 ( ) 5 2 0.0322 6 Exempel 0. Ett instrument, som består av två komponenter A och B, fungerar endast då båda komponenterna är hela. Vid en laboration tar 4 instrument fram. En komponent A är sönder med sannolikheter 0.2. En komponent B är sönder med sannolikheter 0.3. Beräkna sannolikheten att minst två instrument fungerar. (De 8 komponenterna antas oberoende.) Lösning: A = komponent A är hel B = komponent B är hel P(godtyckligt instrument fungerar) = P(A)P(B) = 0.8 0.7 = 0.56 P(minst två är trasiga) = P(högst en är trasig) = (0.56 4 + Exempel. Givet vägnät. Ibland på vintern snöar vägarna igen. ( ) 4 0.56 3 0.44) 0.593 Låt E = vägen mellan A och B är framkomlig, P(E) = 2 5 Låt E2 = vägen mellan A och C är framkomlig, P(E2) = 3 4 Låt E3 = vägen mellan B och C är framkomlig, P(E3) = 2 3 P(E3 E2) = 4 5 P(E E2 E3) = 2 Vad är sannolikheten att resan A C B går att genomföra? Håkan Strömberg 32 KTH Syd
Figur 5.3: Vad är sannolikheten att man kan ta sig från A till B? Vilken resväg skall väljas för att maximera sannolikheten att ta sig från A till B? Lösning: a) P = P(E2 E3) = P(E2) P(E3 E2) = 3 4 4 5 = 3 5 b) P = P(E (E2 E3)) = P(E) + P(E2 E3) P(E (E2 E3)) = P(E) P(E2 E3) P(E2 E3) P(E E2 E3) = 2 5 + 3 5 3 5 c) P direkt = P(E) = 2 5 P via C = P(E2 E3) = 3 5 2 = 7 0 Exempel 2. A och B är oberoende händelser. B är dubbelt så sannolik som A. A B är utfallsrummet. Beräkna P(A) Lösning: Givet A och B oberoende P(B) = 2P(A) = 2x P(A B) = Sökt P(A) ger där och vi får ekvationen P(A B) = P(A) + P(B) P(A B) = x + 2x P(A B) P(A B) = {A,B, oberoende} = P(A)P(B) = x 2x = 2x 2 = x + 2x 2x 2 med rötterna x = och x 2 = 2. Vi testar lösningarna x = P(A) = P(B) = 2 ORIMLIGT Håkan Strömberg 33 KTH Syd
5.3. MER OM BETINGAD SANNOLIKHET x = 2 P(A) = 2 P(B) = P(A B) = P(A B) = 2 Håkan Strömberg 34 KTH Syd
Ett inledande exempel Exempel. I en grupp med 20 personer är 4 kvinnor. 5 personer väljs slumpmässigt till en kommitté. Bestäm sannolikheten P(x kvinnor ingår i kommittén). Lösning: Antag att det ingår X kvinnor i kommittén. X är en så kallad stokastisk variabel SV (Stokastisk variabel är dåligt men fastlagt namn på något som egentligen är en funktion). Här kommer vi att använda stora bokstäver X,Y,Z... för att beteckna en SV. I en del litteratur förekommer här i stället grekiska bokstäver som ξ,η,ζ. Vi får: ( 4 6 ) P(X = x) = x)( 5 x ( 20 5) Vi kan nu med hjälp av denna funktion bestämma sannolikheten för olika antal kvinnor i kommittén. Antal 0 2 3 4 5 Sannolikhet 0.282 0.470 0.27 0.03 0.00 0.000 Resultatet kan med fördel presenteras som ett stolpdiagram 0.4 0.3 0.2 0. 0 2 3 4 5 Figur 6.4: Sannolikhetsfunktionen Om X är en diskret SV betecknar vi Sannolikhetsfunktion p(x) = P(X = x) Fördelningsfunktion F(x) = P(X x) Sannolikhetsfunktionen kallas också frekvensfunktion. När vi studerar fördelningsfunktionens graf ser vi att vi kan utläsa sannolikheten P(X x) till skillnad mot i frekvensfunktionens graf där vi kan avläsa sannolikheten P(X = x). Vi förstår också att Håkan Strömberg 35 KTH Syd
5.3. MER OM BETINGAD SANNOLIKHET 0.8 0.6 0.4 0.2 lim F(x) = x 2 3 4 5 Figur 6.5: Fördelningsfunktionen Stokastiska variabler När man utför ett slumpmässigt försök, studerar man ofta någon numerisk storhet, som antar olika värden beroende på hur försöket utfaller. Pokerspelaren märker att vinsten fluktuerar från omgång till omgång och den laborerande fysikern att det uppmätta värdet på den fysikaliska konstanten varierar från försök till försök. I teorin beskriver man sådana variationer med begreppet stokastisk variabel. Utfallet i ett slumpmässigt försök i form av ett reellt tal, betraktat innan försöket är utfört, kallas för stokastisk variabel. Resultatet efter att man utfört försöket kallas observerat värde på den stokastiska variabeln. De stokastiska variablerna indelas i två grupper: diskreta och kontinuerliga. Då en SV endast kan anta ett ändligt (eller uppräkneligt) antal värden är SV diskret. I övriga fall är den kontinuerlig. Inledningen ovan är ett exempel på en diskret SV. Det finns ett antal vanliga diskreta SV. Vi kommer här att studera: hypergeometriska fördelningen, (som förekommer i det inledande exemplet), binomialfördelningen och poissonfördelningen. Exempel 2. I en urna ligger 0 svarta och 20 vita kulor. Jag tänker att på en gång dra 5 kulor och undrar hur många kulor som kommer att vara svarta. Innan jag drar kulorna kanske jag vet att det är den hypergeometriska fördelningen som gäller ) P(X = x) = ( Np x )( N Np n x N = 30 står för det totala antalet kulor. p = 3 står för andelen svarta kulor. n = 5 står för antalet kulor jag tänker dra. Med hjälp av dessa 3 parametrar är formeln ovan bestämd. Formeln ger oss sannolikheten för att jag ska få x svarta kulor. Detta är vad jag kan ta reda om försöket, innan jag utför det, vilken SV som gäller. Genom att använda formeln kan ( N n) Håkan Strömberg 36 KTH Syd