LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, 216-4-6 OCH INFÖR ÖVNING 4 Övningens mål: Du ska förstå begreppet slumpvariabel och skilja mellan diskreta och kontinuerliga variabler använda sannolikhets- och fördelningsfunktion för att beräkna sannolikheter se eempel på hur Poissonfördelning och binomialfördelning kan användas som modell i biorelaterade situationer samt kunna identifiera binomialfördelningen utifrån en given situation kunna beräkna väntevärde samt ha orienterat dig om varians i en diskret fördelning En slumpvariabel X kan vara diskret (antar bara vissa värden) eller kontinuerlig (antar oändligt många värden). Denna övning handlar enbart om diskreta slumpvariabler, de kontinuerliga slumpvariablerna arbetar vi med nästa gång. 1 Gör uppgift Dig1 på bifogade blad. 2 För att beskriva hur en diskret slumpvariabel varierar används en sannolikhetsfunktion, f () = P(X = ). Läs om den på s. 72 och studera noga eempel 4.3 och efterföljande tet. Gör uppgift Dig2 på bifogade blad och uppgift 3.1(a)-(e) i studiematerialet. 2 Ibland är man intresserade av sannolikheten att slumpvariabeln X är mindre än eller lika med något värde. I formler vill vi alltså ha P(X ). Detta kallas fördelningsfunktionen för X och betecknas F() läs om den på s. 74. Observera att den sannolikhet som du beräknade i 3.1(e) kan uttryckas m.h.a. respektive fördelningsfunktion F(). Gör uppgift 3.1(f) samt Dig3 och Dig4. 3 Sannolikhetsfunktionen (alternativt fördelningsfunktionen) ger oss all information om hur slumpvariabeln X varierar. Ibland räcker det emellertid med att veta var X befinner sig i genomsnitt och hur utspridd X är. Vi vill alltså ha ett lägesmått och ett spridningsmått för fördelningen. Läs om väntevärdet (förväntade värdet) μ och variansen σ 2 i en diskret fördelning på s. 75 77. Vad är det förväntade värdet på X i uppgift 3.1? 4 Läs och begrunda avsnitt 4.2.5 på s. 78! 5 Ofta har man en situation där det är lämpligt att använda en statistisk standardfördelning som modell. En viktig sådan standardfördelning är binomialfördelningen som beskrivs i avsnitt 4.2.6. De första raderna i avsnittet beskriver kortfattat situationen när en sådan modell är lämplig att använda. Studera eempel 4.16 och eempel 4.17. Gör uppgifterna 3.9 och 3.15 i studiematerialet och, om du hinner, Dig7. 6 Den andra viktiga diskreta standardfördelningen är poissonfördelningen studera dess sannolikhetsfunktion på s. 82. Poissonfördelningen används ofta för att modellera förekomsten av en ovanlig sjukdom i en befolkning. Gör uppgift 3.21 i studiematerialet samt (om ni hinner) uppgift 3.13. Om du vill träna mer på detta avsnitt eller när du repeterar är följande uppgifter lämpliga att titta på: 3.2, 3.6, 3.18, 3.17, Dig6, Dig12, Dig13 VÄND!
Biostatistisk grundkurs, VT-15, VT2 2 Inför övning 4 (216-4-11): Aktuella avsnitt i boken är 4.3 4.5 A Läs avsnitt 4.3 och koncentrera dig vid en första genomläsning på begreppet täthetsfunktion för en kontinuerlig slumpvariabel väntevärde och varians observera att de nu beräknas m.h.a. integraler avsnittet 4.3.6 med normalfördelningen avsnittet 4.3.7 med den standardiserade normalfördelningen begreppet kvantiler på s. 97 B C Orientera dig om avsnitt 4.4 vi återkommer till det senare i kursen. Läs avsnitt 4.5 det är kort och med mycket formler som vi kommer att använda flitigt framöver. Tabell 4.3 på s. 16 ger alltsammans i kortformat. DIGITALA UPPGIFTER, diskreta fördelningar 1. Avgör om variabeln X i följande eempel är diskret eller kontinuerlig: (a) X = antalet ägg i ett rede (b) X = längden (cm) hos en slumpmässigt vald 2 årig kvinna (c) X = högsta flödet (m 3 /s) ett år i Vindelälven (d) X = antal år under ett decennium som högsta flödet i Vindelälven överstiger 1 m 3 /s (e) X = kolesterolhalten (mg/ml) hos en slumpmässigt vald manlig diabetiker (f) X = brottgränsen (N/mm 2 ) hos ett material 2. UPPGIFT: I ett spel satsar man 4 kronor. Man kastar en symmetrisk tärning och får lika många kronor som det antal prickar som tärningen visar. Låt X vara vinsten i spelet. (a) Vilka värden kan X anta? Markera de värden som X kan anta. (b) Vad är sannolikheten att vinsten är, d.v.s. vad är P(X = )? (c) Vad är sannolikheten att vinsten är 3, d.v.s. vad är P(X = 3)? (d) Vad är sannolikheten att vinsten överstiger, d.v.s. vad är P(X > )? (e) Vad är sannolikheten att vinsten är negativ, d.v.s. vad är P(X < )? 3. Para ihop: A: P(X 2) 1: Sannolikhetsfunktion i punkten 2, d.v.s. p(2) B: P(X > 2) 2: Fördelningsfunktion i punkten 2, d.v.s. F(2) C: P(X = 2) 3: 1 - fördelningsfunktionen i punkten 2, d.v.s. 1 F(2) 4. UPPGIFT: Nedan visas sannolikhetsfunktion,, och fördelningsfunktion, F(), för en diskret stokastisk variabel X. Kontrollera att du kan använda såväl sannolikhetsfunktion som fördelningsfunktion när du beräknar följande sannolikheter: (a) P(X = 3) (b) P(X 2)
Biostatistisk grundkurs, VT-15, VT2 3 (c) P(X < 2) (d) P(X 3) (e) P(X > 3).4 Sannolikhetsfunktion.3.2.1 1 2 3 4 5 Fördelningsfunktion, F() F()=P(X ) 1.8.6.4.2 1 1 2 3 4 5 6 7 5. Du studerar färgen på bilarna som kör på vägen utanför ditt fönster. Antag att var femte bil i Sveriges fordonspark är röd. Vad är sannolikheten att den första röda bil som kommer (a) är den tredje bilen (b) är den sjunde bilen (c) är bil nr 6. Avgör i vilken eller vilka av de nedanstående situationerna slumpvariabeln X är binomialfördelad (a) En person lämnar varje vecka in samma rad på Lotto. Låt X vara antal gånger hen får vinst under ett år. (b) En person studerar noga tidningens fotbollssidor och lämnar varje vecka in sitt eperttips utom i semestertider då hen har ett stående tips. Låt X vara antal gånger hen får vinst under ett år. (c) En person äter choklad ur en kartong med 3 bitar av både ljus och mörk choklad. Hen väljer slumpmässigt ut bit efter bit och äter till det återstår 1. Låt X vara antal ljusa chokladbitar hen ätit upp. (d) En person står vid en väg och noterar under 1 minuter färgen på de bilar som passerar. Låt X vara antalet bilar innan den första röda bilen passerar. (e) En person står vid en väg och noterar under 1 minuter färgen på de bilar som passerar. Låt X vara antalet röda bilar under dessa 1 minuter. (f) En person står vid en väg och noterar färgen på de första 5 bilar som passerar. Låt X vara antalet röda bilar av de 5. 7. I nedanstående situationer är X binomialfördelad. Ange n och p i fördelningarna. (a) Risken att ett vägavsnitt översvämmas ett år uppskattas til 5 %. Låt X vara antal år under ett decennium med översvämmat vägavsnitt. (b) I genomsnitt råkar Benjamin ut för köer 1 gång av 1 när han tar bilen till jobbet. Låt X vara antal dagar under en arbetsvecka då han inte köar på väg till arbetet.
Biostatistisk grundkurs, VT-15, VT2 4 (c) Lisa och Karin kastar vardera 1 kast med en tärning. Låt X vara antalet femmor de får tillsammans. (d) Vid tillverkning av?? blir 1 % missfärgade medan 2 % får fel form. Dessa två fel sker oberoende av varandra. Låt X vara antalet felfria enheter i en förpackning om 1. 8. Antalet årliga olyckor utmed ett vägsnitt anses vara Poissonfördelat med väntevärde 5, d.v.s. Po(5). Om X=antalet olyckor gäller = e 5 5! för =, 1, 2,.... Beräkna sannolikheten (använd räknare eller tabell) att antalet olyckor ett år är:.18 Sannolikhetsfunktion för X=antal olyckor, Po(5).16.14.12.1.8.6.4.2 2 2 4 6 8 1 12 14 16 =antal olyckor (a) precis 3 (b) minst 7 (c) högst 5 9. UPPGIFT: Du kastar en tärning 5 gånger i rad och räknar antal seor du får. Vad är sannolikheten att du får precis 3 seor? 1. Nedan visas sannolikhetsfunktionen för en stokastisk variabel X. Beräkna variabelns väntevärde, d.v.s. E(X). 1 2 3 4 5.1.3.2.2.1.1 11. I ett spel satsar man 4 kronor. Man kastar en symmetrisk tärning och får lika många kronor som det antal prickar som tärningen visar. Låt X vara vinsten i spelet. Vad är spelets förväntade vinst?
Biostatistisk grundkurs, VT-15, VT2 5 12. Nedan visas sannolikhetsfunktionerna för två stokastiska variabler X och Y. Sannolikhetsfunktion för X.25.2.15.1.5.25 1 2 3 4 5 6 7 8 Sannolikhetsfunktion för Y.2.15.1.5 2 3 4 5 6 7 8 9 1 (a) Vilken av dem har störst väntevärde? (b) Vilken av dem har störst varians? (c) Vilken av dem har störst standardavvikelse? 13. Nedan visas sannolikhetsfunktionerna för två stokastiska variabler X och Y. Sannolikhetsfunktion för X.3.2.1 1 2 3 4 5 6 7 8 Sannolikhetsfunktion för Y.3.2.1 1 2 3 4 5 6 7 8 (a) Vilken av dem har störst väntevärde? (b) Vilken av dem har störst varians? (c) Vilken av dem har störst standardavvikelse? Lösningar 1. (a) diskret (b) kontinuerlig (c) kontinuerlig (d) diskret
Biostatistisk grundkurs, VT-15, VT2 6 (e) kontinuerlig (f) kontinuerlig 2. (a) Vinsten X kan vara -3, -2, -1,, 1 eller 2 (b) P(X = )=P(tärningen visar 4 prickar)= 1 6 (c) P(X = 3)= eftersom man aldrig kan vinna 3 kronor i spelet (d) P(X > ) = P(X = 1) + P(X = 2) =P(tärningen visar 5 prickar)+p(tärningen visar 6 prickar)= 1 6 = 1 6 = 2 6 (e) P(X < ) = P(X = 3) + P(X = 2) + P(X = 1) = 3 6 3. P(X = 2) = p(2) F(2) = P(X 2) 1 F(2) = 1 P(X 2) = P(X > 2) Rätt kombination är alltså: A-2; B-3; C-1 4. (a) P(X = 3) = p(3) =.2; alternativt: P(X = 3) = P(X 3) P(X 2) = F(3) F(2) = (b) P(X 2) = F(2) =.6; alternativt P(X 2) = p() + p(1) + p(2) =.6 (c) P(X < 2) = P(X 1) = F(1) =.4; alternativt P(X < 2) = p() + p(1) =.4 (d) P(X 3) = 1 P(X < 3) = 1 P(X 2) = 1 F(2) =.4; alternativt P(X 3) = p(3) + p(4) + p(5) =.4 (e) P(X > 3) = 1 P(X 3) = 1 F(3) =.2; alternativt P(X > 3) = p(4) + p(5) =.2 5. (a) P(först två ickeröda och sedan en röd)=.8.8.2. (b).8 6.2 (c).8 1.2 6. (a) Binomialfördelning med n = 52 och p=p(vinna), vilket är konstant för varje vecka. (b) Ej binomialfördelad eftersom p=p(vinna) ej är den samma varje vecka. (c) Ej binomialfördelad eftersom p=p(ljus bit) är ej den samma vid de olika tillfällena som en chokladbit tas. (d) Ej binomialfördelad (utan geometriskt fördelad). (e) Ej binomialfördelad eftersom n antal bilar är ej fit. Möjligtvis kan en Poissonfördelning vara en lämplig modell. (f) Binomialfördelad med n = 5 och p=p(en bil som passerar är röd). 7. (a) n = 1, p =.5 (b) n = 5, p =.9 (c) n = 2, p = 1 6 (d) n = 1, p =.99.98 8. Då X = antal olyckor och X Po(5) gäller (a) P(X = 3) = p(3) = e 5 53 3! =.144 (b) P(X 7) = 1 P(X 6) = 1 F(6) = 1.7622 =.2378 (c) P(X 5) = F(5) =.616 9. X =antalet seor på 5 kast; X är binomialfördelat med n = 5 och p = 1 6, d.v.s. X Bin(5, 1 6 ). Då gäller att P(X = 3) = Bin(5, 3) ( 1 6 )3 ( 5 6 )2 =.322
Biostatistisk grundkurs, VT-15, VT2 7 1. E(X ) = 5 = =.1 + 1.3 + 2.2 + 3.2 + 4.1 + 5.1 = 2.2 11. Vinsten X har följande sannolikhetsfunktion: -3-2 -1 1 2 1 1 1 1 1 1 6 6 6 6 6 6 E(X ) = 2 1 = 3 = ( 3) 6 + ( 2) 1 6 + ( 1) 1 6 + () 1 6 + 1 1 6 + 2 1 6 = 3 6 12. (a) E(X ) < E(Y ) eftersom fördelningen för Y är förskjuten till höger i förhållande till fördelningen för X (b) V (X ) = V (Y ) eftersom spridningen är den samma (c) D(X ) = D(Y ) eftersom spridningen är den samma 13. (a) E(X ) = E(Y ) eftersom fördelningarna båda är symmetriska och centrerade kring samma värde (b) V (X ) < V (Y ) eftersom spridningen i fördelningen för X är mindre än den för Y (c) D(X ) < D(Y ) eftersom spridningen i fördelningen för X är mindre än den för Y