1/18 Summor av slumpvariabler Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 9/2 2011
2/18 Dagens föreläsning Parkeringsplatsproblemet Räkneregler för väntevärden Räkneregler för varianser Fördelningen för summor av slumpvariabler Inlämningsuppgift 1 och 2 Problemslösning Obs! Ändrad lektionstid för MI2B imorgon: 13.15 08.15 i 2244 på Polacksbacken.
Hur många parkeringsplatser? Ett företag ska bygga 100 nya lägenheter. Utifrån erfarenhet från liknande områden vet man att sannolikheten är 25 % att ett hushåll inte har någon bil, 50 % att ett hushåll har en bil och 25 % att ett hushåll har två bilar. Hur många bilar kan man förvänta sig att hushållen har tillsammans? Hur många parkeringsplatser ska man bygga vid bostäderna för att sannolikheten att alla hushålls bilar får plats ska vara 95 %? Antag att man av utrymmesskäl inte får plats med fler än 75 parkeringsplatser. Hur stor är då sannolikheten att hushållens bilar får plats? 3/18
4/18 Räkneregler för väntevärden Låt X och Y vara slumpvariabler och a, b, c vara givna konstanter. Då är E[aX + by + c] = ae[x ] + be[y ] + c. Exempel: Om E[X ] = 5 och E[Y ] = 10 så är E[X + Y ] = E[X ] + E[Y ] = 5 + 10 = 15. Om spel 1 i genomsnitt ger 5 kr i vinst och spel 2 i genomsnitt ger 10 kr i vinst så är den genomsnittliga vinsten av spelen tillsammans 15 kr. E[X ] = 5, E[Y ] = 10, a = 2, b = 1 och c = 25 så är E[2X + Y 25] = 2 5 + 10 25 = 5. Om det kostar 25 kr att spela spel 1 två gånger och spel 2 en gång så förlorar man i genomsnitt 5 kr.
5/18 Räkneregler för väntevärden Mer allmänt kan vi låta X 1, X 2,..., X n vara slumpvariabler och a 1, a 2,..., a n vara givna konstanter. Inför slumpvariabeln S n = a 1 X 1 + a 2 X 2 +... + a n X n = n a i X i. i=1 Vi har då följande räkneregel: E[S n ] = a 1 E[X 1 ] + a 2 E[X 2 ] +... + a n E[X n ] = n a i E[X i ] i=1 Se parkeringsplatsexempel på tavlan!
6/18 Oberoende slumpvariabler Vi har tidigare definierat att två händelser A och B är oberoende om P(A B) = P(A) P(B). Två slumpvariabler X och Y kallas oberoende om P({X x} {Y y}) = P(X x) P(Y y) för alla värden på x och y. Många beräkningar blir betydligt enklare när man jobbar med oberoende slumpvariabler. När man redovisar problem på kursen så är det viktigt att poängtera när man utnyttjar att slumpvariabler är oberoende!
7/18 Räkneregler för oberoende slumpvariabler Låt X 1, X 2,..., X n vara oberoende slumpvariabler och c, a 1, a 2,..., a n vara givna konstanter. Inför slumpvariabeln S n = a 1 X 1 + a 2 X 2 +... + a n X n + c = Vi har då följande räkneregel: n a i X i + c. i=1 V[S n ] = a 2 1V[X 1 ] + a 2 2V[X 2 ] +... + a 2 nv[x n ] = Se parkeringsplatsexempel på tavlan! Om X och Y är oberoende så gäller dessutom att E[X Y ] = E[X ] E[Y ] n ai 2 V[X i ] i=1
8/18 Räkneregler för normalfördelningen Antag att X N(µ X, σ 2 X ) och Y N(µ Y, σ 2 Y ). Då gäller att ax + b N(aµ X + b, a 2 σ 2 X ) och om X och Y är oberoende så är X + Y N(µ X + µ Y, σ 2 X + σ2 Y ).
9/18 Centrala gränsvärdessatsen Låt X 1, X 2,..., X n vara oberoende slumpvariabler som alla har samma fördelning, med väntevärde µ och varians σ 2. Då gäller för stora n att är approximativt normalfördelad: där µ y = nµ och σ 2 Y = nσ2. Y = X 1 + X 2 +... + X n Y N(µ y, σ 2 Y ) Se parkeringsplatsexempel på tavlan!
10/18 Centrala gränsvärdessatsen för medelvärden I många situationer är man intresserad av X = 1 n (X 1 + X 2 +... + X n ). Det följer ur centrala gränsvärdessatsen att då n är stort så är X N (µ, σ2 ) n Då n så får vi att variansen σ2 n 0. Vad innebär det?
11/18 Stora talens lag Vi betraktar X = 1 n (X 1 + X 2 +... + X n ). Antag att slumpvariablerna X 1,..., X n är oberoende och har samma väntevärde µ. Man kan då visa att ( ) P X µ då n = 1, vilket vi tolkar som att medelvärdet X ligger nära µ då antalet observationer n är stort. Resultatet kallas stora talens lag och är en av de stora satserna inom sannolikhetsteorin och vetenskap i allmänhet.
12/18 Sammanfattning E[aX + by + c] = ae[x ] + be[y ] + c. Om X och Y är oberoende så är V[aX + by + c] = a 2 V[X ] + b 2 V[Y ]. Centrala gränsvärdessatsen: Summor av likafördelade oberoende slumpvariabler är approximativt normalfördelade. Stora talens lag: Då antalet observationer n är stort så ligger medelvärdet X nära väntevärdet µ.
13/18 Kvalitetskontroll Ett företag får en leverans av ett mycket stort antal komponenter. De vill utföra en kvalitetskontroll och beslutar sig för att skicka tillbaka leveransen om den innehåller minst 10% defekta komponenter. De väljer ut 10 komponenter på måfå och skickar tillbaka leveransen om minst 1 av de valda komponenterna är defekt. Vad är sannolikheten att leveransen skickas tillbaka om 10% av de levererade komponenterna är defekta? Vad är sannolikheten att leveransen skickas tillbaka om 20% av de levererade komponenterna är defekta?
14/18 Arbetsledaren En arbetsledare på en stor arbetsplats har observerat att antalet vikarier X som måste hyras in under en vecka tycks följa en Po(2)-fördelning. Vad är sannolikheten att ingen vikarie behövs en given vecka? Vad är sannolikheten att de behöver hyra in vikarier minst 100 gånger under ett år?
15/18 Diameter på enheter Vissa tillverkade enheter har en diameter X som kan beskrivas av täthetsfunktionen för 2 < x < 3. Bestäm konstanten c. f (x) = c(x 2)(3 x) Man kasserar enheter vars diameter är mindre än 2.2 eller större än 2.8. Hur stor andel av de tillverkade enheterna måste kasseras i det långa loppet?
16/18 Största lasten En mindre bro tål belastningar upp till och med 70 ton. Från en studie av lastbilars vikt, inklusive släp med last, har man kommit fram till att lastbilars vikter är normalfördelade med väntevärde 35 ton och varians 100. Vad är sannolikheten att en lastbil väger mer än 70 ton? Två lastbilar befinner sig på bron samtidigt. Vad är sannolikheten att de tillsammans väger mer än 70 ton? Under en dag passerar 120 lastbilar bron. Vad är sannolikheten att den tyngsta lastbilen väger mer än 70 ton?
17/18 Vilken dörr? I ett amerikanskt tävlingsprogram på TV fick deltagarna spela spelet bilen och getterna. I spelet finns tre dörrar. Bakom en finns en bil och bakom de andra två finns getter. Programledaren vet vilken dörr som bilen finns bakom, men inte deltagaren. Deltagaren vinner bilen om hon gissar rätt dörr. Spelet går till så att deltagaren gissar en dörr, varefter programledaren öppnar en av dörrarna som deltagaren inte valt. Bakom den öppnade dörren finns en get. Programledaren erbjuder sedan deltagaren att ändra sitt val till den andra kvarvarande dörren. Ska deltagaren behålla den dörr hon först gissade på eller byta dörr?
18/18 Två döttrar En man berättar stolt för oss att han har två barn och att minst en av dem är en dotter. Givet den informationen, vad är sannolikheten att han har två döttrar?