9. Funktioner av stokastiska variabler 9.. Oberoende stokastiska variabler Som vi minns innebär P(A B) = P(A) P(B) att händelserna A och B är oberoende. Låt A vara händelsen att X < x och B vara händelsen X 2 < x 2 Definition. Om P(X < x X 2 < x 2 ) = P(X < x ) P(X 2 < x 2 ) för alla tal x och x 2 så är X och X 2 oberoende stokastiska variabler. Exempel. Låt X i vara antalet mål AIK gör i match i. x P(X = x).3.4 2.3 Det verkar vara rimligt att anta att X och X 2 är oberoende SV. Sätt Y = X + X 2 och bestäm sannolikhetsfördelningen för Y. Y kan anta värdena,,2,3,4. P(Y = ) = P(X = X 2 = ) = P(X = )P(X 2 = ) =.3.3 =.9 P(Y = ) = P(X = X 2 = ) + P(X = X 2 = ) = P(X = )P(X 2 = ) + P(X = )P(X 2 = ) =.4.3 +.3.4 =.24 och så vidare. Vi får Y till y P(Y = y).9.24 2.34 3.24 4.9 Håkan Strömberg KTH Syd
9.. FUNKTIONER AV STOKASTISKA VARIABLER Låt a och b vara konstanter samt X, X och X 2 vara stokastiska variabler. Då gäller ) E(aX + b) = ae(x) + b 2) V(aX + b) = a 2 V(X) 3) E(X + X 2 ) = E(X ) + E(X 2 ) 4) V(X + X 2 ) = V(X ) + V(X 2 ), om X och X 2 är oberoende Låt X,X 2,...,X n vara oberoende stokastiska variabler där alla har väntevärde E(X i ) = µ och varians V(X i ) = σ 2, i =,2,...,n. Sätt X = n (X + X 2 +... + X n ) = n n i= X i Då gäller att E(X) = µ och V(X) = σ2 n Exempel 2. En något morgontrött teknolog vet av erfarenhet att hans morgonaktivitet kan struktureras på följande sätt Tvättning och påklädning som tar X N(,2) minuter Frukost som tar X 2 N(2,2) minuter Promenad till skolan X 3 N(9,2) minuter En kväll ställer han väckarklockan på ringning kl 7 : 3. Hur stor är sannolikheten att han kommer att hinna till lektionen som börjar kl 8 : Lösning: Y = X + X 2 + X 3 N( + 2 + 9, 2 2 + 2 2 + 2 2 ) = N(39,2 3) Med Maple 4 2 3 2π (x 39) 2 e 2 2 dx statevalf[cdf,normald[39,2*sqrt(3)]](4);.6358536 Håkan Strömberg 2 KTH Syd
9..2 Summor av normalfördelade SV Vi har lärt oss att bestämma E(X) och V(X) för en summa av två eller flera SV. Men fördelningen för en summa i allmänhet svår att bestämma. Ett undantag är dock summan av normalfördelade SV Om X N(µ,σ ) och X 2 N(µ 2,σ 2 ), där X och X 2 är oberoende SV, så gäller ( ) X + X 2 N µ + µ 2, σ 2 + σ2 2 ( ) X X 2 N µ µ 2, σ 2 + σ2 2 Detta resultat kan generaliseras till X,X 2,...,X n är oberoende SV och X i N(µ i,σ ), i =,2,...,n, samt c,c 2,...,c n är givna konstanter. Då gäller n n c i X i N c i µ i, n c 2 i σ2 i i= i= i= För att knacka in denna formel i TeX krävs denna kod \sum_{i=}^nc_i\cdot X_i\in N\left(\sum_{i=}^n c_i\cdot\mu_i, \sqrt{\sum_{i=}^n c_i^2\cdot\sigma_i^2}\right) Exempel 3. Två stokastiska variabler är X N(3, 4) och Y N(, 3). Bestäm fördelningen för a) X + Y b) X Y c) 3X + Y d) X 4Y Lösning: a) N(3 + 4, 4 2 + 3 2 ) = N(4,5) b) N(3, 4 2 + 3 2 = N(2,5) c) N(3 3 +, 3 2 4 2 + 3 2 ) = N(, 53) d) N(3 4, 4 2 + 4 2 3 2 ) = N(, 6) Exempel 4. Konstgödsel förpackas med maskin i 5-kilossäckar och -kilossäckar. Denna förpackning sker dock inte med exakt precision. Vikten (i kg) av innehållet i en 5- kilossäck kan betraktas som SV X N(5,2) och vikten (i kg) i en -kilossäck kan betraktas som en SV Y N(,). X och X 2 kan anses oberoende. En person behöver 65 kg konstgödsel och köper 3 stycken 5-kilossäckar och 2 stycken -kilossäckar. Vad är sannolikheten att han får mindre är 65 kg? Lösning: De fem säckarna är X,X 2,X 3,Y och Y 2. Vi vet från ovan hur vi ska hantera X + X 2 och blir inte förvånade över X + X 2 + X 3 + Y + Y 2 N(3 5 + 2, 3 2 2 + 2 2 ) Håkan Strömberg 3 KTH Syd
9.. FUNKTIONER AV STOKASTISKA VARIABLER som ger Genom Maple får vi Z N(7, 4) statevalf[cdf,normald[7,sqrt(4)]](65);.97246387 Problem. På väg hem från jobbet anländer Adam slumpmässigt till perrongen. Tågen går var minut. X är SV för den tid han får vänta på tåget. a) Bestäm f X (x) b) Bestäm F X (x) c) Bestäm E(X) d) Bestäm V(X) e) Bestäm S(X) Problem 2. Låt X N(µ,σ), där µ = 8 och σ = 5. Beräkna och pricka in korrekt graf. a) P(X < µ) b) P(X < µ σ) c) P(X > µ + σ) d) P(X < µ 2σ) e) P(X > µ + 2σ) f) P( X µ < σ) g) P( X µ < 2σ).25.2.5..5.25.2.5..5 6 8 2 22 6 8 2 22.25.2.5..5.25.2.5..5 6 8 2 22 6 8 2 22 Håkan Strömberg 4 KTH Syd
.25.2.5..5.25.2.5..5 6 8 2 22 7 8 9 2.25.2.5..5 6 8 2 22 Problem 3. Givet funktionen f X (x) = { x 2 c x 6 för övrigt Bestäm först c så att f X (x) blir en frekvensfunktion. Bestäm därefter E(X), V(X) och SX) Problem 4. Vikten hos jordgubbskartonger varierar från kartong till kartong enligt N(45, 5). Bestäm standardavvikelsen för vikten hos en slumpmässigt vald kartong. Problem 5. X Exp(2). a) Beräkna E(X) a) Beräkna V(X) b) Beräkna medianen c) Beräkna kvartilavståndet. Jämför med E(X) ± S(X) Problem 6. En stokastisk variabel X vars frekvensfunktion är kallas Cauchyfördelad. f X (x) = a) Bestäm medianen för X π( + x 2 ) b) Hur är det med väntevärdet E(X)? < x < Problem 7. Den tid det tar för mig att komma till jobbet kan betraktas som N(2,.5)- fördelat. Vad är sannolikheten att det tar mellan a) 7 och 23 minuter? b) 5.5 och 24.5 minuter? Håkan Strömberg 5 KTH Syd
9.. FUNKTIONER AV STOKASTISKA VARIABLER Problem 8. Vi utgår från N(, ) och önskar de kring, symmetriskt belägna gränser, som innesluter a) 99% b) 99.9% c) 5% Problem 9. ägg ska sorteras med hjälp av en maskin efter vikten X N(49.,7.2). Det finns tre viktklasser A : X 45 B : 45 < X 55 C : X > 55 Hur många ägg kan man förvänta sig i de olika klasserna? Problem. Låt X och X 2 vara oberoende SV med E(X ) = 3 och V(X ) =.5 samt E(X 2 ) = 4 och V(X 2 ) =.9. Beräkna väntevärde, varians och standardavvikelse för a) 2X + b) c) X + X 2 d) X X 2 e) 5X + 2X 2 f) 5X 2X 2 4 Problem. Med hjälp av mätvärden från X N(5,8) och lika många från X 2 N(4,6) har fem filer skapats na.txt till ne.txt. Alla med tal. Följande fem formler ligger till grund för talen på de fem filerna. Skriv ett program som bestämmer µ, σ 2 och σ för de talen på de fem filerna. Para sedan ihop filerna med rätt formel. För att klara det måste du också kunna bestämma det teoretiska värdet E(X), V(X) och S(X). a) 5X + 2X 2 b) X + X 2 c) 5X 2X 2 4 d) 2X + e) X X 2 Problem 2. En fil innehåller normalfördelade slumptal. Skriv ett program som skalar om talen i filerna genom tnytt = t gammalt µ σ Beräkna sedan µ och σ för de nya talen. Testkör programmet på filerna N58.txt och N46.txt, som kommer från N(5,8) respektive N(4,6). Problem 3. I en tvättinrättning betalas dels en fast avgift om 3 kr och dels en rörlig avgift på kr/kg. Vikten av kundernas tvätt är en SV X med frekvensfunktionen { 3 x f X (x) = 2 < x < 3 för övrigt Låt Y vara den avgift kunden betalar. Beräkna E(Y) och V(Y) Håkan Strömberg 6 KTH Syd
Problem 4. En maskin fyller konservburkar och av erfarenhet vet man att vikten varierar från burk till burk. Antag att vikten kan betraktas som en normalfördelad SV X med S(X) = 5 gram. Vilket väntevärde bör man inrikta sig på för att i långa loppet 99% av burkarna skall väga minst 4 gram? Håkan Strömberg 7 KTH Syd
9.. FUNKTIONER AV STOKASTISKA VARIABLER Svar. f X (x) = x [ ] dt t x F X (x) = = = x [ ] x x 2 E(X) = dx = = 5 2 V(X) = (x 5) 2 = 25 3 S(X) = V(X) 2.89.8.6.4.2 2 4 6 8 Figur 9.: f(x), F(x) och området [E(X) S(X), E[X] + S[X] inritat Svar 2. Svar 3. a).5 b).587 c).587 d).2275 e).2275 f).5889 g).9545 6 x 2 c = [ ] x 3 6 3c = 26 3c = x = 72 Svar 4. Med hjälp av Maple E(X) = V(X) = 6 6 x x 2 72 dx = 9 2 (x 9 2 )2 x 72 S(X) = V(X) = dx = 27 2 27 2.69 Håkan Strömberg 8 KTH Syd
n:=proc(m,s,x) return exp(-(/2)*(x-m)^2/s^2)/(s*sqrt(2*pi)) end proc; evalf(int((x-45)^2*n(45,5,x),x=-infinity..infinity)); 225. sqrt(225.); 5. FÖRSTÅS! Svar 5. E(X) = V(X) = 2xe 2x dx = 2 2(x 2 )2 e 2x dx = 4 S(X) = 2 Medianen får man genom att lösa ekvationen Med Maple x 2e 2t dt = 2 x = ln2 2.35 solve(int(2*exp(-2*t),t=..x)=/2) Under kvartilen erhålles genom ekvationen x Övre kvartilen erhålles genom ekvationen Kvartilavståndet till sist x Svar 6. När vi löser ekvationen får vi medianen som rot x =. 2e 2t dt = 4 x.44 2e 2t dt = x =.693 4.693.44.549 x Något väntevärde finns inte, vilket beror på att π( + t 2 ) dt = 2 x π( + x 2 ) dx = Svar 7. a).954, b).9973 Håkan Strömberg 9 KTH Syd
9.. FUNKTIONER AV STOKASTISKA VARIABLER.3.25.2.5..5-4 -2 2 4 Figur 9.2:.4.3.2. 8 9 2 3 Figur 9.3: Sannolikheten.5 att hamna i intervallet [93.26,6.74] Svar 8. a) [74.247, 25.758] b) [67.947, 32.95] c) [93.255, 6.745] Svar 9. a) E(X) = 6, V(X) = 2, S(X) =.4 b) E(X) =, V(X) =, S(X) = c) E(X) = 7, V(X) =.4, S(X) =.8 d) E(X) =, V(X) =.4, S(X) =.8 e) E(X) = 23, V(X) = 6., S(X) = 4. f) E(X) = 7, V(X) = 6., S(X) = 4. Svar. a) nd.txt b) nb.txt c) ne.txt d) na.txt e) nc.txt Svar. De skalade talen har µ = och σ = Håkan Strömberg KTH Syd
Svar 2. Med hjälp av formeln E(Y) = E(aX + b) = ae(x) + b får vi efter att först ha bestämt E(X) 3 E(X) = x 3 x dx = 5 2 3 E(Y) = 5 + 3 = 46.67 3 Med hjälp av formeln V(Y) = V(aX + b) = a 2 V(X) får vi efter att först ha bestämt V(X) V(X) = 3 ( x 5 ) 2 3 x dx = 5 3 2 3 V(Y) = 2 5 3 = 22.22 Svar 3. Vi har att lösa ekvationen 4 5 2π (x m) 2 e 2 5 2 dx =. evalf(solve(int(exp(-(x-m)^2/(2*5^2))/(5*sqrt(2*pi)), x=-infinity..4)=.,m)); 434.89528 Håkan Strömberg KTH Syd