Formelblad Detta formelblad får användas under både KST och KSD, samt ordinarie tentamen. Medelvärde x = 1 n x i with(stats): describe[mean]([3,5]); 4 Varians s = 1 (x i x) n 1 ( s = 1 x i n 1 1 n ) x i n with(stats): describe[variance[1]]([3, 5]); [1] indikerar den definition av varians vi använder. Standardavvikelse s = 1 (x i x) n 1 with(stats): describe[standarddeviation[1]]([3,5]) sqrt() [1] indikerar den definition av standardavvikelse vi använder. Håkan Strömberg 1 KTH Syd
Betingad sannolikhet Sannolikheten att händelsen A ska inträffa då händelse B redan inträffat P(A B) P(A B) = P(B) Binomialfördelningen Sannolikheten för lyckat försök p. Totala antalet försök n. Sannolikheten för x lyckade försök ges genom ( ) n P(X = x) = p x (1 p) n x x E(X) = n p V(X) = n p(1 p) S(X) = n p(1 p) statevalf[pf,binomiald[n,p]](x) statevalf[dcdf,binomiald[n,p]](x) statevalf[idcdf,binomiald[n,p]](a) Hypergeometriska fördelningen Om det finns N kulor i urnan, och andelen röda är p är därmed antalet röda Np. Man drar n kulor ur urnan utan återläggning. Sannolikheten att man ska få x röda är: P(X = x) = ( Np )( N Np x n x ( N n) ) Nnp(N Np)(N n) E(X) = p n V(X) = N (N 1) Nnp(N Np)(N n) S(X) = N (N 1) statevalf[pf,hypergeometric[n1,n,n]](x) statevalf[dcdf,hypergeometric[n1,n,n]](x) statevalf[idcdf,hypergeometric[n1,n,n]](a) Här är N1 antalet röda kulor (lyckade försök), N antalet icke röda (misslyckade försök) och n antalet dragningar. Håkan Strömberg KTH Syd
Poissonfördelningen Om det i medeltal anländer λ kunder till affären under en tidsperiod är sannolikheten att det kommer x stycken P(X = x) = e λ λx x! E(X) = λ V(X) = λ S(X) = λ statevalf[pf,poisson[lambda]](x) statevalf[dcdf,poisson[lambda]](x) statevalf[idcdf,poisson[lambda]](a) Normalfördelningen f X (x) = 1 σ (x µ) π e σ < x < E(X) = µ V(X) = σ S(X) = σ statevalf[pdf,normald[m,s]](x) statevalf[cdf,normald[m,s]](x) statevalf[icdf,normald[m,s]](a) Exponentialfördelningen f X (x) = 1 a e x a x 0 E(X) = a V(X) = a S(X) = a statevalf[pdf,exponential[a,b]](x) statevalf[cdf,exponential[a,b]](x) statevalf[icdf,exponential[a,b]](alpha) b = 0 i våra tillämpningar Håkan Strömberg 3 KTH Syd
Rektangelfördelningen f X (x) = 1 b a a < x < b E(X) = a + b V(X) = (b a) 1 S(X) = (b a) 1 statevalf[pdf,uniform[a,b]](x) statevalf[cdf,uniform[a,b]](x) statevalf[icdf,uniform[a,b]](alpha) Students t-fördelning r anger antalet frihetgrader. Då fördelningen används i samband med intervallskattning och då n är storleken på stickprovet är r = n 1 f(x) = Γ ( ) r+1 1 ( r π Γ r ) ( 1 + x r ) r+1 E(X) = 0 V(X) = r r r S(X) = r statevalf[pdf,studentst[r]](x) statevalf[cdf,studentst[r]](x) statevalf[icdf,studentst[r]](a) Väntevärde Väntevärdet för den SV X definieras av x x p X(x) E(X) = x f X(x)dx Håkan Strömberg 4 KTH Syd
Varians Diskret fördelning Låt X vara en diskret SV som antar värdena x 1,x,... och har väntevärdet E(X) = µ. Variansen för X definieras då V(X) = E((X µ) ) = Standaravvikelsen för X är (x i µ) P(X = x i ) S(X) = V(X) Varians Kontinuerlig fördelning Låt X vara en kontinuerlig SV med frekvensfunktionen f X (x) och väntevärdet E(X) = µ. Variansen för X definieras då V(X) = E((X µ) ) = Standaravvikelsen för X är S(X) = V(X) (x µ) f X (x)dx Oberoende stokastiska variabler Om P(X 1 < x 1 X < x ) = P(X 1 < x 1 ) P(X < x ) för alla tal x 1 och x så är X 1 och X oberoende stokastiska variabler. Håkan Strömberg 5 KTH Syd
Formler med väntevärde och varians Låt a och b vara konstanter samt X, X 1 och X vara stokastiska variabler. Då gäller 1) E(aX + b) = ae(x) + b ) V(aX + b) = a V(X) 3) E(X 1 + X ) = E(X 1 ) + E(X ) 4) V(X 1 + X ) = V(X 1 ) + V(X ), om X 1 och X är oberoende 5) V(X 1 X ) = V(X 1 ) + V(X ), om X 1 och X är oberoende Formel för X Låt X 1,X,...,X n vara oberoende stokastiska variabler där alla har väntevärde E(X i ) = µ och varians V(X i ) = σ, i = 1,,...,n. Sätt X = 1 n (X 1 + X +... + X n ) = 1 n X i Då gäller att E(X) = µ och V(X) = σ n Summor av normalfördelade SV Om X 1 N(µ 1,σ 1 ) och X N(µ,σ ), där X 1 och X är oberoende SV, så gäller ( ) X 1 + X N µ 1 + µ, σ 1 + σ ( ) X 1 X N µ 1 µ, σ 1 + σ Detta resultat kan generaliseras till X 1,X,...,X n är oberoende SV och X i N(µ i,σ 1 ), i = 1,,...,n, samt c 1,c,...,c n är givna konstanter. Då gäller c i X i N c i µ i, n c i σ i Håkan Strömberg 6 KTH Syd
Konfidensintervall för µ hos N(µ, σ) då σ är känd X i,x,...,x n är oberoende SV sådan att X i N(µ,σ). Ett konfidensintervall kring X, [X y,x + y], ska bildas så att intervallet innehåller µ med sannolikheten a. P(X y < µ < X + y) = a Eftersom X N(µ, σ n ) har att lösa ekvationen X+y X y 1 e n(x X) σ σ = a n π n:=proc(m,s,x); return exp(-(m-x)*(m-x)/(*s*s)/(s*sqrt(*pi)); end proc; evalf(solve(int(n(0,1,x),x=-y..y)=0.95,y)); 1.959963985 Alternativt statevalf[icdf,normald[0,1]](0.05) statevalf[icdf,normald[0,1]](0.975) som ger undre och övre gränsen Konfidensintervall för µ hos N(µ, σ) då σ är okänd X i,x,...,x n är oberoende SV sådan att X i N(µ,σ). Ett konfidensintervall kring X, [X y,x + y], ska bildas så att intervallet innehåller µ med sannolikheten a. Starta med att beräkna stickprovets m och s. Intervallet [ m t s n,m t ] s n får man genom att bestämma t ur t-fördelningen. Antalet frihetsgrader r = n 1. ger statevalf[icdf,studentst[r]]((1-a)/) statevalf[icdf,studentst[r]]((1+a)/) Håkan Strömberg 7 KTH Syd