Uppsala Uiversitet Matematiska istitutioe Matematisk Statistik Formel- och tabellsamlig Saolikhetsteori och Statistik IT2-2004
Formelsamlig, Saolikhetsteori och Statistik IT-2004 1 Saolikhetsteori 1.1 Allmät Fördeligsfuktio: F (x) = P(X x) α-kvatil: Det tal x α som uppfyller F (x α ) = 1 α. Diskret s.v.: X är diskret om de atar ett ädligt eller ett uppräkeligt atal värde x 1, x 2,... med saolikheter p(x 1 ), p(x 2 ),... där p(x) är saolikhetsfuktio till X. Kotiuerlig s.v.: X är kotiuerlig om X atar alla värde i ett itervall eligt täthetsfuktioe f(x). Det gäller att 1) F (x) är kotiuerlig för alla x, 2) F (x) = f(x) för alla x där derivata existerar, 3) P(a < X b) = b a f(x)dx. Vätevärde: { i E(X) = µ = x i p(x i ) (X diskret) x f(x) dx (X kotiuerlig) Varias: V(X) = σ 2 = E ( (X µ) 2) = E(X 2 ) E(X) 2 Stadardavvikelse: D(X) = σ = V(X) Kovarias: C(X, Y ) = E((X µ x )(Y µ y )) Korrelatioskoefficiet: ρ(x, Y ) = C(X,Y ) D(X)D(Y ) 1.2 Diskreta fördeligar Här Biomialfördelig: X Bi(, p) om p(k) = ( k) p k q k, k = 0, 1, 2,..., q = 1 p, µ = p, σ 2 = pq Geometrisk fördelig: X Ge(p) om p(k) = pq k, k = 0, 1, 2,... q = 1 p, µ = q p, σ2 = q p 2 För första gåge-fördelig: X Ffg(p) om p(k) = pq k 1, k = 1, 2, 3,... q = 1 p, µ = 1 p, σ2 = q p 2 Poissofördelig: X Po(λ) om p(k) = mk k! e m, k = 0, 1, 2,... µ = λ, σ 2 = λ Hypergeometrisk fördelig: X Hyge(N,, p) om p(k) = (Np k )( Nq, k = 0, 1,..., ( N ) (för de k som är möjliga: k får t.ex. ite överstiga Np). q = 1 p, µ = p, σ 2 = pq N N 1 k) 2
1.3 Kotiuerliga fördeligar Rektagelfördelig: X Re(a, b) om f(x) = 1 µ = a+b 2, σ2 = (b a)2 12 b a, a x b Γ-fördelig: X Γ(p, m) om f(x) = xp 1 m p Γ(p) e x m, x 0 µ = p m, σ 2 = p m 2 Expoetialfördelig: X Exp(m) om X Γ(1, m). Normalfördelig: X N(m, σ) om f(x) = 1 2σ 2, där µ = m är vätevärde och σ 2 är varias. För N(0, 1)-fördelige gäller att fördeligsfuktioe beteckas med Φ(x), kvatilera med λ α. 2π σ e (x m)2 χ 2 -fördelig: Om X 1, X 2,..., X är oberoede N(m, σ) så gäller: 1. 1 σ 2 i=1 (X i m) 2 χ 2 (), 2. 1 σ 2 i=1 (X i X) 2 χ 2 ( 1), 3. X och i=1 (X i X) 2 är oberoede. 4. Om U χ 2 (f 1 ) och V χ 2 (f 2 ) är oberoede så är U + V χ 2 (f 1 + f 2 ). Parameter i χ 2 (f)-fördelige kallas frihetsgrader, kvatilera beteckas χ 2 α(f). µ = f, σ 2 = 2f t-fördelig: Om X N(0, 1) och Y χ 2 (f) är oberoede så gäller: t-fördelige med f frihetsgrader är symmetrisk med kvatiler t α (f). µ = 0 (om f > 1), σ 2 = f f 2 (om f > 2) X Y f t(f). 2 Statistikteori 2.1 Allmät Stickprov: Mätvärdea x 1, x 2,..., x utgör ett (slumpmässigt) stickprov på X om de är observatioer av oberoede slumpvariabler X 1, X 2,..., X med samma fördelig som X. Stickprovsmedelvärde: x = 1 i=1 x i Stickprovsvarias: s 2 = 1 1 i=1 (x i x) 2 = Sxx 1, där S xx = i=1 (x i x) 2 = x 2 i ( x i) 2 Stickprovsstadardavvikelse: s = s 2 3
2.2 Iferes vid ormalfördelig 2.2.1 Ett stickprov x 1, x 2,..., x slumpmässigt stickprov frå N(m, σ). Referesvariabler: X m σ/ N(0, 1) (σ käd) X m s/ t( 1) (σ okäd) ( 1)s 2 σ 2 χ 2 ( 1) 2.2.2 Två stickprov x 1, x 2,..., x 1 slumpmässigt stickprov frå N(m 1, σ 1 ). y 1, y 2,..., y 2 slumpmässigt stickprov frå N(m 2, σ 2 ). Referesvariabler: X Ȳ (m 1 m 2 ) σ1 2 1 + σ2 2 2 N(0, 1) (σ 1 och σ 2 käda) X Ȳ (m 1 m 2 ) t( 1 + 2 2) 1 s p 1 + 1 2 (σ 1 = σ 2 = σ okäd) 2.2.3 Normalapproximatio X Ȳ (m 1 m 2 ) s 2 1 1 + s2 2 2 där s 2 p = S xx + S yy 1 + 2 2 N(0, 1) (σ 1 och σ 2 okäda) Atag θ N(θ, D(θ )) Referesvariabler: θ θ D(θ ) θ θ d(θ ) θ θ d(θ ) N(0, 1) N(0, 1) (om D(θ ) käd) (om D(θ ) okäd) t( 1) (om d(θ ) = s ) 4
2.3 Regressiosaalys y i observatio av Y i = α + β(x i x) + ɛ i, i = 1, 2,..., där ɛ i är oberoede N(0, σ). α = ȳ är observatio frå N(α, σ ). β = Sxy S xx är observatio frå N(β, σ Sxx ), där S xy = i=1 (x i x)(y i ȳ) = x i y i σ = s r där s 2 r = Q0 2, Q 0 = S yy S2 xy S xx Vidare är α, β och Q 0 oberoede. 2.4 Wilcoxotest xi yi. och Q0 σ 2 χ 2 ( 2). x 1,..., x 1 och y 1,..., y 2 är oberoede stickprov frå de kotiuerliga fördeligar- a F och G. För att testa H 0 : F = G aväds x-stickprovets ragsumma r, som är e observatio av R, vilke uder H 0 har E(R) = 1+ 2+1 1 2, V(R) = 1 1+ 2+1 2 12 och är approximativt ormalfördelad om 1 och 2 är tillräckligt stora. 2.5 Test av apassig Ett försök ka utfalla på r olika sätt. Försöket upprepas gåger och ma räkar atalet gåger, x 1,..., x r, de olika utfalle iträffar. A: H 0 : Saolikhetera är p 1,..., p r (giva med p i = 1) (x i p i) 2 p i testas med χ 2 = r i=1 χ 2 (r 1) uder H 0 om är tillräckligt stort. B: H 0 : Saolikhetera är p 1 (θ),..., p r (θ) (med p i (θ) = 1, θ okäd) (x i p i(θ )) 2 p i(θ ) testas med χ 2 = r i=1 skattig. Om 2 parametrar skattas erhålls χ 2 (r 3) osv. 2.6 Homogeitetstest (Oberoedetest) H 0 : Rad- och kolumvariabler är oberoede testas med χ 2 = χ 2 (r 2) uder H 0 om är tillräckligt stort och θ är e lämplig r i=1 j=1 uder H 0 om är tillräckligt stort. Här är ê ij = k (x ij ê ij ) 2 χ 2 ((r 1)(k 1)) ê ij k ν=1 xiν r ν=1 xνj. 5
PSfrag replacemets Bi(, p) Hyp(N,, p) Po(λ) N(µ, σ) N < 0.1 p < 0.1 N + p < 0.1 p(1 p) > 10 p(1 p) N N 1 > 10 λ > 15 Figur 1: Lathud för approximatioer. 6