Kurssammanfattning MVE055

Obs: Detta är enbart tänkt som en översikt och innehåller långt ifrån allt som ingår i kursen (vilket anges exakt på hemsidan). Fullständiga antaganden i satser kan saknas och fel kan förekomma så kontrollera allt som är osäkert med boken. 14 oktober 2009

Översikt 1 2 3

Grundläggande definitioner Experiment: Dra ett spelkort Utfallsrum: S = {2,3,4,5,6,7,8,9,10,Kn,D,K,A} Händelser: Delmängder av S. Ex: B = {Kn,D,K,A} Sannolikhetsfunktion: P(A) Modell: S och P

Räkneregler Axiom P(S) = 1 P(A) 0, A A 1,..., A n parvis disjunkta P(A 1 A n ) = P(A 1 ) + + P(A n ) Räkneregler P(A C ) = 1 P(A) P( ) = 0 P(A B) = P(A) + P(B) P(A B)

Betingade sannolikheter Betingad sannolikhet P(B A) = P(A B) P(A), om P(A) 0 Oberoende A, B ober. omm P(A B) = P(A) P(B), dvs om P(B A) = P(B)

Bayes sats Totala sannolikhetslagen Om A 1,...,A n är en partition av S så är P(B) = n P(B A i ) = i=1 n P(A i ) P(B A i ) i=1 Bayes sats C P(A B) = P(B A) P(A) P(B) om P(B) 0 A 1 A 2 A 3 A 4 A 5 Ex: Slumpmässigt utvald bil A 12 A 7 A 6 B A i = {bilen tillv. på fabrik i} B = {bilen har ett fel} Ta A = A 1 i Bayes sats A 11 A 10 A 9 A 8

Diskreta stokastiska variabler Definition X är en s.v. om X bestäms av utfallet X diskret om X antar uppräkneligt antal värden Frekvens- och fördelningsfunktion f X (x) = P(X = x) F X (x) = P(X x) Krav och samband f X (x) 0 fx (x) = 1 F X (x) = i x f X(i) f X (x) = F X (x) F X (x 1), om X är heltalsvärd

Mått på s.v. Väntevärde E[X] = x x f X(x) = x x P(X = x) E[h(X)] = x h(x)f X(x) = x h(x) P(X = x) Spridningsmått Var X = E [ (X E[X]) 2] = E [ X 2] (E[X]) 2 σ X = Var X

Räkneregler för väntevärden E[a] = a E[aX] = a E[X] E[X + Y] = E[X] + E[Y] E[XY] = E[X] E[Y], om X, Y är oberoende för varianser Var[a] = 0 Var[aX] = a 2 Var[X] Var[X + Y] = Var[X] + Var[Y], om X, Y är oberoende

Standardfördelningar Bernoulli(p)-försök Ett försök som lyckas med sannoliket p. Geometrisk fördelning X: Antal (ober.) försök tills lyckat X Geom(p) Binomial-fördelning Y: Antal lyckade av n oberoende försök. Y Bin(n, p)

Kontinuerliga s.v. Definition Y kont. s.v. med täthetsfunktion f Y (y) om P(a Y b) = b a f Y(y)dy f Y (y) 0, y f Y(y) = 1 Samband F Y (y) = P(Y y) = y f Y(y)dt f Y (y) = F Y (y), om F Y är deriverbar i y Väntevärde E[Y] = y f Y(y)dy

Normalfördelningen Definition Y Norm(µ,σ), om: f Y (y) = 1 e (y µ)2 2σ 2 2πσ, < y < Som approximation Bin(n, p) Norm(np, np(1 p)) om n min(p, 1 p) > 5 Transformationer X normalfördelad ax + b normalfördelad X, Y normalfördelade X + Y normalfördelade

Centrala gränsvärdessatsen 0.5 0.4 Demonstration av centrala gränsvärdessatsen medelvärde av 1 upprepningar normalfördelning 0.18 0.16 0.14 0.12 Demonstration av centrala gränsvärdessatsen medelvärde av 10 upprepningar normalfördelning f(x) 0.3 0.2 0.1 f(x) 0.1 0.08 0.06 0.04 0.02 0 0 1 2 x 0 0 0.5 1 1.5 x CGS Om X 1,...,X n är ober. och likafördelade så är X = 1 n Xi approximativt normalfördelad. Tumregel n 30 ger oftast bra noggrannhet.

Flerdimensionella s.v. Definition X, Y s.v. på samma utfallsrum (S) har 2-dim. frekvensfunktion f XY (x, y) = P(X = x, Y = y) Marginalfördelningar f X (x) = y f XY(x, y) Oberoende X, Y oberoende om f XY (x, y) = f X (x)f Y (y), x, y Väntevärde och korrelation E[h(X, Y)] = x y h(x, y)f XY(x, y) Cov(X, Y) = E[(X µ X )(Y µ Y )] = E[XY] E[X] E[Y] ρ XY = Cov(X,Y) σ X σ Y

Markovkedjor Definition X 0, X 1, X 2,... är en Markovkedja med övergångsmatris P om 7 1/4 1/2 1 2 1/2 1/4 4/8 3 1/4 P(X n+1 = j X n = i, X n 1 = a n 1,... X 0 = a 0 ) = 1/2 1 3/8 5 3/4 1/3 4 2/3 = P(X n+1 = j X n = i) = P ij 1 6 1/8 Sannolikhetsvektorer Om X antar värden 1,..., k kan fördelningen skrivas som u = [u 1 u 2...u k ], där u i = P[X = i]

Markovkedjor II Steg s.v. X 0 X 1 X k sannolikhetsvektor u up up k

Poissonprocesser Uppkomst Punkter utspridda slumpmässigt i tiden/rummet s.a. Antal punkter i två ej överlappande intervall är oberoende. Om X är antal punkter i ett intervall av längd L så är E[X] = λl P[2 händelser på kort tid] = liten

Poissonfördelning II Poissonprocess med intensitet λ X ~ Exp( λ) W ~ Gamma(2, λ) x x x x x x t 1 t 2 t 1 Y ~ Poi( λ ( t 2 t 1) ) t 2 Poissonfördelning Y: antal punkter i intervall av längd L Y Poi(λL) x Exponentialfördelning X: tid(avstånd) till nästa punkt X Exp(λ)

Stickprov X 1,..., X n är slumpmässigt stickprov av X om X 1,..., X n är oberoende X 1,..., X n har samma fördelning som X Skattningar En bra skattare ˆθ för en parameter θ bör vara: Väntevärdesriktig: E[ˆθ] = θ Lågvariant: Var ˆθ liten Allmänna v.v.r. skattningar E[X] skattas med X = 1 n Xi Var X skattas med S 2 = 1 (Xi X) 2 n 1

Konfidensintervall Definition Ett stokastiskt intervall (L, U) är ett konfidensintervall för θ med konfidensgrad 1 α om θ: P(L θ U) = 1 α Standardkonfidensintervall X Norm(µ,σ) µ X ± z α/2 σ n X Norm(µ,σ) µ S X ± t α/2 n [ X Norm(µ,σ) σ 2 (n 1)S 2, (n 1)S2 χ 2 χ α/2 2 1 α/2 X Bin(n, p) p ˆp ± z α/2 ˆp(1 ˆp) n ] Approx. via CGS

Skillnad mellan undersökningar? Konf.int. för skillnader X Norm(µ X,σ X ) Y Norm(µ Y,σ Y ) X Norm(µ X,σ) Y Norm(µ Y,σ) X Bin(n X, p X ) Y Bin(n Y, p Y ) r σ µ X µ Y X Ȳ ± z X 2 α/2 + σ2 Y n X n Y µ X µ Y X Ȳ ± t α/2 p X p Y r S 2 1 p nx + n 1, Y S 2 p = (n X 1)S2 X +(n Y 1)S2 Y n X +n Y 2 r ˆp pˆ X ˆp Y ± z X (1 ˆp X ) α/2 + ˆp Y (1 ˆp Y ) n X n Y (Approx. via CGS)

Genererande funktioner Definition En serie a 0, a 1, a 2,... har gen. fun. Inversionsformel a n = A(n) (0) n! Standardserier 1, c, c 2 1 (,... 1 cx n ) ( 0, n ) ( 1, n ) 2,... (1 + x) n ( k ( k), k+1 ) ( k, k+2 ) k,... 1 (1 x) k+1 A(x) = a 0 + a 1 x + a 2 x 2...

Momentgenererande funktioner Definition m X (t) = E[e tx ] = E[X0 ] 0! + E[X1 ] 1! t + E[X2 ] 2! t 2 +..., om väntevärdet existerar i intervall kring 0. Inversion E[X n ] = m (n) x (0)