Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Relevanta dokument
Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik KTH. Formel- och tabellsamling i Matematisk statistik, grundkurs

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Formel- och tabellsamling i matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

Repetitionsföreläsning

Kap 2. Sannolikhetsteorins grunder

Lufttorkat trä Ugnstorkat trä

SF1901 Sannolikhetsteori och statistik I

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Avd. Matematisk statistik

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Matematisk statistik för D, I, Π och Fysiker

Tentamen i Matematisk Statistik, 7.5 hp

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Thomas Önskog 28/

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

SF1901: Sannolikhetslära och statistik

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Avd. Matematisk statistik

Avd. Matematisk statistik

Avd. Matematisk statistik

Föreläsning 15: Försöksplanering och repetition

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Föreläsning 11, FMSF45 Konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 7: Punktskattningar

Matematisk statistik för D, I, Π och Fysiker

Avd. Matematisk statistik

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Avd. Matematisk statistik

b) Beräkna sannolikheten att en mottagen nolla har sänts som en nolla. (7 p)

SF1901: Medelfel, felfortplantning

f(x) = 2 x2, 1 < x < 2.

Avd. Matematisk statistik

Föreläsning 7: Punktskattningar

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Avd. Matematisk statistik

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Föreläsning 11: Mer om jämförelser och inferens

Kurssammanfattning MVE055

Avd. Matematisk statistik

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

TAMS79 / TAMS65 - vt TAMS79 / TAMS65 - vt Formel- och tabellsamling i matematisk statistik. TAMS79 / TAMS65 - vt 2013.

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 5: Hypotesprövningar

0 om x < 0, F X (x) = c x. 1 om x 2.

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Enkel och multipel linjär regression

Avd. Matematisk statistik

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Föreläsning 12: Linjär regression

Föreläsning 11, Matematisk statistik Π + E

Föreläsning 17, Matematisk statistik Π + E

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

MATEMATISK FORMELSAMLING

Föreläsning 12, FMSF45 Hypotesprövning

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Sannolikheter och kombinatorik

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

Föreläsningsanteckningar i Matematisk Statistik. Jan Grandell

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 7: Punktskattningar

Tentamen MVE302 Sannolikhet och statistik

Tentamen MVE301 Sannolikhet, statistik och risk

Matematisk statistik för B, K, N, BME och Kemister

SF1901: Sannolikhetslära och statistik

Matematisk statistik för D, I, Π och Fysiker

Tentamen MVE301 Sannolikhet, statistik och risk

Formler och tabeller till kursen MSG830

9. Konfidensintervall vid normalfördelning

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Avd. Matematisk statistik

Avd. Matematisk statistik

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

MATEMATISK STATISTIK AK FÖR F, E, D, I, C, Π; FMS 012 FÖRELÄSNINGSANTECKNINGAR I

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

SF1901: Sannolikhetslära och statistik

SF1901 Sannolikhetsteori och statistik I

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 2, FMSF45 Slumpvariabel

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Avd. Matematisk statistik

Transkript:

Matematisk statistik KTH Formel- och tabellsamling i matematisk statistik Varterminen 2005

. Kombinatorik n = k n! k!n k!. Tolkning: n k mängd med n element. 2. Stokastiska variabler V X = EX 2 EX 2 = antalet delmängder av storlek k ur en CX, Y = E X EXY EY = EXY EXEY ρx, Y = CX, Y DXDY 3. Diskreta fördelningar Binomialfördelningen X är Binn, p om p X k = EX = np, V X = np p n k p k p n k, k = 0,,..., n, där 0 < p <. För-första-gangen -fördelningen X är ffgp om p X k = p p k, k =, 2, 3,..., där 0 < p <. EX = p, V X = p p 2 Hypergeometriska fördelningen Np N p k n k X är HypN, n, p om p X k =, 0 k Np, Nn 0 n k N p, där N, Np och n är positiva heltal samt N 2, n < N, 0 < p <. EX = np, V X = N n np p N Poissonfördelningen X är Poµ där µ > 0 om p X k = µk k! e µ, k = 0,, 2,... EX = µ, V X = µ 4. Kontinuerliga fördelningar Likformig fördelning { för a < x < b X är Ua, b där a < b om f X x = b a 0 annars EX = a + b 2, V X = b a2 2

2 Exponentialfördelningen { X är Expλ där λ > 0 om f X x = λ e λx för x > 0 0 annars EX = λ, V X = λ 2 Normalfördelningen X är Nµ, σ om f X x = EX = µ, V X = σ 2 X är Nµ, σ om och endast om X µ σ x µ2 2σ e 2, < x <, σ > 0. 2π σ är N0,. Om Z är N0, sa har Z fördelningsfunktionen Φx enligt tabell och täthetsfunktionen ϕx = 2π e x2 /2, < x <. En linjär sammansättning a i X i + b av oberoende, normalfördelade stokastiska variabler är normalfördelad. 5. Centrala gränsvärdessatsen Om X, X 2,..., X n är oberoende likafördelade stokastiska variabler med väntevärde µ och standardavvikelse σ > 0 sa är Y n = X + + X n approximativt Nnµ, σ n om n är stort. 6. Approximation HypN, n, p Binn, p om n N 0. Binn, p Ponp om p 0. Binn, p N np, np p om np p 0 Poµ Nµ, µ om µ 5 7. Tjebysjovs olikhet Om EX = µ och DX = σ > 0 sa gäller för varje k > 0 att P X µ > kσ k 2 8. Statistiskt material x = x n j j= s 2 = x n j x 2 = [ x n j 2 n ] 2 x n j j= j= j=

3 9. Punktskattningar 9. Maximum-likelihood-metoden Lat x i vara en observation pa X i, i =, 2,..., n, där fördelningen för X i beror pa en okänd parameter θ. Det värde θobs som maximerar L -funktionen { px,...,x x n,..., x n ; θ = om oberoende = p X x ; θ p Xn x n ; θ Lθ = f X,...,X n x,..., x n ; θ = om oberoende = f X x ; θ f Xn x n ; θ kallas maximum-likelihood-skattningen ML-skattningen av θ. 9.2 Minsta-kvadrat-metoden Lat x i vara en observation pa X i, i =, 2,..., n, och antag att EX i = µ i θ, θ 2,..., θ k och V X i = σ 2, där θ, θ 2,..., θ k är okända parametrar och X, X 2,..., X n är oberoende. Minsta-kvadrat-skattningarna MK-skattningarna av θ, θ 2,..., θ k är de värden θ obs, θ 2 obs,..., θ k obs som minimerar kvadratsumman Q = Qθ, θ 2,..., θ k = xi µ i θ, θ 2,..., θ k 2. 9.3 Medelfel En skattning av Dθ kallas medelfelet för θ och betecknas dθ. 9.4 Felfortplantning Med beteckningar och förutsättningar enligt läroboken gäller a Egθ gθ obs Dgθ g θobs Dθ b Egθ,..., θn g θ obs,..., θ n obs [ V gθ,..., θn Cθi, θ g j g ] x j= i x j x k =θ k obs,k=,...,n 0. Nagra vanliga fördelningar i statistiken χ 2 -fördelningen Om X, X 2,..., X f är oberoende och N0, sa gäller att f Xk 2 är χ2 f -fördelad. k= t -fördelningen Om X är N0, och Y är χ 2 f samt om X och Y är oberoende sa gäller att X Y/f är tf -fördelad.

. Stickprovsvariablernas fördelningar vid normalfördelade stickprov. Lat X,..., X n vara oberoende stokastiska variabler som alla är Nµ, σ. Da gäller: a X är N b σ µ, n n X i X 2 n S2 σ 2 = σ 2 är χ 2 n c X och S 2 är oberoende d X µ S/ n är tn 4.2 Lat X,..., X n vara Nµ, σ och Y,..., Y n2 vara Nµ 2, σ och samtliga stokastiska variabler antas oberoende. Da gäller: a X Y är N µ µ 2, σ n + n2 b n + n 2 2S 2 σ 2 är χ 2 n + n 2 2 där S 2 = n 2 S + n 2 S2 2 n + n 2 2 S 2 = n X n i X 2 och S2 2 = n 2 Y n 2 i Y 2 c X Y och S 2 är oberoende d X Y µ µ 2 är tn + n 2 2 S n + n 2,.3 Lat X,..., X n vara Nµ, σ och Y,..., Y n2 vara Nµ 2, σ 2 och samtliga stokastiska variabler antas oberoende. Da gäller: σ 2 X Y är N µ µ 2, + σ2 2 n n 2 2. Konfidensintervall 2. λ -metoden Lat θ vara Nθ, D där D är känd och θ okänd. Da är θ obs ± D λ α/2 ett konfidensintervall för θ med konfidensgraden α.

5 2.2 t -metoden Lat θ vara Nθ, D där D och θ är okända och D inte beror pa θ. Lat Dobs vara en punktskattning av D sadan att θ θ D är tf. Da är θobs ± D obs t α/2 f ett konfidensintervall för θ med konfidensgraden α. 2.3 Approximativa metoden Lat θ vara approximativt Nθ, D. Antag att D obs är en lämplig punktskattning av D. Da är θ obs ± D obs λ α/2 ett konfidensintervall för θ med den approximativa konfidensgraden α. 2.4 Metod baserad pa χ 2 -fördelning Lat θobs vara en punktskattning av en parameter θ sadan att θ 2 f är χ 2 f. Da är θ θobs f χ 2 α/2 f, θ f obs χ 2 α/2 f ett konfidensintervall för θ med konfidensgraden α. 3. Linjär regression 3. Fördelningar Lat Y i vara Nα + βx i, σ, i =, 2,..., n, och oberoende. Da gäller: n a β x = i xy i Y σ n är N β, n b α = Y β x är N c α + β x 0 är N α, σ α + βx 0, σ n + x 2 n n + x 0 x 2 n d n 2S2 σ 2 är χ 2 n 2 där S 2 = n 2 e S 2 är oberoende av α och β Y i α β x i 2

6 3.2 Konf idensintervall I α : α obs ± t p/2 n 2s n + x 2 n I β : βobs ± t s p/2 n 2 n I α+βx0 : α obs + β obs x 0 ± t p/2 n 2s n + x 0 x 2 n 3.3 Beräkningsaspekter S xy = x i xy i y = x i xy i = x i y i y = x i y i nx y S xx = = x 2 i nx2 S yy = y i y 2 n 2s 2 = S yy βobs 2 S xx = S yy βobs S xy = min y i α βx i 2 α,β 4. Hypotesprövning 4. Def initioner Signifikansnivan felrisken α är det maximala värdet av P förkasta H 0 da hypotesen H 0 är sann. Styrkefunktionen hθ = P förkasta H 0 da θ är rätt parametervärde. 4.2 Konf idensmetoden Förkasta H 0 : θ = θ 0 pa nivan α om θ 0 ej faller inom ett lämpligt valt konfidensintervall med konfidensgraden α. 4.3 χ 2 -test Man gör n oberoende upprepningar av ett försök som ger nagot av resultaten A, A 2,..., A r med respektive sannolikheter P A, P A 2,..., P A r. Lat för j =, 2,..., r den stokastiska variabeln X j beteckna antalet försök som ger resultatet A j.

7 Test av given fördelning: Vi vill testa H 0 : P A = p, P A 2 = p 2,..., P A r = p r för givna sannolikheter p, p 2,..., p r. Da blir r x j np j 2 Q = np j= j ett utfall av en approximativt χ 2 r -fördelad stokastisk variabel om H 0 är sann och np j 5, j =, 2,..., r. Om vi skattar k parametrar ur data, θ = θ,..., θ k, för att skatta p, p 2,..., p r med p θobs, p 2 θ obs,..., p r θ obs sa är r xj np Q j θobs = 2 j= np j θobs ett utfall av en approximativt χ 2 r k -fördelad stokastisk variabel. r x 2 j Beräkningsaspekt: Q = n, Q = np j= j r j= x 2 j np j θ obs n Homogenitetstest: Man vill testa om sannolikheterna för resultaten A, A 2,..., A r är desamma i s försöksserier. Inför beteckningar enligt nedanstaende tabell: Serie Antal observationer av Antal försök A A 2 A 3... A r x x 2 x 3... x r n 2. x 2. x 22 x 23... x 2r n 2. s x s x s2 x s3... x sr n s Kolonnsumma m m 2 m 3... m r N s r x ij n i m j 2 N Bilda Q =. n i m j j= N Q är ett utfall av en approximativt χ 2 r s -fördelad stokastisk variabel. Kontingenstabell test av oberoende mellan rader och kolonner: Samma teststorhet och fördelning som ovan.