SF1901: Sannolikhetslära och statistik

Relevanta dokument
SF1901: Sannolikhetslära och statistik

Kap 2. Sannolikhetsteorins grunder

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

SF1901: Sannolikhetslära och statistik

SF1911: Statistik för bioteknik

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

SF1901: Sannolikhetslära och statistik. Mer om Approximationer

SF1901 Sannolikhetsteori och statistik I

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

0 om x < 0, F X (x) = c x. 1 om x 2.

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

Matematisk statistik för B, K, N, BME och Kemister

TAMS79: Föreläsning 6. Normalfördelning

SF1901 Sannolikhetsteori och statistik I

(x) = F X. och kvantiler

Grundläggande matematisk statistik

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

TMS136. Föreläsning 4

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Föreläsningsanteckningar i Matematisk Statistik. Jan Grandell

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Föreläsning 6, Repetition Sannolikhetslära

TMS136. Föreläsning 7

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

9. Konfidensintervall vid normalfördelning

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Formel- och tabellsamling i matematisk statistik

FÖRELÄSNING 7:

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Lektionsanteckningar 11-12: Normalfördelningen

Föreläsning 8, Matematisk statistik Π + E

Summor av slumpvariabler

Föreläsning 4: Konfidensintervall (forts.)

Stokastiska vektorer

Föreläsning 12: Regression

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Avd. Matematisk statistik

Repetitionsföreläsning

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Demonstration av laboration 2, SF1901

Statistik 1 för biologer, logopeder och psykologer

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

Matematisk statistik 9 hp Föreläsning 8: Binomial- och Poissonfördelning, Poissonprocess

Avd. Matematisk statistik

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Väntevärde och varians

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Tentamen i matematisk statistik (92MA31, STN2) kl 08 12

Centrala gränsvärdessatsen (CGS). Approximationer

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik

Introduktion till statistik för statsvetare

F9 Konfidensintervall

Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Thomas Önskog 28/

Tentamen i Matematisk Statistik, 7.5 hp

Avd. Matematisk statistik

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Transformer i sannolikhetsteori

Föreläsning 2, FMSF45 Slumpvariabel

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Matematisk statistik för D, I, Π och Fysiker

Avd. Matematisk statistik

SF1901: Medelfel, felfortplantning

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

F3 Introduktion Stickprov

Jörgen Säve-Söderbergh

Våra vanligaste fördelningar

Avd. Matematisk statistik

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Bengt Ringnér. October 30, 2006

Föreläsning 7: Punktskattningar

Bengt Ringnér. September 20, Detta är föreläsningsmanus på lantmätarprogrammet LTH vecka 5 HT07.

Tentamen MVE301 Sannolikhet, statistik och risk

FACIT: Tentamen L9MA30, LGMA30

Föreläsning 4, Matematisk statistik för M

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Stokastiska vektorer och multivariat normalfördelning

Transkript:

SF1901: Sannolikhetslära och statistik Föreläsning 6. Normalfördelning, Centrala gränsvärdessatsen, Approximationer Jan Grandell & Timo Koski 06.02.2012 Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 1 / 38

Standardiserad normalfördelning, N(0, 1) Definition En s.v. Z säges vara standardiserad normalfördelad om den är N(0, 1)-fördelad, dvs. om den har täthetsfunktionen ϕ(z) = 1 2π e z2 /2. Dess fördelningsfunktion betecknas med Φ(z), dvs. Φ(z) = z 1 2π e x2 /2 dx. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 2 / 38

Standardiserad normalfördelning, N(0, 1) ϕ(z) = 1 2π e z2 /2. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 3 / 38

En bilaga i fin stil (kan överhoppas) Hur vet vi att ϕ(z) = 1 2π e z2 /2 är en sannolikhetstäthet? Dvs. varför gäller det att ϕ(z)dz = 1. Svaret ges t.ex. i Eike Petermann: Analytiska metoder II, Studentlitteratur 2002, sid. 235, Ex. 9.14, Anmärkning 9.6 eller bilagan nedan Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 4 / 38

Bilaga (ur Eike Petermann: Analytiska metoder II) : ϕ(z)dz = 1. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 5 / 38

Bilaga : ϕ(z)dz = 1. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 6 / 38

Sista sidan i bilagan : ϕ(z)dz = 1. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 7 / 38

Standardiserad normalfördelning, N(0, 1) Fördelningsfunktionen betecknas med Φ(z), dvs. Φ(z) = Av symmetriskäl gäller klart att z 1 2π e x2 /2 dx. Φ(0) = 1 2. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 8 / 38

Beräkning av Φ(z): MATLAB Ett problem är att fördelningsfunktionen inte kan ges på en sluten analytisk form. Det är dock lätt att numeriskt beräkna fördelningsfunktionen och vi använder programvara för beräkning av Φ(x). I MATLAB Statistics Toolbox beräknas Φ(1) av : >> normcdf(1, 0, 1) ans = 0.84134474607 Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 9 / 38

Beräkning av Φ(z): TI-82 STATS Ta fram menyn DISTR med tangentsekvensen 2nd DISTR. Gå ned till normalcdf(. Då beräknas Φ(1) av 1 : normcdf( 1E99, 1, 0, 1).8413447404 Man kan även skriva (d.v.s. 0 och 1 är defaultvärden) normcdf( 1E 99, 1).8413447404 1 E tas fram med tangentsekvensen 2ND E Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 10 / 38

Tabellen för Φ(x) ur kursens formelsamling Vi slår upp Φ(1) som.8413 Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 11 / 38

Φ( z) = 1 Φ(z). Vi observerar att ϕ( z) = ϕ(z). Φ(z) är tabulerad i kursens formelsamling endast för z 0. Vi har dock z z Φ( z) = ϕ(x) dx = [y = x] = ϕ( y) dy Sats = z ϕ(y) dy = 1 Φ(z). Φ( z) = 1 Φ(z). Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 12 / 38

Z N(0, 1), E(Z), V(Z) Om Z är N(0, 1)-fördelad, så kan man visa att E(Z) = 0 (ty ϕ( z) = ϕ(z)) V (Z) = 1. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 13 / 38

Kvantiler När vi kommer till statistikdelen av kursen behöver vi ofta lösa ekvationer av följande slag: Bestäm z så att vi för givet α har P(Z z) = 1 α; P(Z > z) = 1 α; P( z < Z z) = 1 α. För att lösa sådana ekvationer inför vi α-kvantilen λ α definierad av P(Z > λ α ) = α eller α = 1 Φ(λ α ). Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 14 / 38

Kvantiler i TI-82 STATS invnorm( Vi vill ta fram λ 0.05 definierad av ekvationen P(Z > λ 0.05 ) = 0.05 eller 0.05 = 1 Φ(λ 0.05 ) Φ(λ 0.05 ) = 0.95 Vi knappar in i räknären (meny DISTR) invnorm(0.95, 0, 1) som ger lösningen ( 1.6449). 1.644853626 Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 15 / 38

Kursens formelsamling: kvantiler Tabell 2 i kursens formelsamling ger λ 0.05 = 1.6449. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 16 / 38

Kvantiler (forts.) α = 1 Φ(λ α ). Det är då bra att observera att 1 α = 1 Φ(λ 1 α ) α = Φ(λ 1 α ) α = 1 Φ( λ 1 α ), vilket ger λ 1 α = λ α. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 17 / 38

Allmän normalfördelning Definition En s.v. X säges vara N(µ, σ)-fördelad, där µ reell och σ > 0, om Z = X µ σ är N(0, 1)-fördelad. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 18 / 38

Allmän normalfördelning Sats Låt X vara N(µ, σ)-fördelad. Då gäller f X (x) = 1 ( ) x µ σ ϕ = 1 σ σ /2σ2 e (x µ)2 2π och ( ) x µ F X (x) = Φ. σ Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 19 / 38

Allmän normalfördelning Bevis. Vi har ( X µ F X (x) = P(X x) = P σ ( = P Z x µ ) ( x µ = Φ Derivation ger f X (x) = 1 σ ϕ ( x µ σ σ ). σ x µ ) σ ). Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 20 / 38

Normalfördelning X N(µ, σ) med f X (x) = 1 σ /2σ2 e (x µ)2 2π där µ godtycklig konstant och σ > 0. I figuren för f X (x) har vi µ = 1, σ = 1 Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 21 / 38

Normalfördelning (även känd som Gaussfördelning efter C.F. Gauss, 1777-1855) Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 22 / 38

Normalfördelning i kinetiska gasteorin X N(0, σ) med m /2k f X (x) = B T 2πk B T e mx2 k d.v.s. σ = B T m, k B = Boltzmans konstant, T = temperatur, m = partikelns massa. the fraction of particles in with velocities in the x-direction within x, x + dx =f X (x)dx.. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 23 / 38

En viktig regel Beviset ovan innehåller en viktig räkneregel. Om X är N(µ, σ)-fördelad, så gäller det att ( ) x µ F X (x) = P(X x) = Φ. σ Man kan m.a.o. använda tabellen för Φ(x) även för att beräkna F X (x) för X N(µ, σ). Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 24 / 38

TI-82 STATS Smidigare än med regeln ovan och tabellen kan vi beräkna, om X N(µ, σ), sannolikheten F X (x) = P(X x) som normcdf( 1E99, x, µ, σ) Till exempel, om X N(2, 2) och beräknas P(0 X 3.5) med TI-82 STATS som normcdf(0, 3.5, 2, 2).614717461 Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 25 / 38

Allmän normalfördelning Sats Om X är N(µ, σ)-fördelad så gäller E(X) = µ och V (X) = σ 2. Bevis. Vi ska nu se hur listig definitionen är! X = σz + µ E(X) = σe(z) + µ = 0 + µ = µ V (X) = σ 2 V (Z) + 0 = σ 2. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 26 / 38

Täthetsfunktionerna för N(0, 1) och N(1, 1) och N(0, 1) och N(0, 2) (från vänster till höger) Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 27 / 38

Allmän normalfördelning Sats Låt X vara N(µ, σ)-fördelad och sätt Y = ax + b. Då gäller det att Y är N(aµ + b, a σ)-fördelad. Bevis. Från definitionen följer att X = µ + σz där Z är N(0, 1)-fördelad. Detta ger Y = ax + b = a(µ + σz) + b = aµ + b + aσz Y (aµ + b) = Z. aσ Om a > 0 följer satsen. Om a < 0 utnyttjar vi att Z och Z har samma fördelning. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 28 / 38

Summan av oberoende normalfördelade variabler Sats Om X är N(µ X, σ X )-fördelad, Y är N(µ Y, σ Y )-fördelad och X och Y är oberoende så gäller att ( ) X + Y är N µ X + µ Y, σx 2 + σ2 Y -fördelad och ( ) X Y är N µ X µ Y, σx 2 + σ2 Y -fördelad. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 29 / 38

Repetition om väntevärden Återkalla i minnet att Låt X och Y vara två oberoende (okorrelerade räcker) s.v. Då gäller E(X + Y ) = E(X) + E(Y ) V (X + Y ) = V (X) + V (Y ) E(X Y ) = E(X) E(Y ) V (X Y ) = V (X) + V (Y ). Det nya är att vi kan ge fördelningen för summan av oberoende normalfördelade variabler Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 30 / 38

Summan av oberoende normalfördelade variabler Sats Låt X 1,..., X n vara oberoende och N(µ 1, σ 1 ),..., N(µ n, σ n ). Då gäller att ( n n n ) c k X k är N c k µ k, ck 2σ2 k -fördelad. k=1 k=1 k=1 Allmän regel: Linjärkombinationer av oberoende normalfördelade stokastiska variabler är normalfördelade med rätt väntevärde och rätt standardavvikelse. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 31 / 38

I förra föreläsningen Sats Låt X 1,..., X n vara oberoende (okorrelerade räcker) s.v. och sätt Y = c 1 X 1 +... + c n X n. Då gäller och E(Y ) = c 1 E(X 1 ) +... + c n E(X n ) V (Y ) = c 2 1V (X 1 ) +... + c 2 nv (X n ) Det nya är att vi för linjärkombinationer av oberoende normalfördelade stokastiska variabler kan ge hela fördelningen. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 32 / 38

Aritmetiska medelvärdet Följdsats Låt X 1, X 2,..., X n vara oberoende och N(µ, σ)-fördelade s.v. Då gäller att ( ) σ X är N µ, -fördelad. n Återkalla i minnet: Sats Låt X 1, X 2,..., X n vara oberoende och likafördelade s.v. med väntevärde µ och standardavvikelse σ. Då gäller att E(X) = µ, V (X) = σ2 n och D(X) = σ n. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 33 / 38

Centrala gränsvärdessatsen Vi har sett några exempel på att normalfördelningen har trevliga statistiska egenskaper. Detta skulle vi inte ha så stor glädje av, om normalfördelningen inte dessutom var vanligt förekommande. Centrala gränsvärdessatsen CGS, som är den huvudsakliga motiveringen för normalfördelningen, kan utan vidare sägas vara ett av sannolikhetsteorins och statistikens allra viktigaste resultat. Sats (CGS) Låt X 1, X 2,... vara oberoende och lika fördelade s.v. med väntevärde µ och standardavvikelse σ. Då gäller att ( n ) P i=1 X i nµ σ x Φ(x) då n. n Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 34 / 38

CGS Ofta uttrycker man slutsatsen i CGS som att n i=1 X i nµ σ n är approximativt N(0, 1)-fördelad eller att n X i är approximativt N ( nµ, σ n ) -fördelad. i=1 Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 35 / 38

CGS En, för statistiken mycket vanlig användning av CGS är följande: Följdsats Låt X 1, X 2,... vara oberoende och lika fördelade s.v. med väntevärde µ och standardavvikelse σ. Då gäller att ( ) ( ) b µ a µ P(a < X b) Φ σ/ Φ n σ/ n om n är tillräckligt stort. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 36 / 38

CGS Det är tyvärr inte möjligt att ge några generella och enkla tumregler om hur stort n måste vara för att normalapproximationen ska vara användbar. Detta beror på hur normalliknande de enskilda variablerna X k är. Om X k na är normalfördelade så gäller ju CGS för alla n. En tumregel är att om X k na är någorlunda symmetriskt fördelade så räcker ganska små n, säg något tiotal. Om X k na är påtagligt skevt fördelade så behöver n var något eller i värsta fall några hundratal. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 37 / 38

CGS Det är svårt att formulera strikt, men det räcker i CGS att X k na är någorlunda oberoende och någorlunda lika fördelade. Med någorlunda lika fördelade menas framförallt att det inte finns vissa X k som är mycket dominerande. Detta innebär att mätfel i välgjorda försök kan anses vara approximativt normalfördelade. I mindre välgjorda försök kan det däremot mycket väl finnas någon dominerande felkälla som inte alls behöver vara approximativt normalfördelad. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 38 / 38

Binomialfördelningen Antag att vi gör ett försök där en händelse A, med sannolikheten p = P(A), kan inträffa. Vi upprepar försöken n gånger, där försöken är oberoende. Sätt X = antalet gånger som A inträffar i de n försöken. Vi säger då att X är binomialfördelad med parametrarna n och p, eller kortare att X är Bin(n, p)-fördelad. Vi har ( ) n p X (k) = p k q n k, för k = 0,..., n, k där q = 1 p. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 39 / 38

X Bin(n, p), X = U 1 +... + U n Låt U 1,..., U n vara s.v. definierade av { 0 om A inträffar i försök nummer i, U i = 1 om A inträffar i försök nummer i. Lite eftertanke ger att U 1,..., U n är oberoende och att X = U 1 +... + U n. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 40 / 38

X Bin(n, p), X = U 1 +... + U n Då och E(U i ) = 0 (1 p) + 1 p = p V (U 1 ) = E(U 2 i ) E(U i ) 2 = E(U i ) E(U i ) 2 = p p 2 = p(1 p) så följer E(X) = ne(u i ) = np och V (X) = nv (U i ) = npq. Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 41 / 38

Bin(n, p) approximativt N(np, npq)-fördelad Av Xs representation som en summa följer att CGS kan tillämpas. Sats Om X är Bin(n, p)-fördelad med npq 10 så är X approximativt N(np, npq)-fördelad. Detta innebär att } P(X k) P(X < k) ( ) k np Φ. npq Med halvkorrektion menas att vi använder följande approximation: ( k + 1 2 P(X k) Φ np ), npq ( k 1 2 P(X < k) Φ np ). npq Jan Grandell & Timo Koski () Matematisk statistik 06.02.2012 42 / 38