Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Relevanta dokument
Lektionsanteckningar 11-12: Normalfördelningen

Samplingfördelningar 1

Föreläsning G60 Statistiska metoder

F9 SAMPLINGFÖRDELNINGAR (NCT

Kap 3: Diskreta fördelningar

Jörgen Säve-Söderbergh

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Föreläsning 6, Repetition Sannolikhetslära

FÖRELÄSNING 7:

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

TMS136. Föreläsning 7

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

TMS136. Föreläsning 4

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

F10 Problemlösning och mer om konfidensintervall

Statistik 1 för biologer, logopeder och psykologer

Formel- och tabellsamling i matematisk statistik

F9 Konfidensintervall

FÖRELÄSNING 8:

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Centrala gränsvärdessatsen (CGS). Approximationer

4 Diskret stokastisk variabel

Föreläsning 8, Matematisk statistik Π + E

F3 Introduktion Stickprov

Kap 2. Sannolikhetsteorins grunder

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

1.1 Diskret (Sannolikhets-)fördelning

Matematisk statistik 9 hp Föreläsning 8: Binomial- och Poissonfördelning, Poissonprocess

Föreläsning 4: Konfidensintervall (forts.)

Grundläggande matematisk statistik

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

Föreläsning 3. Sannolikhetsfördelningar

8. NÅGRA SPECIELLA KONTINUERLIGA SANNOLIKHETSFÖRDELNINGAR

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

4.1 Grundläggande sannolikhetslära

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Föreläsning G70 Statistik A

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

Tentamen den 11 april 2007 i Statistik och sannolikhetslära för BI2

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 4 mars 2006, kl

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Föreläsning 12: Regression

Summor av slumpvariabler

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen

Repetitionsföreläsning

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamen i Statistik, STA A10 samt STA A13 9p 24 augusti 2005, kl

Introduktion till statistik för statsvetare

Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

SF1901 Sannolikhetsteori och statistik I

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

2. Test av hypotes rörande medianen i en population.

TMS136. Föreläsning 11

Föreläsning 7: Punktskattningar

1 Föreläsning IV; Stokastisk variabel

SF1901 Sannolikhetsteori och statistik I

bli bekant med summor av stokastiska variabler.

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Matematisk statistik, LMA 200, för DAI och EI den 25 aug 2011

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Veckoblad 3. Kapitel 3 i Matematisk statistik, Dahlbom, U.

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Tentamen i Matematisk statistik Kurskod S0001M

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

Föreläsning 7: Punktskattningar

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Matematisk statistik för B, K, N, BME och Kemister

(x) = F X. och kvantiler

SF1901: Sannolikhetslära och statistik. Mer om Approximationer

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Mer om konfidensintervall + repetition

, s a. , s b. personer från Alingsås och n b

Transkript:

Kap 6: Normalfördelningen Normalfördelningen Normalfördelningen som approximation till binomialfördelningen σ μ 1

Sats 6 A Om vi ändrar läge och/eller skala på en normalfördelning så har vi fortfarande en normalfördelning Allmänt gäller att en standardiserad s.v. är en s.v. med väntevärde 0 och sd 1 Om ξ är N(µ, σ) och η=(ξ -µ)/ σ, så gäller att η är N(0, 1) Ex. 6.1, sid 156-157 2

Sats 6 B och Sats 6 C Summor av oberoende Normal F är också Normal F Ex. 6.3, sid 159 Ex. 6.5, sid 161 3

Sats 6 D Om ξ 1, ξ 2,, ξ n är oberoende och alla ξ i är N(µ, σ) samt ξ = 1 n n i= 1 ξ i Så gäller ξ är N( μ, σ ) n 4

Samplingfördelningen Statistika varierar från urval till urval Detta betyder att statistika är en slumpvariabel En samplingfördelning är en sannolikhetsfördelning för en statistika Vid upprepade sampling, vet vi vilka värden som kan antas av stickprovsmedelvärdet och sannolikheten för dessa olika värden 5

Exempel Population: 3,5,2,1 (N = 4) Ta ett stickprov med n=3 (utan återläggning) Möjliga urval urval 3, 3, 5, 5, 2 3, 3, 5, 5, 1 3, 3, 2, 2, 1 5, 5, 2, 2, 1 x 10 / 3 = 3.33 9 / 3 = 3 6 / 3 = 2 8/ 3 = 2.67 1/4 p( x) 2 3 x Varje x har samma sannolikhetsvärde = 1/4 6

Exempel Population: 1,2,3,4,5 (N = 5) Ta ett stickprov med n = 2 (med återläggning) x p(x) 1 0.2 2 0.2 3 0.2 4 0.2 5 0.2 1 2 3 4 5 x E(ξ) = µ = 3 Varians = σ 2 = 2,5 Standardavvikelse = σ = 1,58 7

Exempel Urval x Urval 1, 1 1 3, 4 3,5 1, 2 1,5 3, 5 4 1, 3 2 4, 1 2,5 1, 4 2,5 4, 2 3 1, 5 3 4, 3 3,5 2, 1 1,5 4, 4 4 2, 2 2 4, 5 4,5 2, 3 2,5 5, 1 3 2, 4 3 5, 2 3,5 2, 5 3,5 5, 3 4 3, 1 2 5, 4 4,5 3, 2 2,5 5, 5 5 3, 3 3 E( X ) = μ = 3 Varians x = σ 2 X Standardavvikelse = σ frekvens p(x) 1 1 0,04 1,5 2 0,08 2 3 0,12 2,5 4 0,16 3 5 0,20 3,5 4 0,16 4 3 0,12 4,5 2 0,08 5 1 0,04 25 = 1,042 X = 1,0206 8

Exempel x 1 2 3 4 5 1 2 3 4 5 x Originala fördelningen Samplingfördelningen n = 2 9

Exempel Samma medelvärde! x 1 2 3 4 5 1 2 3 4 5 Originala fördelningen Samplingfördelningen n=2 x Mindre varians Mer klockformad x 1 2 3 4 5 1 2 3 4 5 Samplingfördelningen n=3 Samplingfördelningen n=4 x 10

Centrala gränsvärdessatsen (CGS) Samma medelvärde! Population n = 2 n = 30 Mindre varians Mer klockformad μ x μ x μ x μ x 11

Centrala gränsvärdessatsen (CGS) Slutsatsen som kan dras från tidigare exempel: Oavsett formen på den populationsfördelning som ett slumpmässigt stickprov hämtas från, så går fördelningen för stickprovsmedelvärdet mot normalfördelningen då stickprovsstorleken (n) ökar Hur stort stickprov som behövs för att normalfördelningen skall kunna användas som en approximativ modell? Tumregel: I de flesta fall är normalfördelningen en tillräckligt god approximation vid n 30 Sats 6 E 12

Centrala gränsvärdessatsen (CGS) Centrala gränsvärdessatsen är även tillämpbar på summor av oberoende slumpvariabler vid stora stickprov oavsett hur populationens fördelning ser ut Som konsekvens av CGS så har vi följande ξ är approx N(nµ, nσ 2 ) Ex. 6.9, sid 169 13

Fördelningen för stickprovsmedelvärdet Om vi samplar från en normalfördelning är stickprovsmedelvärdet alltid normalfördelat oavsett stickprovsstorlek Om vi samplar från någon annan fördelning är stickprovsmedelvärdet approximativt normalfördelat om n är tillräckligt stort (n 30) 14

Stickprovsmedelvärdets väntevärde och varians Låt n vara stickprovsstorleken och låt µ och σ 2 vara medelvärdet och variansen i den population vi samplar ur ( ) Väntevärde (medelvärde): E ξ = μ Varianse: Standardavvikelse: V ( ) 2 2 σ ξ = σ = ξ n Medelfelet = σ ξ = σ n 15

Beräkningar av sannolikheter med hjälp av CGS Vi Vi utgick utgick ifrån ifrån den den normalfördelning som som då dåξ följde följde och och transformerade oss oss till till standardnormalfördelningen, vi vi kan kan utifrån utifrån detta detta bilda bilda vårt vårt η-värde för för ξ enligt enligt denna denna formel formel η Beräkna sannolikheterna med med hjälp hjälpav avtabellen = ξ σ / μ Ex: Ett slumpmässigt urval, n = 16 från en normalfördelningen med μ = 10 och σ = 8. n ξ μ P( ξ < 12) = P( < σ / n = P( η < 1) = 0,8413 12 10 ) 8 / 16 16

Normalfördelningen som approximation till Binomial Vi ska titta på normalfördelningen som en approximation av binomialfördelningen Då n är stort kan normalfördelningen användas som approximation till binomial Ju mer p avviker från 0.50 desto större n krävs för god approximation. Tumregel: np( 1 p) > 10 17

Exempel n=3 n=20 p(x) 0,4 0,3 0,2 0,1 p(x) 0,2 0,15 0,1 0,05 0 0 1 2 3 Antal lyckade utfall 0 2 4 6 8 10 12 14 16 18 20 Antal lyckade utfall 18

Normalfördelningen som approximation till Binomial Om ξ är Bin (n, p) och tumregeln är uppfylld, så kan vi som approximativ modell använda normalfördelningen med µ= npoch σ 2 =np(1-p) Anledningen till att man vill approximera fördelningar med en normalfördelningen är att man vill förenkla räknearbetet P( a ξ b) P a np np(1 p) η b np np(1 p) 19

Kontinuitetskorrektion En detalj som komplicerar approximationen är att binomialfördelningen är diskret medan normalfördelningen är kontinuerlig Om en variabel är normalfördelad är sannolikheten att variabeln antar ett visst värde alltid lika med noll, vilket ju inte gäller för en binomialfördelad variabel 20

Kontinuitetskorrektion (med halvkorrektion) Lösning: att använda halvkorrektionen P(ξ=a) approximeras med ytan under normalfördelningens kurva i intervallet (a-0,5, a+0,5) P( a ξ b) P a 0,5 np np(1 p) η b + 0,5 np np(1 p) 21

Exempel Antar att ξ är binomialfördelad med n = 50 och p = 0,40. Med hjälp av normal approximation Beräkna P(ξ 10) n = 50 p =.4 (1-p) =.6 np(1-p) = 12>10 Beräkna μ = np = 50(0,4) = 20 normal approximationen är ok! σ = np(1 p) = 50(0,4)(0,6) = 3,46 22

Exempel P( ξ 10) P( η 10,5 20 ) 3,46 = P( η 2.74) = 0,0031 23