1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

Relevanta dokument
F9 SAMPLINGFÖRDELNINGAR (NCT

Lektionsanteckningar 11-12: Normalfördelningen

4 Diskret stokastisk variabel

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Kap 3: Diskreta fördelningar

Samplingfördelningar 1

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Statistik 1 för biologer, logopeder och psykologer

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

1.1 Diskret (Sannolikhets-)fördelning

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen

bli bekant med summor av stokastiska variabler.

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Introduktion till statistik för statsvetare

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Jörgen Säve-Söderbergh

TMS136. Föreläsning 7

Demonstration av laboration 2, SF1901

Exempel för diskreta och kontinuerliga stokastiska variabler

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

TMS136. Föreläsning 4

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Grundläggande matematisk statistik

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

4.1 Grundläggande sannolikhetslära

Föreläsning G60 Statistiska metoder

Formel- och tabellsamling i matematisk statistik

SF1901 Sannolikhetsteori och statistik I

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

1 Sannolikhet enligt frekvenstolkningen Kast med tärning

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

SF1901 Sannolikhetsteori och statistik I

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

SF1901: Sannolikhetslära och statistik

Föreläsning 3. Sannolikhetsfördelningar

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

MVE051/MSG Föreläsning 7

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Matematisk statistik för B, K, N, BME och Kemister

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

SF1901 Sannolikhetsteori och statistik I

Föreläsning 7. Statistikens grunder.

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Kap 2. Sannolikhetsteorins grunder

Föreläsning 5, Matematisk statistik Π + E

Summor av slumpvariabler

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Matematisk statistik KTH. Formelsamling i matematisk statistik

Föreläsning 6, Repetition Sannolikhetslära

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Övning 1 Sannolikhetsteorins grunder

SF1901: Sannolikhetslära och statistik

SF1901 Sannolikhetsteori och statistik I

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Föreläsning 8, Matematisk statistik Π + E

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

Grundläggande matematisk statistik

FÖRELÄSNING 7:

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

4.2.1 Binomialfördelning

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

Föreläsning 5, FMSF45 Summor och väntevärden

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

F3 Introduktion Stickprov

1.1 Diskret (Sannolikhets-)fördelning

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Något om sannolikheter, slumpvariabler och slumpmässiga urval

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Avd. Matematisk statistik

Statistiska metoder för säkerhetsanalys

Laboration 2: 1 Syfte. 2 Väntevärde och varians hos en s.v. X med fördelningen F X (x) MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08

F9 Konfidensintervall

Laboration med Minitab

Föreläsning 12: Regression

Statistiska begrepp och metoder som används i Successivprincipen

Stokastiska Processer F2 Föreläsning 1: Repetition från grundkursen

0 om x < 0, F X (x) = c x. 1 om x 2.

Formler och tabeller till kursen MSG830

Föreläsning 7: Punktskattningar

FÖRELÄSNING 8:

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

Våra vanligaste fördelningar

Transkript:

Lunds universitet Matematikcentrum Matematisk statistik Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT-15 Syftet med denna laboration är att du skall bli förtrogen med två viktiga områden inom kursen, nämligen stora talens lag och den centrala gränsvärdesatsen. 1 Stora talens lag 1.1 Teori Antag att vi betecknar utfallet för ett slumpmässigt försök med den stokastiska variabeln X. Vi känner inte till fördelningen av X men vi vet att X antar reella värden och har medelvärde µ = E (X och varians σ 2 = V (X. Antag nu att vi utför n upprepade oberoende försök. Dessa försök motsvarar en sekvens oberoende och likafördelade stokastiska variabler X 1, X 2,..., X n, alla med samma fördelning som X. Stickprovsmedelvärdet denieras nu som genomsnittet av variablerna i stickprovet: X n = X 1 + X 2 +... + X n. n Eftersom summan av stokastiska variabler också är en stokastisk variabel så är X n en stokastisk variabel. Därför har X n en sannolikhetsfördelning (och ett väntevärde och en varians. 1.2 Uppgifter Problem* 1.1. Visa att E ( X n = µ och att V ( Xn = σ 2 n. Antag att vi låter n. Vad händer då med medelvärdet och variansen av X n? Problem* 1.2. Enkelt tärningskast Låt X vara en stokastisk variabel som beskriver utfallet av ett tärningskast (t.ex. om utfallet av kastet är 3 så är X = 3. Om tärningen antas vara rättvis är X likformigt fördelad över {1, 2, 3, 4, 5, 6. Vad blir väntevärdet och variansen av X? Problem 1.3. Upprepade tärningskast och stora talens lag Vi skall nu exempliera stora talens lag med upprepade tärningskast. Vi vill kasta tärningen många gånger, säg n gånger och vi antar att tärningskasten är oberoende. Låt X i beteckna utfallet av det i:te kastet, i = 1,..., n. Då har alla X i samma fördelning som X i uppgift 1.2. Eftersom vi verkligen inte vill kasta en tärning n gånger (om n är mycket stort använder vi R. I R kan vi simulera detta med hjälp av funktionen sample. Se help(sample för att se hur den fungerar. Simulera n stycken tärningskast i R för olika värden n = 1,..., N där N = 1000. Visa med en plot hur stickprovsmedelvärdet X n för n stycken tärningskast beter sig beroende på n.

Verkar det rimligt? Tips (slinga: I denna uppgift ska du upprepa ett n-faldigt tärningskast för olika värden n. För att slippa skriva samma sak N gånger nns det en så kallade for-slinga i R. Gör tex så här: N <- 1000 medelv <- vector(n # vektor som skall fyllas med X n för n = 1,..., 1000 for(n in 1:N{ kast <- sample(... # simulerar n-faldigt tärningskast medelv[n] <- 1/n*sum(kast # sparar X n i vektorn 2 Centrala gränsvärdessatsen 2.1 Teori Förenklat säger centrala gränsvärdessatsen att fördelningen av den normaliserade summan av ett stort antal oberoende och likafördelade stokastiska variabler blir approximativt normalfördelad, oberoende av den ursprungliga fördelningen. Det gör att satsen är användbar i många situationer. Antag som tidigare att vi utför n upprepade oberoende försök och att dessa försök motsvarar en sekvens oberoende och likafördelade stokastiska variabler X 1, X 2,..., X n. Deniera (som tidigare stickprovsmedelvärdet X n som X n = X 1 + X 2 +... + X n. n Enligt stora talens laget konvergerar X n (i fördelning mot en konstant som är µ = E (X 1 = E ( X n. Likvärdigt kan man säga att ( Xn µ 0 i fördelning. Det betyder att X n visar ett mer och mer deterministiskt beteende då n. Det beror på variansen av X n, V ( X n 0 (för n. I centrala gränsvärdessatsen tittar vi inte längre på slumpvariabeln ( X n µ. Istället betraktar man dem så kallade standardiserade slumpvariablerna Z n = X n µ V ( = n X n µ X n V (X1. Det är inte svårt att visa att E (Z n = 0, V (Z n = 1, oberoende på n. Eftersom variansen inte försvinner för stora n konvergerar Z n inte mot ett konstant tal och man kan förvänta sig att Z n har en (icke-trivial gränsfördelning (dvs en gränsfördelning vars varians är positiv. Att detta är fallet bekräftar centrala gränsvärdessatsen. Enligt denna sats gäller då n går mot oändligheten. Z n N (0, 1 Vi skall nu studera centrala gränsvärdessatsen med hjälp av R. 2

2.2 Uppgifter Problem 2.1. I denna uppgift ska vi simulera M försök där man i varje försök kastar n stycken tärningar, för n = 10, 100, 500, 1000. Detta görs likadant som tidigare. Dock istället för att spara slumpvärden X n sparar vi dem standardiserade värden Z n och studerar deras fördelning för olika värden n (För varje värde n får vi M utfall av Z n, säg Z n,1,..., Z n,m och kan förvänta sig att alla Z n,i varierar mer eller mindre runt väntevärdet E (Z n. Vi vill studera hur de värdena variera. Ser det ut som en normalfördelning?. Vi skapar en matris Z_matris med 4 rader (en rad till varje värde på n och M kolumner. Varje kolumn motsvarar ett försök och vi fyller matrisen med standardiserade värdena. Alltså får vi för varje n precis M stycken stokastiska variabler, säger vi Z n,1,..., Z n,m. Låt mu_n = E ( X n och sigma2_n = V ( Xn. I R ser detta ut så här. M <- 5000 n_vec <- c(10,100,500,1000 L <- length(n_vec Z_matris <- matrix(nrow = L, ncol = M for(m in 1:M{ for(i in 1:L{ n <- n_vec[i] kast <- sample(... mu_n <-... sigma2_n <-... Xn <- mean(kast Zn <- (Xn - mu_n/sqrt(sigma2_n # simulerar n-faldigt tärningskast # standardiserar Z_matris[i,m] <- Zn # sparar Z n i vektorn Problem 2.2. Histogram Gör ett normaliserat histogram över värdena Z n,1,..., Z n,m för varje värde n. Dvs kör hist(z_matris[i, ],... för i = 1, 2, 3, 4. Tillägg täthetsfunktionen för N (0, 1 till varje histrogram. Ser det ut att vara en normalfördelning? Problem* 2.3. Antag att X 1,..., X n är oberoende slumpvariabler som har samma födelning. Enligt centrala gränsvärdessatsen konvergerar Xn E(X 1 mot en standard normalfördelning då V(X n n, oberoende på fördelningen av X 1,..., X n. Man kan undra om approximationen fungerar lika bra för alla fördelningar. Ifall X 1,..., X n är normalfördelade med väntevärde µ och varians σ 2 är Xn E(X 1 precis standard normalfördelade (förvissa dig om att du kan prova V(X n detta. I detta fallet är approximationen även exakt. Om X 1,..., X n är Binomialfördelade så 3

är Xn E(X 1 V(X n inte normalfördelade. Dock för stora n ser täthetsfunktionen av Xn E(X 1 V(X n täthetsfunktionen av en standard normalfördelning ganska lika ut. I de två sista uppgifterna ska vi undersöka hur bra approximationen fungerar för ett särskilt värde n = 60 och olika fördelningar. Beräkna väntevärde och varians för X då (a X unif(a, b (a X Bin(N, p (c X Poisson(λ (dvs X har sannolikhetssfunktionen f X (k = λk k! exp( λ och Problem 2.4. Vi skaar n stycken slumpvariabler X 1,..., X n av 1. två olika likformiga fördelningar, 2. två olika Poissonfördelningar och 3. två olika Binomialfördelingar och plottar deras respektive histogram. M <- 500 n <- 60 stand_values <- matrix(nrow = 6, ncol = M for(m in 1:M{ # X_1,...,X_n är unif(3,500 fördelade a <- 3 b <- 500 uni_mu <- (a+b/2 uni_var <- (b-a^2/12 uni <- runif(n, min = a, max = b uni_medelvärde <- mean(uni uni_stand <- (uni_medelvärde - uni_mu/sqrt(uni_var/n stand_values[1,m] <- uni_stand # X_1,...,X_n är unif(3,3.5 fördelade a <- 3 b <- 3.5 uni_mu <- (a+b/2 uni_var <- (b-a^2/12 4

uni <- runif(n, min = a, max = b uni_medelvärde <- mean(uni uni_stand <- (uni_medelvärde - uni_mu/sqrt(uni_var/n stand_values[2,m] <- uni_stand # X_1,...,X_n är Poisson(0.1 fördelade lambda <- 0.1 pois_mu <- lambda pois_var <- lambda pois <- rpois(n, lambda pois_medelvärde <- mean(pois pois_stand <- (pois_medelvärde - pois_mu/sqrt(pois_var/n stand_values[3,m] <- pois_stand # X_1,...,X_n är Poisson(1000 fördelade lambda <- 1000 pois_mu <- lambda pois_var <- lambda pois <- rpois(n, lambda pois_medelvärde <- mean(pois pois_stand <- (pois_medelvärde - pois_mu/sqrt(pois_var/n stand_values[4,m] <- pois_stand # X_1,...,X_n är Bin(20,0.01 fördelade N <- 20 p <- 0.01 bin_mu <- N*p bin_var <- N*p*(1-p bin <- rbinom(n, size = N, prob = p bin_medelvärde <- mean(bin bin_stand <- (bin_medelvärde-bin_mu/sqrt(bin_var/n stand_values[5,m] <- bin_stand # X_1,...,X_n är Bin(20,0.5 fördelade N <- 20 p <- 0.5 bin_mu <- N*p bin_var <- N*p*(1-p bin <- rbinom(n, size = N, prob = p bin_medelvärde <- mean(bin bin_stand <- (bin_medelvärde-bin_mu/sqrt(bin_var/n stand_values[6,m] <- bin_stand 5

# grid på x-axeln x <- seq(-3,3,0.1 # plotta histogram av likfördelningarna par(mfrow = c(1,2 hist(stand_values[1,], 30, freq = FALSE lines(x, dnorm(x,0,1, col = "red" hist(stand_values[2,], 30, freq = FALSE lines(x, dnorm(x,0,1, col = "red" # plotta histogram av Poissonfördelningarna par(mfrow = c(1,2 hist(stand_values[3,], 30, freq = FALSE lines(x, dnorm(x,0,1, col = "red" hist(stand_values[4,], 30, freq = FALSE lines(x, dnorm(x,0,1, col = "red" # plotta histogram av Binomialfördelningarna par(mfrow = c(1,2 hist(stand_values[5,], 30, freq = FALSE lines(x, dnorm(x,0,1, col = "red" hist(stand_values[6,], 30, freq = FALSE lines(x, dnorm(x,0,1, col = "red" Vad upptäcker du? 6