SF1901 Sannolikhetsteori och statistik I

Relevanta dokument
SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

SF1901: Sannolikhetslära och statistik

Kap 2. Sannolikhetsteorins grunder

Grundläggande matematisk statistik

(x) = F X. och kvantiler

SF1901: Sannolikhetslära och statistik

SF1901 Sannolikhetsteori och statistik I

SF1911: Statistik för bioteknik

Formel- och tabellsamling i matematisk statistik

Matematisk statistik för B, K, N, BME och Kemister

FÖRELÄSNING 7:

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

SF1901 Sannolikhetsteori och statistik I

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

F9 Konfidensintervall

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Föreläsning 7: Punktskattningar

SF1901: Sannolikhetslära och statistik

Matematisk statistik för D, I, Π och Fysiker

9. Konfidensintervall vid normalfördelning

Demonstration av laboration 2, SF1901

Avd. Matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Föreläsning 7: Punktskattningar

Föreläsning 6, Matematisk statistik Π + E

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Thomas Önskog 28/

TAMS79: Föreläsning 6. Normalfördelning

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

Stokastiska vektorer

0 om x < 0, F X (x) = c x. 1 om x 2.

Avd. Matematisk statistik

SF1901: Sannolikhetslära och statistik

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Summor av slumpvariabler

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

TMS136. Föreläsning 4

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

Föreläsning 7: Punktskattningar

Datorövning 1: Fördelningar

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Tentamen i Matematisk Statistik, 7.5 hp

Jörgen Säve-Söderbergh

Statistik 1 för biologer, logopeder och psykologer

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

Matematisk statistik för D, I, Π och Fysiker

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

1 Föreläsning V; Kontinuerlig förd.

Avd. Matematisk statistik

Centrala gränsvärdessatsen (CGS). Approximationer

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Avd. Matematisk statistik

Föreläsning 5, Matematisk statistik Π + E

Föreläsning 4: Konfidensintervall (forts.)

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Avd. Matematisk statistik

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Stokastiska vektorer och multivariat normalfördelning

SF1901: Sannolikhetslära och statistik

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

Föreläsning 2, FMSF45 Slumpvariabel

Repetitionsföreläsning

Matematisk statistik KTH. Formelsamling i matematisk statistik

Lektionsanteckningar 11-12: Normalfördelningen

Grundläggande matematisk statistik

Föreläsning 3. Sannolikhetsfördelningar

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

SF1901: Sannolikhetslära och statistik

Föreläsning 5, FMSF45 Summor och väntevärden

Föreläsning 6, FMSF45 Linjärkombinationer

e x/1000 för x 0 0 annars

Mer om konfidensintervall + repetition

F9 SAMPLINGFÖRDELNINGAR (NCT

Transkript:

SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 7 15 november 2017 1 / 28

Lite om kontrollskrivning och laborationer Kontrollskrivningen omfattar Kap. 1 5 i boken, alltså Föreläsning 1 6. Hjälpmedel: endast miniräknare. omfattar 5 uppgifter. För att erhålla bonus krävs helt korrekt svar till minst 3 av uppgifterna. Gamla kontrollskrivningar att öva på finns på hemsidan. 2 / 28

Idag Förra gången Normalfördelningen och dess egenskaper (Kap. 6.3 6.4) Linjärkombinationer av oberoende normalfördelade s.v. (Kap. 6.5) Centrala gränsvärdessatsen (Kap. 6.7) 3 / 28

Denna kurs Sannolikhetsteori: Hur kan man ställa upp en matematisk modell för ett slumpmässigt försök? (lv. 1 3) Inferensteori: Vilka slutsatser kan man dra av ett givet datamaterial? (lv. 4 7) Sannolikhetsteorin utgör en grund för inferensteorin. 4 / 28

Idag Förra gången Normalfördelningen och dess egenskaper (Kap. 6.3 6.4) Linjärkombinationer av oberoende normalfördelade s.v. (Kap. 6.5) Centrala gränsvärdessatsen (Kap. 6.7) 5 / 28

Förra gången Väntevärden av funktion av flerdimensionell s.v., kovarians och korrelation, väntevärde och varians för linjärkombinationer, stora talens lag. 6 / 28

Mer om kovarianser: bilinjäritet Man övertygar sig enkelt om att kovariansen är bilinjär, dvs. för godtyckliga linjärkombinationer i a ix i och j b jy j av ev. beroende s.v. gäller att C i a i X i, j b j Y j = a i b j C(X i, Y j ). i,j Ofta praktiskt när man räknar! Speciellt gäller att (jfr. förra gången) ( ) V a i X i = C a i X i, a j X j i i j = a i a j C(X i, X j ) = ai 2 V(X i ) + 2 i,j i i<j a i a j C(X i, X j ). 7 / 28

Exempel: summa och differens Låt X och Y vara s.v. sådana att V(X ) = V(Y ). Beräkna C(X + Y, X Y ). [ svar: 0 ] 8 / 28

Idag Förra gången Normalfördelningen och dess egenskaper (Kap. 6.3 6.4) Linjärkombinationer av oberoende normalfördelade s.v. (Kap. 6.5) Centrala gränsvärdessatsen (Kap. 6.7) 9 / 28

Täthetsfunktion Definition Om en s.v. X har täthetsfunktionen f X (x) = 1 σ 2π e (x µ)2 /(2σ2), x R, där µ och σ > 0 är givna tal, sägs X vara normalfördelad (kodbeteckning: X N(µ, σ)). Om µ = 0 och σ = 1 sägs X vara standardiserad normalfördelad. Den standardiserade normalfördelningen är så viktig att man gett dess täthets- och fördelningsfunktion egna namn, ϕ resp. Φ: ϕ(x) = 1 2π e x2 /2 och Φ(x) = x 1 2π e z2 /2 dz. 10 / 28

Täthetsfunktion (forts.) (a) Täthetsfunktioner (b) Fördelningsfunktioner Figur: Täthets- och fördelningsfunktioner för N(µ, σ)-fördelningar med olika parametrar (µ, σ). 11 / 28

Gauß och Laplace (a) C. F. Gauß (1777 1855) (b) P. S. Laplace (1749 1827) 12 / 28

Exempel: lite tabellexercis Låt X N(0, 1). Använd tabell för att beräkna (a) P(X 0.75), (b) P(X 0.75), (c) x 0.15, dvs. 15%-kvantilen för X. MATLAB-lösning: >> normcdf([0.75 0.75]) ans = 0.7734 0.2266 >> norminv(1 0.15) ans = 1.0364 13 / 28

Väntevärde och varians för N(0, 1) Låt X N(0, 1). Då ϕ är symmetrisk inses direkt att E(X ) = xϕ(x) dx = 1 x e x2 /2 dx = 0. 2π Vidare, då V(X ) = E(X 2 ) E(X ) 2 = E(X 2 ) gäller att V(X ) = [ = x x 2 ϕ(x) dx = )] ( 1 2π e x2 /2 } {{ } =0 ( ) 1 x x e x2 /2 dx 2π + 1 e x2 /2 dx 2π }{{} =1 = 1. 14 / 28

Allmän normalfördelning N(µ, σ) Sats X N(µ, σ) om och endast om Y = (X µ)/σ N(0, 1). Dessutom gäller att f X (x) = 1 σ ϕ ( x µ σ ) och ( ) x µ F X (x) = Φ, x R. σ Detta ger direkt att E(X ) = E(σY + µ) = σe(y ) + µ = µ, V(X ) = V(σY + µ) = σ 2 V(Y ) = σ 2, dvs. parametrarna µ och σ är väntevärde resp. standardavvikelse för N(µ, σ)-fördelningen. 15 / 28

Exempel: lite mer tabellexercis Låt X N(6, 2) och beräkna P(7 < X < 9) med hjälp av tabell. MATLAB-lösning: normcdf(9,6,2) normcdf(7,6,2) ans = 0.2417 16 / 28

Normalfördelningens kvantiler Standardnormalfördelningens α-kvantil betecknas λ α och kan hittas i tabell; om X N(0, 1) gäller alltså att P(X > λ α ) = α. Vidare, P( λ α/2 < X < λ α/2 ) = 1 2(α/2) = 1 α. Om X N(µ, σ) är α-kvantilen µ + λ α σ, ty Dessutom, ( ) X µ α = P > λ α = P(X > µ + λ α σ). σ ( 1 α = P λ α/2 < X µ ) < λ σ α/2 = P ( µ λ α/2 σ < X < µ + λ α/2 σ ). 17 / 28

Idag Förra gången Normalfördelningen och dess egenskaper (Kap. 6.3 6.4) Linjärkombinationer av oberoende normalfördelade s.v. (Kap. 6.5) Centrala gränsvärdessatsen (Kap. 6.7) 18 / 28

Linjärkombinationer av oberoende normalfördelade s.v. Linjärkombinationer av normalfördelade s.v. är fortfarande normalfördelade! Sats Om X 1 N(µ 1, σ 1 ), X 2 N(µ 2, σ 2 ),..., X n N(µ n, σ n ) är oberoende gäller för alla konstanter a 1, a 2,..., a n och b att n n a i X i + b N a i µ i + b, n. i=1 i=1 i=1 a 2 i σ2 i Om X 1, X 2,..., X n är oberoende och N(µ, σ)-fördelade erhålls speciellt, för a 1 = a 2 =... = a n = 1/n, X = 1 n n i=1 ( ) σ X i N µ,. n 19 / 28

Exempel: bomullsband En maskin klipper till bomullsband i bitar, vilkas längd (enhet: meter) uppvisar en slumpmässig variation som är N(1, 0.05). Vid ett tillfälle vill man ha 10 bitar med en sammanlagd längd på 10 meter. Då gör man på ett av nedanstående två sätt: (I) Tag ett band slumpmässigt med längden X 1 och klipp till ytterligare 9 precis lika långa bitar. Sammanlagda längden är då Y. (II) Tag 10 bitar slumpmässigt med längder X 1, X 2,..., X 10. Deras sammanlagda längd är då Z. Med vilken metod är sannolikheten störst att den sammanlagda längden ligger nära 10? [ svar: metod (II) ] 20 / 28

Idag Förra gången Normalfördelningen och dess egenskaper (Kap. 6.3 6.4) Linjärkombinationer av oberoende normalfördelade s.v. (Kap. 6.5) Centrala gränsvärdessatsen (Kap. 6.7) 21 / 28

Centrala gränsvärdessatsen Följande är det viktigaste resultatet i matematisk statistik. Sats (centrala gränsvärdessatsen) Låt X 1, X 2,... vara en oändlig följd av likafördelade s.v. med väntevärde µ och standardavvikelse σ > 0 och sätt Y n = X 1 + + X n. Då gäller för alla a < b att ( P a < Y ) n nµ σ < b Φ(b) Φ(a) då n. n Med andra ord, när n är stort är Y n ungefär N(nµ, σ n)-fördelad. Vi skriver detta Y n AsN(nµ, σ n). 22 / 28

Centrala gränsvärdessatsen (forts.) Notera att Y n AsN(nµ, σ n) X = Y n n AsN ( µ, ) σ, n vilket är i linje med stora talens lag. Men centrala gränsvärdessatsen beskriver även felet mellan X och µ. Det märkliga med CGS:en är att den håller oberoende av fördelningen hos X i :na sålänge väntevärde och varians är väldefinierade! Hur stort n som krävs för bra approximation beror på fördelningen hos X i :na och i synnerhet på hur skev denna är. Många mätfel uppstår som summor av delfel av ungefär samma storlek och blir alltså approximativt normalfördelade. 23 / 28

Exempel: upprepade kast med tärning För utfallet X av ett tärningskast gäller att µ = E(X ) = 3.5 och σ = D(X ) = 1.71. Vi kastar en tärning upprepade gånger och betecknar utfallen X 1, X 2, X 3,... Efter varje nytt kast skriver vi upp summan Y n = n i=1 X i. MATLAB-simulering: X = randi(6,1,n); S = cumsum(x); means = S./(1:n); Slutligen beräknar vi den normerade summan (Y n nµ)/(σ n). 24 / 28

Exempel: upprepade kast med tärning (forts.) 0.45 Simulation of 2000 rolls 0.4 0.35 0.3 Normalised histogram 0.25 0.2 0.15 0.1 0.05 0 4 3 2 1 0 1 2 3 4 Normalised deviation from 3.5 Figur: Normerat histogram över 2000 simulerade normerade summor. Rödstreckad linje är täthetsfunktionen för N(0, 1). 25 / 28

Exempel: brinntid hos glödlampor En viss typ av glödlampor har livslängder som är oberoende och exponentialfördelade med väntevärde 1000 (enhet: timme). Hur stor är sannolikheten att 100 lampor av denna typ har en sammanlagd brinntid på minst 110000 timmar? [ svar: 0.16] 26 / 28

Centrala gränsvärdessatsen, bevisskiss Idé: visa att täthetsfunktionen f n för (Y n nµ)/(σ n) är lika med ϕ för stora n genom att visa att Fouriertransformerna av dessa funktioner är lika. Man visar tämligen enkelt (övning!) att Fouriertransformen av ϕ är e t2 /2. För varje täthet f X med väntevärde 0 och varians 1 ges Fouriertransformen allmänt av F(t) = e itx f X (x) dx = E (e ) itx Taylor = 1 + E(X )it V(X ) t 2 + o(t 2 ) 2 = 1 1 2 t2 + o(t 2 ). Överkurs för den intresserade studenten. 27 / 28

Centrala gränsvärdessatsen, bevisskiss (forts) Trick: skriv Z n = Y n nµ σ n = 1 n n X i µ. }{{ σ } not. = X i i=1 Nu erhålls, då E( X i ) = 0 och V( X i ) = 1. ) ϕ n (t) = E (e itzn = E (e i t n X ) n i=1 i ober. = = ( 1 1 2 ( t n ) 2 + o ( ) ) n 1 n n i=1 E (e i t ) n X i n e t2 /2 = ϕ(t). Överkurs för den intresserade studenten. 28 / 28