TAMS79: Föreläsning 6. Normalfördelning

Relevanta dokument
Matematisk statistik 9hp Föreläsning 7: Normalfördelning

SF1901: Sannolikhetslära och statistik

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik

Stokastiska vektorer och multivariat normalfördelning

(x) = F X. och kvantiler

Grundläggande matematisk statistik

Föreläsning 3: Konfidensintervall

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Betingning och LOTS/LOTV

Föreläsning 7: Stokastiska vektorer

Stokastiska vektorer

Matematisk statistik för B, K, N, BME och Kemister

SF1911: Statistik för bioteknik

SF1901 Sannolikhetsteori och statistik I

Lektionsanteckningar 11-12: Normalfördelningen

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 6: Hypotestester (forts.)

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Veckoblad 3. Kapitel 3 i Matematisk statistik, Dahlbom, U.

Kap 2. Sannolikhetsteorins grunder

Bengt Ringnér. October 30, 2006

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Bengt Ringnér. September 20, Detta är föreläsningsmanus på lantmätarprogrammet LTH vecka 5 HT07.

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

FÖRELÄSNING 7:

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

Summor av slumpvariabler

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Föreläsning 5, FMSF45 Summor och väntevärden

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

TATM79: Föreläsning 6 Logaritmer och exponentialfunktioner

TAMS79: Föreläsning 4 Flerdimensionella stokastiska variabler

Tentamen MVE301 Sannolikhet, statistik och risk

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 6, Matematisk statistik Π + E

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

9. Konfidensintervall vid normalfördelning

Väntevärde och varians

TMS136. Föreläsning 4

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

1.1 Diskret (Sannolikhets-)fördelning

TATM79: Föreläsning 4 Funktioner

TAMS79: Matematisk statistik vt 2013

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Föreläsning 5, Matematisk statistik Π + E

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Matematisk statistik för D, I, Π och Fysiker

Jörgen Säve-Söderbergh

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Våra vanligaste fördelningar

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

Avd. Matematisk statistik

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Föreläsning 1: Repetition och punktskattningar

SF1901 Sannolikhetsteori och statistik I

SF1901: Medelfel, felfortplantning

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Övning 1 Sannolikhetsteorins grunder

Repetitionsföreläsning

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

Grundläggande matematisk statistik

MVE051/MSG Föreläsning 7

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Föreläsning 7: Punktskattningar

Hur måttsätta osäkerheter?

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

TMS136. Föreläsning 5

Transformer i sannolikhetsteori

Thomas Önskog 28/

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Föreläsning 6, FMSF45 Linjärkombinationer

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Avd. Matematisk statistik

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

SVANTE JANSON OCH SVANTE LINUSSON

TMS136. Föreläsning 7

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Föreläsningsanteckningar till kapitel 8, del 2

8. NÅGRA SPECIELLA KONTINUERLIGA SANNOLIKHETSFÖRDELNINGAR

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Formler och tabeller till kursen MSG830

SF1901: Sannolikhetslära och statistik

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

Formel- och tabellsamling i matematisk statistik

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

Demonstration av laboration 2, SF1901

Föreläsning 5: Hypotesprövningar

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Samplingfördelningar 1

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Transkript:

TAMS79: Föreläsning 6 Normalfördelningen Johan Thim (johan.thim@liu.se 3 november 018 Normalfördelning Definition. Låt µ R och > 0. Om X är en stokastisk variabel med täthetsfunktion f X ( = 1 ( ep ( µ, R, så kallar vi X för normalfördelad med parametrarna µ och. Vi skriver X N(µ,. Om µ = 0 och = 1 kallar vi X för standardiserad, och i det fallet betecknar vi täthetsfunktionen med ϕ( = 1 ep (, R. Fördelningsfunktionen för en normalfördelad variabel ges av F X ( = 1 ˆ (u µ ep ( du, R, och även här döper vi speciellt den standardiserade fördelningsfunktionen till Φ( = 1 ˆ ep ( u du, R. Är det någon som kommer ihåg vad som hände när man försökte integrera e i envariabelanalsen? Man kan visa att det inte går att uttrcka den primitiva funktionen i elementära funktioner, utan man definierar helt enkelt en n funktion utifrån den bestämda integralen (slå upp erf-funktionen i något matematiskt uppslagsverk. Vad detta innebär för oss är att vi kommer att använda tabell för att beräkna numeriska värden för uttrck som innehåller funktionen Φ. Är då detta en täthetsfunktion? Beviset är så roligt att jag inte kan låta bli. Vi visar att e / d =. Sättet vi kommer åt det hela är genom att titta på kvadraten och tolka denna som en itererad dubbelintegral: ( ( ( ˆ ˆ e d / = = e / d ˆ 0 0 e / d re r / dθ dr = = [ ] e r / 0 R e ( + / d d =. 1

Standardisering av variabel Om X är en stokastisk variabel med E(X = µ och V (X =, så är Z = (X µ/ en stokastisk variabel med E(Z = 0 och V (Z = 1. Vi kallar Z för standardiserad. Beviset för att E(Z = 0 följer direkt från linjäriteten hos väntevärdet. Variansen kan ses genom följande argument: V ((X µ/ = E((X µ / 0 = 1 ( E(X µe(x + µ = 1 ( E(X E(X = = 1. Standardiserad normalfördelning Sats. Om X N(0, 1 så är E(X = 0 och V (X = 1. Eftersom e / går mot noll väldigt snabbt, så kommer Alltså måste ϕ( d <. E(X = 1 ϕ( d = 0 eftersom ϕ( är en udda funktion. På liknande sätt ser vi att E(X = ϕ( d = 1 = 1 ( [ ( e / ] + ( e / d e / d = 0 + 1 e / d = 1, där vi partialintegrerat och utnttjat att ϕ( är en täthetsfunktion så den sista integralen blir ett. Ett korollarium av satsen ovan (gör ett variabelbte i integralerna är följande. X N(µ, Om X N(µ, så är E(X = µ och V (X =. Standardavvikelse eller varians? I kursboken (Blom et al används beteckningen X N(µ,, så precis som i vårt fall ovan är den andra parametern är alltså standardavvikelsen, inte variansen. Varför ta upp detta? I mcket av litteraturen så används variansen som andra parameter. Var försiktig när ni slår upp saker eller använder färdiga formler!

= 0.5 0.40 = 1 µ = Låt X N(0, 1. Då gäller Bruk av tabell för Φ( (i P (X = Φ( för alla R; (ii P (a X b = Φ(b Φ(a för alla a, b R med a b; (iii Φ( = 1 Φ( för alla R. Φ( a b Φ(b Φ(a Φ( = 1 Φ( Eempel Låt X N(0, 1. Bestäm P (X 1, P (X < 1, P (X 1, samt P (0 < X 1. Direkt ur tabell, P (X 1 = Φ(1 0.8413. Eftersom X är kontinuerlig kvittar det om olikheterna är strikta eller inte, så P (X < 1 = P (X 1 = Φ(1 igen. Vidare har vi P (X 1 = Φ( 1 = 1 Φ(1 = 0.1587 och P (0 < X 1 = Φ(1 Φ(0 = 0.8413 0.5 = 0.3413. 3

Sats. X N(µ, Z = X µ Standardisering av normalfördelning N(0, 1. Bevis. Antag att Z N(0, 1. Eftersom ( X µ F X ( = P (X = P µ ( = P Z µ ( µ = Φ och Φ ( = ϕ( då ϕ är kontinuerlig, så följer det att f X ( = F X( = 1 ( µ ϕ = 1 ( µ e, R, vilket är precis hur vi definierat N(µ, tidigare. Omvänt, om X N(µ, så är F Z (z = P (Z z = P (µ + Z < µ + z = F X (µ + z, så dvs Z N(0, 1. f Z (z = f X (µ + z = ϕ(z, Eempel Låt X N(1,. Bestäm P (X 1, P (X 1, P (0 < X 1, samt P ( X < 3. ( X 1 (i P (X 1 = P ( X 1 (ii P (X 1 = P 1 1 = Φ(0 = 1. 1 1 = Φ( 1 = 1 Φ(1 0.1587. (iii ( 0 1 P (0 < X 1 = P < X 1 1 1 = Φ(0 Φ( 1/ = 1/ (1 Φ(1/ = 1/ + Φ(1/ 0.1915. (iv ( 1 1 P ( X < 3 = P ( 3 < X < 3 = P < X 1 = Φ( Φ( 1 = Φ( 1 + Φ(1 0.8186. 5 1 Eempel Låt X N(0, 1. Hitta ett tal a så att P ( X > a = 0.05. 4

Situationen ser ut som i bilden nedan. De skuggade områdena utgör tillsammans 5% av sannolikhetsmassan, och på grund av smmetri måste det vara.5% i varje svans. a a Om vi söker talet a, och vill använda funktionen Φ( = P (X, måste vi söka det tal som ger Φ(a = 0.975 (dvs de.5% i vänstra svansen tillsammans med de 95% som ligger i den stora kroppen. Detta gör vi genom att helt enkelt leta efter talet 0.975 i tabellen över Φ( värden. Där finner vi att a = 1.96 uppfller kravet att P (X a = 0.975. 6.1 Linjärkombinationer av normalfördelade variabler Det är inte på något sätt uppenbart att summan av två likafördelade variabler har samma fördelning. Oftast är det inte ens sant. Men, just normalfördelningen har precis denna trevliga egenskap! Summa av normalfördelade variabler Sats. Låt X 1 N(µ 1, 1 och X N(µ, vara oberoende och låt a, b R. Då gäller att ax 1 + bx N(aµ 1 + bµ, a 1 + b. Beviset är inte trivialt. Att E(aX 1 + bx = aµ 1 + bµ och V (ax + bx = a 1 + b är enkelt att se. Detta gäller oavsett vad variablerna har för slags fördelning (enbart egenskaper för väntevärde och varians. Det faktum att summan blir normalfördelad kräver ett djupare argument; se boken (man använder faltningssatsen. Satsen ovan generaliserar direkt till flera variabler. Vi har följande användbara specialfall. Summor och medelvärde Sats. Låt X 1, X,..., X n vara oberoende och X k N(µ, för k = 1,,..., n. Då gäller följande: X := X k N(nµ, n och X := 1 n X k N(µ, / n. 5

Den sista likheten är intressant, då det innebär att ju fler likadana variabler vi tar med i ett medelvärde, desto mindre blir variansen. Till eempel får vi alltså säkrare resultat ju fler mätningar vi gör (något som känns intuitivt korrekt. Det är dock mcket viktigt att variablerna är oberoende. Annars gäller inte satsen! Vi bildar aldrig heller några skillnader mellan varianser, utan det som gör att variansen minskar med antalet termer är faktorn 1/n i medelvärdet: V (X = V ( 1 n ( X k = 1 n V X k = 1 n eftersom variablerna är oberoende och V (X k = för alla k. V (X k = n n = n, Eempel Låt X N(10, 3 och Y N(1, 6 vara oberoende. Vad är sannolikheten att Y är mer än dubbelt så stor som X? Lösning: Låt W = Y X N(1 0, 6 + 4 3 = N(1, 7. Vi söker alltså ( 0 1 P (Y > X = P (Y X > 0 = P (W > 0 = 1 P (W 0 = 1 Φ 7 = 1 (1 Φ(0.1 = 0.5478. Eempel Låt T vara livslängden för en viss sorts lsrör (enhet: månader och T N(0, 8. (i Vad är sannolikheten att man klarar 43 månader om man har två (oberoende lsrör och bter direkt det första går sönder? (ii Hur många lsrör måste man skaffa för att medellivslängden ska vara mer än 19 månader med sannolikhet 95%? Lösning: (i Vi har två lsrör, T 1 och T. Vi söker sannolikheten att T 1 + T 43. Satsen ovan visar att T 1 + T N(40, 4, så ( T1 + T 40 43 40 P (T 1 + T 43 = 1 P (T 1 + T < 43 = 1 P < 16 16 = 1 Φ(3/ 16 1 Φ(0.75 0.66. (ii Låt T vara medelvärdet av n stcken lsrör. Det följer att T N(0, 8/ n. Vi vill att ( T 0 19 0 0.95 = P (T > 19 = P > = 1 P (Z 1/ 8/n 8/n 8/n = 1 Φ( 1/ 8/n = 1 ( 1 Φ(1/ 8/n = Φ( n/8, där Z = T 0 8/n N(0, 1. Ur tabell finner vi då att n/8 = 1.645, eller ekvivalent, att n 1.6. Således behövs åtminstone stcken lsrör. 6