Summor av slumpvariabler

Relevanta dokument

Summor av slumpvariabler

5 Kontinuerliga stokastiska variabler

Storräkneövning: Sannolikhetslära

Industriell matematik och statistik, LMA /14

Mer om slumpvariabler

F14 Repetition. Måns Thulin. Uppsala universitet Statistik för ingenjörer 6/ /15

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 24 januari 2004, kl

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Diskussionsproblem för Statistik för ingenjörer

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p)

Avd. Matematisk statistik

Diskreta slumpvariabler

9. Beräkna volymen av det område som begränsas av planet z = 1 och paraboloiden z = 5 x 2 y 2.

(a) Hur stor är sannolikheten att en slumpvist vald person tror att den är laktosintolerant?

Tentamen MVE300 Sannolikhet, statistik och risk

Föreläsning 3. Sannolikhetsfördelningar

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Uppgift 2 Betrakta vädret under en följd av dagar som en Markovkedja med de enda möjliga tillstånden. 0 = solig dag och 1 = regnig dag

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 23 februari 2004, klockan

Tentamen i Matematisk statistik Kurskod S0001M

Formel- och tabellsamling i matematisk statistik

Wienerprocesser. Finansiell statistik, vt-05. Enkel slumpvandring. Enkel slumpvandring. Varför: model för aktiekurs (dock med aber...

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

SF1901 Sannolikhetsteori och statistik I

Lär lätt! Statistik - Kompendium

Grundläggande matematisk statistik

Tentamen i Sannolikhetslära och statistik (lärarprogrammet) 12 februari 2011

Slumpvariabler och sannolikhetsfördelningar

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Samverkande Expertnät

1. En kontinuerlig slumpvariabel X har följande täthetsfunktion (för någon konstant k). f.ö.

Några extra övningsuppgifter i Statistisk teori

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 ( ) OCH INFÖR ÖVNING 9 ( )

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Lär lätt! Statistik - Kompendium

Väntevärde och varians

SF1911: Statistik för bioteknik

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''

Räkna med variation - Digitala uppgifter Studiematerial i sannolikhetslära och statistisk inferens. Lena Zetterqvist och Johan Lindström

Tentamen i Matematisk statistik Kurskod S0001M

ÖVNINGSUPPGIFTER KAPITEL 9

Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Föreläsning 9: Hypotesprövning

Statistiska metoder för säkerhetsanalys

DATORÖVNING 2: SIMULERING

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl

FÖRELÄSNING 3:

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Föreläsning 7. Statistikens grunder.

Kapitel 5 Multivariata sannolikhetsfördelningar

Introduktion till statistik för statsvetare

Tentamen MVE265 Matematisk statistik för V,

Grundläggande matematisk statistik

Lennart Carleson. KTH och Uppsala universitet

STYRNING AV PORTFÖLJER MED FLERA TILLGÅNGAR

Övning 1 Sannolikhetsteorins grunder

Samplingfördelningar 1

Tentamen i Matematisk statistik, LKT325,

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2

FÖRELÄSNING 8:

Lösningar till Tentamen i Matematisk Statistik, 5p 22 mars, Beräkna medelvärdet, standardavvikelsen, medianen och tredje kvartilen?

DATORÖVNING 4: DISKRETA

Kap 3: Diskreta fördelningar

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

SF1901: Sannolikhetslära och statistik

Bengt Ringnér. October 30, 2006

Lektion 1: Fördelningar och deskriptiv analys

Bengt Ringnér. September 20, Detta är föreläsningsmanus på lantmätarprogrammet LTH vecka 5 HT07.

Tentamen i matematisk statistik

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Sannolikhetsteori. Måns Thulin. Uppsala universitet Statistik för ingenjörer 23/ /14

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT Angående grafisk presentation

Föreläsning 12: Regression

0 om x < 0, F X (x) = c x. 1 om x 2.

SF1901: Sannolikhetslära och statistik

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer. Thommy Perlinger

Tentamen i Matematisk statistik Kurskod S0001M

F9 Konfidensintervall

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

Föreläsning 7: Punktskattningar

4 Diskret stokastisk variabel

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

TENTAMEN MÅNDAGEN DEN 22 OKTOBER 2012 KL a) Bestäm P(ingen av händelserna inträffar). b) Bestäm P(exakt två av händelserna inträffar).

Tentamen MVE301 Sannolikhet, statistik och risk

Tillämpad Matematik III Övningar i Statistik

Tentamen i Tillämpad Matematik och statistik för IT-forensik. Del 2: Statistik 7.5 hp

FÖRELÄSNING 7:

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

AMatematiska institutionen avd matematisk statistik

Transkript:

1/22 Summor av slumpvariabler Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 8/2 2013

2/22 Dagens föreläsning Väntevärde och varians Vanliga kontinuerliga fördelningar Parkeringsplatsproblemet Räkneregler för väntevärden Räkneregler för varianser Fördelningen för summor av slumpvariabler

Kontinuerliga slumpvariabler Alla icke-negativa funktioner f (x) som är sådana att f (x)dx = 1 är täthetsfunktioner. Exempel: vi hittade en funktion f (x) som beskrev fördelningen för ett kompositmaterials hållfasthet och kunde använda den för att räkna ut sannolikheter. Exempel: en buss går var 10:e minut. Man går till busshållsplatsen på måfå. Om X är tiden man får vänta så är f (x) = 1/10 för 0 x < 10. X sägs vara likformigt fördelad eller rektangelfördelad på intervallet 0 till 10. För kontinuerliga slumpvariabler är man ofta intresserad av fördelningsfunktionen F (x) = P(X x) = x f (x)dx. Observera att det för alla slumpvariabler X gäller att P(a < X b) = F (b) F (a). 3/22

4/22 Väntevärde och varians För en diskret slumpvariabel X är väntevärdet E[X ] = k k p(k) och variansen V[X ] = k (k µ)2 p(k). För en kontinuerlig slumpvariabel X med täthetsfunktion f (x) är: Väntevärdet: E[X ] = x x f (x)dx. Även här betecknas väntevärdet µ och tolkas som det genomsnittliga eller förväntade värdet på X. Variansen: V[X ] = x (x µ)2 f (x)dx. Som tidigare betecknas variansen ofta σ 2 och tolkas som ett mått på spridningen/osäkerheten/variationen för X. Som tidigare gäller att E[g(X )] = x g(x)f (x)dx och att V[X ] = E[X 2 ] (E[X ]) 2. Se bussexempel på tavlan!

5/22 Likformig fördelning (rektangelfördelning) Om slumpvariabeln X antar alla värden i ett interval (a, b) med samma sannolikhet så sägs X vara likformigt fördelad på intervallet. Exempel: hur länge man får vänta på bussen. Kodbeteckning: X Re(a, b). Täthetsfunktionen är en rektangel: Se bild på tavlan! För likformig fördelning gäller att E[X ] = (a + b)/2 V [X ] = (b a) 2 /12 Se bussexempel på tavlan! f (x) = 1 b a, a x b.

Tid mellan händelser Hur lång tid går det mellan det att man tänder en glödlampa och att den går sönder? (Hur lång är livslängden?) Hur lång tid går det mellan att två samtal ankommer till en telefon? Hur lång tid går det mellan två jordskalv? Hur lång tid går det mellan två driftstopp i en fabrik? Hur lång tid går det mellan två mål i en fotbollsmatch? 6/22

7/22 Exponentialfördelningen Vi såg tidigare hur Weibullfördelningen kan användas för att modellera hållfasthet. Den används också för exempelvis vindhastigheter och livslängder. Det viktigaste (och matematiskt enklaste) specialfallet av Weibullfördelningen är exponentialfördelningen, som ofta används för att modellera tider mellan händelser som inträffar med en konstant intensitet. Slumpvariabeln X är exponentialfördelad med parameter a, betecknat X Exp(a) om dess täthetsfunktion är f (x) = 1 a e x/a, för x 0. För exponentialfördelningen gäller att E[X ] = a V [X ] = a 2

0.0 0.2 0.4 0.6 0.8 1.0 Exponentialfördelningens täthetsfunktion Exp(1/2) Exp(1) Exp(2) Exp(5) 0 1 2 3 4 5 x 8/22

Exponentialfördelningen och jordbävningar Seismologer anser att tiden mellan japanska jordbävningar kan anses vara exponentialfördelad. Låt X vara tiden i år till nästa skalv med en magnitud på minst 7,0 på Richterskalan. Antag att X Exp(4/3). Vad är P(X > 1)? Se tavlan! 9/22

Hur många parkeringsplatser? Ett företag ska bygga 100 nya lägenheter. Utifrån erfarenhet från liknande områden vet man att sannolikheten är 25 % att ett hushåll inte har någon bil, 50 % att ett hushåll har en bil och 25 % att ett hushåll har två bilar. Hur många bilar kan man förvänta sig att hushållen har tillsammans? Hur många parkeringsplatser ska man bygga vid bostäderna för att sannolikheten att alla hushålls bilar får plats ska vara 95 %? Antag att man av utrymmesskäl inte får plats med fler än 75 parkeringsplatser. Hur stor är då sannolikheten att hushållens bilar får plats? Se tavlan! 10/22

11/22 Räkneregler för väntevärden Låt X och Y vara slumpvariabler och a, b, c vara givna konstanter. Då är E[aX + by + c] = ae[x ] + be[y ] + c. Exempel: Om E[X ] = 5 och E[Y ] = 10 så är E[X + Y ] = E[X ] + E[Y ] = 5 + 10 = 15. Om spel 1 i genomsnitt ger 5 kr i vinst och spel 2 i genomsnitt ger 10 kr i vinst så är den genomsnittliga vinsten av spelen tillsammans 15 kr. E[X ] = 5, E[Y ] = 10, a = 2, b = 1 och c = 25 så är E[2X + Y 25] = 2 5 + 10 25 = 5. Om det kostar 25 kr att spela spel 1 två gånger och spel 2 en gång så förlorar man i genomsnitt 5 kr.

12/22 Räkneregler för väntevärden Mer allmänt kan vi låta X 1, X 2,..., X n vara slumpvariabler och a 1, a 2,..., a n vara givna konstanter. Inför slumpvariabeln S n = a 1 X 1 + a 2 X 2 +... + a n X n = n a i X i. i=1 Vi har då följande räkneregel: E[S n ] = a 1 E[X 1 ] + a 2 E[X 2 ] +... + a n E[X n ] = n a i E[X i ] i=1 Se parkeringsplatsexempel på tavlan!

13/22 Oberoende slumpvariabler Vi har tidigare definierat att två händelser A och B är oberoende om P(A B) = P(A) P(B). Två slumpvariabler X och Y kallas oberoende om P({X x} {Y y}) = P(X x) P(Y y) för alla värden på x och y. Många beräkningar blir betydligt enklare när man jobbar med oberoende slumpvariabler. När man redovisar problem på kursen så är det viktigt att poängtera när man utnyttjar att slumpvariabler är oberoende!

14/22 Räkneregler för oberoende slumpvariabler Låt X 1, X 2,..., X n vara oberoende slumpvariabler och c, a 1, a 2,..., a n vara givna konstanter. Inför slumpvariabeln S n = a 1 X 1 + a 2 X 2 +... + a n X n + c = n a i X i + c. i=1 Vi har då följande räkneregel: V[S n ] = a 2 1V[X 1 ] + a 2 2V[X 2 ] +... + a 2 nv[x n ] = n ai 2 V[X i ] i=1 Se parkeringsplatsexempel på tavlan! Kan vi säga något om fördelningen för S n?

15/22 Normalfördelningen Den fördelning som är allra vanligast vid modellering av slumpfenomen kallas normalfördelningen. Den används bland mycket annat för att modellera mätfel, brus, variation i storlek, olika finansvariabler och kvantmekaniska fenomen. Slumpvariabeln X är normalfördelad med parametrar µ och σ, betecknat X N(µ, σ 2 ) om dess täthetsfunktion är f (x) = 1 σ /2σ2 e (x µ)2, för < x <. 2π För normalfördelningen gäller att E[X ] = µ V [X ] = σ 2 och P(µ 2σ X µ + 2σ) 0.95.

0.0 0.1 0.2 0.3 0.4 Normalfördelningens täthetsfunktion N(0,1) N(2,1) N(0,2) N(0,5) 4 2 0 2 4 x 16/22

17/22 Att räkna med normalfördelningen Exempel. Vikten X på en sorts bläckfisk är N(5, 2)-fördelad. Vad är P(X 6)? Om X N(µ, σ 2 ) så gäller att X µ σ N(0, 1) och därmed kan man alltid översätta problem som rör N(µ, σ 2 ) till problem med N(0, 1). Av den anledningen så finns tabeller över Φ(x) = P(X x) om X N(0, 1). Vi kommer att använda dem på räkneövningarna. Se exempel på tavlan!

18/22 Räkneregler för normalfördelningen Antag att X N(µ X, σ 2 X ) och Y N(µ Y, σ 2 Y ). Då gäller att ax + b N(aµ X + b, a 2 σ 2 X ) och om X och Y är oberoende så är X + Y N(µ X + µ Y, σ 2 X + σ2 Y ). Summor av normalfördelade slumpvariabler är normalfördelade! Se exempel på tavlan!

19/22 Centrala gränsvärdessatsen (CGS) Låt X 1, X 2,..., X n vara oberoende slumpvariabler som alla har samma fördelning, med väntevärde µ och varians σ 2 <. Då gäller för stora n att är approximativt normalfördelad: där µ y = nµ och σ 2 Y = nσ2. Y = X 1 + X 2 +... + X n Y N(µ y, σ 2 Y ) Se parkeringsplatsexempel på tavlan!

20/22 Centrala gränsvärdessatsen för medelvärden I många situationer är man intresserad av X = 1 n (X 1 + X 2 +... + X n ). Det följer ur centrala gränsvärdessatsen att då n är stort så är X N (µ, σ2 ) n Då n så får vi att variansen σ2 n 0. Vad innebär det?

21/22 Stora talens lag Vi betraktar X = 1 n (X 1 + X 2 +... + X n ). Antag att slumpvariablerna X 1,..., X n är oberoende och har samma väntevärde µ. Man kan då visa att ( ) P X µ då n = 1, vilket vi tolkar som att medelvärdet X ligger nära µ då antalet observationer n är stort. Resultatet kallas stora talens lag och är en av de stora satserna inom sannolikhetsteorin och vetenskap i allmänhet.

22/22 Sammanfattning Viktiga fördelningar: likformig fördelning, exponentialfördelning, normalfördelning. E[aX + by + c] = ae[x ] + be[y ] + c. Om X och Y är oberoende så är V[aX + by + c] = a 2 V[X ] + b 2 V[Y ]. Centrala gränsvärdessatsen: Summor av likafördelade oberoende slumpvariabler är approximativt normalfördelade. Stora talens lag: Då antalet observationer n är stort så ligger medelvärdet X nära väntevärdet µ.