Föreläsning 3, Matematisk statistik Π + E

Relevanta dokument
Matematisk statistik 9 hp Föreläsning 3: Transformation och simulering

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Föreläsning 2, FMSF45 Slumpvariabel

Matematisk statistik 9 hp Föreläsning 4: Flerdim

Matematisk statistik för B, K, N, BME och Kemister

SF1901 Sannolikhetsteori och statistik I

Föreläsning 2, Matematisk statistik för M

Föreläsning 4, Matematisk statistik för M

Föreläsning 5, Matematisk statistik Π + E

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Kap 2. Sannolikhetsteorins grunder

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

SF1911: Statistik för bioteknik

Exempel för diskreta och kontinuerliga stokastiska variabler

SF1901: Sannolikhetslära och statistik

Föreläsning 5, FMSF45 Summor och väntevärden

SF1901: Sannolikhetslära och statistik

Matematisk statistik för B, K, N, BME och Kemister

SF1901: Sannolikhetslära och statistik

Datorövning 1: Fördelningar

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

Simulering. Introduktion. Exempel: Antag att någon kastar tärning

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

17.1 Kontinuerliga fördelningar

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

SOS HT Slumpvariabler Diskreta slumpvariabler Binomialfördelning. Sannolikhetsfunktion. Slumpförsök.

SF1901: SANNOLIKHETSTEORI OCH FLERDIMENSIONELLA STOKASTISKA STATISTIK VARIABLER. Tatjana Pavlenko. 8 september 2017

Datorövning 1: Fördelningar

Statistiska metoder för säkerhetsanalys

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

SF1901: Sannolikhetslära och statistik

Föreläsning 8, Matematisk statistik Π + E

Grundläggande matematisk statistik

Laboration 2: 1 Syfte. 2 Väntevärde och varians hos en s.v. X med fördelningen F X (x) MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08

Grundläggande matematisk statistik

SF1901: Sannolikhetslära och statistik

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

TMS136. Föreläsning 4

SF1901 Sannolikhetsteori och statistik I

träna på att använda olika grafiska metoder för att undersöka vilka fördelningar ett datamaterial kan komma från

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

Grundläggande matematisk statistik

Matematisk statistik för D, I, Π och Fysiker

(x) = F X. och kvantiler

SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2

Mer om slumpvariabler

Föreläsning 8 för TNIU23 Integraler och statistik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Monte Carlo-metoder. Bild från Monte Carlo

Föreläsning 6, Matematisk statistik Π + E

Föreläsning 3. Sannolikhetsfördelningar

TMS136. Föreläsning 5

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Laboration 3: Parameterskattning och Fördelningsanpassning

Kurssammanfattning MVE055

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Slumpvariabler och sannolikhetsfördelningar

Föreläsning 11, Matematisk statistik Π + E

Simulering av Poissonprocesser Olle Nerman, Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp)

Datorövning 1 Fördelningar

Matematisk statistik för B, K, N, BME och Kemister

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

SF1901: Sannolikhetslära och statistik

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

SF1901 Sannolikhetsteori och statistik I

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Övning 1 Sannolikhetsteorins grunder

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT Angående grafisk presentation

4 Diskret stokastisk variabel

TMS136. Föreläsning 5

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

TAMS79: Föreläsning 4 Flerdimensionella stokastiska variabler

Matematisk statistik for B, K, N, BME och Kemister. Matematisk statistik slumpens matematik. Beskriva Data Florence Nightingale. Forel.

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

Demonstration av laboration 2, SF1901

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

Tentamen i Beräkningsvetenskap II, 5.0 hp, Del A

Föreläsning 17, Matematisk statistik Π + E

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

Datorövning 1 Introduktion till Matlab Fördelningar

Poisson Drivna Processer, Hagelbrus

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Laboration med Minitab

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Transkript:

Repetition Kvantil Presentation Slumptal Transformer Inversmetoden Föreläsning 3, Matematisk statistik Π + E Sören Vang Andersen 13 november 2014 Sören Vang Andersen - sva@maths.lth.se FMS012 F3 1/19

Repetition Kvantil Presentation Slumptal Transformer Stokastisk Inversmetoden variabel Glödlampa Stokastisk variabel En stokastisk variabel eller slumpvariabel är ett tal vars värde styrs av slumpen (en funktion Ω R). Bet X, Y,.... Kan vara diskret eller kontinuerlig En stokastisk variabel beskrivs av: Sannolikhetsfunktion För en diskret s.v. X p X (k) = P(X = k) Täthetsfunktion För en kontinuerlig s.v X har vi f X (x). P(X A) = f X (x) dx Fördelningsfunktion Summa av p X (k) eller integral av f X (x). F X (x) = P(X x) A Sören Vang Andersen - sva@maths.lth.se FMS012 F3 2/19

Repetition Kvantil Presentation Slumptal Transformer Stokastisk Inversmetoden variabel Glödlampa Exempel Glödlampa Låt X = Livslängden hos en glödlampa i år. Antag att fördelningen för X beskrivs av följande täthetsfunktion { e x, x 0 f X (x) = 0 x < 0 a) Beräkna F X (x) samt skissa den och f X (x). b) Beräkna sannolikheten att lampan håller minst två år. c) Om vi sett att lampan lyst ett år, vad är sannolikheten att den lyser två år till? Sören Vang Andersen - sva@maths.lth.se FMS012 F3 3/19

Repetition Kvantil Presentation Slumptal Transformer Exempel Inversmetoden α-kvantil, x α En kvantil, x α, till en s.v. X är en gräns som överskrids med slh α. Den fås som lösning till någon av följande ekvationer. F X (x α ) = 1 α xα f X (x) dx = 1 α x α f X (x) dx = α f 1 a a x_a x Eller direkt ur x α = F 1 X (1 α) Sören Vang Andersen - sva@maths.lth.se FMS012 F3 4/19

Repetition Kvantil Presentation Slumptal Transformer Exempel Inversmetoden Exempel Glödlampa (forts.) Låt X = Livslängden hos en glödlampa i år. Antag att fördelningen för X beskrivs av följande täthetsfunktion { e x, x 0 f X (x) = 0 x < 0 a) Beräkna kvantilen x α som funktion av α. b) Beräkna numeriskt de tre kvartilerna x 0.25, x 0.50 och x 0.75. (x 0.50 kallas även median) c) Gör en konkret tolkning av x 0.25. Sören Vang Andersen - sva@maths.lth.se FMS012 F3 5/19

Repetition Kvantil Presentation Slumptal Transformer Empirisk Inversmetoden fördelningsfunktion Normplot Grafisk presentation av ett datamaterial I ett histogram delar man in datamaterial i (lika stora) intervall och avsätter en stapel vars höjd är proportionell mot antalet mätvärden stapeln står på. Om man normerar totala stapelarean till 1 kan man jämföra med en täthetsfunktion. 80 Volymen mjölk i 97 mjölkpaket, täthet för Normalfördelning täthet / relativt antal 60 40 20 0 0.98 0.99 1 1.01 1.02 1.03 Volym [l] Matlab: [n,x] = hist(y); bar(x, n/sum(n)/(x(2)-x(1)), 1) Sören Vang Andersen - sva@maths.lth.se FMS012 F3 6/19

Repetition Kvantil Presentation Slumptal Transformer Empirisk Inversmetoden fördelningsfunktion Normplot Vid diskreta data kan man i stället göra staplar på varje utfall och låta höjden vara andelen mätvärden med det givna utfallet. Stapeldiagrammet kan jämföras med en sannolikhetsfunktion. Sannolikhet / relativt antal 0.5 0.4 0.3 0.2 0.1 0 50 spel Keno 8, sannolikhetsfunktion för antalet vinstnummer 22 11 7 6 3 0 1 0 0 0 1 2 3 4 5 6 7 8 Antal vinstnummer Matlab: [n,x] = hist(y,0:8); stem(x, n/sum(n)) Sören Vang Andersen - sva@maths.lth.se FMS012 F3 7/19

Repetition Kvantil Presentation Slumptal Transformer Empirisk Inversmetoden fördelningsfunktion Normplot Empirisk fördelningsfunktion En empirisk fördelningsfunktion konstrueras genom att sortera de n mätvärdena och plotta mätvärde i mot i/n. Vid ett givet x-värde kan man då avläsa andelen mätvärden som är mindre än detta x. Denna kan jämföras med en fördelningsfunktion. sannolikhet / relativ frekvens 1 0.8 0.6 0.4 0.2 Empirisk fördelningsfunktion för mjölkpaketen, Normalfördelning 0 0.98 0.99 1 1.01 1.02 1.03 Volym [l] Matlab: stairs(sort(x), (1:length(x))/length(x)) Sören Vang Andersen - sva@maths.lth.se FMS012 F3 8/19

Repetition Kvantil Presentation Slumptal Transformer Empirisk Inversmetoden fördelningsfunktion Normplot Vanligt är att man skalar om axlarna i den empiriska fördelningsfunktionen så att en given fördelnings fördelningsfunktion blir en rät linje. T.ex en normalfördelningsplot. Denna är användbar för att se om datamaterialet passar den givna fördelningen. sannolikhet / relativ frekvens 0.997 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 0.003 Mjölkpaketen i en ett normalfördelningsdiagram 0.995 1 1.005 1.01 1.015 1.02 Volym [l] Matlab: normplot(x) qqplot(exprnd(1,1000,1), expinv((1:1e3)/1e3)) Sören Vang Andersen - sva@maths.lth.se FMS012 F3 9/19

Repetition Kvantil Presentation Slumptal Transformer Empirisk Inversmetoden fördelningsfunktion Normplot Invers till fördelningsfunktion Fördelningsfunktionen till en kontinuerlig s.v. X, F X (x) är strängt växande, så den har en invers funktion, F 1 X (x). Den är användbar till Bestäm k så att P(X k) = 1 3. F X (k) = 1 3 F 1 X (F X(k)) = F 1 X (1 ) k = F 1 X 3 (1 3 ) Beräkna kvantiler x α som definieras som F X (x α ) = 1 α. Kvantilen blir x α = F 1 X (1 α). Generera slumptal som har en given fördelning. (Se inversmetoden) Ex. Beräkna F 1 X om X Exp(λ). Sören Vang Andersen - sva@maths.lth.se FMS012 F3 10/19

Repetition Kvantil Presentation Slumptal Transformer Empirisk Inversmetoden fördelningsfunktion Normplot Exempel normplot Probability 0.997 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 0.003 Normal Probability Plot 2 0 2 Data Probability 0.997 0.99 0.98 0.95 0.90 0.75 0.50 0.25 Normal Probability Plot 0.10 0.05 0.02 0.01 0.003 0 0.2 0.4 0.6 0.8 1 Data Probability 0.997 0.99 0.98 0.95 0.90 0.75 0.50 0.25 Normal Probability Plot 0.10 0.05 0.02 0.01 0.003 0 2 4 6 Data Sören Vang Andersen - sva@maths.lth.se FMS012 F3 11/19

Repetition Kvantil Presentation Slumptal Transformer Matlab Inversmetoden Pseudoslumptal Pseudoslumptal är tal som genereras enligt en algorithm men ser slumpmässiga ut Har rätt fördelning Lång periodicitet Oberoende Snabba att beräkna De flesta programspråk tillhandahåller slumptal som är R(0, 1). rand och unifrnd i matlab rand i C/C++ gsl rng uniform i GNU Scientific Library Random i Java Sören Vang Andersen - sva@maths.lth.se FMS012 F3 12/19

Repetition Kvantil Presentation Slumptal Transformer Matlab Inversmetoden Generering av slumptal från R(0, 1)-fördelning Ett enkel sätt är att använda en kongruensalgoritm av typen x n+1 = (ax n + b) mod c som ger heltal mellan 0 och c 1. Detta x i -värde delas sedan med c för att hamna i intervallet [0, 1). Sekvensen är periodisk med perioden c (visa villkor). Man får samma sekvens för ett givet startvärde x 0. Några exempel: a b c Numerical Recipes 1664525 1013904223 2 32 glibc (GCC) 1103515245 12345 2 32 matlab pre v. 5 7 5 = 16807 0 2 32 1 RANDU (IBM 1960) 2 16 + 3 = 65539 0 2 31 Se t.ex Numerical Recipies in C, kap. 7 för diskussion och andra algoritmer. Mersenne twister (en.wikipedia.org/wiki/mersenne_twister) är nu mer standard i de flesta programspråk (MT19937). Sören Vang Andersen - sva@maths.lth.se FMS012 F3 13/19

Repetition Kvantil Presentation Slumptal Transformer Matlab Inversmetoden Matlab funktioner I Statistics toolbox i matlab finns F 1 X (x) implementerad för de vanligaste fördelningarna. Generera slumptal, täthetsfunktioner, etc. exprnd Generera Exp slumptal exppdf Täthetsfunktion (probability density function). expcdf Fördelningsfunktion (cumulative distribution function). expinv Invers till fördelningsfunktion Standardfördelningar bino... Binomialfördelning poiss... Poissonfördelning geo... Geometrisk fördelning unif... Rektangel- eller likformig fördelning exp... Exponentialfördelning norm... Normalfördelning Sören Vang Andersen - sva@maths.lth.se FMS012 F3 14/19

Repetition Kvantil Presentation Slumptal Transformer Exempel Inversmetoden Transformation av stokastiska variabler Givet en s.v. X. Vilken fördelning får Y = g(x)? Metod om Y är kontinuerlig: 1. Sätt upp F Y (y) = P(Y y). 2. Stoppa in Y = g(x) och uttryck F Y (y) som fkn av F X (y). 3. Derivera för att få f Y (y) som fkn av f X (y) Om Y är diskret kan man räkna ut sannolikhetsfunktionen p Y (k) = p X (j) j:g(j)=k dvs P(Y = k) fås genom att lägga ihop p X (j) för alla j sådana att g(j) = k. Sören Vang Andersen - sva@maths.lth.se FMS012 F3 15/19

Repetition Kvantil Presentation Slumptal Transformer Exempel Inversmetoden Exempel 1. Vilken täthetsfunktion har Y = a + bx om X har täthet f X? 2. Vilken täthetsfunktion har Y = πx 2 om X R( 1, 1)? 3. Bestäm p Y (k) om Y = X 4 och i 1 0 1 2 p X (i) 1 5 4. Vilken fördelning får man om man stoppar in en kont. s.v. X i sin egen fördelnigsfunktion F X (x)? 5. Vilken fördelning får man om man stoppar in X R(0, 1) i inversen till fördelningsfunktionen för en kont s.v. Y? dvs Z = F 1 Y (X). 1 2 2 10 1 10 Sören Vang Andersen - sva@maths.lth.se FMS012 F3 16/19

Repetition Kvantil Presentation Slumptal Transformer Exempel Inversmetoden Inversmetoden Hur drar vi slumptal från en godtycklig kontinuerlig s.v. med fördelningsfunktion F Y (y)? Låt X R(0, 1), dvs F X (x) = x, 0 x 1. Finn inversen F 1 Y (y), till fördelningsfunktionen, F Y(y), för Y. Bestäm fördelningsfunktionen för Z = F 1 Y (X) F Z (z) =P(Z z) = P(F 1 Y (X) z) = P(F Y(F 1 Y (X)) F Y(z)) =P(X F Y (Z)) = F X (F Y (z)) = F Y (z) För att dra slumptal från en fördelning med fördelningsfunktion F Y (y): 1. Räkna ut F 1 Y (y) 2. Dra slumptal från en R(0, 1)-fördelning. 3. Beräkna F 1 Y (y) för varje slumptal. Sören Vang Andersen - sva@maths.lth.se FMS012 F3 17/19

Repetition Kvantil Presentation Slumptal Transformer Exempel Inversmetoden Kontinuerlig fördelning Exp(1/2) Inversmetoden 1 0.8 0.6 0.4 0.2 f X (x) 0 0.2 0 0.2 0.4 0.6 0.8 1 1.2 2 1.5 1 Önskad täthet f Y (y) 0.5 0 0 0.5 1 1.5 2 2.5 3 1 0.8 F Y (y) 0.6 0.4 0.2 0 0 0.5 1 1.5 2 2.5 3 Önskade slumptal Sören Vang Andersen - sva@maths.lth.se FMS012 F3 18/19

Repetition Kvantil Presentation Slumptal Transformer Exempel Inversmetoden Diskret fördelning Ge(0.3) 1 Inversmetoden 0.5 0 0.5 0 0.5 1 1.5 Önskad sannolikhetsfunktion 0.4 0.3 0.2 0.1 0 0 10 20 30 40 50 60 70 80 90 100 1 0.5 0 0 2 4 6 8 10 12 14 16 18 20 Önskade slumptal Sören Vang Andersen - sva@maths.lth.se FMS012 F3 19/19