Laboration 2: Sannolikhetsteori och simulering

Relevanta dokument
Laboration 2: Sannolikhetsteori och simulering

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen

Laboration 2: Sannolikhetsteori och simulering

bli bekant med summor av stokastiska variabler.

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

Syftet med den här laborationen är att du skall bli mer förtrogen med några viktiga områden inom kursen nämligen

Laboration 2: Sannolikhetsteori och simulering

Datorövning 2 Diskret fördelning och betingning

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

SF1901 Sannolikhetsteori och statistik I

Datorövning 1: Fördelningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 2: 1 Syfte. 2 Väntevärde och varians hos en s.v. X med fördelningen F X (x) MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Matematisk statistik för D, I, Π och Fysiker

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Föreläsning 5, FMSF45 Summor och väntevärden

Föreläsning 5, Matematisk statistik Π + E

Matematisk statistik 9 hp Föreläsning 4: Flerdim

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Kap 2. Sannolikhetsteorins grunder

Föreläsning 6, Matematisk statistik Π + E

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Demonstration av laboration 2, SF1901

Statistiska metoder för säkerhetsanalys

SF1901: Sannolikhetslära och statistik

TMS136. Föreläsning 5

TMS136. Föreläsning 4

TMS136. Föreläsning 5

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

Datorövning 1 Fördelningar

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

Föreläsning 8, Matematisk statistik Π + E

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

träna på att använda olika grafiska metoder för att undersöka vilka fördelningar ett datamaterial kan komma från

Föreläsning 3. Sannolikhetsfördelningar

Stokastiska signaler. Mediesignaler

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

FINGERÖVNINGAR I SANNOLIKHETSTEORI MATEMATISK STATISTIK AK FÖR I. Oktober Matematikcentrum Matematisk statistik

Föreläsning 7: Punktskattningar

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Kapitel 5 Multivariata sannolikhetsfördelningar

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik för B, K, N, BME och Kemister

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Formler och tabeller till kursen MSG830

SF1911: Statistik för bioteknik

Kurssammanfattning MVE055

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

SF1901: Sannolikhetslära och statistik

TENTAMEN I STATISTIKENS GRUNDER 1

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

Datorövning 1: Fördelningar

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

SF1901: Sannolikhetslära och statistik

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

Laboration med Minitab

Projekt 1: Om fördelningar och risker

Stokastiska vektorer och multivariat normalfördelning

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik. Mer om Approximationer

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Stokastiska vektorer

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

4 Diskret stokastisk variabel

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

SF1901: SANNOLIKHETSTEORI OCH FLERDIMENSIONELLA STOKASTISKA STATISTIK VARIABLER. Tatjana Pavlenko. 8 september 2017

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT Angående grafisk presentation

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Lärmål Sannolikhet, statistik och risk 2015

Jörgen Säve-Söderbergh

Statistiska metoder för säkerhetsanalys

KURSPROGRAM HT-18 MATEMATISK STATISTIK AK FÖR D, I OCH PI, FMSF45 & MASB03

KURSPROGRAM HT-10 MATEMATISK STATISTIK AK FÖR CDI, FMS 012

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

Transkript:

Lunds tekniska högskola Matematikcentrum Matematisk statistik Laboration 2 Matematisk statistik AK för Π och E, FMS012, HT14/VT15 Laboration 2: Sannolikhetsteori och simulering Syftet med den här laborationen är att du skall bli mer förtrogen med några viktiga områden inom kursen nämligen Simulering Beroende Betingade fördelningar Tvådimensionella normalfördelade stokastiska variabler Funktioner av stokastiska variabler Datamaterial och specialrutiner finns att hämta på kursens hemsida: http://www.maths.lth.se/matstat/kurser/fms012/pie/ 1 Förberedelseuppgifter Som förberedelse till laborationen bör du läsa igenom Kapitel 3.10, 4.5, 4.8, 5 och 7, samt hela laborationshandledningen. Repetera dessutom det som sades om Gauss approximationsformler på föreläsning 7. Till laborationens start har du med dig lösningar till förberedelseuppgifterna (a) (f): (a) Vi köper en påse med 7 solrosfrön. På baksidan i den finstilta texten står det att grobarheten är 75 %. Skriv upp sannolikhetsfunktionen för antalet frön som kommer att gro. (Behövs i 2.1) (b) Skriv upp sannolikhetsfunktionen för en Po(μ)-fördelad stokastisk variabel. (Behövs i 2.2) (c) Om X och Y är oberoende Po(μ)-fördelade variabler, vilken fördelning har då X+Y? (Behövs i 2.2) (d) Om vi har p X (k) och p Y X (y k), hur kan vi då beräkna p Y (y)? (Behövs i 2.2) (e) Definiera följande begrepp: oberoende stokastiska variabler, väntevärde, varians, kovarians, korrelation och betingad täthetsfunktion. (Behövs i 3.1 2). (f) Skriv upp den simultana täthetsfunktionen för X och Y om X N(μ X, σ X ) och Y N(μ Y, σ Y ) och X och Y är oberoende av varandra. (Behövs i 3.2)

2 Laboration 2, Matstat AK för Π och E, HT14/VT15 2 Diskret fördelning 2.1 Simulering av grobarhet hos solrosfrön Detta är en fortsättning av förberedelseuppgift (a). Vi vill simulera antalet frön som kommer att gro bland de sju fröna i påsen. Det kan vi göra på två sätt. Det mest rättframma är att simulera 7 frön och räkna antalet som gror. Funktionen rand(7,1) ger en kolonnvektor med 7 rektangelfördelade slumptal, U, mellan 0 och 1. För att sannolikheten att ett frö kommer att gro skall bli p kan vi helt enkelt se efter om U p. I så fall kommer fröet att gro. Om U > p så kommer det inte att gro. För att få reda på antalet frön som kommer att gro bland de 7 summerar vi den resulterande 0/1-variabeln: >> U=rand(7,1) >> U<=0.75 >> X=sum(U<=0.75) Ett smidigare sätt är att utnyttja att vi vet att antalet frön som kommer att gro är Bin(7, 0.75)-fördelat (enligt förberedelseuppgift (a)). Då kan vi simulera X direkt med hjälp av matlabs färdiga rutiner: >> help binornd >> X=binornd(7,0.75) Gör om proceduren några gånger. Antalet frön som kommer att gro varierar uppenbarligen från gång till gång, dvs från påse till påse. För att se hur vanligt det är med olika antal frön som kommer att gro simulerar vi 20 påsar och ritar ett stolpdiagram. Vi kan också rita in sannolikhetsfunktionen i samma diagram. Den heter binopdf (pdf uttyds Probability Density Function, dvs sannolikhets/täthets-funktion) i matlab. >> help binopdf >> X=binornd(7,0.75,20,1) >> N=hist(X,0:7) % vi vet att resultatet bara kan bli 0,...,7 >> bar(0:7,[n/20;binopdf(0:7,7,0.75)] ) 1. De blå stolparna är vårt simulerade resultat och de röda är den teoretiska sannolikhetsfunktionen. Hur stämmer det? 2. Simulera 1000 påsar istället. Stämmer det bättre nu? 2.2 Tvådimensionell fördelning med hjälp av betingade fördelningar: Skördeutfall Vi tänker oss nu att varje solrosfrö som gror ger upphov till ett Poissonfördelat antal nya frön, i medeltal 50 frön per groende solros. Frön som inte gror ger naturligtvis inga nya frön. Vi är intresserade av fördelningen för det totala antalet nya frön som en fröpåse med 7 frön och 75 % grobarhet kan ge upphov till. Vi har, som tidigare, X = antal frön som gror Bin(7, 0.75). Då kommer vi att få att den betingade fördelningen för Y = antal nya frön, givet att vi fick X = x frön som

Laboration 2, Matstat AK för Π och E, HT14/VT15 3 grodde, blir Y X = x Po(50 x) där x = 0,..., 7 (enligt förberedelseuppgift (c)). Fördelningen för Y ges då (enligt förberedelseuppgift (d)) av p Y (y) = P(Y = y) = k = 7 k=0 e 50k (50k)y y! P(Y = y X = k) P(X = k) = 7 p Y X (y k) p X (k) k=0 ( ) 7 0.75 k 0.25 7 k = Nått gräsligt! för y = 0, 1, 2,... k För att ta reda på hur denna fördelning ser ut börjar vi med att rita upp var och en av de 8 olika möjliga Poissonfördelningarna. Detta är de 8 olika varianterna av betingade fördelningar vi har (Po(0), Po(50), Po(100),..., Po(350)). Vi ritar de 8 sannolikhetsfunktionerna i samma figurfönster men i varsin delfigur för att få lite överblick: >> clf % Töm figurfönstret. >> y=0:450; >> for k=0:7 subplot(4,2,k+1) % Rita i delfigur nr 1..8 i en 4x2-plan. bar(y,poisspdf(y,50*k)) end 3. Hur ändrar sig fördelningen när antalet frön som gror, k, ändrar sig? 4. Tänk efter hur fördelningen för Y ungefär bör se ut, när vi har viktat ihop dessa 8 fördelningar med vikter enligt binomialfördelningen för antal frön som gror. Vi ska nu låta matlabberäkna sannolikhetsfunktionen för Y och rita upp den: >> py=zeros(size(y)); % Fyll först py med nollor. >> for k=0:7 % Uppdatera py(y) för varje k py=py+poisspdf(y,50*k)*binopdf(k,7,0.75); end >> figure % Nytt figurfönster så vi kan jämföra med de % 8 poissonfördelningarna i förra fönstret. >> bar(y,py) 5. Ser fördelningen ut som du hade tänkt dig? Den specialskrivna funktionen solrosor(n,p,μ), som finns på hemsidan, ritar upp sannolikhetsfunktionen för Y där Y X = x Po(μ x) och X Bin(n, p) för valfria värden på n, p och μ: >> help solrosor >> solrosor(7,0.75,50)

4 Laboration 2, Matstat AK för Π och E, HT14/VT15 6. Experimentera med olika värden på n, p och μ. Vad händer om antalet frön i påsen (n) minskar eller ökar? Om grobarheten (p) minskar eller ökar? Om medelantalet nya frön per frö som gror (μ) minskar eller ökar? 3 Normalfördelningen 3.1 Endimensionell normalfördelning Vi ska nu bekanta oss med normalfördelningen. Täthetsfunktionen för en normalfördelad stokastisk variabel, N(μ, σ) ges av f X (x) = 1 σ 2π e (x μ)2 /2σ 2 för < x <. Den beror alltså på två parametrar μ och σ där μ är väntevärdet i fördelningen och σ är dess standardavvikelse. Normalfördelningen är en av de fördelningar som används mest inom sannolikhets- och statistikteorin. Rita upp täthetsfunktionen för olika värden på μ och σ och se hur fördelningen påverkas när vi ändrar parametrarna: >> x = linspace(0,10,1000); % Genererar 1000 tal jämnt utspridda % mellan 0 och 10. >> plot(x,normpdf(x,2,0.5)) % N(2, 0.5) >> hold on % Lås plotten, övriga ritas i samma % bild. >> plot(x,normpdf(x,7,0.5), r ) % N(7, 0.5) i rött >> plot(x,normpdf(x,5,2), g ) % N(5, 2) i grönt >> plot(x,normpdf(x,5,0.2), y ) % N(5, 0.2) i gult >> hold off % Lås upp plotten >> title( Täthetsfunktioner, f(x) ) 7. Vad händer då μ ändras? Då σ ändras? 3.2 Tvådimensionell och betingad normalfördelning Den här avsnittet syftar till att belysa begreppet betingad fördelning. Detta är viktigt eftersom betingade fördelningar och speciellt deras väntevärden och varianser är grundläggande för all prediktion och rekonstruktion i stokastiska system. Avsikten är också att du skall träna på korrelation som mått på beroende mellan två stokastiska variabler X och Y. Vi arbetar här med en tvådimensionell normalfördelning (X, Y). Täthetsfunktionen för en tvådimensionell normalfördelning med väntevärden μ X och μ Y, C(X, Y) standardavvikelser σ X och σ Y samt korrelationskoefficient ρ = ρ(x, Y) = är σ X σ Y där K = f X,Y (x, y) = { [ 1 = K exp 2(1 ρ 2 ) 1 2πσ X σ Y 1 ρ 2. ( x μ X σ X ) 2 + ( y μ Y σ Y ) 2 2ρ( x μ X )( y μ ]} Y ), σ X σ Y

Laboration 2, Matstat AK för Π och E, HT14/VT15 5 8. Vad gäller för beroendet mellan X och Y om ρ = 0? Använd förberedelseuppgift (e) och (f) för att besvara frågan. Genom att bestämma den betingade täthetsfunktioneen f X Y (x y) = f X,Y(x, y) ser man f Y (y) att den betingade fördelningen för X givet att Y = y är en endimensionell normalfördelning med E(X Y = y) = μ X + ρ σ X σ Y (y μ Y ) V(X Y = y) = σ 2 X(1 ρ 2 ). Observera att det betingade väntevärdet är lika med μ X plus en korrektionsterm som beror linjärt av y medan den betingade variansen bara beror på ρ. (Analoga formler gäller för n-dimensionella normalfördelningar.) Du ska nu studera grafiskt hur den betingade fördelningen, väntevärdet och variansen för X ändras då vi skruvar lite på de olika parametrarna i uttrycken ovan. Med andra ord, hur ändras vår information om X efter det att vi observerat att Y = y? Till din hjälp finns två m-filer normal2d och condnormal som ger dig bilder över de inblandade täthetsfunktionerna. >>normal2d(μ X,μ Y,σ X,σ Y,ρ) ger en bild över den tvådimensionella täthetsfunktionen, dess nivåkurvor och de marginella täthetsfunktionerna för X och Y. Funktionen condnormal ger bilder av de betingade täthetsfunktionerna. >>condnormal(μ X,μ Y,σ X,σ Y,ρ, y,y) genererar t.ex. en bild över den betingade täthetsfunktionen för X givet att Y = y. 9. Undersök hur betingat väntevärde och varians påverkas för små resp. stora värden på ρ, σ X och σ Y. Vad händer om ρ = 0 eller 0.99? 10. Använd t.ex. condnormal samt hold on och studera hur tätheten ändras med ρ och σ Y. Vad händer när du ändrar ρ och σ Y? 4 Funktioner av stokastiska variabler 4.1 Konstant prisutveckling över tiden En viss typ av elektroniska komponenter har, på grund av förfinad framställningsteknik, kunnat minska i pris med en viss procent per år. Om prisändringen är konstant kan priset, P(t), vid tiden t beskrivas med sambandet P(t) = P(0) r t där P(0) är utgångpriset och r är den årliga prisändringen. Antag nu att r = 0.8, dvs att priset minskar med 20 % per år, och att P(0) = 100 kr. Plotta prisutvecklingen under de kommande 15 åren:

6 Laboration 2, Matstat AK för Π och E, HT14/VT15 >> r = 0.8; >> P0 = 100; >> t = linspace(0,15); >> Pt = P0*r.^t; >> plot(t,pt) Den tid, T 0.5, det tar innan priset halverats, dvs då P(T 0.5 ) = P(0) 2, fås som T 0.5 = ln 0.5. Som synes beror halveringstiden inte på utgångpriset. I det här fallet är ln r T 0.5 = ln 0.5 3.1 år. ln 0.8 I verkligheten är prisfallet inte lika stort för alla tillverkare, t.ex. beroende på växelkurser, personalpolitik och råvarupriser. Det är inte orimligt att tänka sig att prisändringen, R, för en slumpmässigt vald tillverkare är Beta-fördelad så att R Beta(a, b). Vi antar då att priset inte kan öka. En Beta-fördelning har täthetsfunktion f R (r) = r a 1 (1 r) b 1 där a och b är positiva parametrar och E(R) = Γ(a + b) Γ(a)Γ(b), 0 r 1 a a + b, V(R) = E(R) b (a + b) (a + b + 1). Vi börjar med att titta på hur prisfallet kan variera när a = 16 och b = 4, dvs E(R) = 16 16+4 = 0.8 och D(R) = 4 0.8 (16+4)(16+4+1) 0.087. Vi börjar med att titta på fördelningen för R: >> a=16; b=4; >> rr=linspace(0,1); >> frr=betapdf(rr,a,b); >> plot(rr,frr) Vi vill nu titta på prisutvecklingen för 10 olika tillverkare: >> r = betarnd(a,b,10,1); >> T50 = log(0.5)./log(r) >> for k=1:10, plot(t,p0*r(k).^t), hold on, end >> plot(t50,0, * ) >> hold off 11. Ser det ut att vara stor spridning på P(t)? På T 0.5? 12. Man kan undra hur täthetsfunktionen för T 0.5 ser ut och vad det förväntade T 0.5 kommer att bli. Hur stor spridning är det på T 0.5? Besvara dessa frågor genom att simulera T 0.5 1000 gånger, rita histogram med hist och uppskatta E(T 0.5 ) och D(T 0.5 ) med funktionerna mean och std.

Laboration 2, Matstat AK för Π och E, HT14/VT15 7 13. Gör om ovanstående simuleringar med mindre spridning på R, t.ex. a = 64 och b = 16, dvs E(R) = 64 64+16 = 0.8 och D(R) = 16 0.8 (64+16)(64+16+1) 0.044. Hur ändrar sig E(T 0.5 ) och D(T 0.5 )?