Laboration 2: Sannolikhetsteori och simulering



Relevanta dokument
Datorövning 2 Diskret fördelning och betingning

Laboration 2: Sannolikhetsteori och simulering

Laboration 2: Sannolikhetsteori och simulering

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen

bli bekant med summor av stokastiska variabler.

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

Tentamen i matematisk statistik (9MA241/9MA341/LIMAB6, STN2) kl 08-13

1. Frekvensfunktionen nedan är given. (3p)

Lunds tekniska högskola Matematikcentrum Matematisk statistik

Syftet med den här laborationen är att du skall bli mer förtrogen med några viktiga områden inom kursen nämligen

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT Angående grafisk presentation

Föreläsning 9: Hypotesprövning

Datorövning 2 Statistik med Excel (Office 2003, engelska)

Statistik 1 för biologer, logopeder och psykologer

Statistiska metoder för säkerhetsanalys

HT 2011 FK2004 Tenta Lärare delen 4 problem 6 poäng / problem

INLÄMNINGSUPPGIFT 2 (Del 2, MATEMATISK STATISTIK) Kurs: MATEMATIK OCH MATEMATISK STATISTIK 6H3000

Du ska nu skapa ett litet program som skriver ut Hello World.

Lösningar till Tentamen i Matematisk Statistik, 5p 22 mars, Beräkna medelvärdet, standardavvikelsen, medianen och tredje kvartilen?

Laboration 2: 1 Syfte. 2 Väntevärde och varians hos en s.v. X med fördelningen F X (x) MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Tentamen TAIU07 Matematiska beräkningar med MATLAB för MI

Laborationspecifikation

Datorövning 1: Fördelningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Uppgift

Modul 6: Integraler och tillämpningar

TT091A, TVJ22A, NVJA02 By, Pu, Ti. 50 poäng

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Lathund, procent med bråk, åk 8

Enkätresultat för elever i åk 9 i Borås Kristna Skola i Borås hösten Antal elever: 20 Antal svarande: 19 Svarsfrekvens: 95% Klasser: Klass 9

F14 Repetition. Måns Thulin. Uppsala universitet Statistik för ingenjörer 6/ /15

konstanterna a och b så att ekvationssystemet x 2y = 1 2x + ay = b 2 a b

Enkätresultat för elever i år 2 i Nösnäsgymnasiet 2 i Stenungsund våren 2014

Tentamen i Tillämpad matematisk statistik LMA521 för EPI och MI den 14 dec 2011

Enkätresultat för elever i år 2 i Mega Musik gymnasium hösten Antal elever: 47 Antal svarande: 46 Svarsfrekvens: 98% Klasser: MM13

Enkätresultat för elever i år 2 i Praktiska Skövde i Praktiska Sverige AB hösten 2014

Vi skall skriva uppsats

Algebra, polynom & andragradsekvationer en pampig rubrik på ett annars relativt obetydligt dokument

EXTRAUPPGIFTER MATEMATISK STATISTIK AK FÖR CDE, FMS 022

Linjära system av differentialekvationer

Väga paket och jämföra priser

Laboration 2: Sannolikhetsteori och simulering

Kapitel 6. f(x) = sin x. Figur 6.1: Funktionen sin x. 1 Oinas-Kukkonen m.fl. Kurs 6 kapitel 1

Har vi lösningen för en bättre hemtjänst? Självklart.

Syftet med en personlig handlingsplan

a n = A2 n + B4 n. { 2 = A + B 6 = 2A + 4B, S(5, 2) = S(4, 1) + 2S(4, 2) = 1 + 2(S(3, 1) + 2S(3, 2)) = 3 + 4(S(2, 1) + 2S(2, 2)) = = 15.

Sammanfatta era aktiviteter och effekten av dem i rutorna under punkt 1 på arbetsbladet.

Får nyanlända samma chans i den svenska skolan?

Matematisk statistik 9 hp Föreläsning 4: Flerdim

Facit med lösningsförslag kommer att anslås på vår hemsida Du kan dessutom få dem via e-post, se nedan.

SF1625 Envariabelanalys

Utveckla arbetsmiljö och verksamhet genom samverkan

ÖVNINGSKÖRNINGSOLYCKOR

Förskolan Vårskogen, Svaleboskogen 7. Plan mot diskriminering och kränkande behandling

KTHs Matematiska Cirkel. Sannolikhetsteori. Joakim Arnlind Andreas Enblom

Om erbjudandet för din pensionsförsäkring med traditionell förvaltning.

Ekvationssystem, Matriser och Eliminationsmetoden

Möbiustransformationer.

Hävarmen. Peter Kock

Index vid lastbilstransporter

912 Läsförståelse och matematik behöver man lära sig läsa matematik?

L(9/G)MA10 Kombinatorik och geometri Gruppövning 1

Volymer av n dimensionella klot

7. SAMHÄLLSORIENTERING ÅK 5

Exempel på tentamensuppgifter i LMA100, del 1

5 Kontinuerliga stokastiska variabler

Test Virkesmarknad och Lagerteori

Svenska Du kan med flyt läsa texter som handlar om saker du känner till. Du använder metoder som fungerar. Du kan förstå vad du läser.

SANNOLIKHET. Sannolikhet är: Hur stor chans (eller risk) att något inträffar.

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08

Något om permutationer

Tränarguide del 1. Mattelek.

Laborativ matematik som bedömningsform. Per Berggren och Maria Lindroth

Träning i bevisföring

Föräldrabroschyr. Björkhagens skola - en skola med kunskap och hjärta. Vad ska barnen lära sig i skolan?

Kvalster. Korrelation och regression: lineära modeller för bivariata samband. Spridningsdiagram. Bivariata samband

Datorövning 1 Fördelningar

Jämförelse länder - Seminarium

729G04 - Hemuppgift, Diskret matematik

Elektronen och laddning

ANVÄNDARHANDLEDNING FÖR

1 Navier-Stokes ekvationer

Övningshäfte i matematik för. Kemistuderande BL 05

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Boll-lek om normer. Nyckelord: likabehandling, hbt, normer/stereotyper, skolmiljö. Innehåll

INTERVJU MED TOMI SÖDERSTRÖM, PRODUKTCHEF / MAT- & RESTAURANGSERVICE, SILJA LINE , HELSINGFORS

Invisible Friend Senast uppdaterad

Texturbild. Lagerpaletten du kommer arbeta med ser du till höger. 1. Kopiera bakgrunden till ett nytt lager och gör den svartvit.

STATISTIK. Statistik är: 1. Insamling av data 2. Analys av data 3. Presentation av data.

Stokastiska signaler. Mediesignaler

Från min. klass INGER BJÖRNELOO

Energi & Miljötema Inrikting So - Kravmärkt

UPPGIFT: SKRIV EN DEBATTARTIKEL

Design by. Manual Jossan.exe. Manual. till programmet. Jossan.exe. E-post:

Transkript:

LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 2 MATEMATISK STATISTIK AK FÖR CDIFYSIKER, FMS012/MASB03, HT11 Laboration 2: Sannolikhetsteori och simulering Syftet med den här laborationen är att du skall bli mer förtrogen med några viktiga områden inom kursen nämligen Simulering Beroende Betingade fördelningar Tvådimensionella normalfördelade stokastiska variabler Funktioner av stokastiska variabler Datamaterial och specialrutiner finns att hämta på kursens hemsida: http://www.maths.lth.se/matstat/kurser/fms012/cdi/ 1 Förberedelseuppgifter Som förberedelse till laborationen bör du läsa igenom Kapitel 3.10, 4.5, 4.8, 5 och 7, samt hela laborationshandledningen. Repetera dessutom det som sades om Gauss approximationsformler på föreläsning 7. Till laborationens start har du med dig lösningar till förberedelseuppgifterna (a) (f): (a) Vi köper en påse med 7 solrosfrön. På baksidan i den finstilta texten står det att grobarheten är 75 %. Skriv upp sannolikhetsfunktionen för antalet frön som kommer att gro. (Behövs i 2.1) (b) Skriv upp sannolikhetsfunktionen för en Po(Ñ)-fördelad stokastisk variabel. (Behövs i 2.2) (c) Om X och Y är oberoende Po(Ñ)-fördelade variabler, vilken fördelning har då X +Y? (Behövs i 2.2) (d) Om vi har p X (k) och p Y X (y k), hur kan vi då beräkna p Y (y)? (Behövs i 2.2) (e) Definiera följande begrepp: oberoende stokastiska variabler, väntevärde, varians, kovarians, korrelation och betingad täthetsfunktion. (Behövs i 3.1 2). (f) Skriv upp den simultana täthetsfunktionen för X och Y om X N (ÑX, X ) och Y N (ÑY, Y ) och X och Y är oberoende av varandra. (Behövs i 3.2)

2 Laboration 2, Matstat AK för CDIfysiker, HT11 2 Diskret fördelning 2.1 Simulering av grobarhet hos solrosfrön Detta är en fortsättning av förberedelseuppgift (a). Vi vill simulera antalet frön som kommer att gro bland de sju fröna i påsen. Det kan vi göra på två sätt. Det mest rättframma är att simulera 7 frön och räkna antalet som gror. Funktionen rand(7,1) ger en kolonnvektor med 7 rektangelfördelade slumptal, U, mellan 0 och 1. För att sannolikheten att ett frö kommer att gro skall bli p kan vi helt enkelt se efter om U p. I så fall kommer fröet att gro. Om U > p så kommer det inte att gro. För att få reda på antalet frön som kommer att gro bland de 7 summerar vi den resulterande 0/1-variabeln: >> U=rand(7,1) >> U<=0.75 >> X=sum(U<=0.75) Ett smidigare sätt är att utnyttja att vi vet att antalet frön som kommer att gro är Bin(7, 0.75)- fördelat (enligt förberedelseuppgift (a)). Då kan vi simulera X direkt med hjälp av MATLABs färdiga rutiner: >> help binornd >> X=binornd(7,0.75) Gör om proceduren några gånger. Antalet frön som kommer att gro varierar uppenbarligen från gång till gång, dvs från påse till påse. För att se hur vanligt det är med olika antal frön som kommer att gro simulerar vi 20 påsar och ritar ett stolpdiagram. Vi kan också rita in sannolikhetsfunktionen i samma diagram. Den heter binopdf (pdf uttyds Probability Density Function, dvs sannolikhets/täthets-funktion) i MATLAB. >> help binopdf >> X=binornd(7,0.75,20,1) >> N=hist(X,0:7) % vi vet att resultatet bara kan bli 0,...,7 >> bar(0:7,[n/20;binopdf(0:7,7,0.75)] ) 1. De blå stolparna är vårt simulerade resultat och de röda är den teoretiska sannolikhetsfunktionen. Hur stämmer det? 2. Simulera 1000 påsar istället. Stämmer det bättre nu? 2.2 Tvådimensionell fördelning med hjälp av betingade fördelningar: Skördeutfall Vi tänker oss nu att varje solrosfrö som gror ger upphov till ett Poissonfördelat antal nya frön, i medeltal 50 frön per groende solros. Frön som inte gror ger naturligtvis inga nya frön. Vi är intresserade av fördelningen för det totala antalet nya frön som en fröpåse med 7 frön och 75 % grobarhet kan ge upphov till. Vi har, som tidigare, X = antal frön som gror Bin(7, 0.75). Då kommer vi att få att den betingade fördelningen för Y = antal nya frön, givet att vi fick X = x frön som grodde, blir

Laboration 2, Matstat AK för CDIfysiker, HT11 3 Y X = x Po(50 x) där x = 0,..., 7 (enligt förberedelseuppgift (c)). Fördelningen för Y ges då (enligt förberedelseuppgift (d)) av p Y (y) = P(Y = y) = k = 7 k=0 e 50k (50k)y y! P(Y = y X = k) P(X = k) = 7 p Y X (y k) p X (k) k=0 ( ) 7 0.75 k 0.25 7 k = Nått gräsligt! för y = 0, 1, 2,... k För att ta reda på hur denna fördelning ser ut börjar vi med att rita upp var och en av de 8 olika möjliga Poissonfördelningarna. Detta är de 8 olika varianterna av betingade fördelningar vi har (Po(0), Po(50), Po(100),..., Po(350)). Vi ritar de 8 sannolikhetsfunktionerna i samma figurfönster men i varsin delfigur för att få lite överblick: >> clf % Töm figurfönstret. >> y=0:450; >> for k=0:7 subplot(4,2,k+1) % Rita i delfigur nr 1..8 i en 4x2-plan. bar(y,poisspdf(y,50*k)) end 3. Hur ändrar sig fördelningen när antalet frön som gror, k, ändrar sig? 4. Tänk efter hur fördelningen för Y ungefär bör se ut, när vi har viktat ihop dessa 8 fördelningar med vikter enligt binomialfördelningen för antal frön som gror. Vi ska nu låta MATLAB beräkna sannolikhetsfunktionen för Y och rita upp den: >> py=zeros(size(y)); % Fyll först py med nollor. >> for k=0:7 % Uppdatera py(y) för varje k py=py+poisspdf(y,50*k)*binopdf(k,7,0.75); end >> figure % Nytt figurfönster så vi kan jämföra med de % 8 poissonfördelningarna i förra fönstret. >> bar(y,py) 5. Ser fördelningen ut som du hade tänkt dig? Den specialskrivna funktionen solrosor(n,p,ñ), som finns på hemsidan, ritar upp sannolikhetsfunktionen för Y där Y X = x Po(Ñ x) och X Bin(n, p) för valfria värden på n, p och Ñ: >> help solrosor >> solrosor(7,0.75,50)

4 Laboration 2, Matstat AK för CDIfysiker, HT11 6. Experimentera med olika värden på n, p ochñ. Vad händer om antalet frön i påsen (n) minskar eller ökar? Om grobarheten (p) minskar eller ökar? Om medelantalet nya frön per frö som gror (Ñ) minskar eller ökar? 3 Normalfördelningen 3.1 Endimensionell normalfördelning Vi ska nu bekanta oss med normalfördelningen. Täthetsfunktionen för en normalfördelad stokastisk variabel, N (Ñ, ) ges av f X (x) = 1 2Ôe (x Ñ) 2 /2 2 för < x <. Den beror alltså på två parametrarñoch därñär väntevärdet i fördelningen och är dess standardavvikelse. Normalfördelningen är en av de fördelningar som används mest inom sannolikhets- och statistikteorin. Rita upp täthetsfunktionen för olika värden påñoch och se hur fördelningen påverkas när vi ändrar parametrarna: >> x = linspace(0,10,1000); % Genererar 1000 tal jämnt utspridda % mellan 0 och 10. >> plot(x,normpdf(x,2,0.5)) % N(2, 0.5) >> hold on % Lås plotten, övriga ritas i samma % bild. >> plot(x,normpdf(x,7,0.5), r ) % N(7, 0.5) i rött >> plot(x,normpdf(x,5,2), g ) % N(5, 2) i grönt >> plot(x,normpdf(x,5,0.2), y ) % N(5, 0.2) i gult >> hold off % Lås upp plotten >> title( Täthetsfunktioner, f(x) ) 7. Vad händer dåñändras? Då ändras?... 3.2 Tvådimensionell och betingad normalfördelning Den här avsnittet syftar till att belysa begreppet betingad fördelning. Detta är viktigt eftersom betingade fördelningar och speciellt deras väntevärden och varianser är grundläggande för all prediktion och rekonstruktion i stokastiska system. Avsikten är också att du skall träna på korrelation som mått på beroende mellan två stokastiska variabler X och Y. Vi arbetar här med en tvådimensionell normalfördelning (X, Y ). Täthetsfunktionen för en tvådimensionell normalfördelning med väntevärdenñx ochñy, standardavvikelser X och Y samt korrelationskoefficientö=ö(x, Y ) = C(X, Y ) är f X,Y (x, y) = { 1 = K exp 2(1 Ö2 ) X Y [ ( x ÑX ) 2 + ( y ÑY ) 2 2Ö( x ÑX )( y ]} ÑY ), X Y X Y 1 där K =. 2Ô X Y 1 Ö2 8. Vad gäller för beroendet mellan X och Y omö=0? Använd förberedelseuppgift (e) och (f) för att besvara frågan....

Laboration 2, Matstat AK för CDIfysiker, HT11 5 Genom att bestämma den betingade täthetsfunktioneen f X Y (x y) = f X,Y (x, y) ser man att den f Y (y) betingade fördelningen för X givet att Y = y är en endimensionell normalfördelning med E(X Y = y) +Ö X =ÑX (y ÑY ) Y V (X Y = y) = 2 X (1 Ö2 ). Observera att det betingade väntevärdet är lika medñx plus en korrektionsterm som beror linjärt av y medan den betingade variansen bara beror påö. (Analoga formler gäller för n-dimensionella normalfördelningar.) Du ska nu studera grafiskt hur den betingade fördelningen, väntevärdet och variansen för X ändras då vi skruvar lite på de olika parametrarna i uttrycken ovan. Med andra ord, hur ändras vår information om X efter det att vi observerat att Y = y? Till din hjälp finns två m-filer normal2d och condnormal som ger dig bilder över de inblandade täthetsfunktionerna. >>normal2d(ñx,ñy, X, Y,Ö) ger en bild över den tvådimensionella täthetsfunktionen, dess nivåkurvor och de marginella täthetsfunktionerna för X och Y. Funktionencondnormal ger bilder av de betingade täthetsfunktionerna. >>condnormal(ñx,ñy, X, Y,Ö, y,y) genererar t.ex. en bild över den betingade täthetsfunktionen för X givet att Y = y. 9. Undersök hur betingat väntevärde och varians påverkas för små resp. stora värden påö, X och Y. Vad händer omö=0 eller 0.99?... 10. Använd t.ex. condnormal samt hold on och studera hur tätheten ändras medöoch Y. Vad händer när du ändraröoch Y?... 4 Funktioner av stokastiska variabler 4.1 Konstant prisutveckling över tiden En viss typ av elektroniska komponenter har, på grund av förfinad framställningsteknik, kunnat minska i pris med en viss procent per år. Om prisändringen är konstant kan priset, P(t), vid tiden t beskrivas med sambandet P(t) = P(0) r t där P(0) är utgångpriset och r är den årliga prisändringen. Antag nu att r = 0.8, dvs att priset minskar med 20 % per år, och att P(0) = 100 kr. Plotta prisutvecklingen under de kommande 15 åren: >> r = 0.8; >> P0 = 100; >> t = linspace(0,15); >> Pt = P0*r.^t; >> plot(t,pt)

6 Laboration 2, Matstat AK för CDIfysiker, HT11 Den tid, T 0.5, det tar innan priset halverats, dvs då P(T 0.5 ) = P(0) 2, fås som T 0.5 = synes beror halveringstiden inte på utgångpriset. I det här fallet är ln 0.5 ln r. Som T 0.5 = ln 0.5 3.1 år. ln 0.8 I verkligheten är prisfallet inte lika stort för alla tillverkare, t.ex. beroende på växelkurser, personalpolitik och råvarupriser. Det är inte orimligt att tänka sig att prisändringen, R, för en slumpmässigt vald tillverkare är Beta-fördelad så att R Beta(a, b). Vi antar då att priset inte kan öka. En Betafördelning har täthetsfunktion f R (r) = r a 1 (1 r) b 1 + b) (a, 0 r 1 (a) (b) där a och b är positiva parametrar och E(R) = a a + b, V (R) = E(R) b (a + b) (a + b + 1). Vi börjar med att titta på hur prisfallet kan variera när a = 16 och b = 4, dvs E(R) = 16 16+4 = 0.8 4 och D(R) = 0.8 (16+4)(16+4+1) 0.087. Vi börjar med att titta på fördelningen för R: >> a=16; b=4; >> rr=linspace(0,1); >> frr=betapdf(rr,a,b); >> plot(rr,frr) Vi vill nu titta på prisutvecklingen för 10 olika tillverkare: >> r = betarnd(a,b,10,1); >> T50 = log(0.5)./log(r) >> for k=1:10, plot(t,p0*r(k).^t), hold on, end >> plot(t50,0, * ) >> hold off 11. Ser det ut att vara stor spridning på P(t)? På T 0.5? 12. Man kan undra hur täthetsfunktionen för T 0.5 ser ut och vad det förväntade T 0.5 kommer att bli. Hur stor spridning är det på T 0.5? Besvara dessa frågor genom att simulera T 0.5 1000 gånger, rita histogram medhist och uppskatta E(T 0.5 ) och D(T 0.5 ) med funktionernamean ochstd. 13. Gör om ovanstående simuleringar med mindre spridning på R, t.ex. a = 64 och b = 16, dvs E(R) = 64 64+16 = 0.8 och D(R) = 16 0.8 (64+16)(64+16+1) 0.044. Hur ändrar sig E(T 0.5) och D(T 0.5 )?