Poisson Point Processes. Edvin Listo Zec Maja Fahlén

Relevanta dokument
Introduktion till statistik för statsvetare

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

TMS136. Föreläsning 4

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

SF1901: SANNOLIKHETSTEORI OCH FLERDIMENSIONELLA STOKASTISKA STATISTIK VARIABLER. Tatjana Pavlenko. 8 september 2017

LINKÖPINGS UNIVERSITET EXAM TAMS 15 / TEN 1

bli bekant med summor av stokastiska variabler.

Matematisk statistik TMS064/TMS063 Tentamen

Demonstration av laboration 2, SF1901

Simulering av Poissonprocesser Olle Nerman, Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp)

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

Statistiska metoder för säkerhetsanalys

Övning 1 Sannolikhetsteorins grunder

Föreläsning 4: Konfidensintervall (forts.)

Matematisk statistik för D, I, Π och Fysiker

Stokastiska signaler. Mediesignaler

Avd. Matematisk statistik

Tentamen i Sannolikhetslära och statistik, TNK069, , kl 8 13.

Tentamen MVE302 Sannolikhet och statistik

Uppgift 1. Produktmomentkorrelationskoefficienten

MVE051/MSG Föreläsning 7

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Formler och tabeller till kursen MSG830

Problemsamling i Sannolikhetsteori

Binomialfördelning, två stickprov

Våra vanligaste fördelningar

LINKÖPINGS UNIVERSITET EXAM TAMS 79 / TEN 1

SF1901: Sannolikhetslära och statistik

Statistisk analys av komplexa data

Stokastiska vektorer

SF1901: Sannolikhetslära och statistik

Tentamen MVE301 Sannolikhet, statistik och risk

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsningen ger en introduktion till differentialekvationer och behandlar stoff från delkapitel 18.1, 18.3 och 7.9 i Adams. 18.

x(t) I elimeringsmetoden deriverar vi den första ekvationen och sätter in x 2(t) från den andra ekvationen:

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Väntevärde och varians

Tentamen MVE301 Sannolikhet, statistik och risk

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Tentamen MVE302 Sannolikhet och statistik

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''

Lufttorkat trä Ugnstorkat trä

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

Formel- och tabellsamling i matematisk statistik

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Matematisk statistik 9 hp Föreläsning 4: Flerdim

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

4 Diskret stokastisk variabel

6. Flerdimensionella stokastiska variabler

TANA17 Matematiska beräkningar med MATLAB för M, DPU. Fredrik Berntsson, Linköpings Universitet. 2 november 2015 Sida 1 / 23

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

Tentamen MVE301 Sannolikhet, statistik och risk

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Föresläsningsanteckningar Sanno II

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

TENTAMEN MÅNDAGEN DEN 22 OKTOBER 2012 KL a) Bestäm P(ingen av händelserna inträffar). b) Bestäm P(exakt två av händelserna inträffar).

TSBB14 Laboration: Intro till Matlab 1D

Tentamen MVE301 Sannolikhet, statistik och risk

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Föreläsning 3, Matematisk statistik Π + E

Föreläsning 5, FMSF45 Summor och väntevärden

TMS136. Föreläsning 5

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

, s a. , s b. personer från Alingsås och n b

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

Index. Vektorer och Elementvisa operationer. Summor och Medelvärden. Grafik i två eller tre dimensioner. Ytor. 20 januari 2016 Sida 1 / 26

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

SF1901 Sannolikhetsteori och statistik I

Tentamen MVE301 Sannolikhet, statistik och risk

Statistiska metoder för säkerhetsanalys

1.1 MATLABs kommandon för matriser

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Föreläsning 4, Matematisk statistik för M

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

9. Konfidensintervall vid normalfördelning

Avd. Matematisk statistik

Laboration 2: 1 Syfte. 2 Väntevärde och varians hos en s.v. X med fördelningen F X (x) MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08

Några extra övningsuppgifter i Statistisk teori

Lösningsförslag till tentamen i SF1683 och SF1629 (del 1) 18 december xy = y2 +1

Matematisk statistik 9 hp Föreläsning 3: Transformation och simulering

Lösningar till tentamen i Matematisk Statistik, 5p

TMS136. Föreläsning 5

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Tentamen MVE301 Sannolikhet, statistik och risk

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Tentamen MVE301 Sannolikhet, statistik och risk

Industriell matematik och statistik, LMA /14

MVE051/MSG Föreläsning 14

Föreläsning 7: Stokastiska vektorer

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Laboration 4: Hypotesprövning och styrkefunktion

SF1901 Sannolikhetsteori och statistik I

Transkript:

Poisson Point Processes Edvin Listo Zec Maja Fahlén 2013 05 19 1

Innehåll 1 Introduktion 3 2 Inhomogena poisson-punktprocesser 3 3 Analys av riktig data 5 2

1 Introduktion I det här arbetet komer vi att diskutera inhomogena Poisson-punktprocesser (PPP), det vill säga processer med varierande intensitet. De homogena PPP (med konstant intensitet) har vi tidigare studerat i kursen, till exempel när vi kollade på data om platser där bomber slog ned i London under andra världskriget. I det exemplet undersökte vi hur vida platserna var slumpmässigt träffade enligt poissonfördelning med konstant intensitet eller inte. Hypotesen testades sedan via ett χ 2 -test. På liknande sätt har vi undersökt data och fösökt modellera den som en inhomogen PPP. Vi kommer först ge en närmare förklaring och fler exempel på inhomogena PPP för att därefter visa teoretiskt hur man kan analysera data. 2 Inhomogena poisson-punktprocesser Antag att vi har ett område W = [0,a] x [0,b] och att N w är antalet punkter på den ytan. Den stegvisa definitionen av en PPP är då: Steg 1: Anta vidare att N w P o(m) med positivt men ändligt medelvärde m. Steg 2: Välj en tvådimensionell pdf f(x,y) 0 för (x,y) W och annars 0. (X,Y ) är stokastiska variabler med pdf som f(x,y). Steg 3: Givet att N w = n > 0 så placerar man n punkter (x i,y i ) oberoende vilka man får genom oberoende repetera (X,Y ). Med andra ord är koordinaterna oberoende stokastiska variabler med en pdf f(x,y), 0 x a och 0 y b. I det homogena fallet är X uniformt fördelad på [0,a] medan Y är uniformt fördelad på [0,b]. De är dessutom oberoende. Den enklaste versionen av en inhomogen PP kan fås genom att ta X och Y oberoende, men inte uniformt fördelade. Generellt sett räknas intensiteten ut som λ(x,y) = m f(x,y) men då X och Y är oberoende fås λ(x,y) = m f(x) f(y). Observera att eftersom f(x,y)dxdy = 1 är λ = m. I princip kan vilken PP som helst med separabel intensitet fås genom den homogena PP fast med ändrad skala. Låt t.ex. X och Y N(0,1) och definiera: Z = a X W = b Y 2 Då fås F z = P (Z z) = P ( X z/a) = P (X (z/a) 2 ) = (z/a) 2 0 1dx = z 2 /a 2 3

Täthetsfunktionen blir då alltså: f z = F z = 2z/a 2 På samma sätt fås F w = P (W w) = P (by 2 w) = P (Y w/b) = w/b 0 1dy = w/b. Täthetsfunktionen blir då f w = F w = 1/2 wb. Observera att eftersom X och Y N(0,1) gäller att f z = 2z/a 2 då 0 < z < a och 0 för övrigt och f w = 1/2 wb då 0 < w < b och 0 för övrigt. Intensiteten kan nu enkelt beräknas som λ(x,y) = m fx fy. Här följer matlabkod för ovanstående modellering: m = 50; noevents = poissrnd(m); coords = rand(noevents,2); figure(1), hold on a=5;b=10; axis([0 a 0 b]); X=a*sqrt(coords(:,1)); Y=b*coords(:,2).^2; subplot(4,2,1) plot(x,y, * ) title( X och Y ) subplot(4,2,3) hist(x) title( Histogram av X ) subplot(4,2,4) hist(y) title( Histogram av Y ) subplot(4,2,5) x=0:0.1:a; fx=(2*x)./(a^2); plot(x,fx) title( f(x) ) subplot(4,2,6) t=0:0.2:b; fy=1./(2*sqrt(t)*b^(1/2)); plot(t,fy) lambda=@(x,t) m.*fx.*fy; title( f(y) ) subplot(4,2,7) plot3(x,t, lambda(x,t)) 4

3 Analys av riktig data Antag att X är positionen av en skada, X [0,125]cm (tex plats på korrosionsskada på en rörledning) och Y [0, ] är storleken på skadan mätt i en lämplig enhet. Här är resultatet av ett test utfört i ett laboratorium på försämringen hos materialet på en 1.25 lång rörledning. Om datan kan anses vara en PP med separabel intensitet så har man i princip n oberoende observationer av (X,Y ) och vi kan anta att X och Y är oberoende. För att säkerhetställa att antagandet om oberoende inte är helt galet gör vi ett χ 2 -test. Vi delar in datan enligt: v1=[50 48 39 57 44 38 14 290]; %vektor för X v2=[0 1 2 2 3 5 0 13]; %vektor för Y v3=[50 49 41 59 47 43 14 303]; %vektor för totala A=[v1;v2;v3]; E=[47.8548 46.8977 39.2409 56.4686 44.9835 41.1551 13.3993; 2.1452 2.1023 1.7591 2.5314 2.0165 1.8449 0.6007]; %Expected frequency E r,c = (n r n c )/n där E r,c är the expected frequency count för nivå r av variabel A och nivå c av variabel B, n r är totala antalet av observationerna vid nivå r av variabel A, n c är totala antalet av observationerna vid nivå c av variabel B och n är summan av de båda. 5

sum=0; for i=1:2 for j=1:7 sum=sum+((a(i,j)-e(i,j))^2)/e(i,j); %%Detta är formeln för chi2-testet. end end sum Vi får Q = 9.7627. Detta jämförs sedan med χ(d) där d är frihetsgraden, d = (7 1) (2 1) = 6. Enligt tabell är χ(6) 0.05 = 12.59 > 9.7627. Alltså kan vi inte förkasta teorin om att X och Y är oberoende. Vi fortsätter analysen av datan under förutsättningen att X och Y är oberoende vilket gör λ = m f x f y till en lämplig modell. För att få tag i f x och f y analyserar vi x och y för sig i Matlab och jämför med diverse olika fördelningar. Det visar sig att X weibull(ax,bx ) och Y weibull(ay,by ). Där ax = 693.9861, bx = 1.7012, ay = 411.2290 och by = 0.7897. 6

Antag att den riktiga rörledningen är 10m lång och risken för olyckor är hög om måttet på förstörelsen, y, överskrider 50000. Under förutsättningen att vår estimering av λ gäller även utanför intervallet [0,125] utökar vi då W = [0,1000] [50000, ]. Vidare antar vi naturligtvis att antalet skador N w P o(m). Alltså behöver vi beräkna m = λ(x,y)dxdy vilket vi försökt göra i Matlab utan framgång, men det borde vara teoretiskt möjligt. 7