Grundläggande matematisk statistik Flerdimensionella Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Flerdimensionella Ett slumpförsök kan ge upphov till flera (s.v.): kast med två tärningar: s.v. X = ögontalet tärning 1 tvådimensionell s.v. s.v. Y = ögontalet tärning 2 kast med pil på en måltavla: s.v. X = höjden mätt från nedre kanten s.v. Y = horisontellt avstånd till vänster sidan av måtavlan slumpmässigt vald person s.v. X = längd i cm s.v. Y = vikt i kg tredimensionell s.v. s.v. Z = blodtryck i mmhg slumpmässigt vald barnfamilj: s.v. X = antal flickor s.v. Y = antal pojkar 1
tvådimensionell slumpvariabel: funktion Ω R 2 X, Y (stora bokstäver): i = 0, 1, 2, j = 0, 1, 2, i, j (små bokstäver): reella värden (ofta heltal för diskreta ) Slumpvariabeln (X, Y) kallas diskret om X och Y bara antar ett ändligt eller uppräkneligt oändligt antal olika värden. Sannolikhetsfunktion: P X = i, Y = j = p X,Y i, j joint probability distribution Sannolikhetsfunktionen anger sannolikheten för varje kombination av i och j (för hela utfallsrummet). Normering: (axiom 2: P Ω = 1) Sannolikhetsfunktionen kan åskadliggöras genom ett stolpdiagram (exempel barnkullar): P(X = 0, Y = 0) P(X = 0, Y = 1) Bild: Blom et al, s. 85 ( barnkullar ) 2
Sannolikhetsfunktionen kan åskadliggöras genom en tabell (exempel barnkullar): P(X = 0, Y = 0) P(X = 3, Y = 0) Y/X X=0 X=1 X=2 X=3 X=4 Y=0 0.38 0.16 0.04 0.01 0.01 Y=1 0.17 0.08 0.02 - - Y=2 0.05 0.02 0.01 - - Y=3 0.02 0.01 - - - Y=4 0.02 - - - - P(X = 1, Y = 3) Fördelningsfunktion: analogt till endimensionell fördelningsfunktion x och y är reella tal, fördelningsfunktionen är alltså en kontinuerlig tvådimensionell trappfunktion igen: tecknen viktiga för diskreta p X,Y i, j dessa slh. måste summeras för att erhålla F X,Y 1, 1 3
Marginalfördelningen ( margin = rand) Exempel: barnkullar (Blom et al.) Vi vill bara veta sannolikheten för antalet flickor i en slumpmässigt vald familj, oavsett hur många pojkar som finns i den familjen, dvs. vi behöver bara fördelningen för slumpvariablen X (flickor). Uppgiften är alltså att härleda den endimensionella fördelningen p X i från den tvådimensionella fördelningen p X,Y i, j : p X i = p X,Y i, j j=0 summeras över alla värden för s.v. Y, dvs. över j p Y j = p X,Y i, j i=0 summeras över alla värden för s.v. X, dvs. över i Marginalfördelningen ( margin = rand) Y/X X=0 X=1 X=2 X=3 X=4 Σ Y=0 0.38 0.16 0.04 0.01 0.01 0.60 Y=1 0.17 0.08 0.02 0.27 Y=2 0.05 0.02 0.01 0.08 Y=3 0.02 0.01 0.03 Y=4 0.02 0.02 Σ 0.64 0.27 0.07 0.01 0.01 1 P(Y = 0) P(Y = 2) P(Y = 4) P(X = 0) P(X = 2) P(X = 4) 4
Multinomialfördelningen: Exempel: Urna med kulor av r olika färg, drar n kulor med återläggning. Hur stor är sannolikheten att dra k 1 kulor av färg 1, (slumpvariabel X 1 : antalet dragna kulor med färg 1) k 2 kulor av färg 2, (slumpvariabel X 2 : antalet dragna kulor med färg 2) k r kulor av färg r? (slumpvariabel X r : antalet dragna kulor med färg r) Sannolikhetsfunktion för multinomialfördelningen: p X1, X 2,, X r k 1, k 2,, k r = n! k 1! k 2!.. k r! p 1 k 1 p 2 k 2 p r k r r p i = 1 i=1 r k i = n i=1 i varje dragning måste vi få en av de föreliggande färgarna vi drar totalt n gånger antalen måste summeras till n Multinomialfördelningen, speciellt r = 2: Om r (antalet färgar) är bara 2 (t.ex svart och vit): r = 2 p X1, X 2 k 1, k 2 = n! k 1! k 2! p 1 k 1 p 2 k 2 sannolikhetsfunktion k 2 = n k 1 p 2 = 1 p 1 antalet vita och svarta måste vara antalet dragna slh. att dra en vit eller svart måste adderas till 1 p X1, X 2 k 1, k 2 = n! k 1! (n k 1 )! p 1 k 1 1 p 1 n k 1 = n k 1 p 1 k 1 1 p 1 n k 1 Binomialfördelning Binomialfördelningen är ett speciellt fall av multinomialfördelningen för r = 2 5
Kontinuerliga tvådimensionella Tvådimensionell slumpvariabel: funktion Ω R 2 X, Y (stora bokstäver): x, y (små bokstäver): reella värden Slumpvariabeln (X, Y) kallas kontinuerlig om X och Y inte är diskreta. (Simultan) täthetsfunktion f X,Y x, y Normering: (axiom 2) Täthetsfunktion f X,Y x, y Kontinuerliga tvådimensionella Beräkna slh. att X, Y ett område A: ligger inom täthetsfunktionen integreras över detta område (A)! 6
Kontinuerliga tvådimensionella Beräkna slh. att X, Y ligger inom ett område A: Exempel: Låt f X,Y x, y vara given. Beräkna slh. att X ligger mellan 0 och 2, och att Y ligger mellan 1 och 3: Integrationsområdet: 2 X 0 1 Y 3 2 0 1 3 Kontinuerliga tvådimensionella Fördelningsfunktion: tvärtom gäller: f X,Y x, y = 2 x y F X,Y x, y 7
Kontinuerliga tvådimensionella Marginalfördelningar: f X x + = න f X,Y x, y dy Beräkning av marginalfördelningen för X från den simultana fördelninegn + f Y y = න f X,Y x, y dx Beräkning av marginalfördelningen för Y från den simultana fördelninegn integrera över en dimension Kontinuerliga tvådimensionella Marginalfördelning för fördelningsfunktionen: F X x = lim y F X,Y x, y F Y y = lim x F X,Y x, y f X u 8
Likformigt kontinuerlig tvådimensionell fördelning Simultan täthetsfunktion: f X,Y x, y = const för alla x, y Likformig kontinuerlig 2-dim. fördeln.: Om X, Y är definerade på ett område med arean B, och om man söker slh. att X, Y ligger i ett delområde A, så gäller: f X,Y x, y P X, Y A = arean av A arean av B X Y Likformigt kontinuerlig tvådimensionell fördelning Exempel: Blom et al, s. 88 P X, Y A = arean av A arean av B En punkt väljs slumpmässigt i kvadraten X, Y = ±1, ±1. Söker slh. P X 2 + Y 2 1? +1 (0,0) R=1-1 -1 +1 X 2 + Y 2 1 Kom ihåg: X 2 + Y 2 = R 2 är ekvationen för en cirkel med radius R och mittpunkt (0,0) P X 2 + Y 2 1 = arean av cirkeln π R2 = arean av rektangeln 2 2 = π 4 9
Oberoende flerdimensionella diskreta tvådimensionella s.v.: p X,Y i, j = p X i p Y j för alla i, j kontinuerliga tvådimensionella s.v.: f X,Y x, f = f X x f Y y för alla x, y Kom ihåg: P A B = P(A) P(B) om A och B oberoende diskreta och kontinuerliga tvådimensionella s.v.: F X,Y x, f = F X x F Y y för alla x, y Oberoende flerdimensionella diskreta tvådimensionella s.v.: p X,Y i, j = p X i p Y j för alla i, j p x,y (1, 1) p Y (1) Y/X X=1 X=2 X=3 marg. Y=1 0.04 0.06 0.1 0.2 Y=2 0.02 0.03 0.05 0.1 Y=3 0.14 0.21 0.35 0.7 marg. 0.2 0.3 0.5 1 p X (1) p X,Y i, j = p X i p Y j för alla i, j 0.04 = 0.2 0.2 0.06 = 0.3 0.2 0.35 = 0.5 0.7 måste gäller för alla celler om oberoendet föreligger 10
Oberoende flerdimensionella Exempel: livstid hos två glödlampor, Blom s. 91 s.v. X: livstid glödlampa 1 antas vara oberoende, båda exponentiellt fördelade s.v. Y: livstid glödlampa 2 f X x = a e a x x > 0 0 x 0 f Y y = b e b y y > 0 0 y 0 Söker slh. att båda glödlampor har en livstid mindre än t : P X t, Y t? använd oberoendet använd integrationsregler fördelningsfunktion för X~Exp(μ) Fördelning av maximumet av flera X 1, X 2,, X n oberoende (med känd fördelning) Söker: fördelning för Z = max X 1, X 2,, X n? Om den största (maximumet) ska vara mindre än z, så måste alla vara det!: P största z = P X 1 z X 2 z X n z F Z z = P Z z = P X 1 z P X 2 z P X n z om alla X i är parvist oberoende = F X1 z F X2 z F Xn z definition för F X F Z z n = i=1 F Xi z fördelning för maximumet av flera oberoende F Z z = F X z n om alla X i (är oberoende och) har samma fördelning 11
Fördelning av maximumet av flera Exempel: livslängd hos elektroniskt instrument med två komponenter: Ett elektroniskt instrument innehåller två komponenter vilkas livslängder X resp. Y är oberoende och exponentiellt fördelade: F X x = 1 e a x x > 0 0 x 0 F Y y = 1 e b y y > 0 0 y 0 Instrumentet fungerar så länge minst en av båda komponenter fungerar. Livslängden hos instrumentet är alltså maximumet av livslängden X och Y. Söker: täthetsfunktion för Z = max X, Y? F Z z = F X z F Y z = 1 e a z 1 e b z f Z z = d dz F Z z = a e a z 1 e b z + b e b z 1 e a z för z > 0; 0 annars Fördelning av minimumet av flera X 1, X 2,, X n oberoende (med känd fördelning) Söker: fördelning för Z = min X 1, X 2,, X n? Om den minsta (minimumet) ska vara större än z, så måste alla vara det!: P minsta > z = P X 1 > z X 2 > z X n > z P Z > z = P X 1 > z P X 2 > z P X n > z om alla X i är parvis oberoende 1 F Z z = 1 F X1 z 1 F X2 z 1 F Xn z kom ihåg: P X i > z = 1 F Xi z F Z z n = 1 1 F Xi z i=1 fördelning för minimumet av flera oberoende F Z z = 1 1 F X z n om alla X i (är oberoende och) har samma fördelning 12
Fördelning av minimumet av flera Exempel: livstid hos elektroniskt instrument, Blom et al. s. 93 Ett elektroniskt instrument innehåller två komponenter (X, Y) som är seriekopplade. Livstiderna för båda komponenter är exponentiellt fördelade. Söker: fördelningen för instrumentets livstid (Z)! F X x = 1 e a x x > 0 0 x 0 F Y y = 1 e b y y > 0 0 y 0 komponent 1 komponent 2 Seriekopplung: intrumentets livstid = minimum av komponenternas livstid! Z = min X, Y F Z z = 1 1 F X z 1 F Y z = 1 1 1 e a z 1 1 e b z = 1 e a z e b z = 1 e a+b z z > 0 f Z z = a + b e a+b z z > 0 täthetsfunktion, efter derivering Z ~ Exp a + b seriekoppling Fördelning av en summa av två X, Y: diskreta s.v., p X,Y i, j antas vara känd (simultan sannolikhetsfunktion) Z = X + Y summa, slumpvariabel p Z k = P Z = k = P X + Y = k = i + j = k j = k i p Z k = i+j=k p X,Y i, j k i+j=k = p X,Y i, k i i=0 p X,Y i, j summeras över alla i och j vilkas summa är k p Z k k = p X i p Y k i om X och Y är oberoende i=0 13
Fördelning av en summa av två X, Y: kontinuerliga s.v., f X,Y x, y antas vara känd (simultan täthetsfunktion) Z = X + Y summa, slumpvariabel F Z z = P Z z = P X + Y Z = ඵ x+y z f X,Y x, y dx dy Täthetsfunktionen erhålls genom derivering. integrationsområdet måste väljas noggrant Om X och Y är oberoende erhåller man (härledning utelämnad, se Blom et al. s. 96): f Z z + = න f X x f Y z x dx faltningsformel Anmärkning: differenser mellan 2, Z = X Y, kan behandlas genom att addera Y. Fördelning av en summa av Exempel: Låt bade X och Y vara oberoende och exponentiellt fördelade med samma parameter λ. Beräkna täthetsfunktionen för summan av X och Y! f X x = λ e λ x x > 0 0 x 0 f Y y = λ e λ y y > 0 0 y 0 X, Y ~ Exp λ f Z z + = න + f X x f Y z x dx = න λ e λ x λ e λ z x dx = න λ 2 e λ z dx = λ 2 e λ z න 1 dx = λ 2 e λ z z 0 z 0 z OBS!: z x > 0 erfordras! f Z z = λ 2 e λ z z täthetsfunktion för summan av två oberoende, likafördelade, exponentiellt fördelade s.v. (z > 0). Generalisering till fler än två summander (z > 0) : f Z z = λn n 1! zn 1 e λ z täthetsfunktion för summan av n oberoende, likafördelade, exponentiellt fördelade s.v. (gammafördelning med c = n) 14