Grundläggande matematisk statistik

Relevanta dokument
Grundläggande matematisk statistik

Grundläggande matematisk statistik

Grundläggande matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH FLERDIMENSIONELLA STOKASTISKA STATISTIK VARIABLER. Tatjana Pavlenko. 8 september 2017

Exempel för diskreta och kontinuerliga stokastiska variabler

SF1901: Sannolikhetslära och statistik

SF1901 Sannolikhetsteori och statistik I

TAMS79: Föreläsning 4 Flerdimensionella stokastiska variabler

SOS HT Slumpvariabler Diskreta slumpvariabler Binomialfördelning. Sannolikhetsfunktion. Slumpförsök.

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Grundläggande matematisk statistik

Föreläsning 2, FMSF45 Slumpvariabel

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Föreläsning 2, Matematisk statistik för M

Kapitel 5 Multivariata sannolikhetsfördelningar

SF1901: Sannolikhetslära och statistik

6. Flerdimensionella stokastiska variabler

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

4.1 Grundläggande sannolikhetslära

Föreläsning 3. Sannolikhetsfördelningar

Kap 3: Diskreta fördelningar

Slumpvariabler och sannolikhetsfördelningar

Grundläggande matematisk statistik

Föreläsning 5, FMSF45 Summor och väntevärden

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del I

Grundläggande matematisk statistik

Matematisk statistik 9 hp Föreläsning 4: Flerdim

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

SF1901: Sannolikhetslära och statistik

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 5, Matematisk statistik Π + E

Övning 1 Sannolikhetsteorins grunder

Föreläsning 4, Matematisk statistik för M

4 Diskret stokastisk variabel

SF1901 Sannolikhetsteori och statistik I

TMS136. Föreläsning 5

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Kolmogorovs Axiomsystem Kolmogorovs Axiomsystem Varje händelse A tilldelas ett tal : slh att A inträar Sannolikheten måste uppfylla vissa krav: Kolmog

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Några extra övningsuppgifter i Statistisk teori

Formel- och tabellsamling i matematisk statistik

Matematisk statistik 9 hp Föreläsning 3: Transformation och simulering

TMS136. Föreläsning 5

Kap 2. Sannolikhetsteorins grunder

1.1 Diskret (Sannolikhets-)fördelning

Utfall, Utfallsrummet, Händelse. Sannolikhet och statistik. Utfall, Utfallsrummet, Händelse. Utfall, Utfallsrummet, Händelse

SF1901 Sannolikhetsteori och statistik I

FÖRELÄSNING 3:

Föreläsning 7: Punktskattningar

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Föreläsning 3, Matematisk statistik Π + E

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

SF1901: Sannolikhetslära och statistik

Våra vanligaste fördelningar

Problemsamling i Sannolikhetsteori

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Föresläsningsanteckningar Sanno II

TMS136. Föreläsning 4

Repetitionsföreläsning

Föreläsning 7: Punktskattningar

Introduktion till statistik för statsvetare

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Statistik 1 för biologer, logopeder och psykologer

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Statistiska metoder för säkerhetsanalys

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Demonstration av laboration 2, SF1901

Statistiska metoder för säkerhetsanalys

SF1901: Sannolikhetslära och statistik

17.1 Kontinuerliga fördelningar

Stokastiska signaler. Mediesignaler

Föreläsning 7: Punktskattningar

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Kurssammanfattning MVE055

Lektionsanteckningar 11-12: Normalfördelningen

SF1911: Statistik för bioteknik

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen L9MA30, LGMA30

Betingad sannolikhet och oberoende händelser

SF1901 Sannolikhetsteori och statistik I

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

Oberoende stokastiska variabler

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

4. Stokastiska variabler

Kompendium om flerdimensionella fördelningar för kursen S0008M Sannolikhetslära och statistik

FINGERÖVNINGAR I SANNOLIKHETSTEORI MATEMATISK STATISTIK AK FÖR I. Oktober Matematikcentrum Matematisk statistik

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

Transkript:

Grundläggande matematisk statistik Flerdimensionella Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Flerdimensionella Ett slumpförsök kan ge upphov till flera (s.v.): kast med två tärningar: s.v. X = ögontalet tärning 1 tvådimensionell s.v. s.v. Y = ögontalet tärning 2 kast med pil på en måltavla: s.v. X = höjden mätt från nedre kanten s.v. Y = horisontellt avstånd till vänster sidan av måtavlan slumpmässigt vald person s.v. X = längd i cm s.v. Y = vikt i kg tredimensionell s.v. s.v. Z = blodtryck i mmhg slumpmässigt vald barnfamilj: s.v. X = antal flickor s.v. Y = antal pojkar 1

tvådimensionell slumpvariabel: funktion Ω R 2 X, Y (stora bokstäver): i = 0, 1, 2, j = 0, 1, 2, i, j (små bokstäver): reella värden (ofta heltal för diskreta ) Slumpvariabeln (X, Y) kallas diskret om X och Y bara antar ett ändligt eller uppräkneligt oändligt antal olika värden. Sannolikhetsfunktion: P X = i, Y = j = p X,Y i, j joint probability distribution Sannolikhetsfunktionen anger sannolikheten för varje kombination av i och j (för hela utfallsrummet). Normering: (axiom 2: P Ω = 1) Sannolikhetsfunktionen kan åskadliggöras genom ett stolpdiagram (exempel barnkullar): P(X = 0, Y = 0) P(X = 0, Y = 1) Bild: Blom et al, s. 85 ( barnkullar ) 2

Sannolikhetsfunktionen kan åskadliggöras genom en tabell (exempel barnkullar): P(X = 0, Y = 0) P(X = 3, Y = 0) Y/X X=0 X=1 X=2 X=3 X=4 Y=0 0.38 0.16 0.04 0.01 0.01 Y=1 0.17 0.08 0.02 - - Y=2 0.05 0.02 0.01 - - Y=3 0.02 0.01 - - - Y=4 0.02 - - - - P(X = 1, Y = 3) Fördelningsfunktion: analogt till endimensionell fördelningsfunktion x och y är reella tal, fördelningsfunktionen är alltså en kontinuerlig tvådimensionell trappfunktion igen: tecknen viktiga för diskreta p X,Y i, j dessa slh. måste summeras för att erhålla F X,Y 1, 1 3

Marginalfördelningen ( margin = rand) Exempel: barnkullar (Blom et al.) Vi vill bara veta sannolikheten för antalet flickor i en slumpmässigt vald familj, oavsett hur många pojkar som finns i den familjen, dvs. vi behöver bara fördelningen för slumpvariablen X (flickor). Uppgiften är alltså att härleda den endimensionella fördelningen p X i från den tvådimensionella fördelningen p X,Y i, j : p X i = p X,Y i, j j=0 summeras över alla värden för s.v. Y, dvs. över j p Y j = p X,Y i, j i=0 summeras över alla värden för s.v. X, dvs. över i Marginalfördelningen ( margin = rand) Y/X X=0 X=1 X=2 X=3 X=4 Σ Y=0 0.38 0.16 0.04 0.01 0.01 0.60 Y=1 0.17 0.08 0.02 0.27 Y=2 0.05 0.02 0.01 0.08 Y=3 0.02 0.01 0.03 Y=4 0.02 0.02 Σ 0.64 0.27 0.07 0.01 0.01 1 P(Y = 0) P(Y = 2) P(Y = 4) P(X = 0) P(X = 2) P(X = 4) 4

Multinomialfördelningen: Exempel: Urna med kulor av r olika färg, drar n kulor med återläggning. Hur stor är sannolikheten att dra k 1 kulor av färg 1, (slumpvariabel X 1 : antalet dragna kulor med färg 1) k 2 kulor av färg 2, (slumpvariabel X 2 : antalet dragna kulor med färg 2) k r kulor av färg r? (slumpvariabel X r : antalet dragna kulor med färg r) Sannolikhetsfunktion för multinomialfördelningen: p X1, X 2,, X r k 1, k 2,, k r = n! k 1! k 2!.. k r! p 1 k 1 p 2 k 2 p r k r r p i = 1 i=1 r k i = n i=1 i varje dragning måste vi få en av de föreliggande färgarna vi drar totalt n gånger antalen måste summeras till n Multinomialfördelningen, speciellt r = 2: Om r (antalet färgar) är bara 2 (t.ex svart och vit): r = 2 p X1, X 2 k 1, k 2 = n! k 1! k 2! p 1 k 1 p 2 k 2 sannolikhetsfunktion k 2 = n k 1 p 2 = 1 p 1 antalet vita och svarta måste vara antalet dragna slh. att dra en vit eller svart måste adderas till 1 p X1, X 2 k 1, k 2 = n! k 1! (n k 1 )! p 1 k 1 1 p 1 n k 1 = n k 1 p 1 k 1 1 p 1 n k 1 Binomialfördelning Binomialfördelningen är ett speciellt fall av multinomialfördelningen för r = 2 5

Kontinuerliga tvådimensionella Tvådimensionell slumpvariabel: funktion Ω R 2 X, Y (stora bokstäver): x, y (små bokstäver): reella värden Slumpvariabeln (X, Y) kallas kontinuerlig om X och Y inte är diskreta. (Simultan) täthetsfunktion f X,Y x, y Normering: (axiom 2) Täthetsfunktion f X,Y x, y Kontinuerliga tvådimensionella Beräkna slh. att X, Y ett område A: ligger inom täthetsfunktionen integreras över detta område (A)! 6

Kontinuerliga tvådimensionella Beräkna slh. att X, Y ligger inom ett område A: Exempel: Låt f X,Y x, y vara given. Beräkna slh. att X ligger mellan 0 och 2, och att Y ligger mellan 1 och 3: Integrationsområdet: 2 X 0 1 Y 3 2 0 1 3 Kontinuerliga tvådimensionella Fördelningsfunktion: tvärtom gäller: f X,Y x, y = 2 x y F X,Y x, y 7

Kontinuerliga tvådimensionella Marginalfördelningar: f X x + = න f X,Y x, y dy Beräkning av marginalfördelningen för X från den simultana fördelninegn + f Y y = න f X,Y x, y dx Beräkning av marginalfördelningen för Y från den simultana fördelninegn integrera över en dimension Kontinuerliga tvådimensionella Marginalfördelning för fördelningsfunktionen: F X x = lim y F X,Y x, y F Y y = lim x F X,Y x, y f X u 8

Likformigt kontinuerlig tvådimensionell fördelning Simultan täthetsfunktion: f X,Y x, y = const för alla x, y Likformig kontinuerlig 2-dim. fördeln.: Om X, Y är definerade på ett område med arean B, och om man söker slh. att X, Y ligger i ett delområde A, så gäller: f X,Y x, y P X, Y A = arean av A arean av B X Y Likformigt kontinuerlig tvådimensionell fördelning Exempel: Blom et al, s. 88 P X, Y A = arean av A arean av B En punkt väljs slumpmässigt i kvadraten X, Y = ±1, ±1. Söker slh. P X 2 + Y 2 1? +1 (0,0) R=1-1 -1 +1 X 2 + Y 2 1 Kom ihåg: X 2 + Y 2 = R 2 är ekvationen för en cirkel med radius R och mittpunkt (0,0) P X 2 + Y 2 1 = arean av cirkeln π R2 = arean av rektangeln 2 2 = π 4 9

Oberoende flerdimensionella diskreta tvådimensionella s.v.: p X,Y i, j = p X i p Y j för alla i, j kontinuerliga tvådimensionella s.v.: f X,Y x, f = f X x f Y y för alla x, y Kom ihåg: P A B = P(A) P(B) om A och B oberoende diskreta och kontinuerliga tvådimensionella s.v.: F X,Y x, f = F X x F Y y för alla x, y Oberoende flerdimensionella diskreta tvådimensionella s.v.: p X,Y i, j = p X i p Y j för alla i, j p x,y (1, 1) p Y (1) Y/X X=1 X=2 X=3 marg. Y=1 0.04 0.06 0.1 0.2 Y=2 0.02 0.03 0.05 0.1 Y=3 0.14 0.21 0.35 0.7 marg. 0.2 0.3 0.5 1 p X (1) p X,Y i, j = p X i p Y j för alla i, j 0.04 = 0.2 0.2 0.06 = 0.3 0.2 0.35 = 0.5 0.7 måste gäller för alla celler om oberoendet föreligger 10

Oberoende flerdimensionella Exempel: livstid hos två glödlampor, Blom s. 91 s.v. X: livstid glödlampa 1 antas vara oberoende, båda exponentiellt fördelade s.v. Y: livstid glödlampa 2 f X x = a e a x x > 0 0 x 0 f Y y = b e b y y > 0 0 y 0 Söker slh. att båda glödlampor har en livstid mindre än t : P X t, Y t? använd oberoendet använd integrationsregler fördelningsfunktion för X~Exp(μ) Fördelning av maximumet av flera X 1, X 2,, X n oberoende (med känd fördelning) Söker: fördelning för Z = max X 1, X 2,, X n? Om den största (maximumet) ska vara mindre än z, så måste alla vara det!: P största z = P X 1 z X 2 z X n z F Z z = P Z z = P X 1 z P X 2 z P X n z om alla X i är parvist oberoende = F X1 z F X2 z F Xn z definition för F X F Z z n = i=1 F Xi z fördelning för maximumet av flera oberoende F Z z = F X z n om alla X i (är oberoende och) har samma fördelning 11

Fördelning av maximumet av flera Exempel: livslängd hos elektroniskt instrument med två komponenter: Ett elektroniskt instrument innehåller två komponenter vilkas livslängder X resp. Y är oberoende och exponentiellt fördelade: F X x = 1 e a x x > 0 0 x 0 F Y y = 1 e b y y > 0 0 y 0 Instrumentet fungerar så länge minst en av båda komponenter fungerar. Livslängden hos instrumentet är alltså maximumet av livslängden X och Y. Söker: täthetsfunktion för Z = max X, Y? F Z z = F X z F Y z = 1 e a z 1 e b z f Z z = d dz F Z z = a e a z 1 e b z + b e b z 1 e a z för z > 0; 0 annars Fördelning av minimumet av flera X 1, X 2,, X n oberoende (med känd fördelning) Söker: fördelning för Z = min X 1, X 2,, X n? Om den minsta (minimumet) ska vara större än z, så måste alla vara det!: P minsta > z = P X 1 > z X 2 > z X n > z P Z > z = P X 1 > z P X 2 > z P X n > z om alla X i är parvis oberoende 1 F Z z = 1 F X1 z 1 F X2 z 1 F Xn z kom ihåg: P X i > z = 1 F Xi z F Z z n = 1 1 F Xi z i=1 fördelning för minimumet av flera oberoende F Z z = 1 1 F X z n om alla X i (är oberoende och) har samma fördelning 12

Fördelning av minimumet av flera Exempel: livstid hos elektroniskt instrument, Blom et al. s. 93 Ett elektroniskt instrument innehåller två komponenter (X, Y) som är seriekopplade. Livstiderna för båda komponenter är exponentiellt fördelade. Söker: fördelningen för instrumentets livstid (Z)! F X x = 1 e a x x > 0 0 x 0 F Y y = 1 e b y y > 0 0 y 0 komponent 1 komponent 2 Seriekopplung: intrumentets livstid = minimum av komponenternas livstid! Z = min X, Y F Z z = 1 1 F X z 1 F Y z = 1 1 1 e a z 1 1 e b z = 1 e a z e b z = 1 e a+b z z > 0 f Z z = a + b e a+b z z > 0 täthetsfunktion, efter derivering Z ~ Exp a + b seriekoppling Fördelning av en summa av två X, Y: diskreta s.v., p X,Y i, j antas vara känd (simultan sannolikhetsfunktion) Z = X + Y summa, slumpvariabel p Z k = P Z = k = P X + Y = k = i + j = k j = k i p Z k = i+j=k p X,Y i, j k i+j=k = p X,Y i, k i i=0 p X,Y i, j summeras över alla i och j vilkas summa är k p Z k k = p X i p Y k i om X och Y är oberoende i=0 13

Fördelning av en summa av två X, Y: kontinuerliga s.v., f X,Y x, y antas vara känd (simultan täthetsfunktion) Z = X + Y summa, slumpvariabel F Z z = P Z z = P X + Y Z = ඵ x+y z f X,Y x, y dx dy Täthetsfunktionen erhålls genom derivering. integrationsområdet måste väljas noggrant Om X och Y är oberoende erhåller man (härledning utelämnad, se Blom et al. s. 96): f Z z + = න f X x f Y z x dx faltningsformel Anmärkning: differenser mellan 2, Z = X Y, kan behandlas genom att addera Y. Fördelning av en summa av Exempel: Låt bade X och Y vara oberoende och exponentiellt fördelade med samma parameter λ. Beräkna täthetsfunktionen för summan av X och Y! f X x = λ e λ x x > 0 0 x 0 f Y y = λ e λ y y > 0 0 y 0 X, Y ~ Exp λ f Z z + = න + f X x f Y z x dx = න λ e λ x λ e λ z x dx = න λ 2 e λ z dx = λ 2 e λ z න 1 dx = λ 2 e λ z z 0 z 0 z OBS!: z x > 0 erfordras! f Z z = λ 2 e λ z z täthetsfunktion för summan av två oberoende, likafördelade, exponentiellt fördelade s.v. (z > 0). Generalisering till fler än två summander (z > 0) : f Z z = λn n 1! zn 1 e λ z täthetsfunktion för summan av n oberoende, likafördelade, exponentiellt fördelade s.v. (gammafördelning med c = n) 14