Kapitel 5 Multivariata sannolikhetsfördelningar

Relevanta dokument
Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Statistiska metoder för säkerhetsanalys

Föreläsning 7: Punktskattningar

Statistik 1 för biologer, logopeder och psykologer

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

SF1901: Sannolikhetslära och statistik

4.1 Grundläggande sannolikhetslära

SF1901: Sannolikhetslära och statistik

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

SF1901 Sannolikhetsteori och statistik I

Kap 3: Diskreta fördelningar

Repetition och förberedelse. Sannolikhet och sta.s.k (1MS005)

4 Diskret stokastisk variabel

Grundläggande matematisk statistik

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Formel- och tabellsamling i matematisk statistik

Föreläsning 3. Sannolikhetsfördelningar

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Matematisk statistik för D, I, Π och Fysiker

Kap 2. Sannolikhetsteorins grunder

Kurssammanfattning MVE055

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Några extra övningsuppgifter i Statistisk teori

Stokastiska signaler. Mediesignaler

Jörgen Säve-Söderbergh

6. Flerdimensionella stokastiska variabler

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

4.2.1 Binomialfördelning

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Summor av slumpvariabler

Problemsamling i Sannolikhetsteori

SF1901: Sannolikhetslära och statistik

Kapitel 9 Egenskaper hos punktskattare

Matematisk statistik TMS063 Tentamen

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Övning 1 Sannolikhetsteorins grunder

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

Grundläggande matematisk statistik

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

SF1901: Sannolikhetslära och statistik

FÖRELÄSNING 7:

Stokastiska vektorer och multivariat normalfördelning

SF1901: SANNOLIKHETSTEORI OCH FLERDIMENSIONELLA STOKASTISKA STATISTIK VARIABLER. Tatjana Pavlenko. 8 september 2017

Grundläggande matematisk statistik

Föreläsning 7: Stokastiska vektorer

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Grundläggande matematisk statistik

SF1901 Sannolikhetsteori och statistik I

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

FÖRELÄSNING 8:

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

Föreläsning 5, FMSF45 Summor och väntevärden

C1 Sannolikhetslära och inferens II: Läsanvisningar (6e upplagan)

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Föreläsning 12: Repetition

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del I

F10 Kap 8. Statistikens grunder, 15p dagtid. Binomialfördelningen 4. En räkneregel till. Lite repetition HT Sedan

Föreläsning 6, Repetition Sannolikhetslära

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Föreläsning 6, Matematisk statistik Π + E

Föreläsning 5, Matematisk statistik Π + E

SOS HT Slumpvariabler Diskreta slumpvariabler Binomialfördelning. Sannolikhetsfunktion. Slumpförsök.

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

Våra vanligaste fördelningar

Tentamen i Matematisk statistik Kurskod S0001M

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

Tentamen MVE302 Sannolikhet och statistik

Introduktion till statistik för statsvetare

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del I

FÖRELÄSNING 3:

TENTAMEN MÅNDAGEN DEN 22 OKTOBER 2012 KL a) Bestäm P(ingen av händelserna inträffar). b) Bestäm P(exakt två av händelserna inträffar).

Föreläsning 6, FMSF45 Linjärkombinationer

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

TMS136. Föreläsning 5

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Tentamen i Matematisk Statistik, 7.5 hp

Tentamen i Tillämpad Matematik och statistik för IT-forensik. Del 2: Statistik 7.5 hp

TENTAMEN I STATISTIKENS GRUNDER 1

modell Finansiell statistik, vt-05 Modeller F5 Diskreta variabler beskriva/analysera data Kursens mål verktyg strukturera omvärlden formellt

Föreläsning G70 Statistik A

SF1901 Sannolikhetsteori och statistik I

Lektionsanteckningar 11-12: Normalfördelningen

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

SF1911: Statistik för bioteknik

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

4. Stokastiska variabler

Transkript:

Sannolikhetslära och inferens II Kapitel 5 Multivariata sannolikhetsfördelningar 1

Multivariata sannolikhetsfördelningar En slumpvariabel som, när slumpförsöket utförs, antar exakt ett värde sägs vara en univariat slumpvariabel. En slumpvariabel som, när slumpförsöket utförs, antar exakt två värden sägs vara en bivariat slumpvariabel. Vi betecknar (X 1,X 2 ) och när försöket utförs fås (X 1 =x 1, X 2 =x 2 ). Mer generellt fås en sk k-variat slumpvariabel som betecknas (X 1,X 2,,X k ) och när försöket utförs fås (X 1 =x 1, X 2 =x 2,,X k =x k ) Vi pratar mer allmänt om multivariata slumpvariabler och multivariata sannolikhetsfördelningar. 2

Simultan sannolikhetsfunktion Den simultana sannolikhetsfunktionen för två (univariata) diskreta slumpvariabler X 1 och X 2 ges av för alla (x 1,x 2 ) som kan förekomma. För en simultan sannolikhetsfunktion gäller att 3

Uppgift 5.3 Av nio anställda i ett företag är fyra gifta, tre aldrig gifta och två skilda. Tre av de anställda ska befordras. Låt Den simultana sannolikhetsfunktionen för Y 1 och Y 2 ges av 4

Simultan fördelningsfunktion Den simultana fördelningsfunktionen för två (univariata) diskreta slumpvariabler X 1 och X 2 ges av Om det för två (univariata) kontinuerliga slumpvariabler X 1 och X 2 existerar en funktion f(x 1,x 2 ) sådan att den simultana fördelningsfunktionen kan skrivas som sägs f(x 1,x 2 ) vara den simultana täthetsfunktionen för X 1 och X 2. 5

Egenskaper hos bivariata kontinuerliga slumpvariabler För den simultana fördelningsfunktionen F(x 1,x 2 ) för två (univariata) kontinuerliga slumpvariabler X 1 och X 2 gäller att För den simultana täthetsfunktionen f(x 1,x 2 ) för två (univariata) kontinuerliga slumpvariabler X 1 och X 2 gäller att 6

Uppgift 5.15b Vi studerar nu kö- och kassatid i en snabbmatsrestaurang. Låt Y₁ = Total servicetid Y₂ = Kötid Den simultana tätheten ges av Vi börjar med att åskådliggöra definitionsområdet grafiskt. y 1 =y 2 Definitionsområde 7

Uppgift 5.15b Vi söker nu Pr(Y 1 2Y 2 ) och för att finna integrationsgränserna börjar vi med att åskådliggöra integrationsområdet grafiskt. y 1 =y 2 y 1 =2y 2 dvs y 2 = y 1 /2 Integrationsområde Detta innebär att den sökta sannolikheten kan beräknas via Den avslutande integralen blir 1 eftersom det är väntevärdet för en Exp(1). 8

Marginalfördelningar Låt de diskreta slumpvariablerna X 1 och X 2 ha simultan sannolikhetsfunktion p(x 1,x 2 ).Vi kan då alltid finna (den univariata) sannolikhetsfunktionen för X 1 respektive X 2 via Låt de kontinuerliga slumpvariablerna X 1 och X 2 ha simultan täthetsfunktion f(x 1,x 2 ).Vi kan då alltid finna (den univariata) täthetsfunktionen för X 1 respektive X 2 via 9

Uppgift 5.21a Utifrån Uppgift 5.3 följer att marginalfördelningen för Y 1 ges av Sannolikhetsfunktion För Hyp(3-y 1,3,5). Således följer (som väntat) att Y 1 är Hyp(3,4,9). 10

Uppgift 5.33a Bestäm marginaltätheterna för Y 1 och Y 2 i Uppgift 5.15. För fixt värde y 1 följer att 0 y 2 y 1 varför det följer att vilket innebär att Y 1 är Ga(2,1). På motsvarande sätt följer att vilket innebär att Y 2 är Ga(1,1), eller Exp(1). 11

Betingade fördelningar Låt de diskreta slumpvariablerna X 1 och X 2 ha simultan sannolikhetsfunktion p(x 1,x 2 ) samt marginalfördelningarna p 1 (x 1 ) och p 2 (x 2 ). Den betingade sannolikhetsfunktionen för X 1 givet X 2 =x 2 ges då via Låt de kontinuerliga slumpvariablerna X 1 och X 2 ha simultan täthetsfunktion f(x 1,x 2 ) samt marginalfördelningarna f 1 (x 1 ) och f 2 (x 2 ). Den betingade täthetsfunktionen för X 1 givet X 2 =x 2 ges då via 12

Uppgift 5.33bc Bestäm den betingade fördelningen för Y 1 givet att Y 2 = y 2. För fixt värde y 2 följer att 0 y 2 y 1 varför det följer att På motsvarande sätt följer att den betingade fördelningen för Y 2 givet att Y 1 = y 1 ges av Uppenbarligen gäller att Y 2 Y 1 = y 1 är U(0,y 1 ). 13

Oberoende slumpvariabler Låt de diskreta slumpvariablerna X 1 och X 2 ha simultan sannolikhetsfunktion p(x 1,x 2 ) samt (marginal)sannolikhetsfunktionerna p 1 (x 1 ) och p 2 (x 2 ). X 1 och X 2 är oberoende om och endast om Låt de kontinuerliga slumpvariablerna X 1 och X 2 ha simultan täthetsfunktion f(x 1,x 2 ) samt marginaltätheterna f 1 (x 1 ) och f 2 (x 2 ). X 1 och X 2 är oberoende om och endast om 14

Oberoende slumpvariabler Det är ofta besvärligt att via definitionen undersöka huruvida två slumpvariabler X 1 och X 2 är oberoende. Då har man glädje av följande resultat X 1 och X 2 är oberoende om och endast om 1. definitionsområdet är rektangulärt, dvs det finns konstanter a, b, c och d sådana att a x 1 b, c x 2 d, och 2. den simultana funktionen kan skrivas som en produkt av två funktioner g(x 1 ) och h(x 2 ) där g är en funktion som enbart beror på x 1 och h är en funktion som enbart beror på x 2. 15

Uppgift 5.62 Person A singlar en slant tills han för första gången får krona. Sedan singlar en annan person, B, samma slant tills hon för första gången får krona. Antag att sannolikheten att få krona (i en viss singling) är p. Bestäm sannolikheten att A och B singlar slanten lika många gånger. Låt Y 1 och Y 2 representera det antal singlingar A respektive B behöver. Det följer att båda slumpvariablerna är Ge(p). Vidare är det rimligt att förutsätta att Y 1 och Y 2 är oberoende. 16

Uppgift 5.62 Sannolikheten att de båda behöver singla slanten ett visst givet, k, antal gånger ges av Vi kräver dock inte ett visst givet antal kast utan enbart att det är lika många för A och B. Den sökta sannolikheten blir därför 17

Uppgift 5.68 En buss går en gång och vi som passagerare känner till den aktuella timmen, dvs vi vet när timmen börjar och slutar. Låt Y 1 = Bussens ankomsttid Y 2 = Passagerarens ankomsttid Utifrån förutsättningarna följer att Y 1 och Y 2 är oberoende och U(0,1)-fördelade slumpvariabler vilket innebär att den simultana täthetsfunktionen ges av 18

Uppgift 5.68 Om vi betecknar den sökta sannolikheten P följer att Vi börjar med att beskriva definitions- och integrationsområdet grafiskt. Vi ser att integrationsområdet måste delas upp i två delar vilket ger oss uttrycket 19

Väntevärden för funktioner av slumpvariabler Vi är ofta intresserade av att studera funktioner av slumpvariabler. Låt X 1 och X 2 ha simultan sannolikhetsfunktion p(x 1,x 2 ) (eller simultan täthetsfunktion f(x 1,x 2 )) och betrakta funktionen g(x 1,X 2 ). Väntevärdet för denna funktion är 20

Väntevärden för funktioner av slumpvariabler 1. Om en funktion är komplicerad kan den eventuellt brytas ner i mer lätthanterliga delar. Antag att Då följer att 2. Antag att X 1 och X 2 är oberoende och att g(x 1 ) och h(x 2 ) är funktioner som enbart beror på X 1 respektive X 2. Då gäller att 21

Uppgift 5.81 Låt Y 1 och Y 2 representera livslängden (i 100-tals timmar) för komponenter av typ I respektive II. Den simultana tätheten är Vi är nu intresserade av att mäta den relativa effektiviteten, vilket är kvoten Y 2 /Y 1, och beräkna väntevärdet för denna. Eftersom integrationsområdet är rektangulärt samtidigt som följer att Y 1 och Y 2 är oberoende. 22

Uppgift 5.81 Det sökta väntevärdet blir därmed Täthetsfunktion för Exp(2). Väntevärde för Exp(2). 23

Kovarians och korrelation För att mäta graden av (linjärt) samband mellan två slumpvariabler X 1 och X 2 används kovarians och korrelation. Vid manuella beräkningar av kovariansen används med fördel att Då X 1 och X 2 är oberoende finns inget samband varför Cov(X 1,X 2 )=0. Kovariansen är skalberoende. För att få ett linjärt sambandsmått som inte är skalberoende beräknas korrelationskoefficienten. 24

Kovarians: Bevis för beräkningsformel Räkneregler för väntevärden ger att 25

Väntevärden för linjärkombinationer av slumpvariabler Låt a 1, a 2,, a n vara konstanter, Y 1, Y 2,,Y n vara slumpvariabler med väntevärden μ 1, μ 2,, μ n. Då sägs vara en linjärkombination av Y 1, Y 2,,Y n. För U gäller att 26

Trinomialfördelningen Betrakta en urna med vita och svarta bollar där andelen vita bollar är p. Då vi med återläggning drar n bollar ur urnan och låter X räkna hur många av bollarna som blev vita gäller att X är Bi(n,p). Låt nu urnan innehålla vita, röda och svarta bollar där andelen vita och röda bollar är p 1 respektive p 2. Då vi med återläggning drar n bollar ur urnan och låter X 1 räkna vita bollar och X 2 räkna röda bollar fås den simultana sannolikhetsfunktionen för X 1 och X 2 till Då vi på detta sätt simultant studerar två binomialfördelade slumpvariabler uppstår den sk trinomialfördelningen. 27

Multinomialfördelningen Genom att även räkna de svarta bollarna skapar vi indirekt i binomial- och trinomialfördelningen ännu en slumpvariabel. Binomialfallet: Trinomialfallet: Drag med återläggning n bollar ur en urna som innehåller bollar i k olika färger och låt X₁,X₂,,X k räkna hur många bollar i respektive färg som kommer med i urvalet. Låter vi som innan p₁,p₂,,p k representera andelen bollar i urnan av respektive färg följer den simultana sannolikhetsfunktionen 28

Bivariat normalfördelning Låt Y₁ och Y₂ ha den simultana täthetsfunktionen där Vidare gäller att - y₁, - y₂. Detta sägs vara en bivariat normalfördelning med parametrar μ 1,σ 1, μ 2,σ 2 och ρ Det går att visa att Y 1 är N(μ 1,σ 1 ) och Y 2 är N(μ 2,σ 2 ). Vidare gäller att ρ är korrelationskoefficienten mellan Y 1 och Y 2. 29

Hierarkiska modeller Låt X vara en slumpvariabel vars sannolikhetsfördelning beror på en parameter θ, dvs vi känner den betingade fördelningen f(x θ) Antag vidare att även θ är en slumpvariabel med fördelning f 2 (θ). I dessa sammanhang pratar vi om en hierarkisk modell. Vi är nu intresserade av att finna (den obetingade) marginalfördelningen för X. För att göra detta går vi tillväga i två steg. 1. Först bestämmer vi den simultana fördelningen via f(x,θ)= f(x θ)f 2 (θ). 2. Sedan finner vi marginalfördelningen, f 1 (x), för X genom att integrera (eller summera) bort θ. 30

Uppgift 5.42 (avsnitt 5.3) Antal defekter på en yard av ett visst tyg, Y, kan ses som en poissonfördelad slumpvariabel med intensitet λ. Dock gäller att denna intensitet λ inte är känd utan själv en slumpvariabel. Vår modell anger att λ är Exp(1). Alltså gäller att Vi söker nu marginalfördelningen, p(y), för Y. Utifrån denna kan vi sedan beräkna väntevärde och varians för Y. 31

Uppgift 5.42 (avsnitt 5.3) En antydan till täthet för Ga(y+1, 1/2). Täthetsfunktion för Ga(y+1, 1/2). Alltså gäller att Y+1 är Ge(1/2) vilket betyder att E(Y)=1 och V(Y)=2. 32

Betingade väntevärden Vi är intresserade av om E(X 1 ) och V(X 1 ) kan beräknas utifrån det vi känner till, dvs f(x 1 x 2 ) och f 2 (x 2 ), så att vi inte behöver bestämma marginalfördelningen f 1 (x 1 ). En betingad sannolikhetsfördelning uppfyller alla krav på en sannolikhetsfördelning och således kan vi beräkna väntevärden. Vi får 33

Betingade väntevärden Låt oss studera det betingade väntevärdet E(X 1 X 2 =x 2 ). Detta betingade väntevärde kan ses som en funktion av x 2, dvs Om vi låter x 2 variera över alla sina värden kan vi således se det som en funktion av slumpvariabeln X 2. En funktion av slumpvariabeln X 2 är i sig en slumpvariabel och intressanta saker händer när vi beräknar väntevärde och varians för h(x 2 ). 34

Betingade väntevärden Vad gäller då för E[h(X 2 )]? I det diskreta fallet får vi att 35

Betingade väntevärden Låt X 1 och X 2 vara två slumpvariabler. Då gäller alltså att I högerledet gäller det inre väntevärdet den betingade fördelningen f(x 1 x 2 ). Medan det yttre väntevärdet gäller f 2 (x 2 ). Vidare gäller att 36

Uppgift 5.136 a Betrakta Y = Antal defekta enheter per yard λ = Den intensitet med vilken defekta enheter uppkommer Enligt förutsättningarna gäller att Y λ är Po(λ) och λ är Exp(1). Egenskaper hos Po(λ) ger att vilket innebär att 37

Uppgift 5.136 b Eftersom egenskaper hos Po(λ) vidare ger V(Y λ)= λ följer att I a-uppgiften fann vi att E(Y λ)= λ varför vi därmed får att Slutligen följer därmed att 38