Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Relevanta dokument
Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

SF1901: Sannolikhetslära och statistik

Föreläsning 7: Punktskattningar

SF1901: Sannolikhetslära och statistik

Föreläsning 7: Punktskattningar

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Statistiska metoder för säkerhetsanalys

Föreläsning 7: Punktskattningar

Stokastiska signaler. Mediesignaler

Sannolikhet och statistik XI

SF1901 Sannolikhetsteori och statistik I

TENTAMEN I STATISTIKENS GRUNDER 1

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning 5, FMSF45 Summor och väntevärden

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

F3 SANNOLIKHETSLÄRA (NCT ) För komplementhändelsen A till händelsen A gäller att

Kap 2. Sannolikhetsteorins grunder

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Kapitel 5 Multivariata sannolikhetsfördelningar

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

Matematisk statistik för D, I, Π och Fysiker

Grundläggande matematisk statistik

Föreläsning 6, Matematisk statistik Π + E

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

Stokastiska vektorer

Kovarians och kriging

Kurssammanfattning MVE055

Lektionsanteckningar 11-12: Normalfördelningen

Matematisk statistik för D, I, Π och Fysiker

SF1901: Sannolikhetslära och statistik

LINKÖPINGS UNIVERSITET EXAM TAMS 79 / TEN 1

2 x dx = [ x ] 1 = 1 ( 1 (1 0.9) ) 100 = /

Föreläsning 5, Matematisk statistik Π + E

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

Föreläsning 6, FMSF45 Linjärkombinationer

Matematisk statistik 9 hp Föreläsning 4: Flerdim

Stokastiska vektorer och multivariat normalfördelning

Några extra övningsuppgifter i Statistisk teori

Väntevärde och varians

2.1 Mikromodul: stokastiska processer

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

TMS136. Föreläsning 5

Statistik 1 för biologer, logopeder och psykologer

TMS136. Föreläsning 5

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Oberoende stokastiska variabler

Matematisk statistik TMS063 Tentamen

Tentamen MVE302 Sannolikhet och statistik

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Formler och tabeller till kursen MSG830

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Föreläsning 7: Stokastiska vektorer

Övning 1. Vad du ska kunna efter denna övning. Problem, nivå A

TENTAMEN MÅNDAGEN DEN 22 OKTOBER 2012 KL a) Bestäm P(ingen av händelserna inträffar). b) Bestäm P(exakt två av händelserna inträffar).

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

19.1 Funktioner av stokastiska variabler

FACIT: Tentamen L9MA30, LGMA30

4 Diskret stokastisk variabel

FINGERÖVNINGAR I SANNOLIKHETSTEORI MATEMATISK STATISTIK AK FÖR I. Oktober Matematikcentrum Matematisk statistik

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

SF1901: Sannolikhetslära och statistik

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

4.1 Grundläggande sannolikhetslära

Tentamen MVE301 Sannolikhet, statistik och risk

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Simulering av elmarknader. EG2205 Föreläsning 11, vårterminen 2016 Mikael Amelin

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Grundläggande matematisk statistik

Föreläsning 6, Repetition Sannolikhetslära

F10 Kap 8. Statistikens grunder, 15p dagtid. Binomialfördelningen 4. En räkneregel till. Lite repetition HT Sedan

1 Föreläsning I, Mängdlära och elementär sannolikhetsteori,

F2 SANNOLIKHETSLÄRA (NCT )

2. Test av hypotes rörande medianen i en population.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

import totalt, mkr index 85,23 100,00 107,36 103,76

FACIT: Tentamen L9MA30, LGMA30

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

Kap 3: Diskreta fördelningar

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Föreläsning G70 Statistik A

Lärmål Sannolikhet, statistik och risk 2015

Sannolikheter och kombinatorik

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

TMS136. Föreläsning 2

TMS136. Föreläsning 2

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Transkript:

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT Jointly distributed Joint probability function Marginal probability function Conditional probability function Independence Scatter plot Covariance Correlation Simultant fördelad Simultan sannolikhetsfunktion Marginell sannolikhetsfunktion Betingad sannolikhetsfunktion Oberoende Spridningsdiagram Kovarians Korrelation 1

Simultant fördelade stokastiska variabler Ibland vill vi samtidigt studera flera olika stokastiska variabler, vilkas värde bestäms i ett och samma slumpförsök. Ofta är vi intresserade av hur variablerna eventuellt samvarierar. Ex.: a) Välj slumpmässigt en man från en population av män. X = den valde mannens vikt Y = den valde mannens längd b) Gör två kast med en tärning. X = antal prickar i första kastet Y = antal prickar i andra kastet c) Välj slumpmässigt en familj från en population av familjer. X = antal pojkar i den valda familjen Y = antal flickor i den valda familjen Vi säger att X och Y är simultant fördelade. 2

Generalisering: n simultant fördelade stokastiska variabler X 1, X 2,, X n. Ex.: Slumpförsök = 10 kast med en tärning. X 1 = antal prickar i första kastet X 2 = antal prickar i andra kastet M X 10 = antal prickar i tionde kastet Låt X och Y vara två diskreta stokastiska variabler, som uppträder tillsammans. De har då en simultan sannolikhetsfunktion: P(x, y) = P(X=x och Y=y) = P(X=x Y=y) Den simultana slh-funktionen ger alltså slh för att få olika kombinationer av värden på X och Y. Vi säger att den ger oss den simultana sannolikhetsfördelningen för X och Y. 3

Ex.: En familj väljs slumpmässigt från en population av familjer. X = antalet pojkar; Y = antalet flickor. Antag att den simultana slh-funktionen är följande: Flickor Pojkar y = 0 1 2 3 4 Summa x = 0 0,38 0,16 0,04 0,01 0,01 0,60 1 0,17 0,08 0,02 - - 0,27 2 0,05 0,02 0,01 - - 0,08 3 0,02 0,01 - - - 0,03 4 0,02 - - - - 0,02 Summa 0,64 0,27 0,07 0,01 0,01 1,00 P(En pojke, två flickor) = P(1, 2) = 0,02 P(Inga barn) = P(0, 0) = 0,38 Tabellen visar den simultana fördelningen för X och Y. Summan av alla sannolikheterna är = 1. Marginalerna visar marginalfördelningen för X resp. Y. Den marginella slh-funktionen för X är P(x) = P(X = x) = P( x, Alla y y) Analogt definieras den marg. slh-funktionen för Y. 4

Vi kan också se på betingade sannolikheter. Definitionen är densamma som tidigare, när vi dfinierade betingade sannolikheter för händelser. P ( x y) = P( X = x Y = y) = P( X = x Y = P( Y = y) y) = P( x, y) P( y) I exemplet ovan får vi följande betingade sannolikheter för X, givet Y. OBS alla kolumnsummor blir nu = 1. y=0 1 2 3 4 Marg. x=0 0,59 0,59 0,57 1,00 1,00 0,60 1 0,27 0,30 0,29 - - 0,27 2 0,08 0,07 0,14 - - 0,08 3 0,03 0,04 - - - 0,03 4 0,03 - - - - 0,02 Summa 1,00 1,00 1,00 1,00 1,00 1,00 5

Oberoende stokastiska variabler Finns det, eller finns det inte, någon form av samvariation mellan X och Y? Två stokastiska variabler, X och Y, sägs vara oberoende om (och endast om) P(x, y) = P(x) P(y) för alla par av värden på x och y. Tänk på definitionen av oberoende mellan två händelser A och B: P(A B) = P(A) P(B). Att de stokastiska variablerna X och Y är oberoende är detsamma som att händelserna X=x och Y=y är oberoende händelser för alla kombinationer av värden på x och y. I praktiken: När man vet (t.ex. från tidigare erfarenhet) att två slumpmässiga numeriska storheter inte är relaterade till varandra på något sätt, så brukar man i modellen anta att det är fråga om två oberoende stokastiska variabler. 6

Ex.: Två kast med en tärning. Låt X = antalet prickar i första kastet Y = antalet i andra kastet. Om kasten sker korrekt, så kan resultatet i andra kastet inte påverkas av resultatet i första kastet. Alltså rimligt att anta att X och Y här är oberoende stokastiska variabler. T.ex. P(X=6 Y=6) = P(X=6) P(Y=6) = 1 6 1 6 = 1 36 Ex.: Är X och Y oberoende i exemplet med antal pojkar och flickor ovan? Nej, ty villkoret i definitionen är inte uppfyllt för alla värden på x och y. Vi ser t.ex. att Medan P(X=1, Y=1) = 0,08 P(X=1) P(Y=1) = 0,27 0,27 = 0,0729 0,08 Det räcker för att konstatera att X och Y inte är oberoende. 7

Ex.: X och Y är två stokastiska variabler, som antas oberoende av varandra. X antar värdena 1 och 2 med sannolikheterna 0,4 och 0,6. Y antar värdena 1, 2, 3 med sannolikheterna 0,2, 0,5, 0,3. Den simultana sannolikhetsfördelningen, vid oberoende, får vi genom att multiplicera marginalsannolikheterna: y=1 2 3 Summa x=1 0,08 0,20 0,12 0,4 2 0,12 0,30 0,18 0,6 Summa 0,2 0,5 0,3 1,0 (T.ex. 0,08 = 0,4 0,2 och 0,20 = 0,4 0,5) Definitionen av oberoende stokastiska variabler kan generaliseras till fallet med fler än två variabler: X 1, X 2,, X n är oberoende stokastiska variabler om och endast om P(x 1, x 2,, x n ) = P(x 1 ) P(x 2 ) P(x n ) för alla värden på x 1, x 2,, x n. 8

Kovarians och korrelation för observerade data, repetition (se NCT 2.5 och 3.4) Data: Observationer på två variabler, x och y. Obs. nr. x y 1 x 1 y 1 2 x 2 y 2 M M M n x n y n Kan åskådliggöras i spridningsdiagram: Spridningsdiagram 60 50 y 40 30 20 10 7 8 9 10 11 12 x 13 14 15 16 9

Definition av kovarians för två observerade variabler: s xy = 1 n 1 n i= 1 ( x i x)( y i y) Kovariansen positiv: positivt linjärt samband. Kovariansen negativ: negativt linjärt samband. Korrelationskoefficienten för två observerade variabler är en sorts standardiserad kovarians: r = xy s s x xy s y där s x och s y är standardavvikelsen för x resp. y. Korrelationskoefficienten kan också skrivas: r xy = n ( x x)( y i i i= 1 n n 2 ( xi x) i= 1 i= 1 y) ( y i y) 2 10

Korrelationskoefficienten är ett standardiserat mått på graden av linjär samvariation hos data. r xy och s xy har alltid samma tecken. -1 r xy +1 r xy = 1: perfekt negativ linjär samvariation r xy = 0 : ingen linjär samvariation (men det kan finnas icke-linjär samvariation) r xy = +1: perfekt positiv linjär samvariation Se exempel på sid. 66-68 i NCT. 11

Kovarians och korrelation för stokastiska variabler Vi ska nu definiera kovarians och korrelation för två stokastiska variabler. Med kovariansen för de stokastiska variablerna X och Y menas Cov(X, Y) = σ XY = E[(X µ X )(Y µ Y )] = x µ )( y Alla x Alla y ( µ ) P( x, X Y y) Beräkningsformel: Cov(X, Y) = E(XY) - µ X µ Y = xyp x, y) Alla x Alla y ( µ µ X Y 12

Med korrelationskoefficienten för X och Y menas Cov( X, Y ) σ XY ρ = ρ XY = Corr( X, Y ) = = Var( X ) Var( Y ) σ σ Både Cov(X, Y) och Corr(X, Y) mäter hur mycket linjär samvariation det finns mellan X och Y. Kovariansens värde är lite svårtolkat. Det enda vi kan säga är att positiv kovarians betyder positiv samvariation, och negativ kovarians betyder negativ samvariation. Korrelationen är en standardiserad kovarians, som kan anta värden från 1 till +1. Därigenom lättare att tolka värdet. Följande gäller: Kovariansen och korrelationskoefficienten har alltid samma tecken. Båda mäter graden av linjär samvariation mellan X och Y. Det är alltid så att 1 ρ +1. När ρ = +1, finns det ett perfekt positivt linjärt samband mellan X och Y. När ρ = 1, är det ett perfekt negativt linjärt samband. X Y 13

När ρ = 0, finns inget linjärt samband mellan X och Y. Då är X och Y okorrelerade. Om X och Y är oberoende, så är de också okorrelerade. Men omvändningen gäller inte. X och Y kan vara okorrelerade men ändå beroende. Det kan nämligen finnas ett ickelinjärt samband mellan X och Y. Korrelationskoefficienten ρ kan ses som en sorts teoretisk motsvarighet till den empiriska korrelationskoefficienten, r, som definierades nyss. Ex.: Antag att den simultana fördelningen för X och Y är följande: y=0 1 2 P(x) x=1 0,08 0,12 0,30 0,50 2 0,12 0,18 0,20 0,50 P(y) 0,20 0,30 0,50 1,00 Beräkna korrelationen mellan X och Y. (Svar: ρ = -0,18) 14

Väntevärde och varians för summor mm. X och Y är två stokastiska variabler. Säg att vi är intresserade av summan, X + Y, eller av differensen, X Y. Då gäller följande. E(X + Y) = E(X) + E(Y) E(X Y) = E(X) E(Y) Var(X + Y) = Var(X) + Var(Y) + 2Cov(X, Y) Var(X Y) = Var(X) + Var(Y) 2Cov(X, Y) Specialfall: X och Y okorrelerade. Då är Var(X + Y) = Var(X) + Var(Y) Var(X Y) = Var(X) + Var(Y) OBS X och Y oberoende X och Y okorrelerade. 15

Ett mer generellt resultat än vad NCT ger är följande: För n stokastiska variabler X 1, X 2,, X n och konstanter a 0, a 1, a 2,, a n gäller att: E(a 0 +a 1 X 1 + a 2 X 2 + + a n X n ) = = a 0 +a 1 E(X 1 ) + a 2 E(X 2 ) +...+ a n E(X n ) Om de stokastiska variablerna är parvis okorrelerade gäller dessutom att: Var(a 0 + a 1 X 1 + a 2 X 2 + + a n X n ) = 2 2 2 1 1 2 2 n n = a Var( X ) + a Var( X ) + K + a Var( X ) OBS X 1,, X n oberoende parvis okorrelerade. Ex.: Gör tre kast med en symmetrisk tärning. Beräkna summan av antalet prickar. Vad är väntevärde och varians för summan? För medelvärdet? Ex.: Gör ett kast med en symmetrisk tärning och multiplicera utfallet med tio. Vad är väntevärde och varians? Vad blir det om man i stället adderar tio? 16