F10 Kap 8. Statistikens grunder, 15p dagtid. Binomialfördelningen 4. En räkneregel till. Lite repetition HT Sedan

Relevanta dokument
F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

Statistikens grunder HT, dagtid Statistiska institutionen

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

TENTAMEN I STATISTIKENS GRUNDER 1

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Föreläsning 12: Repetition

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Övning 1 Sannolikhetsteorins grunder

Kap 2. Sannolikhetsteorins grunder

Lärmål Sannolikhet, statistik och risk 2015

Våra vanligaste fördelningar

SF1901: Sannolikhetslära och statistik

4.1 Grundläggande sannolikhetslära

Statistik 1 för biologer, logopeder och psykologer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

4 Diskret stokastisk variabel

TMS136. Föreläsning 4

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Statistiska metoder för säkerhetsanalys

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Kurshemsidan. Statistikens grunder, 15p dagtid. Kursens upplägg. Kursens upplägg.

SF1901 Sannolikhetsteori och statistik I

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar

Lektionsanteckningar 11-12: Normalfördelningen

Tentamen i Matematisk Statistik, 7.5 hp

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

Veckoblad 3. Kapitel 3 i Matematisk statistik, Dahlbom, U.

Kurssammanfattning MVE055

Repetitionsföreläsning

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Kapitel 5 Multivariata sannolikhetsfördelningar

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Några extra övningsuppgifter i Statistisk teori

Jörgen Säve-Söderbergh

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Stokastiska signaler. Mediesignaler

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Sannolikheter och kombinatorik

Tentamen MVE301 Sannolikhet, statistik och risk

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

Kap 3: Diskreta fördelningar

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

SF1901: Sannolikhetslära och statistik

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Introduktion till statistik för statsvetare

4.2.1 Binomialfördelning

Föreläsning 7: Punktskattningar

Föreläsning 5: Hypotesprövningar

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

1.1 Diskret (Sannolikhets-)fördelning

Formler och tabeller till kursen MSG830

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Matematisk statistik för D, I, Π och Fysiker

SF1901: Sannolikhetslära och statistik

MVE051/MSG Föreläsning 7

Tentamen MVE301 Sannolikhet, statistik och risk

Matematisk statistik KTH. Formelsamling i matematisk statistik

modell Finansiell statistik, vt-05 Modeller F5 Diskreta variabler beskriva/analysera data Kursens mål verktyg strukturera omvärlden formellt

Matematisk statistik för B, K, N, BME och Kemister

FÖRELÄSNING 7:

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

SF1911: Statistik för bioteknik

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

Tentamen i Tillämpad Matematik och statistik för IT-forensik. Del 2: Statistik 7.5 hp

Grundläggande matematisk statistik

SF1901 Sannolikhetsteori och statistik I

Föreläsning 8, Matematisk statistik Π + E

Föreläsning 3. Sannolikhetsfördelningar

Grundläggande matematisk statistik

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Avd. Matematisk statistik

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

FÖRELÄSNING 8:

Stokastiska Processer F2 Föreläsning 1: Repetition från grundkursen

Thomas Önskog 28/

1.1 Diskret (Sannolikhets-)fördelning

8. NÅGRA SPECIELLA KONTINUERLIGA SANNOLIKHETSFÖRDELNINGAR

TMS136. Föreläsning 7

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

Formel- och tabellsamling i matematisk statistik

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Repetition och förberedelse. Sannolikhet och sta.s.k (1MS005)

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

F9 SAMPLINGFÖRDELNINGAR (NCT

Transkript:

01-09-7 F10 Kap 8 Statistikens grunder, 15p dagtid HT 01 Lite repetition Kovarians Binomial- och Poissonfördelning Täthetsfunktion (kont.) Fördelningsfunktion (kont.) Arean under en kurva Sedan Normalfördelningen Standardisering Eponential-, χ- och t-fördelningar En räkneregel till Antag att och Y är s.v. och a, b och c är konstanter. E(a + by + c) = ae() + be(y) + c V(a + by + c) = a V() + b V(Y) + abcov(,y) Binomialfördelningen 4 Vi skriver ~Bin(n,p) el. Bin(n,p) Frekvensfunktion: n n- f ( ) p (1- p) Parametrar för = 0,1,,n och där 0 < p < 1 och n är ett heltal 0, (q = 1-p) Vad bidrar kovarianstermen med? Om samvariationen är positiv så blir variansen större, varför? Om samvariationen är negativ så blir variansen mindre, varför? Väntevärde: Varians: E() = np V() = np(1-p) =npq (verkar det vettigt?) 1

01-09-7 Poissonfördelningen 1 Approimera Bin med Po Låt ~Bin(n,p) och låt n och p 0 på ett sådant sätt att np = λ, en konstant, dvs. p = λ/n. När n blir binomialfördelningen en Poissonfördelning: ~Po(λ) för = 0,1,, och där λ > 0. Väntevärde: Varians: λ f ( ) e! E() = λ V() = λ -λ Om ~Bin(n,p) och om n är stort ( 0) och p litet ( 0,1) sätt λ = np En Poisson är ofta enklare att använda beräkningsmässigt. np -np λ -λ f ( ) e e!! Vad är väntevärdet och varians för en Binomial resp. Possion? Funktionerna för en kontinuerlig s.v. Kontinuerlig s.v. Täthetsfunktionen: f() = täthet Inte en sannolikhet Arean f() = P( = ) 1,6 1,4 1, 1 0,8 Täthetsfunktion (pdf) f( ) 6 6 [0,1] 0,6 Fördelningsfunktion: F() = P( ) En sannolikhet ( F ) f( t) dt Höjden 0,4 0, 0-0, 0 0, 0,4 0,6 0,8 1 1, F() = P( ) 1, 1 0,8 0,6 0,4 Fördelningsfunktion (cdf) F( ) 3 [0,1] 3 0, 0-0, 0 0, 0,4 0,6 0,8 1 1,

01-09-7 Normalfördelningen 1 Normalfördelningen En av de viktigaste, mest kända och mest använda (på gott och ont) sannolikhetsmodellerna. Täthetsfunktion: 1 μ 1 f ( ) e, π - Alternativa benämningar: Bell curve, Gaussian (Gaussisk efter matematikern J.C.F. Gauss) Bestäms helt av väntevärdet och variansen (parametrar). Fördelningsfunktion: P( ) F( ) Väntevärde: E() = μ 1 t μ 1 e π Varians och standardavvikelse: V() = ; SD() = dt Kan inte förenklas! Normalfördelningen 3 Räkneregler, en gång till Täthetsfunktion (PDF): Antag att c är konstant (ett tal som aldrig ändras). Fördelningsfunktion (CDF) E(c) = c E(c+) = c + E() E(c) = c E() V(c) = 0 V(c+) = V() V(c) = c V() 3

01-09-7 Standardisering 1 Standardisering Antag att en s.v. som är normalfördelad med E() = μ och V() = Transformera till en ny normalfördelad s.v. Z med Väntevärde E(Z) = μ Z = 0 Varians V(Z) = Z = 1 Z~N(0,1) Varför? Så vi slipper ha tabeller för alla möjliga värden på μ och. Vi behöver bara en standardtabell Vi har s.v. och skapar Z: - E( ) -μ Z V( ) Väntevärde: Varians: 1 μ 1 μ 1 μ E( Z) E E( ) 0 1 μ 1 V( Z) V ( ) 0 1 V Eempel Approimera Bin med N Vi har s.v. ~N(10,5) och vill veta sannolikheten P( > 18) Standardisera: 18-10 P( 18) PZ ( 1,6) 5 P Z 1 - P( Z 1,6) 1 - (1,6) [avläs t] 1-0,945 0,0548 Särskild symbol Φ för den standardiserade normalfördelningens fördelningsfunktion Antag att ~Bin(n,p). Om n är stort (hur stort?) kan man approimera binomialfördelningen med en normalfördelning. Om n är stort blir binomialfördelningen oerhört jobbig (omöjlig?) att räkna på. En standardnormalfördelning är enklare att använda då vi använder tabeller. 4

01-09-7 Halvkorrektion Eempel För en diskret s.v. som bara kan anta heltal är följande relation giltig P( = ) = P( ½ < < + ½) Varför? Lite för mycket ½ Lite för litet + ½ Låt ~Bin(100;0,8) Beräkna P( 75) (alt. 1 P( > 75)) E() = μ = np = 80 V() = = np(1-p) = 16 Halvkorrektion P( 75) = P( 75,5) P Z = P(Z -1,15) = P(Z > 1,15) = 1 P(Z 1,15) = 1 Φ(1,15) Φ1,1Φ1,13 1 = [avläst] 0,86860,8708 = 1 = 0,1303 (0,1314) 75,5-50 16 Eakt svar Komboövning Komboövning, forts. En anläggning förpackar varor. Vikten i gram i varje förpackning är en s.v. som vi betecknar med. Vi antar att varje förpackning är oberoende och att ~N(100;1). Om man har en last om 1000 förpackningar, vad är sannolikheten att högst 19 väger under 98 gram? Beteckna med Y antalet som väger under 98 gram. Hur är Y fördelad? Y~Bin(1000;p) där p = P( 98). 1. Beräkna p P( 98) P Z. Beräkna P(Y 19) Alt 1. n är stort, p är litet 98-100 1 P( Z,0) 1- P( Z,0) 1 - (,0) [avläs t] 1-0,9775 0,075 sätt λ = np =,75 och Poissonapproimera! P( Z,0) 5

01-09-7 Komboövning, forts. Eponentialfördelningen Y~Bin(1000;0,075). Beräkna P(Y 19) Alt. n är stort sätt μ = np =,75 = np(1-p) =,3 och Normalapproimera! Jämförelse: Eakt: Poisson: Normal: 0,509 0,538 0,453 Om är Poissonfördelad med parameter λ så förväntar man sig i snitt λ observationer (lyckade utfall) per tidsenhet. Låt Y = tiden mellan varje observation. Hur är Y fördelad? Vad är den förväntade tiden mellan varje observation? Variansen? Eponentialfördelningen Eponentialfördelningen Fördelningen för Y kallas eponentialfördelningen. Vi skriver Y~Ep(1/λ) alt. Ep(λ) Täthetsfunktion: f(y) = λ e -λy, y 0 Fördelningsfunktion: P(Y y) = F(y) = 1 e -λy Ibland sätter man θ = 1/λ och skriver Y~Ep(θ): Täthetsfunktion: f(y) = θ -1 e -y/θ, y 0 Väntevärde: E(Y) = θ Varians: V(Y) = θ Väntevärde: E(Y) = 1/λ Varians: V(Y) = 1/λ 6

01-09-7 χ-fördelningen χ-fördelningen ν ν stycken oberoende lika fördelade (olf eller iid) s.v. 1,,, ν. Alla är normalfördelade med väntevärde μ och varians. Bilda standardiserade s.v.: Yi Kvadrera dessa: Yi Väntevärde: Varians: i μ i μ E(Yi) = 0 V(Yi) = 1 t-fördelningen Summera: Q Yi i 1 Q (eller χ) är då χ -fördelad Läses oftast chi-två. Vi skriver att Q ~ χ(ν) ν kallas frihetsgrader (d.f., degrees of freedom) E(Q) = ν V(Q) = ν Väntevärde: Varians: χ- och t-fördelningarna Låt Z ~ N(0,1) Låt Q ~ χ(ν) Observera att tabeller för χ- och tfördelningarna typiskt är tvärtom. Z Bilda T Q/ Isf att ange sannolikheten för något givet värde på variabeln, anger de vilket värde som ger den givna sannolikheten. T är t-fördelad med ν frihetsgrader. 0,4 0,35 Kallas också Student s t-distribution. χ(ν) 0,3 0,5 0, 0,15 Arean = 0,05 0,1 Används inom inferensteorin (SG). 0,05 0 0 4 6 8 10 1 Vilket är värdet? Slå upp i tabell! 7

01-09-7 F11 Repetition Vetenskapsteori Allt som följer har redan visats vid tidigare föreläsningar! Några begrepp som behandlats: Kunskapstyper Propositionell och icke propositionell kunskap Sanning Korrespondensteori Koherensteori Pragmatism Ett påstående måste vara sant för att vara kunskap. Vetenskapsteori Vetenskapsteori Ännu några begrepp : Vad är en teori? Epistemologi Vad vi veta och hur vet vi det? Rationalism Empirism Vetenskaper kan delas in i Generaliserande Partikulariserande Formella Empiriska En teori är ett logiskt sammanhängande system av satser (påståenden) som beskriver relationer mellan väldefinierade objekt el. begrepp samt tolkningar av dessa relationer och objekt Ska vara generell Förklara så mycket som möjligt Förutsägelser Kunna ange riktlinjer Enkel (Occam s razor) Objektiv 8

01-09-7 Vetenskapsteori Modeller Orsak och verkan Kausalitet Varför hände det? Kan vi styra utvecklingen? Objektivitetskrav nödvändighet Krav på verkliga orsaker Assymetri (A påverkar B men inte tvärtom) Kontrollerbarhet (vi kan ändra) Fördröjning i tid (orsak för verkan) Något som representerar något annat för att hjälpa oss förstå Är en förenklad beskrivning Vi ersätter de relevanta aspekterna med symboler Deterministiska modeller E. Tryck Volym = konstant Stokastiska modeller E. Observation = Sant värde + mätfel Modeller Lite mängdlära Några inledande begrepp: Population och urval (objekt och uppsättning observationer) Variabler (uppmätta egenskaper) Typer och skalor Variabeltyp Skaltyp Diskret Kontinuerlig Nominal - Ordinal - Intervall Kvot Kvalitativ Kvantitativ e 1, e, osv. element A, B, Ω osv. betecknar mängder av element. A = {1,} e i tillhör A skrivs e i A; 1 {1,} Delmängd: A B allmän delmängd; strikt delmängd A B Komplementet till en mängd är motsatsen; Ā ; P(>) och P( ) 9

01-09-7 Lite mängdlära, forts. Stokastiska modeller Unionen av mängder (och/eller); A B Snittet av mängder (både och) A B Tomma mängden innehåller inget alls. Disjunkta (oförenliga) mängder om snittet är tomt; A B = Utfallsrummet Ω Vad kan hända? En fullständig beskrivning av alla tänkbara utfall. En händelse är en delmängd till Ω. A Ω Sannolikhet Varje händelse A tillskrivs ett numeriskt värde, sannolikheten P(A) En kvantifiering av hur troligt det är att det ska hända. Tolkning av sannolikhet En aiomatisk teori Frekventistisk n A /n P(A) då n Klassisk antal(a) / antal(ω) = P(A) storlek(a) / storlek(ω) = P(A) Subjektiv (personlig) insats/total vinst = P(A) Kolmogorovs aiom: En sannolikhet är en funktion P som tilldelar varje möjlig händelse A i ett utfallsrum Ω ett tal P (A), så att följande villkor är uppfyllda: P(A) 0 P(Ω) = 1 Om A 1, A,..., A k, är parvis disjunkta händelser i S, då är P(A 1 A... A k ) = P(A 1 ) + P(A ) +... + P(A k ) 10

01-09-7 En aiomatisk teori, forts. Summatecken Följande satser kan bevisas (härledas) ur de tre aiomen: P(Ā) = 1 - P(A) P( ) = 0 Om A B så gäller P(A) P(B) P(A) P(Ω) = 1 P(A B) = P(A) + P(B) P(A B) Vad betyder följande? n i1 n i i1 i n i1 n i1 n i1 n i1 c c i ( i y i ) i y i Sannolikheter Additionssatsen Att beräkna sannolikheter Händelser; A, B, C osv. Sannolikheten för att A ska inträffa; P(A) Alla händelser; 0 P(A) 1 Omöjlig händelse; P( ) = 0 Säker händelse; P(Ω) = 1 A och/eller B (union); P(A B) A och B (snitt); P(A B) Inte A (komplement); P(Ā) = 1 - P(A) Sannolikheten att A eller B eller både A och B inträffar. P(A B) = P(A) + P(B) P(A B) Specialfall om A och B disjunkta dvs. A B = vilket ger P(A B) = P(A) + P(B) P(A B) = P(A) + P(B) P( ) = P(A) + P(B) Jmfr med Kolmogorovs aiom 11

01-09-7 Betingade sannolikheter Betingning, forts. Sannolikheten att A inträffar givet att B inträffar eller har inträffat. Genom att B har hänt så har utfallsrummet påverkats. B har inte hänt, dvs. vi kan stryka bort den delen av Ω. Mulitplikationssatsen P(A B) = = P(A B) P(B) = P(B A) P(A) Ibland vet man P(B A) men söker P(A B). P(A B) utläses sannolikheten för A givet B och beräknas P( A B) P( A B) P( B) Oberoende Kombinatorik Två händelser / eperiment är statistiskt oberoende omm P(A B) = P(A) Om A och B är oberoende så inses att följande gäller: P(A B) = P(A) P(B) Ordnat utan återläggning Dra k stycken ur n möjliga. 1:a kulan n möjligheter, :a kulan (n-1) möjligheter, osv. Multiplikationsprincipen ger n( n1)... ( n k ) ( n k 1) k stycken faktorer n... ( n k 1) ( n k)... 1 ( n k)... 1 n! ( n - k)! 1

01-09-7 Kombinatorik, forts. Kombinatorik Ej ordnat utan återläggning Sammanfattning Dra k stycken ur n möjliga. 1:a kulan n möjligheter, :a kulan (n-1) möjligheter, osv. Ger n! ( n - k)! Justera sedan för att ordningen inte spelar roll genom att dela med antal möjliga permutationer av k objekt n! n k!( n - k)! k Med återläggning Utan återläggning Ordnad n! (n- k)! Ej ordnad n k -1 ( n k -1)! k n k k!( n 1)! n n! k k!( n k)! Väntevärden Varianser Väntevärdet för en diskret s.v. betecknas med E() och definieras E( ) K i1 f( i i För en kontinuerlig s.v. med utfallsrum på intervallet (a,b) definieras väntevärdet b E ( ) f ( ) d a Medelvärdet för ett observerat datamaterial eller väntevärdet för en fördelning ger en indikation om var observationerna kommer att hamna, dvs. läget (eng. location). ) Variansen för en diskret s.v. betecknas med V() och definieras V( ) K - E( ) i1 i f( i För en kontinuerlig s.v. med utfallsrum på intervallet (a,b) definieras variansen b V ( ) f( ) d - E( ) a Variansen för ett observerat datamaterial eller för en fördelning ger en indikation om hur utspridda observationerna är eller kommer att bli, dvs. spridningen eller skalan (eng. scale) ) 13

01-09-7 Varianser Simultana fördelningar Alternativa men helt ekvivalenta sätt att räkna variansen är resp. V K ( ) i f( i) E( ) i1 V b ( ) f( ) d E( ) a Standardavvikelse definieras sedan helt enkelt som kvadratroten ur variansen, dvs. SD( ) V( ) Låt och Y vara två diskreta s.v. Vi definierar sedan den simultana frekvensfunktionen som f y (,y) = P( = Y = y) För kontinuerliga s.v. kan man ange sannolikheter att de ska anta värden inom olika interval P( (a, b) Y (c, d)) Marginalfördelningar Betingade fördelningar Ofta är man intresserad av att titta på en av de två s.v. och se hur den är fördelad för sig. Vi beräknar då marginalfördelningarna enligt: f ( ) f (, y) j Dvs. för att få den ena summerar man över den andra. y y f ( y) f (, y) Y y På samma sätt som vi kunde betinga på en händelse när vi beräknade sannolikheten för en annan händelse kan vi manipulera en simultanfördelning för att få en betingad fördelning. f Y ( y) = P( = Y = y) = P( Y y) P( Y y) fy(, y) f ( y) Y 14

01-09-7 Betingade väntevärden Oberoende s.v. När man har den betingade fördelningen så kan vi ta fram det betingade väntevärdet och den betingade variansen. Två s.v. är oberoende omm f Y ( y) = f () f Y (y ) = f Y (y) Betrakta f Y ( y) resp. f Y (y ) som en vanlig frekvens- alt. täthetsfunktion och räkna på som vanligt. Obs! Kontrollera att du har koll på det betingade utfallsrummet! Om och Y är oberoende så inses att följande gäller: f Y (,y) = f () f Y (y) Räkneregler Kovarians Antag att och Y är s.v. och att c är en konstant. E(c) = c V(c) = 0 E(c+) = c + E() E(c) = c E() V(c+) = V() E(a + by + c) = ae() + be(y) + c V(c) = c V() V(a + by + c) = a V() + b V(Y) + abcov(,y) Vi definierar kovariansen mellan och Y enligt Cov(,Y) = E[( μ ) (Y μ Y )] = E(Y) μ μ Y där μ = E() och μ Y = E(Y) Väntevärdet av produkten Y måste då beräknas: E ( Y) y f (, y) y Y y 15

01-09-7 Korrelation Bernoulli Korrelationen: ett standardiserat mått på det linjära sambandet mellan två s.v. säg och Y, dvs. hur de samvarierar linjärt. Definition: ρ Y Corr (,Y ) Cov(, Y) V( ) V( ) Om är Bernoulli fördelad kan vi skriva sannolikhetsfunktion: f Z () = p (1-p) 1- för = 0,1 och där 0 < p < 1. Väntevärde: Varians: E() = p V() = p(1-p) Parameter Binomialfördelningen Vi skriver ~Bin(n,p) el. Bin(n,p) Frekvensfunktion: n n- f ( ) p (1- p) Parametrar för = 0,1,,n och där 0 < p < 1 och n är ett heltal 0. Poissonfördelningen 1 Låt ~Bin(n,p) och låt n och p 0 på ett sådant sätt att np = λ, en konstant, dvs. p = λ/n. När n blir binomialfördelningen en Poissonfördelning: ~Po(λ) λ f ( ) e! -λ Väntevärde: Varians: E() = np V() = np(1-p) för = 0,1,, och där λ > 0. Väntevärde: E() = λ Varians: V() = λ 16

01-09-7 Approimera Bin med Po Normalfördelningen Om ~Bin(n,p) och om n är stort ( 0) och p litet ( 0,1) sätt λ = np En Poisson är ofta enklare att använda beräkningsmässigt. np -np λ -λ f ( ) e e!! Vad är väntevärdet och varians för en Binomial resp. Possion? Täthetsfunktion (PDF): Fördelningsfunktion (CDF) Standardisering Approimera Bin med N Vi har s.v. och skapar Z: Antag att ~Bin(n,p). Z - E( ) V( ) -μ 1 μ Om n är stort (hur stort?) kan man approimera binomialfördelningen med en normalfördelning. Väntevärde: 1 μ 1 μ E( Z) E E( ) 0 Varians: 1 μ 1 V( Z) V ( ) 0 1 V Om n är stort blir binomialfördelningen oerhört jobbig (omöjlig?) att räkna på. En standardnormalfördelning är enklare att använda då vi använder tabeller. 17

01-09-7 Halvkorrektion Eempel För en diskret s.v. som bara kan anta heltal är följande relation giltig P( = ) = P( ½ < < + ½) Varför? Lite för mycket ½ Lite för litet + ½ Låt ~Bin(100;0,8) Beräkna P( 75) (alt. 1 P( > 75)) E() = μ = np = 80 V() = = np(1-p) = 16 Halvkorrektion P( 75) = P( 75,5) P Z = P(Z -1,15) = P(Z > 1,15) = 1 P(Z 1,15) = 1 Φ(1,15) Φ1,1Φ1,13 1 = [avläst] 0,86860,8708 = 1 = 0,1303 (0,1314) 75,5-80 16 Eakt svar 18