Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

Relevanta dokument
Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Kapitel 5 Multivariata sannolikhetsfördelningar

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

Formel- och tabellsamling i matematisk statistik

Grundläggande matematisk statistik

SF1911: Statistik för bioteknik

Grundläggande matematisk statistik

Kap 3: Diskreta fördelningar

Statistik 1 för biologer, logopeder och psykologer

Introduktion till statistik för statsvetare

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

C1 Sannolikhetslära och inferens II: Läsanvisningar (6e upplagan)

FÖRELÄSNING 7:

Lektionsanteckningar 11-12: Normalfördelningen

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

4.1 Grundläggande sannolikhetslära

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Kapitel 10 Hypotesprövning

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Kap 2. Sannolikhetsteorins grunder

4.2.1 Binomialfördelning

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

1 Stokastiska processer. 2 Poissonprocessen

Övning 1 Sannolikhetsteorins grunder

4 Diskret stokastisk variabel

TMS136. Föreläsning 4

Statistiska metoder för säkerhetsanalys

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Kurssammanfattning MVE055

FÖRELÄSNING 8:

Kapitel 9 Egenskaper hos punktskattare

Föreläsning 8: Konfidensintervall

Föreläsning G60 Statistiska metoder

SF1901 Sannolikhetsteori och statistik I

Mer om slumpvariabler

Repetitionsföreläsning

Föreläsning 3. Sannolikhetsfördelningar

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 4, Matematisk statistik för M

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

9. Konfidensintervall vid normalfördelning

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Föreläsning 7. Statistikens grunder.

SF1901: Sannolikhetslära och statistik

SF1901 Sannolikhetsteori och statistik I

FÖRELÄSNING 4:

TMS136. Föreläsning 11

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Demonstration av laboration 2, SF1901

Lärmål Sannolikhet, statistik och risk 2015

Grundläggande matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Våra vanligaste fördelningar

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Föreläsning 8 för TNIU23 Integraler och statistik

Tentamen i Matematisk statistik Kurskod S0001M

Thomas Önskog 28/

Tentamen MVE301 Sannolikhet, statistik och risk

TAMS79: Föreläsning 6. Normalfördelning

SF1901 Sannolikhetsteori och statistik I

Några extra övningsuppgifter i Statistisk teori

Matematisk statistik KTH. Formelsamling i matematisk statistik

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

Stokastiska signaler. Mediesignaler

Matematisk statistik TMS064/TMS063 Tentamen

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

Oberoende stokastiska variabler

1 Föreläsning V; Kontinuerlig förd.

SF1901 Sannolikhetsteori och statistik I

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Föreläsning 7: Punktskattningar

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

8. NÅGRA SPECIELLA KONTINUERLIGA SANNOLIKHETSFÖRDELNINGAR

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Föreläsning 7: Punktskattningar

Mer om konfidensintervall + repetition

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Tentamen MVE301 Sannolikhet, statistik och risk

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Tentamen i Matematisk Statistik, 7.5 hp

Hur måttsätta osäkerheter?

Föreläsning 7: Punktskattningar

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Experimentella metoder 2014, Räkneövning 1

Extrauppgifter i matematisk statistik

Matematisk statistik 9 hp Föreläsning 3: Transformation och simulering

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Transkript:

Sannolikhetslära och inferens II Kapitel 4 Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar 1

Kontinuerliga slumpvariabler En slumpvariabel som kan anta alla värden på något intervall sägs vara kontinuerlig. Exempel: IQ, Ålder, Vikt osv. För en kontinuerlig slumpvariabel är det inte meningsfullt att konstruera en sannolikhetsfunktion eftersom Pr(X=x)=0 för alla x. Det är dock möjligt att beräkna sannolikheter för alla former av intervall, dvs Pr(a<X<b), där a<b kan beräknas. För en kontinuerlig slumpvariabel är det därmed meningsfullt att konstruera en fördelningsfunktion. 2

Kontinuerliga slumpvariabler Fördelningsfunktion Fördelningsfunktionen för en slumpvariabel X i värdet x, F X (x), anger sannolikheten att X antar högst detta värde, dvs Det är enkelt att acceptera följande egenskaper hos F X (x). 3

Kontinuerlig slumpvariabel: Definition För en diskret slumpvariabel blir fördelningsfunktionen en trappstegsfunktion, dvs den kommer att vara diskontinuerlig. För en kontinuerlig slumpvariabel blir fördelningsfunktionen kontinuerlig. Definition: En slumpvariabel X med fördelningsfunktion F X (x) sägs vara kontinuerlig om F X (x) är kontinuerlig för alla x. 4

Kontinuerlig slumpvariabel: Täthetsfunktion För en diskret slumpvariabel blir F X (x) en summering av sannolikhetsfunktionens värden (t.o.m. x), dvs Den kontinuerliga motsvarigheten till summation är integration. Om det för en kontinuerlig slumpvariabel X finns en funktion f X (x) sådan att sägs f X (x) vara täthetsfunktionen för X. Således har vi sambandet f(x) = F (x). 5

Samband mellan fördelningsfunktion och täthetsfunktion Då man åskådliggör situationen grafiskt följer att F X (x) är arean under kurvan till f X (x) på intervallet (-,x]. Sannolikheten för ett godtyckligt intervall kan uttryckas på följande sätt. 6

Kontinuerlig slumpvariabel: Täthetsfunktion Utifrån sambandet med fördelningsfunktionen fås följande egenskaper hos täthetsfunktionen. Om f X (x) är täthetsfunktion för den kontinuerliga slumpvariabeln X gäller att 7

Grundläggande primitiva funktioner Primitiva funktioner för de grundläggande funktionerna. 8

Grundläggande integreringsregler De grundläggande integreringsreglerna är 9

Exempel Vid en viss tentamen har studenterna två timmar på sig att bli färdiga. Låt X representera tidpunkten för inlämning. Enligt en sannolikhetsmodell gäller att täthetsfunktionen för X är Bestäm värdet på konstanten c. Vi får ekvationen vilket innebär att c=3/8. 10

Exempel Bestäm sannolikheten att en slumpmässigt vald student lämnar in skrivningen under den första timmen. F X (1) 11

Väntevärden för kontinuerliga slumpvariabler Väntevärden för kontinuerliga slumpvariabler beräknas och tolkas på samma sätt som för diskreta slumpvariabler men med summationen ersatt av integration. Låt u(x) vara en funktion av X. Väntevärdet för u(x) blir 12

Väntevärden för kontinuerliga slumpvariabler E(X) anger det värde X antar i genomsnitt. Då slumpförsöket upprepas kommer de värden X antar att variera. Som ett mått på graden av variation används variansen av X. Variansen för X är väntevärdet för u(x)=(x-µ) 2, och mäter alltså det förväntade kvadratavståndet mellan X och sitt väntevärde. Den vanligaste beräkningsformeln för variansen är 13

Exempel (forts.) Vi studerar en slumpvariabel X med täthetsfunktion Vi bestämmer väntevärdet till Den genomsnittlige studenten lämnar in skrivningen efter en och en halv timme. 14

Exempel (forts.) Olika studenter tar olika lång tid på sig och vi söker nu ett mått på denna spridning eller variation. varför det följer att V(X) = 2.4-1.5 2 = 0.15. För att få ett mått som är bättre att tolka beräknas standardavvikelsen till σ = 0.15 = 0.39. Den tid en student tar på sig avviker med i genomsnitt 0.39 timmar från den genomsnittliga skrivningstiden (1.5 tim). 15

Likformig sannolikhetsfördelning Betrakta en slumpvariabel Y definierad på intervallet θ 1 Y θ 2. Antag att sannolikheten för ett delintervall enbart är beroende på intervallets längd. (Två intervall med samma längd är alltså lika sannolika.) Täthetsfunktionen blir Y sägs vara likformigt fördelad på intervallet (θ 1,θ 2 ), och betecknas vanligtvis U(θ 1,θ 2 ). Väntevärde och varians ges av 16

Poissonprocesser igen Då vi i en poissonprocess med intensitet λ studerar den diskreta slumpvariabeln Y = Antal händelser på ett enhetsintervall följer att Y är Po(λ). Antag att vi istället studerar den kontinuerliga slumpvariabeln X 1 = Tidpunkten för den första händelsen eller mer allmänt X α = Tidpunkten för den α:te händelsen 17

Exponentialfördelningen I en poissonprocess med intensitet λ studerar vi X = Tidpunkten för den första händelsen Fördelningsfunktionen för X följer av sannolikhetsfunktionen för Po(λx). (Se även uppgift 4.168.) Y=Antal händelser på intervallet (0,x] är Po(λx). 18

Exponentialfördelningen Fördelningsfunktionen för X blir således Deriveringsregeln för exponentialfunktionen tillsammans med kedjeregeln ger sedan att täthetsfunktionen blir på formen I dessa sammanhang används ofta parmetern β=1/λ (eller θ=1/λ) vilket betyder att täthetsfunktionen blir 19

Exponentialfördelningen I en poissonprocess med intensitet λ=1/β studerar vi X = Tidpunkten för den första händelsen Täthetsfunktion, väntevärde och varians för X ges av En slumpvariabel med denna täthetsfunktion sägs vara exponentialfördelad med parameter β; Exp(β). 20

Matematiskt verktyg: Partialintegrering Vi vill bestämma den primitiva funktionen h(x)dx till någon besvärlig funktion h(x). Antag att h(x)=f(x)g(x) där F(x) är en primitiv funktion till f(x). Deriveringsregeln för en produkt ger då att Bestämmer vi en primitiv funktion till respektive led fås att 21

Matematiskt verktyg: Partialintegrering Vi får därmed att För att partialintegrering ska vara meningsfull bör uppdelningen h(x)=f(x)g(x) göras så att F(x) inte är nämnvärt besvärligare än f(x) och att gʹ(x) är enklare än g(x). Den bestämda integralen på intervallet (a,b) blir 22

Matematiskt verktyg: Mer gränsvärden Vid partialintegrering är vi ofta intresserade av att studera gränsvärden för en produkt av två funktioner då x. 23

Exponentialfördelning. Bevis för väntevärdet Låt X vara Exp(β). Då följer via partialintegrering att 24

Gammafördelningen Vi generaliserar nu exponentialfördelningen. I en poissonprocess med intensitet λ=1/β studerar vi X = Tidpunkten för den α:te händelsen På samma sätt som för exponentialfördelningen får vi att Y=Antal händelser på intervallet (0,x] är Po(λx). β=1/λ

Gammafördelningen Fördelningsfunktionen för X blir således För att få detta på sluten form deriveras (med termen för y=0 separat) och får på så sätt täthetsfunktionen 26

Gammafördelningen Detta är en sk teleskopsumma, dvs en summa på formen vilket har till följd att endast två termer i summan blir kvar. 27

Gammafördelningen I det allmänna fallet måste parametern α inte nödvändigtvis vara ett heltal. Täthetsfunktion, väntevärde och varians blir där gammafunktionen Γ(α) definieras via En slumpvariabel med denna täthetsfunktion sägs vara gammafördelad med parametrar α och β; Ga(α,β). 28

Uppgift 4.81 Gammafunktionen Γ(α) kan ses som den kontinuerliga motsvarigheten till (det diskreta) fakultetsbegreppet. 29

χ 2 -fördelningen Exponentialfördelningen är specialfallet Ga(1,β). Ett annat viktigt specialfall är Ga(α,2), med α=v/2 där v är ett positivt heltal. Detta är den sk χ 2 -fördelningen; χ 2 (v). Täthetsfunktion, väntevärde och varians blir 30

Betafördelningen Betrakta två oberoende gammafördelade slumpvariabler där X 1 är Ga(α,θ) och X 2 är Ga(β,θ). Utifrån X 1 och X 2 skapas en ny slumpvariabel X via Tolkning. I en poissonprocess med intensitet λ=1/θ anger först X 1 tidpunkten för den α:te händelsen. Sedan börjar vi om och låter X 2 ange tidpunkten för den β:te händelsen (dvs totalt inträffar α+β händelser). X mäter den relativa tid det tar för α händelser att inträffa. 31

Betafördelningen I det allmänna fallet måste parametrarna α och β inte nödvändigtvis vara heltal. Det gäller att där betafunktionen B(α,β) definieras via En slumpvariabel med denna täthetsfunktion sägs vara betafördelad med parametrar α och β; Beta(α,β). 32

Uppgift 4.130 Vid bestämning av väntevärden för betafördelningen används den vanliga tekniken att skriva om integranden så att det blir en täthetsfunktion för en (annan) sannolikhetsfördelning. 33

Moment E(X) kallas för det första momentet för X. Det k:te momentet för X definieras via. Då man studerar moment kring väntevärdet fås sk centralmoment för X. Det k:te centralmomentet för X definieras via. 34

Momentgenererande funktioner Låt X vara en slumpvariabel där samtliga moment existerar. Den momentgenererande funktionen för X definieras via Den momentgenererande funktionen för X är alltså en funktion av t och existerar endast då den är ändlig i en omgivning av origo. 35

Den momentengenererande funktionen ger sannolikhetsfördelningen Via den momentgenererande funktionen kan man oftast någorlunda enkelt finna momenten för en slumpvariabel X, vilket bl a innebär att E(X) och V(X) kan bestämmas. Det gäller att Den viktigaste egenskapen hos momentgenererande funktioner är emellertid att den fullständigt och entydigt bestämmer sannolikhetsfördelningen för X. Alltså; om två slumpvariabler X och Y har momentgenererande funktioner som är identiska, dvs gäller att X och Y följer samma sannolikhetsfördelning. 36

Uppgift 4.136 Låt Y vara Exp(θ). Den momentgenererande funktionen blir eftersom den sista integranden är täthet för Exp(θ/(1-θt)). 37

Uppgift 4.136 Genom att derivera m(t) finner vi nu momenten för Y. ger att ger att Detta medför att 38

Normalfördelningen En slumpvariabel X med täthetsfunktion sägs vara normalfördelad med parametrar μ och σ; N(μ,σ). Vi anser oss sedan tidigare kurser veta att normalfördelningen har ett antal trevliga egenskaper. Mha momentgenererande funktioner är det enkelt att visa att så verkligen är fallet 39

Normalfördelningen Momentgenererande funktion För att integranden ska bli en täthet för normalfördelningen måste uttrycket x 2-2μx+μ 2-2σ 2 tx skrivas om som en jämn kvadrat på formen (x-θ) 2. 40

Normalfördelningen Momentgenererande funktion Eftersom en jämn kvadrat (x-θ) 2 i utskriven form är skriver vi om det intressanta uttrycket Vi ser att det har blivit en jämn kvadrat som emellertid lämnat några resttermer. Dessa resttermer beror dock inte på x varför dom kan flyttas utanför integralen. 41

Normalfördelningen Momentgenererande funktion eftersom den sista integranden är täthetsfunktion för N(μ+σ 2 t,σ). 42

Uppgift 4.137 och 4.139 Låt Y vara N(μ,σ) med momentgenererande funktion m(t) och betrakta linjärfunktionen X=aY+b. Eftersom det för linjärfunktioner (rent allmänt) gäller att följer att det i fallet med normalfördelningen blir vilket är momentgenererande funktion för N(aμ+b, a σ). En linjärfunktion av en normalfördelad slumpvariabel är alltså även den normalfördelad. 43

Tchebyshevs olikhet I normalfördelningen är det tillräckligt med att känna μ och σ för att fullständigt känna sannolikhetsfördelningen och således kunna bestämma sannolikheter. För en godtycklig sannolikhetsfördelning kan man utifrån μ och σ enbart göra uppskattningar av sannolikheter. Tchebyshevs olikhet. Låt X vara en slumpvariabel med (ändligt) medelvärde μ och standardavvikelse σ. För varje k>0 gäller då att 44

Tchebyshevs olikhet (bevis) Variansen, σ 2, är ett väntevärde och beräknas enligt formeln Vi delar upp integralen i tre delar där vi tar hänsyn till huruvida x befinner sig närmare μ än k standardavvikelser, dvs Eftersom integranden är en kvadrat är den aldrig negativ. Tar vi bort den mittersta termen följer därmed att 45

Tchebyshevs olikhet (bevis) Fortsätter vi i samma anda inses att i dessa integraler är uttrycket (x-μ) 2 (μ-kσ-μ) 2 = (μ+kσ-μ) 2 = k 2 σ 2. Alltså gäller att Dividera båda leden med k 2 σ 2 och saken är klar. 46

Uppgift 4.150 Låt Y vara Exp(β) och bestäm För Exp(β) gäller att μ=σ=β varför vi söker Enligt Tchebyshevs olikhet ska denna sannolikhet minst vara 47