F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Relevanta dokument
Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Kap 3: Diskreta fördelningar

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

4.1 Grundläggande sannolikhetslära

4 Diskret stokastisk variabel

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Stokastiska signaler. Mediesignaler

SOS HT Slumpvariabler Diskreta slumpvariabler Binomialfördelning. Sannolikhetsfunktion. Slumpförsök.

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

Lektionsanteckningar 11-12: Normalfördelningen

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

F2 SANNOLIKHETSLÄRA (NCT )

4. Stokastiska variabler

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Exempel för diskreta och kontinuerliga stokastiska variabler

Övning 1 Sannolikhetsteorins grunder

Föreläsning 5, FMSF45 Summor och väntevärden

4.2.1 Binomialfördelning

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

1.1 Diskret (Sannolikhets-)fördelning

Grundläggande matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

S0005M. Stokastiska variabler. Notes. Notes. Notes. Stokastisk variabel (slumpvariabel) (eng: random variable) Mykola Shykula

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Grundläggande matematisk statistik

Föreläsning 5, Matematisk statistik Π + E

Statistiska metoder för säkerhetsanalys

Laboration med Minitab

S0005M, Föreläsning 2

Föreläsning 2, FMSF45 Slumpvariabel

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

modell Finansiell statistik, vt-05 Modeller F5 Diskreta variabler beskriva/analysera data Kursens mål verktyg strukturera omvärlden formellt

ÖVNINGSUPPGIFTER KAPITEL 9

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

Föreläsning 2, Matematisk statistik för M

SF1901: Sannolikhetslära och statistik

FÖRELÄSNING 3:

Satsen om total sannolikhet och Bayes sats

SF1901: Sannolikhetslära och statistik

Introduktion till statistik för statsvetare

Föreläsning G70 Statistik A

1.1 Diskret (Sannolikhets-)fördelning

Tentamen MVE301 Sannolikhet, statistik och risk

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

Väntevärde och varians

Matematisk statistik för D, I, Π och Fysiker

Jörgen Säve-Söderbergh

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

Matematisk statistik - Slumpens matematik

Våra vanligaste fördelningar

TMS136. Föreläsning 4

Övning 1. Vad du ska kunna efter denna övning. Problem, nivå A

Grundläggande matematisk statistik

SF1901: Sannolikhetslära och statistik

TMS136. Föreläsning 2

Några extra övningsuppgifter i Statistisk teori

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

SF1901 Sannolikhetsteori och statistik I

ÖVNINGSUPPGIFTER KAPITEL 9

Mer om slumpvariabler

Tentamen MVE301 Sannolikhet, statistik och risk

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

Kurssammanfattning MVE055

Hur måttsätta osäkerheter?

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

SF1901 Sannolikhetsteori och statistik I

Betingning och LOTS/LOTV

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 7: Punktskattningar

19.1 Funktioner av stokastiska variabler

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 12 november 2005, kl

Kapitel 5 Multivariata sannolikhetsfördelningar

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Formler och tabeller till kursen MSG830

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

SF1901: Sannolikhetslära och statistik

Kap 2. Sannolikhetsteorins grunder

Monte Carlo-metoder. Bild från Monte Carlo

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

Slumpvariabler och sannolikhetsfördelningar

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Transkript:

Stat. teori gk, ht 006, JW F5 STOKASTISKA VARIABLER (NCT 5.1-5.3, samt del av 5.4) Ordlista till NCT Random variable Discrete Continuous Probability distribution Probability distribution function Cumulative probability function Expected value Variance Standard deviation Bernoulli distribution Stokastisk variabel (slumpvariabel) Diskret Kontinuerlig Sannolikhetsfördelning Sannolikhetsfunktion Fördelningsfunktion Väntevärde Varians Standardavvikelse Bernoullifördelning 1

Stokastisk variabel En stokastisk variabel är en kvantitativ variabel vars värde bestäms av ett slumpförsök. (Annat namn: slumpvariabel) Utfallet av slumpförsöket bestämmer vilket värde den stokastiska variabeln skall anta. Innan slumpförsöket äger rum, vet vi inte vilket värde den kommer att anta. Men vi kan i förväg säga vilka som är dess möjliga värden. Exempel på stokastiska variabler: 1. Antal prickar vid ett kast med en tärning. Summan av antal prickar vid två tärningskast 3. Antal kast tills man för första gången får en sexa 4. Antal flickor i en slumpmässigt vald trebarnsfamilj 5. Längden hos ett slumpmässigt valt nyfött barn 6. Livslängden hos en slumpmässigt vald glödlampa 7. Årsinkomsten i ett slumpmässigt valt hushåll. Vilka är de möjliga värdena för dessa stokastiska variabler?

Stokastiska variabler kan vara diskreta eller kontinuerliga. En diskret stokastisk variabel kan anta ett ändligt (eller uppräkneligt oändligt) antal möjliga värden. En kontinuerlig stokastisk variabel kan anta alla värden inom ett intervall på den reella talaxeln (intervallet kan ha oändlig utsträckning). Vilka av de stokastiska variablerna i exemplet ovan är diskreta och vilka är kontinuerliga? 3

Sannolikhetsfördelning för en diskret stokastisk variabel Beteckningsprincip: Stokastiska variabler betecknas med stora bokstäver: X, Y, Z etc. Ett numeriskt värde som antas av en stokastisk variabel betecknas med motsvarande lilla bokstav: x, y, z etc. Ex.: Låt X = antal prickar vi kommer att få vid ett (ännu inte utfört) tärningskast. Nu kastar vi tärningen och får en trea. Då säger vi att den stokastiska variabeln X har antagit värdet x = 3. Eftersom slumpen bestämmer vilket värde X skall anta, så kan vi tala om sannolikheten att X antar olika värden. Vi låter P(x) beteckna slh för händelsen att den diskreta stokastiska variabeln X skall anta det numeriska värdet x, dvs. P(x) = P(X = x) 4

Funktionen P(.) kallas för den stokastiska variabelns sannolikhetsfunktion. Det måste gälla att: 0 P(x) 1 för alla x P( x) = 1 Alla x Om vi känner till sannolikheten P(x) för alla möjliga värden, x, som den diskreta stokastiska variabeln X kan anta, så säger vi att vi känner till sannolikhetsfördelningen för X. Slh-fördelningen för en diskret stokastisk variabel kan presenteras (1) i tabellform, eller () med stolpdiagram, eller (3) med en formel. Ex.: Slumpförsöket = två kast med ett mynt. Utfallsrum: {(kr,kr), (kr,kl), (kl,kr), (kl,kl)} Alla utfall antas ha lika slh, 0,5. Låt X = antal krona i de två kasten. (Forts.) 5

Utfall, O Slh, P(O) X antar värdet kr, kr 0,5 kr, kl 0,5 1 kl, kr 0,5 1 kl, kl 0,5 0 Summa 1,00 Slh-fördelningen för X blir följande, i tabellform: x P(x) 0 0,5 1 0,50 0,5 Summa 1,00 eller som stolpdiagram: 0,5 0,4 Sannolikhetsfördelningen för X P(x) 0,3 0, 0,1 0,0 0 1 x 6

Hur kan man uttrycka slh-fördelningen med en formel? Fördelningsfunktionen, F(x), är en funktion som för varje givet tal x anger slh att X skall anta ett värde mindre än eller lika med talet x, dvs. F(x) = P(X x) I exemplet ovan ser fördelningsfunktionen ut så här (komplettera bilden!): 1,0 0,8 Fördelningsfunktionen för X F(x) 0,6 0,4 0, 0,0 0,0 0,5 1,0 x 1,5,0 7

Väntevärde och varians En stokastisk variabels slh-fördelning kan (på samma sätt som en empirisk fördelning) beskrivas med hjälp av lägesmått och spridningsmått. Lägesmått: väntevärde (motsvarar medelvärde). Spridningsmått: standardavvikelse. Väntevärdet för den stokastiska variabeln X definieras som E ( X ) = x P( x) ( = µ Alla x X ) Ex.: (Forts. på föreg. ex.) X = antal krona vid två kast med ett mynt. E(X) = µ X = 0 0,5 + 1 0,50 + 0,5 = 1 Frekventistisk tolkning av väntevärde: E(X) kan tolkas som genomsnittsvärdet av X i det långa loppet. (En lång serie oberoende upprepningar av försöket. Varje gång observeras vilket värde X antar. Genomsnittet bildas av dessa värden.) 8

På analogt sätt definieras E[g(X)], när g(x) är en funktion av X: E[g(X)] = g( x) P( x) Alla x Kan tolkas som ett genomsnittsvärde av g(x) i det långa loppet. Variansen för den stokastiska variabeln X definieras som Var( X ) = E[( X µ ) ] = ( x µ σ X ( = ) X Alla x X ) P( x) Med standardavvikelsen för X menas den positiva kvadratroten ur variansen, σ X = Var(X ) Ex.: (Forts.) Variansen blir Var(X) = (0-1) 0,5 + (1-1) 0,50 + (-1) 0,5 = 0,50 = σ Forts. X 9

och standardavvikelsen blir σ X = 0,50 0,7071 Ibland lättare att beräkna variansen enligt formeln: Var(X) = E(X ) µ = X [ x p( x)] µ X Alla x Ex.: (Forts.) Variansen kan beräknas såsom Var(X) = [0 0,5 + 1 0,50 + 0,5] 1 = 0,50 Ex.: X = antalet prickar vid ett tärningskast. Värdena 1,, 3, 4, 5, 6 antas med lika slh = 1/6. E(X) = 1 (1/6) +... +6 (1/6) = 7/ E(X ) = 1 (1/6) + + 6 (1/6) = 91/6 Var(X) = E(X ) = 35/1,9 µ X = (91/6) (7/) 10

Räkneregler för väntevärde och varians Antag att vi redan känner till väntevärde och varians för en stokastisk variabel X. Om nu den stokastiska variabeln Y är definierad som en linjär funktion av X, så kan vi lätt beräkna väntevärde och varians för Y. Om Y = a + b X, så gäller att E(Y) = E(a + b X) = a + b E(X) Var(Y) = Var(a + b X) = b Var(X) Ex.: (=NCT, Ex. 5.5, sid. 146) X = antal arbetsdagar i ett framtida projekt. X antas vara en stokastisk variabel med följande sannolikhetsfördelning: x (= antal arb.-dagar) 10 11 1 13 14 P(x) 0,1 0,3 0,3 0, 0,1 Forts. 11

Kostnaden för projektet består av dels en fast kostnad på $5 000, dels en arbetskostnad på $900 per arbetsdag. Beräkna väntevärde, varians och standardavvikelse för projektets totalkostnad. Med användning av givna definitioner av väntevärde och varians får vi (visa detta!) E(X) = 11,9 och Var(X) = 1,9 Låt nu Y = totalkostnaden. Eftersom så blir Y = 5 000 + 900 X E(Y) = E(5 000 + 900 X) = 5 000 + 900 E(X) = 5 000 + 900 11,9 = 35 710 Var(Y) = Var(5 000 + 900 X) = 900 Var(X) = 900 1,9 = 1 044 900 σ Y = Var( Y ) = 1044 900 = 10,0 1

Ex.: Låt X vara en stokastisk variabel med väntevärde µ X. Av räknereglerna ovan följer (visa!) att E(X µ X ) = 0 Ex.: Standardiserad stokastisk variabel. Låt X vara en stokastisk variabel med väntevärde µ X och varians σ X. Vi bildar nu den standardiserade variabeln Z såsom Z = X µ X σ X Av räknereglerna följer (visa!) att E(Z) = 0 och Var(Z) = 1. En på detta sätt standardiserad stokastisk variabel har alltså alltid väntevärde = 0 och varians = 1. 13

Bernoullifördelningen Vi ska se på några olika slh-fördelningar som brukar användas som sannolikhetsmodeller i vissa typiska situationer. Den första är Bernoullifördelningen. Formell definition: En stokastisk variabel X har en Bernoullifördelning, om den antar endast värdena 0 och 1, med slh 1-P respektive P. (0 P 1) Sannolikhetsfördelningen ser alltså ut så här: x P(x) 0 1-P 1 P För en Bernoullifördelad stokastisk variabel X gäller att E(X) = P Var(X) = P(1-P) Visa! 14

En typisk användning av Bernoullifördelningen är följande: Vi har ett slumpförsök där vi bara är intresserade av ifall en viss händelse A inträffar eller ej. Låt P(A) = P och P( A ) = 1-P. Låt X vara en indikatorvariabel för händelsen A. Dvs. om A inträffar, så blir X = 1, och om A inte inträffar, så blir X = 0. Alltså är X en stokastisk variabel som anger om händelsen A inträffar eller ej. Då har X en Bernoullifördelning med P(X=1) = P. (I många böcker, t.ex. NCT, talar man om A som Success och A som Failure. Men man ska inte tolka dessa termer alltför bokstavligt.) Observera att E(X) = P = P(A) 15

Ex.: Slumpförsök = ett kast med en tärning. Låt X vara indikatorvariabel för händelsen att få sexa. Dvs. X = 0 1 om vi inte får en sexa om vi får en sexa Då har X en Bernoullifördelning med P = 1/6, och E(X) = P = 1/6 Var(X) = P(1-P) = (1/6) (5/6) = 5/36 16