FÖRELÄSNING 4: 26-4-9 LÄRANDEMÅL Poissonfördelning Kontinuerliga slumpvariabler Kontinuerlig uniform fördelning Exponentialfördelning Samla in data Sammanställ data Gissa modell för datan Testa modellen Använd modellen för att förutsäga information om ny data o för fler fördelningar oen POISSONFÖRDELNING Poissonfördelningar dyker ibland upp när man räknar antalet saker/event av något slag som inträffar under ett mätintervall t.ex. en tidsperiod eller en sträcka. Poissonegenskaper,. Eventen inträffar oberoende av varandra 2. Inga event kan inträffa exakt samtidigt 3. Antalet event X som inträffar under ett mätintervall är proportionellt mot intervallets längd Antalet kunder som kommer in i en butik under en rusningstimme Antalet bilar som passerar en bro under en timma Antalet sprickor längs en betongpelare
Om en diskret slumpvariabel X uppfyller ovanstående egenskaper är den Poissonfördelad med parameter λ, och vi skriver, X~Poisson(λ) Sannolikhetsfunktionen ges av, P(X = x) = λx e λ en ges av tabell. x! Parametern λ anger hur många saker som i snitt inträffar under det mätintervall man tittar på. Sannolikhetsfunktion - 2 3 4 5 6 7 8 9 2 3 4 5 6 7 8 9 KONTINUERLIGA SLUMPVARIABLER Alla fördelningar vi gick igenom förra gången var diskreta, alltså de möjliga utfallen var endast några eller alla heltal. Sannolikhetsfunktionen angav sannolikheten att X antar ett specifikt värde, P(X = x), och är bara punkter i en graf. en angav sannolikheten att X antar ett värde mindre eller lika med ett specifikt värde, F(x) = P(X x), och är alltid en trappstegsfunktion. Om fördelningsfunktionen F(x) till en slumpvariabel X är: En kontinuerlig funktion så säger vi att X är en kontinuerlig slumpvariabel En trappfunktion så säger vi att X är en diskret slumpvariabel När vi tittar på kontinuerliga slumpvariabler så tänker vi oss att sannolikheten att X antar ett specifikt värde alltid är noll, P(X = x) =. Varför? X: Lufttemperaturen vid en husvägg. Det är känns intuitivt att sannolikheten för att temperaturen är exakt 8. C och inte en decimal mer eller mindre, alltså P(X = x), är extremt väldigt låg.
Sannolikhetsfunktionen P(X = x) är därför sällan intressant för kontinuerliga X, utan istället fokuserar vi på händelser när X hamnar inom ett intervall, t.ex. P(a X b). P(a X b) = P(X b) P(X < a) = P(X b) P(X a) + P(X = a) = Detta påminner om integraler! b f(x)dx = F(b) F(a) a = F(b) F(a) + = F(b) F(a) Om det finns en funktion f(x) sådan att fördelningsfunktionen kan skrivas som, F(x) = x f(x)dx så säger vi att f(x) är en frekvensfunktion till X. Vi kan alltså derivera fördelningsfunktionen för att få fram frekvensfunktionen för X, F (x) = f(x) KONTINUERLIG UNIFORM FÖRDELNING OBS! Boken kallar denna fördelning för rektangelfördelning. Vi säger att X är uniformt fördelad på intervallet [a, b], och skriver, X~Unif(a, b) en ges av, F(x) = {, om x < a x a, om x > b en ges av, f(x) = {, annars Låt X: hur långt in en m lång vajer går av vid ett stresstest. X~Unif(,) en ser då ut på följande sätt,, om x < F(x) = { x, om x, om x >,5-2
Sannolikheten att brottet sker någonstans mellan punkt a och b på vajern ges av, P(a < X b) = P(X b) P(X a) = = F(b) F(a) = b a, då a b Sannolikheten beror alltså endast på intervallets längd! Alla intervall som ) ligger inom - och 2) har samma längd, är lika sannolika för X att hamna i Hur ser sannolikhetsfunktionen ut för en kontinuerlig uniform slumpvariabel för a x b? P(X = x) = P(X x) P(X < x) = = P(a X x) P(a X < x) = = (x a) (x a) = För kontinuerliga slumpvariabler är inte P(X = x) ett bra sätt att beskriva X på, som vi konstaterade ovan. Låt oss istället undersöka hur frekvensfunktionen ser ut, F(x) =, om x < a f(x) = F (x) =, om x < a F(x) = x a f(x) = F (x) = F(x) =, om x > b f(x) = F (x) =, om x > b Alltså ges frekvensfunktionen för en kontinuerlig uniform slumvariabel f(x) = {, annars X av,,5 a= b= - 2 EXPONENTIALFÖRDELNING Poissonfördelningen hänger ihop med exponentialfördelningen på följande sätt. Låt X: antalet olyckor vid en fabrik på ett år, och anta att det sker i snitt 5 olyckor på ett år. Alltså är parametern λ = 5 och vårt mätintervall är år. X~Poisson(5) Tiden T från det att vi börjar mäta tills det att första olyckan inträffar är exponentialfördelad.
Om en slumpvariabel T är exponentialfördelad beror den av parameter λ, och vi skriver, T~Exp(λ) en ges av, F(t) = P(T t) = e λt en ges av, f(t) = λe λt Om vi har en Poissonprocess där det i snitt inträffar λ saker per tidsenhet, så är den förväntade tiden T mellan två händelser, alltså anger inversen av parametern λ förväntad tid mellan två händelser. λ Vi kan se hur fördelningsfunktionen hänger ihop med frekvensfunktionen för exponentialfördelningen, f(t) = d dt F(t) = d dt ( e λt ) = e λt ( λ) = λe λt 2 3 4 5 6 7 8 9 2,5,5-2 3 4 5 6 7 8 9 SAMMANFATTNING FÖRDELNINGAR Diskret Kontinuerlig Fördelning Parametrar Sannolikhetsfunktion P(X = x) Diskret likformig Bernoulli Binomial n, antal möjliga utfall (a, b), min-/maxvärde p, sannolikhet för X = n, antal försök p, sannolikhet för vinst Poisson λ, snittförekomst λ x e λ Kontinuerlig uniform n f(x) = F (x) - x a+ F(x) = P(X x) P(X = ) = p - p, om x < ( n x )px ( p) n x - Tabell (a, b), min-/maxvärde - x! - Tabell x a Exponential λ, snittförekomst - λe λx e λx n