FÖRELÄSNING 3: 26-4-3 LÄRANDEMÅL Fördelningsfunktion Empirisk fördelningsfunktion Likformig fördelning Bernoullifördelning Binomialfördelning Varför alla dessa fördelningar? Samla in data Sammanställ data Gissa modell för datan Testa modellen Använd modellen för att förutsäga information om ny data oempirisk fördelningsfunktion ofördelningsfunktion för olika fördelningar REPETITION Vi avslutade förra föreläsningen med att konstatera att om vi vet vad P(X = i) är för alla i k så kan vi räkna ut allt om X med hjälp av P(X k), P(X = k) P(X k) P(X > k) = P(X k) P(X < k) = P(X k) P(X = k) P(X k) = P(X < k) = P(X k) + P(X = k) P(k X l) = P(X l) P(X k) + P(X = k) Etc. FÖRDELNINGSFUNKTION Definition, Fördelningsfunktionen F till slumpvariabeln X ges av, F(k) = F X (k) = P(X k)
Exempel, Om vi har en slumpvariabel X: antalet ögon vi får vid ett tärningskast, så kommer sannolikhetsfunktionen P(X = k) ges av, P(X = ) = P(X = 2) = P(X = 3) = P(X = 4) = P(X = 5) = P(X = 6) = 6 P(X = k) = 6 för alla kε{, 2, 3, 4, 5, 6} P(X = k) = för alla andra värden på k För att få fram värdena på fördelningsfunktionen behöver vi bestämma P(X k) för relevanta k P(X ) = P(X = ) = 6 P(X 2) = P(X = eller X = 2) = P(X = ) + P(X = 2) = 6 + 6 = 3 P(X 3) = P(X = ) + P(X = 2) + P(X = 3) = + + = 6 6 6 2 P(X 6) = Generellt gäller alltså att denna fördelningsfunktion följer, F(k) = P(X k) = k 6 då k=, 2, 3,, 6 Vi kan rita sannolikhetsfunktionen P(X = k) och fördelningsfunktionen P(X k), Sannolikhetsfunktionen /6 2 3 4 5 6 /6 Fördelningsfunktionen 2 3 4 5 6 7 LIKFORMIG FÖRDELNING Vi kan nu definiera vår första modell! Definition, Om P(X = k) = antal möjliga utfall eller att X har en likformig fördelning. för alla möjliga utfall k så säger vi att X är likformigt fördelad
Antal observationer k Antal utfall Andel utfall Andel utfall Exempel, Tänkt att vi utför följande försök och beräkningar. ) Kastar en tärning upprepade gånger och får följande stapeldiagram efter 6 kast. 2) Normaliserar genom att dela antalet utfall för varje stapel med det totala antalet kast. 3) Ser vad som händer om vi ökar storleken på stickprovet. 5 4 3 2 2 3 4 5 6 /6 2 3 4 5 6 ) 2) 3) /6 2 3 4 5 6 Normalisera Öka stickprovsstorleken (n ) För stora stickprov kommer stapeldiagrammet följa samma form som P(X = k). Vad gäller för fördelningsfunktionen F(k) = P(X k)? Så här blir det för samma data som ovan? 6 4 2 8 6 4 2 2 3 4 5 6 ) 2) 3) /6 2 3 4 5 6 7 /6 2 3 4 5 6 7 Normalisera Öka stickprovsstorleken (n ) Graf 2) ovan kallar vi för empirisk fördelningsfunktion, och den beskriver hur vårt stickprov ser ut. Om vi tänker oss att vi tar ett oändligt stort stickprov, då får vi graf 3) som är fördelningsfunktionen F(k) Under resten av dagens föreläsning kommer vi att gå igenom ett antal olika namngivna fördelningar. Alla dagens fördelningar är diskreta, alltså kommer X bara kunna anta heltalsvärden. Oavsett vilken fördelning vi tittar på måste fördelningsfunktionen uppfylla följande kriterier: F(k) för alla k F(k) är växande F(k) då k, och F(k) då k
BERNOULLIFÖRDELNING Definition, Låt X vara en slumpvariabel sådan att sannolikhetsfunktionen P(X = ) = p och P(X = ) = p, där p. Vi säger att X är Bernoullifördelad med parameter p, och skriver, X~Bernoulli(p) Fördelningsfunktionen ges av, om k < F(k) = P(X k) = { p, om k <, om k Sannolikhetsfunktion Fördelningsfunktion p -p -p - 2-2 Exempel, X: Du vinner på lotto. Parametern p är sannolikheten för vinst. X: En komponent går sönder. Parametern p är sannolikheten haveri. X: Regn imorgon. Parametern p är sannolikheten för regn. BINOMIALFÖRDELNING Ofta har man fler än en Bernoullifördelad slumpvariabel, t.ex., X i : Skruv i är defekt. Då anger summar X = X + X 2 + X 3 + X 4 hur många av 4 skruvar som är trasiga X i : Det regnar dag i, där dag är måndag, dag 2 tisdag, osv. Då anger summan X = X + X 2 + + X 7 hur många dagar under en vecka det regnar. Binomiala egenskaper,. Experimentet består av ett fixerat antal, n, försök. Varje försök kan antingen klassas som vinst eller förlust. 2. Försöken är identiska och oberoende av varandra. Sannolikheten för vinst i varje försök, p, är samma för alla försök i experimentet. 3. Den stokastiska variabeln X betecknar antalet vinster av de n försöken.
Definition, Om X är en summa av n stycken Bernoullifördelade slumpvariabler, alla med samma parameter p, så säger vi att X är binomialfördelad med parametrar n och p och skriver, X~Binomial(n, p) Sannolikhetsfunktionen ges av, P(X = k) = ( n k )pk ( p) n k, för k =,, 2,, n Fördelningsfunktionen ges av tabell. Hur kommer man fram till detta uttryck för sannolikhetsfunktionen? (Ej på tentan!) Exempel för att ni skall förstå de olika delarna av sannolikhetsfunktionen för binomialfördelningen, X: antalet skruvar som går av i ett stresstest. Totalt testas n = 3 skruvar och sannolikheten att en skruv går av är p =.. Vi kan anta att skruvarnas prestanda i testet är oberoende av varandra och har alltså, X~Binomial(3,.) Säg att vi vill veta vad sannolikheten är att exakt skruv går av, alltså P(X = ). Detta kan ske på 3 olika sätt: A. Skruv går av, skruv2 och skruv3 klarar sig B. Skruv klarar sig, skruv2 går av, och skruv3 klarar sig C. Skruv och skruv2 klarar sig, och skruv3 går av Eftersom resultaten för de olika skruvarna är oberoende av varandra blir sannolikheten för händelse A följande, P(S går av och S2 och S3 klarar sig) = = P(S går av)p(s2 klarar sig)p(s3 klarar sig) = =. (.) (.) =. (.) 2 = p ( p) 2 Sannolikheten för händelse B och C blir samma som för händelse A. Vad blir den totala sannolikheten för att exakt en skruv går av? Eftersom händelserna A, B, och C är disjunkta kan vi addera de individuella händelsernas sannolikheter för att få den totala sannolikheten. P(exakt en skruv går av) = P(A, B eller C inträffar) = P(A) + P(B) + P(C) = = 3. (.) 2 = = ( 3 ). (.) 3 = P(X = ) = ( n k )pk ( p) n k = P(X = k) ( n k ) utläses n över k och är inte en kvot. Den beskriver på hur många olika sätt man kan välja k element ur en mängd med totalt n element.
I denna kurs kommer vi använda oss av en tabell för att slå upp olika värden av ( n ). Den finns att ladda k ner på kurshemsidan. Fördelningsfunktionen F(x) = P(X x) är också omständlig att räkna med, så värden för denna kommer vi också slå upp i tabell.,8,6,4,2 Sannolikhetsfunktion n = p =.5-2 3 4 5 6 7 8 9,8,6,4,2 Fördelningsfunktion n = p =.5-2 3 4 5 6 7 8 9