och sannolikhetsfördelningar Föreläsning 4 Sannolikhet och Statistik 5 hp Fredrik Jonsson April 2010
Översikt 1. Verklighetsanknutna exempel. Definition relativt utfallsrum. 2. Sannolikhetsfördelningar Koppling till slumpvariabler. Diskret/kontinuerlig. Fördelnings-, sannolikhets- och täthetsfunktion. 3. Diskret/kontinuerlig. 4. Sammanfattning av viktiga formler
Två exempel I en marknadsundersökning i ett köpcentrum vill man tillfråga förbipasserande som har småbarn. Antalet individer som passerar innan första småbarnsföräldern kan betraktas som en slumpvariabel. Detta antal är per definition heltalsvärt ( 0). Vid ett gruvfält borras hål på jämnt utspridda platser och man borrar tills halten ädelmetall överstiger 0.001 g/kg berg. Djupet som behöver borras i ett specifikt hål kan betraktas som en slumpvariabel som antar positiva värden. Eftersom i princip alla positiva tal kan antas sägs slumpvariabeln vara kontinuerlig.
Allmän beskrivning Slumpvariabel = stokastisk variabel. Betecknas X, Y, Z,..., X 1, X 2, X 3... Bakgrund Kvantitativa slumpförsök. Utfallen i utfallsrummet ger var för sig upphov till något man kan mäta eller räkna.
Definition En stokastisk variabel är en reellvärd funktion definierad på ett utfallsrum, dvs. X : Ω R X (u) sägs vara observationen motsvarande utfallet u. Genom sannolikhetsmåttet P kan man uttala sig om troligheten för klasser av observationer (=troligheten för de utfall som leder till observationerna). Ex: P(X = 0) sannolikheten att X är 0, P(X > 0) sannolikheten att X är positiv Till en slumpvariabel hör på så sätt en fördelning; ett sannolikhetsmått med R som utfallsrum. Man säger att två slumpvariabler har samma (sannolikhets)fördelning om A, P(X A) = P(Y A)
Hur illustrera fördelningar?
För det mesta bortser man från utfallsrummet och fokuserar på fördelningar (beroendestrukturer genom flerdim. fördelningar). Slumpvariabel = sannolikhetsfördelning? En slumpvariabel är inte ekvivalent med dess fördelning: Flera slumpvariabler kan definieras på samma utfallsrum. Beroendestrukturer mellan skilda slumpmässiga storheter. Fördelningen anger troligheten för alla olika typer av observationer relativt en isolerad slumpvariabel.
Kort sammanfattning Slumpmässig storhet, Slumpvariabel, Stokastisk variabel, X, Y, Z. Regelbunden kvantitativ variation. Som man kan uttala sig mer eller mindre precist om. Man räknar på fördelningar. Exempelvis Vad är sannolikheten att X är positiv? Vilket är X och Y :s genomsnittliga värden? Har vi större variation/osäkerhet i storheten X än i storheten Y? Är X och Y oberoende? Är X och Y starkt beroende?
Fördelningsfunktion F X (x) = P(X x), x R Karaktäriserar fördelningen för X. Antar värden mellan 0 och 1. Ickeavtagande i x. Observera P(x < X y) = F (y) F (x)
Diskret fördelning X antar värden x 1, x 2, x 3,... Man kallar p(k) = P(X = x k ) för sannolikhetsfunktionen. F (x) = P(x < X y) = p(k) k: x k x k: x<x k y p(k)
Kontinuerlig fördelning X antar värden över ett kontinuum. Den kontinuerliga motsvarigheten till sannolikhetsfunktionen p är täthetsfunktionen f. F (x) = P(x < X y) = x y x f (z) d(z) f (z) d(z) = F (y) F (x) Obs: Sannolikheten för specifika observationer är alltid 0.
Sannolikhetsmassan jämnt utspridd över de möjliga observationerna.
Repetition: funktioner Fördelningsfunktion Betecknas för det mesta F. Används inte så ofta i illustrativa syften. Huvudsyte: systematiskt räknande på sannolikheter. Sannolikhetsfunktion Betecknas för det mesta p. Diskret fördelning. Vilka värden som kan antas och med vilka sannolikheter Används illustrativt. Täthetsfunktion Betecknas för det mesta f. Kontinuerlig fördelning. Den kontinuerliga motsvarigheten till sannolikhetsfunktionen. Används illustrativt.
Repetition: formler Allmänt F (x) = P(X x), F (y) F (x) = P(x < X y) Diskret F (x) = p(k), F (y) F (x) = p(k) k: x k x k: x<x k y Kontinuerlig F (x) = x F (x) = f (x), f (z) dz, F (y) F (x) = y x f (z) dz
Övningsuppgift En slumpmässigt vald punkt delar intervallet [0, 2] i två delar. Låt den ena delen vara basen i en rektangel och den andra vara höjden i samma rektangel. Beräkna sannolikheten för att arean av rektangeln är mindre än 0.5.