7. Kontinuerliga fördelningar En SV X är kontinuerlig om F X (x) är kontinuerlig för alla x F X (x) är deriverbar med kontinuerlig derivata för alla x utom eventuellt för ändligt många värden Som vi tidigare sagt kan fördelningsfunktionen för en SV åskådlig göras med en graf som växer kontinuerligt från till då x. Här är ett exempel.8.6-4 -2 2 4 Figur 7.: En fördelningsfunktion Exempel. lim F X(x) = x lim F X(x) = x x < f X (x) = sinx x π 2 x > π 2 Funktionen f X (x) fungerar som en sannolikhetsfördelning därför att F X (x) får vi genom sinxdx = π 2 x sin x dx = [ cosx] π 2 = ( ) = sin(t)dt = [ cost] x = cosx Håkan Strömberg KTH Syd
7.. KONTINUERLIGA FÖRDELNINGAR.8.6.6.8.2.4 Figur 7.2: En fördelningsfunktion Eftersom F X () = och F X ( π 2 ) = är motsvarande fördelningsfunktion F X(x) = cosx som har utseendet: Just den här SV har troligtvis inget självständigt liv, även om den uppfyller villkoren för en SV. Derivatan till fördelningsfunktionen F X (x) med avseende på x betecknas f X (x) och benäms frekvensfunktionen för den stokastiska variabeln X Dessa tre egenskaper gäller alltså och och x f X (t)dt f X (t)dt = P(a < X b) = F x (b) F x (a) = b a f X (t)dt Uttrycket P(X = x) är befängt för kontinuerliga fördelningar. Hur stor är sannolikheten att an spik har längden.453676 mm? Helt enkelt är P(X = x) =. Detta betyder förstås att det inte är någon skillnad mellan skrivsätten P(a < X b) och P(a < X < b) 5 5.5-4 -3-2 - 2 3 4 Figur 7.3: För att bestämma sannolikheten i samband med kontinuerliga SV handlar det alltid om ett intervall och den area som ligger mellan grafen och x-axeln inom detta intervall. I figur Håkan Strömberg 2 KTH Syd
?? ser vi den area, som motsvarar sannolikheten för att vi ska få ett observationsvärde x i intervallet [,2]. 5 5.5-4 -2 2 4 Figur 7.4: Den här arean är eller hur? Ja, nästan i alla fall eftersom vi troligtvis inte har ritat hela grafen. Om man bestämmer ett x så att arean till höger om x blir lika med ett givet tal α, α får man den så kallade α-kvartilen för fördelningen. Detta är samma sak som lösningen till x = x α till ekvationen F x (X) = α Detta är ett begrepp som vi kommer att används i senare i statistikteorin. 5 5.5-4 -3-2 - 2 3 4 5 5.5-4 -2 2 4 Till vänster har vi x -kvartilen och till höger x.75 -kvartilen. Rektangelfördelningen Om frekvensfunktionen är konstant i ett intervall [a,b] och för övrigt, sägs X ha en rektangelfördelning (uniform distribution). Eftersom arean under frekvensfunktionen ska vara får vi f X (x) = b a annars om a < x < b Synonymer är frekvensfunktion är sannolikhetsfunktion eller täthetsfunktion (engelska frequency function eller probability density). Håkan Strömberg 3 KTH Syd
7.. KONTINUERLIGA FÖRDELNINGAR om x < a x a b a x > b om a x b.5.3-2 3 4 5 6 Figur 7.5: Ett exempel Den här funktionen kommer man nära genom C-satsen s=(double) rand()/32768.; rand levererar i många system heltal i intervallet... 32768. Dividerar vi det med 32768 får vi ett tal i intervallet [,). Hur stor är sannolikheten att vi på detta sätt kommer att få ett slumptal i intervallet [3,8]? 7.. Exponentialfördelningen Frekvensfunktionen har följande utseende f X (x) = a e x a om a < x < b x < Hur ser fördelningsfunktionen ut? Vi vet nu hur vi ska få tag i den x som gäller då x. Då x < är. Eftersom arean under kurvan ska vara måste a e t a dt = e x a a e x a = Hur visar man det? Vi har ju redan F X (x) och då lim F X(x) = lim x x e x a = Håkan Strömberg 4 KTH Syd
.5.3 2 4 6 8 Figur 7.6: Kan man med hjälp av grafen fastställa a? Maple a:=statevalf[cdf,exponential[/,]](5);.393469343 b:=statevalf[cdf,exponential[/,]](7);.53446962 b-a; 99453559 Exempel 2. The exponential[alpha, a] distribution (exponential distribution) has the probability density function equal to alpha*exp(-alpha*(x-a)) if x>=a and equal to zero if x<a. Constraint: alpha is a non-negative real number. Default: a=. 7..2 Normalfördelningen Om en SV har frekvensfunktionen f X (x) = s (x m) 2 2π e 2s 2 Håkan Strömberg 5 KTH Syd
7.. KONTINUERLIGA FÖRDELNINGAR som gäller för < x < och där s > och m är givna storheter. Detta är den kanske vanligast förekommande av alla SV och betecknas N(m,s). Här några varianter..3.3.25.2.5..5-4 -2 2 4 5 6 7 8 9 2 2 22.3.25.2.5..5.8.6.4.2 5 6 7 8 9 2 2 22 65 7 75 8 85 9 95 2 I tur och ordning är visas frekvensfunktionerna. N(, ),N(8, 5), N(8, 5), N(8, 5). Kan man ha en aning om vad s och m står för? Hur är det då med fördelningsfunktionen? Den som kan skrivas x s (t m) 2 2π e 2s 2 dt Tyvärr kan inte denna F X (x) uttryckas som en funktion med hjälp av elementära funktioner. Det går med lite högre matematik, än vi bryr oss om här, att visa att arean under kurvan är. Maple a:=statevalf[cdf,normald[8,5]](65); 586552539 b:=statevalf[cdf,normald[8,5]](95);.84344746 b-a;.6826894922 Det är N(8,5) som gäller a är P(X < 65) och b är P(X < 95). b a ger då sannolikheten P(65 < X < 95) För att bestämma b a f X (x)dx behöver de flesta en tabell. Men vi som kan integrera numeriskt klarar biffen med hjälp av Simpsons formel och ett litet C-program. Håkan Strömberg 6 KTH Syd
double f(double m,double s,double x){ 2 return /(s sqrt(2 M PI)) exp( (x m) (x m)/(2 s s)); 3 } 4 5 int main(void){ 6 double x= 5.,x2=.; 7 double x,h,sum,i; 8 int nh=,s,k; 9 printf("\n"); for(x2=.;x2<=4.;x2=x2+){ sum=f(.,.,x); 2 h=(x2 x)/nh; 3 for(s=;s<nh;s++){ 4 if(s%2==) k=4; else k=2; 5 sum+=k f(.,.,x+s h); 6 } 7 sum+=f(.,.,x2); 8 sum=h sum/3; 9 printf("x=%6.3f -> %7.5f\n",x2,sum); 2 } 2 } Det här lilla programmet producerar stora delar av av det tabellverk, som många statistiker alltid måste bära med sig. Tabellen gäller för m = och s =. Vi har tidigare inte löst en generaliserad integral med hjälp av Simpson. Knepet som vi använder här, är att börja med tillräckligt stora negativa x, här 5 då f X (x) är mycket litet. Förhoppningsvis är alla tal korrekta med 4 decimaler. Problem. Använd programmet som grund för skriva en funktion i C som bestämmer sannolikheten för att ett mätvärde X ska ligga i intervallet [x,x 2 ] för givna m och s. Ett anrop p=norm(x,x2,m,s) Maple Problem 2. Den SV X har 2 + π arctanx Beräkna följande sannolikheter: P(X ), P( < X ) och P(X ). Problem 3. x < 2(x ) + x 2 3 3 x > 2 Håkan Strömberg 7 KTH Syd
7.. KONTINUERLIGA FÖRDELNINGAR Låt X vara en SV med den ovan angivna funktionen som fördelningsfunktion. Beräkna P(X < 5/3),P(X > 3/2) och P(4/3 < X < 5/3). Problem 4. Den SV X har en sannolikhetsfunktion f X (x) som för x =,,2 3 antar värdena: P(X = ) = /2,P(X = ) = /4,P(X = 2) = /8,P(X = 3) = /8 a) Hur stor är sannolikheten att X antar värdet 3? b) Hur kan man inse att f X (x) = för alla x utom för de fyra ovan angivna x-värdena? c) Hur stor är P(X > ) Problem 5. En SV X kan bara anta värdena 3,4,7,8 och 9. Vidare vet man att P(X = 3) = /3,P(X = 4) = /4,P(X = 7) = /6,P(X = 8) = /6 a) Beräkna P(X = 9). b) Beräkna F X (5). c) Beräkna sannolikheten att X antar ett udda värde. d) Beräkna P(4 X 8) e) Beräkna P(X 8). Problem 6. I en ask ligger en tvåkrona och två femöringar. Man tar upp två på måfå valda av dessa mynt. Låt X beteckna sammanlagda värdet (enhet: öre) av de upptagna mynten. a) Vilka värden kan X anta? b) Ange sannolikhetsfunktionen för X. Problem 7. Ur en urna med 4 vita och 6 svarta kulor drar man upprepade gånger en kula med återläggning mellan varje dragning. Man håller på tills man för första gången får en vit kula. Låt X beteckna antalet dragningar som resulterar i svart kula (dvs antalet misslyckade dragningar) a) Ange sannolikhetsfunktionen för X b) Beräkna P(X 3) Problem 8. En urna innehåller 4 vita och 6 svarta kulor. Man drar 3 gånger en kula med återläggning mellan varje dragning. Låt X beteckna antalet vita kulor bland de dragna kulorna. a) Ange sannolikhetsfunktionen för X b) Beräkna sannolikheten att man får fler vita kulor än svarta. Problem 9. Förutsättningarna i förra uppgiften förändras så att dragningen sker utan återläggning. Utför samma beräkningar som förut. Problem. Den SV X är Poisson-fördelad och har egenskapen att P(X = ) = /2. Beräkna P(X 2) Håkan Strömberg 8 KTH Syd
Problem. Ett visst försök ger ett utfall som kan beskrivas som en över intervallet [,] rektangelfördelad SV. Beräkna sannolikheten att man får ett försöksresultat sådant att den första siffran efter decimalkommat är udda. Problem 2. Ett svagt radioaktivt preparat sänder ut elementarpartiklar så att tidsavståndet (enhet: sekund) mellan två på varandra följande emissioner är exponentialfördelat med frekvensfunktionen f X (x) = e x Beräkna sannolikheten att ett sådant tidsavstånd är större än 2 minuter. Problem 3. Radiorör av en viss typ antages ha en livslängd X (enhet: timme) som har frekvensfunktionen f X (x) = e x Beräkna sannolikheten att ett sådant rör håller mer än 5 men ej mer än 5 timmar. Håkan Strömberg 9 KTH Syd