Föreläsningsmnus i mtemtisk sttistik för lntmätre, veck 3 och 4 HT07 Bengt Ringnér September 5, 2007 Inledning Dett är preliminärt undervisningsmteril. Synpunkter är välkomn. 2 Stokstisk vribler En stokstisk vribel är ett slumpmässigt försök där resulttet är ett eller fler tl. Iblnd, t. ex. när mn räknr kombintorik, är det lämpligt tt betrkt den som en funktion från ett utfllsrum till tllinjen. Om försöket går ut på tt räkn något, klls vribeln diskret, medn den klls kontinuerlig om mn mäter något vrvid resulttet blir ett reellt tl. 2. Diskret stokstisk vribler 2.. Likformig fördelning Här hr ll värden smm snnolikhet. Exempel är tärningskst. Mn skriver P(X = ) = /6, P(X = 2) = /6, etc., där X betecknr resulttet v försöket tt kst en tärning och räkn ntlet prickr. 2..2 Binomilfördelning Här utgår mn från ett försök som kn utfll på två sätt, kn uppreps fler gånger under smm betingelser och
där upprepningrn är oberoende v vrndr. Mn gör ett givet ntl, n, försök som hr en snnolikhet p tt utfll på en sättet och räknr ntlet sådn utfll. Det kn vr ntlet dgr mn får punktering när mn cyklr till skoln, ntlet sexor vid tärningskst eller ntlet kron vid slntsingling. Mn brukr benämn utfllen som lyckde och misslyckde eller 0 och och räkn ntlet lyckde resp. ntlet ettor. Mn sätter q = p. För tt beräkn snnolikheter börjr vi med specilfllet tt n = 3. Vi hr då följnde möjligheter: X = 0 X = X = 2 X = 3 000 snnolikhet qqq 00 pqq 00 qpq 00 qqp 0 ppq 0 pqp 0 qpp ppp. Dett ger, eftersom det inte spelr någon roll i vilken ordning p och q multiplicers ihop, P(X = 0) = q 3, P(X = ) = 3pq 2, P(X = 2) = 3p 2 q, P(X = 3) = p 3. Den llmänn formeln är där och n! = P(X = k) = ( ) n = k ( ) n p k q n k k n! (n k)!k! { 2... n om n =,2,... om n = 0 Uttrycket n över k får mn frm med kombintorik. Det är lik med ntlet sätt tt tt välj ut k pltser tt sätt ettorn på. Välj först en plts. Dett kn görs på n sätt. Till vrt och ett v dess finns n sätt tt välj plts näst gång. Antlet kombintioner är nu n(n ), men eftersom 2
det inte spelr någon roll vilken ordning pltsern väljs, kn 2 pltser väljs på n(n )/2 sätt. Alltså ( ) ( ) n n n(n ) n! = n, = = 2 2 (n 2)!2!. Genom tt fortsätt i smm stil får vi ( ) n n(n )(n 2) = 3 2 3 = n! (n 3)!3!, osv. Slutligen gäller ( ) n = 0 ( ) n =, n eftersom mn br hr en möjlighet. Benämningen binomilfördelning kommer från binomilteoremet i mtemtiken; ( + b) 2 = 2 + 2b + b 2, osv. och llmänt (+b) n = n +n n b+ ( + b) 3 = 3 + 3 2 b + 3b 2 + b 3, ( + b) 4 = 4 + 4 3 b + 6 2 b 2 + 4b 3 + b 4, n(n ) 2 = n 2 b 2 n! +...+ (n k)!k! n k b k +...+b n = n ( ) n n k b k, k som mn får frm just genom tt räkn ntlet ordningsföljder när mn multiplicerr ihop n k stycken :n och k stycken b:n. I specilfllet = q och b = p får vi n P(X = k) = n ( ) n p k q n k = (q + p) n = n =, k så summn v snnolikhetern för ll möjlig utfll är ett, vilket den måste vr. Slutligen en inledning till begreppet väntevärde, eller medelvärde i det lång loppet. Vid till exempel tärningskst säger teorin tt mn i det lång loppet kommer tt få sex i /6 v fllen. I ett mindre ntl försök brukr det bli ungefär så; om mn gör t. ex. 60 kst är det rimligt tt giss på 3
0 sexor. Dett klls väntevärde. Väntevärdet för en binomilfördelning är tydligen np. I ett senre kpitel skll vi inför en mtemtisk definition v väntevärdet tillsmmns med vrins och stndrdvvikelse som hr tt gör med hur mycket utfllet brukr vvik från väntevärdet, ntingen dett sker uppåt eller nedåt. 2..3 Poissonfördelning Denn nvänds i situtioner som kn tänks beskrivs v en binomilfördelning, men där br väntevärdet, dvs. np, är känt och inte n och p seprt, mn vet br tt n är mycket stort. Den kn också nvänds som pproximtion v binomilfördelningen. Som exempel kn vi t trfikräkning; under en tiominutersperiod räknr mn ntlet fordon som psserr en given punkt. Dett är den stokstisk vribeln X. Trfikintensiteten nts vr 2.45 fordon per minut, dvs i det lång loppet kommer det i medeltl 2.45 fordon per minut. Väntevärdet för ntlet fordon under tiominutersperioden är lltså 24.5. Eftersom trfikintensiteten är gnsk låg behöver bilrn inte vänt på vrndr och mn kn resoner så här: Det finns ett mycket stort ntl bilr som vr och en hr liten snnolikhet tt psser under mätperioden. Eftersom trfiken är gles kn mn räkn med tt de är oberoende v vrndr. Dett skulle innebär tt X är binomilfördeld med np = µ = 24.5, dvs. p = µ/n och q = µ/n. Låt nu n gå mot oändligheten och utnyttj stndrdgränsvärden och lim n ( + n) n = e 2.78288 ( lim + x n = e n n) x, (som blnd nnt nvänds vid ränteberäkningr). Dett ger ( P(X = 0) = lim µ n = e n n) µ, ( P(X = ) = lim nµ µ ) n = µe µ, n n }{{ n } ( µ/n) n /( µ/n) }{{} osv. Vi fördjupr oss inte i dett utn skriver upp den llmänn formeln P(X = k) = e µµk k!, k = 0,,2,.... 4
Noter också tt P(X = k) = e µµk k! = enligt någon Mc-Lurin-utveckling, som mn kn sväv i lycklig okunnighet om i denn kurs. I situtioner som den ovn hr mn exkt poissonfördelning. Men resonemnget ger också tt mn kn pproximer binomilfördelningen med poissonfördelningen om n är någorlund stort i förhållnde till p. Dett kn underlätt beräkningr. Mn hr kommit frm till tt pproximtionen är hyfsd (det beror nturligtvis på vilken noggrnnhet mn vill h) om p 0.. 2..4 Geometrisk fördelning Mn utgår från smm försök som i binomilfördelningen, men räknr ntlet nollor innn mn får en ett. Till exempel ntlet dgr i sträck mn kn cykl till skoln utn tt få punktering. Nu gäller P(X = 0) = p, P(X = ) = qp, P(X = 2) = q 2 p, etc., dvs. P(X = k) = q k p, k = 0,,2,.... Om mn räknr med det sist försöket också, klls det en ffg-fördelning efter för först gången. Om Y = X +, är lltså Y ffg-fördeld och P(Y = ) = p, P(Y = 2) = qp, P(Y = 3) = q 2 p, etc., dvs. P(Y = k) = q k p, k =,2,3,.... Som kontroll konstterr vi tt P(X = k) = P(Y = k) = k= enligt formeln för geometrisk seriens summ. Snnolikheten är lltså noll tt mn ldrig kommer till slut. Vi går inte in på filosofisk resonemng kring dett, utn konstterr br tt i prktiken kn mn lugnt räkn med tt förr eller senre få punktering (skulle jg h fel på den punkten kommer det ldrig tt märks). 5
Slutligen något om väntevärdet. Om snnolikheten tt få punktering är, säg, 0., kommer mn i det lång loppet tt få punktering en tiondel v dgrn, vilket är smm sk som tt det är i medeltl tio dgr melln punkteringrn. Enligt dett resonemng är väntevärdet för en ffgfördelning /p, och /p = q/p för en geometrisk, vilket kommer tt vis sig stämm med teorin senre. 2..5 Allmänt Funktionen som ger P(X = k) klls snnolikhetsfuntionen, på engelsk probbility mss function, pmf, i Mtlb pdf, för den stokstisk vribeln X och beteckns p X. I de olik fllen ovn hr vi { /6 om k =,2,3,4,5,6 p X (k) = 0 nnrs, p X (k) = ( ) n p k q n k, k k = 0,,...,n, p X (k) = e µµk k!, k = 0,,2,..., och så vidre. Det är underförstått tt funktionen är noll för de k-värden som inte finns med i formeln. Vilken fördelning som mn nvänder beror på smmnhnget. Det finns fler snnolikhetsfunktioner än de som gåtts igenom ovn. Mn kn h vilken funktion som helst br den uppfyller 0 p X (k) för ll k, och p X(k) =. Det vnlig är tt mn med teoretisk resonemng kommer frm till en formel som innehåller okänd prmetrr, t ex µ. Metoder tt sktt prmetrrn från dt och metoder tt kontroller tt funktionsuttrycket är förenligt med observtioner kommer i ndr delen v kursen. 2.2 Kontinuerlig stokstisk vribler Här kn mn inte tl om snnolikheten för enskild värden; snnolikheten är noll tt få 0.0000...,.3400000..., π eller 2 med ll decimler rätt i ll oändlighet. Däremot kn mn tl om snnolikheten tt hmn i ett intervll melln och b. 6
2.2. Likformig fördelning, eller rektngelfördelning Istället för tt kst tärning kn vi tänk oss tt snurr en penn och noter vinkeln, mätt i grder, när den stnnr. Om mn hr br snurr på pennn från börjn är det rimlig tt ll värden melln 0 och 360 är lik snnolik i den meningen tt intervllen 0, 2,..., 359 360 hr snnolikhet /360. Motsvrnde gäller om mn delr in i tiondels grd, hundrdels grd, osv. Alltså P( < X < b) = b 360. Medelvärdet i det lång loppet, dvs. väntevärdet, är 80. 2.2.2 Exponentilfördelning Dett är den kontinuerlig motsvrigheten till den geometrisk fördelningen; i vrje ögonblick kn någonting inträff oberoende v hur lång tid som gått, och mn registrerr tiden tills dett sker. Om mn räknr tiden i hel dgr, hel timmr, hel minuter, etc, får mn en geometrisk fördelning, om mn inte vrundr blir det en exponentilfördelning. Om snnolikheten för händelsen (t ex punktering) i ett litet intervll är λ gånger intervllängden, kn mn efter en del gränsövergångr komm frm till P( < X < b) = b λe λx dx. Dett kn mn jämför med geometrisk fördelningens P( X b) = b q k p om mn tänker på tt q k = e k log q, vrvid log q, som är negtivt, svrr mot λ och p svrr mot λdx. Mn brukr inför µ = /λ, vrvid P( < X < b) = b k= µ e x/µ dx, och µ är väntevärdet v X, vilket verkr rimligt om mn tänker på tt väntevärdet v en ffgfördelning är /p. 7
2.2.3 Normlfördelning Kommer i särskilt vsnitt senre. Här gäller 2.2.4 Allmänt P( < X < b) = b 2πσ e (x µ)2 /2σ 2 dx. Integrnden klls (snnolikhets)täthetsfunktion, på enelsk probbility density function, pdf, och beteckns med f X. I fllet likformig fördelning melln A och B gäller så P( < X < b) = b b B A = f X (x) = För exponentilfördelning är B A dx, { B A om A x B 0 nnrs. f X (x) = µ e x/µ, x > 0, underförstått tt f X är noll för negtiv x, lterntivt tt den br är definierd för värden som X kn nt, dvs positiv. Som täthetsfunktion kn mn h vilken funktion som helst som uppfyller f X (x) 0 för ll x, och f X(x)dx =, lterntivt B A f X(x)dx = om X br kn nt värden melln A och B. Observer tt funktionen mycket väl kn vr större än ett. Det bör också påpeks tt den skll h någon egenskp, t ex kontinuitet, som gör tt den är integrerbr. 2.3 Fördelningsfunktion Snnolikhetsfunktionen och täthetsfunktionen tlr om hur den totl snnolikheten ett fördelr sig på enskild tl, resp. enligt ren under funktionskurvn. Ett nnt sätt tt nge fördelningen är tt nvänd fördelningsfunktionen. Tg som exempel exponentilfördelningen. P( < X < b) = b µ e x/µ dx = [ e x/µ] b = e /µ e b/µ 8
enligt den vnlig metoden med primitiv funktion. Primitiv funktion som brukr beteckns med F i mtemtiken är bestämd så när som på en integrtionskonstnt; vi hde lik gärn kunnt nvänd t ex 8 e x/µ. Fördelningsfunktionen för en kontinuerlig stokstisk vribel är ett specilfll v primitiv funktion, nämligen Dett ger F X (x) = För exponentilfördelningen får vi x f X (s)ds. P( < X < b) = F X (b) F X (), 0 P(X < b) = F X (b) P(X > ) = F X (). F X (x) = 0ds + }{{} kn hopps över Nu blir snnolikhetsberäkningen P( < X < b) = x 0 b µ es/µ ds = e x/µ. µ e x/µ dx = = F X (b) F X () = ( e b/µ ) ( e /µ ) = e /µ e b/µ. Eftersom F X är ett vl v primitiv funktion till f X gäller nturligtvis f X (x) = F X (x). För normlfördelningen kn mn inte räkn ut primitiv funktion nlytiskt, utn dett måste görs numeriskt. I boken tbell finns dett i fllet µ = 0 och σ =. I ett senre vsnitt skll vi gå igenom hur mn kn få övrig fll ur dett. Om den stokstisk vribeln är kontinuerlig spelr det ingen roll om mn hr < eller i snnolikheten i vänsterledet. Är den diskret blir det däremot skillnd: P( X b) = b P(X = k) = k= b p X (k) p X (k), 9
P( < X b) = b k=+ P(X = k) = b p X (k) p X (k), osv. För tt räkn ut dett utn tt behöv räkn ut vrje term och summer, kn mn nvänd fördelningsfunktionen, som, när x är heltl, ges v x F X (x) = p X (k). För binomilfördelningen och poissonfördelningen finns den i tbell 8 resp 7. För geometrisk fördelning får mn nvänd formeln för geometrisk summ. I prktiken är nturligtvis och b heltl. Skulle mn behöv räkn ut snnolikheten tt X ligger melln t ex 3.4 och 2.5, utnyttjr mn tt dett smm sk som 4 < X 2. Dett innebär tt den llmänn definitionen v fördelningsfunktionen är x F X (x) = p X (k) där x betecknr heltlsdelen v x. Slutligen bör det nämns tt det finns stokstisk vribler som är vrken diskret eller kontinuerlig. Den llmänn definitionen v fördelningsfunktion är F X (x) = P(X x) och definitionern ovn är specilfll v dett. Eftersom händelsern X och < X b inte kn inträff smtidigt gäller P(X b) = P(X eller < X b) = P(X ) + P( < X b). Dett ger P( < X b) = F X (b) F X (). Eftersom fördelningsfunktionen är definierd som en snnolikhet hr den egenskpern den ligger melln 0 och, och den är växnde. I specilfllen ovn ser mn tt om x går mot eller går F X (x) mot resp. 0, och 0
om F X hoppr, som när X är diskret och x psserr heltl, är det det större värdet som gäller i hoppunkten. För tt bevis dett llmänt skulle mn behöv definier snnolikhetsbegreppet lite noggrnnre än vd vi hr gjort. Omvänt kn mn med en hel del djupsinnig mtemtik bevis tt vrje funktion med de fyr egenskpern ovn kn nvänds som fördelningsfunktion, men det går vi inte in på här. 2.4 Smmnfttning För diskret vribler hr mn snnolikhetsfunktionen p X (k) = P(X = k). För kontinuerlig vribler hr mn täthetsfunktionen, sådn tt P( < X < b) P( < X b) b = f P( X < b) X (x)dx. P( X b) Observer P(X = ) = 0. Snnolikheter för intervll kn mn ntingen räkn ut mnuellt eller få ur fördelningsfunktionen. I det kontinuerlig fllet hr mn P( < X < b) = F X (b) F X (), och sträng eller osträng olikhet spelr ingen roll, medn i det diskret gäller P( < X b) = F X (b) F X (). Här får mn gör en omskrivning om mn hr ndr olikheter. Till exempel P(3 < X < 7) = P(3 < X 6) = P(4 X < 7) = P(4 X 6) = F X (6) F X (3). En hel del informtion finns i formelsmlingen.
2.5 Flerdimensionell stokstisk vribler En tvådimensionell stokstisk vribel är i prktiken smm sk som två stokstisk vribler som hör ihop. Till exempel kn mn mät längd och bredd på smm objekt. Om vriblern heter X och Y, så ger (X, Y ) ett tlpr eller koordintern för en punkt i plnet. Ett exempel på dett är mötesproblemet i vsnitt 2.5 veck 2. 2.5. Diskret fllet Dett fll lär mn sig bäst genom tt räkn övningsuppgifter. Dess kommer emellertid inte förrän senre i kursen. Snnolikheten tt X = j och Y = k skrivs P(X = j,y = k) och funktionen p X,Y som ges v p X,Y (j,k) = P(X = j, Y = k) klls snnolikhetsfunktion. Sedn räknr mn någr påhittde exempel där mn inte hr fler fll än tt de kn sätts upp i en tbell, t ex: X\ Y 0 2 3 0 0.05 0.2 0.2 0.05 0.2 0.08 0.05 0.0 2 0.08 0.05 0.08 0.05 Summn v ll värden är. Snnolikhetsfördelningen för X ges v de tre rdsummorn och snnolikhetsfördelningen för Y ges v de fyr kolonnsummorn, eftersom P(X = j) = P(X = j, Y = vd som helst) = = P(X = j, Y = 0)+P(X = j, Y = )+P(X = j, Y = 2)+P(X = j, Y = 3) och motsvrnde för Y. Därför klls dess fördelningr mrginlfördelningrn. Allmänt hr vi p X (j) = P(X = j) = P(X = j, Y = k) = p X,Y (j,k) och motsvrnde för Y. Mn kn också räkn ut snnolikheter för X + Y. I exemplet ovn är t ex P(X + Y 4) = 0.08 + 0.0 + 0.05 = 0.23 2
och P(X + Y = 4) = 0.08 + 0.0 = 0.8. Ett nnt exempel är summn v två tärningskst i vsnitt 2.. Ett viktigt specilfll är X och Y är oberoende om P(X = j, Y = k) = P(X = j)p(y = k). Då är ll rder i tbellen proportionell mot vrndr, och ll kolonner är det också. 2.5.2 Kontinuerlig fllet Dett vsnitt ligger utnför kursen och ts med för tt få en vrundning v kursinnehållet, och för tt ök förståelsen för resten. Vi börjr med ett exempel: En person åker först buss, sedn txi. Väntetiden på bussen är likformigt fördeld i intervllet melln 0 och 0 medn väntetiden på txin är exponentilfördeld med väntevärde 8, om mn räknr i minuter. Tidern nses oberoende. Hur stor är snnolikheten tt hn får vänt smmnlgt minst 5 minuter? Om väntetidern beteckns med X, resp. Y, skll vi räkn ut P(X+Y 5). Dett är snnolikheten tt hmn i det streckde området i figuren. Om mn byter summ mot integrl och snnolikhetsfunktion mot täthetsfunktion i resonemnget i förr stycket, får mn P(X + Y 5) = = 0 0 0 x 5 x+y 5 8 e y/8 dy } {{ } e (5 x)/8 f X (x)f Y (y)dxdy = dx = e 5/8 0 0 x+y 5 0 x 0 0 8 e y/8 dxdy = e x/8 dx 0.0875. 0 }{{} 8( e 0/8 ) För tt härled dett utgår mn från snnolikhetsmodellen tt P( < X < b) = R b fx(x)dx, P(c < Y < d) = R d fy (y)dy och tt händelsern är oberoende. Snnolikheten tt (X, Y ) hmnr i en rut är c då P( < X < b, c < Y < d) = Z b f X(x)dx Z d c f Y (y)dy = Z d Z b c f X(x)f Y (y)dxdy. Genom tt sedn del in plnet i mindre och mindre rutor och dder snnolikhetern för dess får mn det sökt resulttet. 3
25 Y 20 5 0 5 0 X 5 5 0 5 0 5 20 Figure : Väntetidern på bussen resp. txin med området X + Y 5 streckt 4
Allmänt hr vi en täthetsfunktion f X,Y sådn tt P((X,Y ) A) = f X,Y (x,y)dxdy. De mrginell täthetsfunktionern ges v f X (x) = A f X,Y (x,y)dy och motsvrnde för Y. Mn definierr tt X och Y är oberoende om f X,Y (x,y) = f X (x)f Y (y). 5