Föreläsning 8 för TNIU Integrler och sttistik Krzysztof Mrcinik ITN, Cmpus Norrköping, krzm@itn.liu.se www.itn.liu.se/krzm ver. 4 - --8 Inledning - lite om sttistik Sttistik är en gren v tillämpd mtemtik som bygger på snnolikhetsteori och som uttlr sig om mtemtisk egenskper v stor popultioner eller lång serier v eperiment. Den tillämps (iblnd lite för fritt) v politiker och tjänstemän för tt ftt viktig beslut som rör hel smhället. Den här föreläsningen är dock inglund någon inledning i sttistik utn den skll enbrt illustrer hur integrler och integrlklkyl kn tillämps i sttistik. Mycket v mterilet presenterd nedn kn hitts (utspridd) t.e. i [] därifrån ett ntl uppgifter hämtdes. En modern presenttion v sttistik utifrån integrlteori (som heter måtteori nuförtiden) kn hitts t.e. i []. Kontinuerlig stokstisk vribler Betrkt en vribel X som vid olik tillfällen (olik mätmoment) kn nt olik värden ur (en delmängd v) reell eln R. Ant också tt dess värden kn fås med en viss snnolikhet som kn fås eperimentellt efter mång upprepde mätningr. En sådn vribel klls då för en kontinuerlig stokstisk vribel (s.v.). Noter tt det inte är någon stringent de nition v s.v. då den sistnämnd kräver kunskper i snnolikhetsteori. Vi får nöj oss lltså med den intuitiv beskrivningen ovn. Någr eempel på kontinuerlig s.v. lists nednför: Längd (eller vikt el. dyl.) för en slumpmssigt vld mn i lndet Väntetid på en buss vid en busskur Överlevndstid för en rdioktiv tom Den årlig inkomsten hos en slumpmssigt vld person i lndet. Denn vribel är egentligen diskret med minst "kvnt" = öre men vi kn nt tt den är så gott som kontinuerlig. Noter tt i ll dess eempel den s.v. ntr viss värden mer snnolikt än ndr. För tt beskriv dett inför mn begreppet täthetsfunktion. De nition En (Riemnnintegrerbr) funktion f : R! R som uppfyller två kriterier:. f() för ll. Z f() d = () klls för täthetsfunktion för en stokstisk vribel X.
f() En möjlig täthetsfunktion. Aren under grfen måste vr. Noter tt en täthetsfunktion behöver ej vr kontinuerlig. En täthetsfunktion de nierr entydigt hur snnolikt det är tt den tillhörnde s.v. X ntr ett värde inom en viss mängd. Mn tolkr nämligen uttrycket f()d som den in nitesiml snnolikheten tt X ntr ett värde melln och + d. Som konsekvens får vi då tt snnolikheten tt en kontinuerlig stokstisk vribel X med täthetsfunktionen f ntr vid ett givet tillfälle värdet i mängden A R ges v Z P (X A) = f() d () där lltså symbolen A under integrltecknet betyder tt vi integrerr f på mängden A. Mängden A kn (men behöver ej vr) ett intervll eller en union v intervller (det är i princip det vi kn från nlyskursen). Speciellt, snnolikheten P ( X b) för en s.v. X med täthetsfunktionen f() tt nt värdet någonstns i intervllet [; b] ges v Ur dett följer då tt A P ( X b) = P (X = c) = Z c c Z b f() d () f() d = så tt snnolikheten P (X = c) tt X får ekt värdet c är noll! Således, snnolikhetern P ( X b), P ( < X < b), P ( X < b) och P ( < X b) är ll lik och ges v formeln (). En nnn sitution uppstår när f är så klld distribution, men vi skll inte studer dett här (se dock uppgift 6 för tt se vd kn händ då). Vidre, noter tt P ( < X < ) = Z f() d = enligt () vilket vspeglr det självklr påståendet tt snnolikheten för tt en s.v. X ntr något värde vid ett eperiment är lik med och som således är en käll till De nition. Problem Bestäm konstnten c så tt funktionen c f() = för < < 6 nnrs
blir en täthetsfunktion. Bestäm sedn snnolikheten tt den tillhörnde s.v. X ntr värdet större än. Lösning: Enligt (), vi kräver först tt f() vilket medför tt c > (c = är uteslutet, vrför?). Vidre, vi kräver tt R f() d = vilket ger Z f() d = Z 6 c d = c så tt c = 7. Vidre, enligt (), den sökt snnolikheten blir P ( < X) = Z f() d = 7 Z 6 d = 7 6 6 = 7c = = 89 (6 7) = 6 6 = 7 = ; 875 8 f().5.4... 4 5 6 7 8 9 Täthetsfunktionen i Problem. Nednför följer ett ntl typisk täthetsfunktioner:. Likförmig fördelning: en s.v. X sägs vr likformigt fördeld om dess täthetsfunktion hr formen f() = b för < < b nnrs (4) Denn fördelning beskriver en s.v. som kn nt ll värden ur intervllet ]; b[ (eller [; b] etc.) med smm snnolikhet. f().5..5..5 4 5 6 7 8 Likförmig fördelning med = och b = 4:
. Eponentilfördelning: ges v täthetsfunktionen f() = e för > för (5) där >. f()..5..5. Normlfördelning: ges v. Eponentilfördelning för = f() = p e ( ) (6) (med > ) och nvänds mycket oft i bl.. popultionsbiologi. Den beskriver en typisk fördelning v en egenskp hos en popultion. Mer om och under fö. f().4... 5 4 4 5 Normlfördelning med = och = Eempel (Väntetiden för en buss). Antg tt väntetiden T för en buss är likformigt fördeld med = och b = i (4) (bussr nländer vr :e minut). Snnolikheten tt du skll vänt på bussen mer än p minuter (med p ) ges då v P (T > p) = Z p dt = [t] p = ( p) = p och vid p = är noll (bussen kommer säkert efter högst minuter). 4
Problem 4 (Rdioktivt sönderfll). Eponentilfördelningen (5) beskriver bl.. rdioktivt sönderfll: snnolikheten tt en rdioktiv tom överlever en viss tid T ges v (5). Bestäm tiden t = vid vilken hälften v tomer v smm typ försvinner (s.k. hlveringstid) som funktion v. Lösning: den sökt tiden uppfyller smbndet Å ndr sidn vilket leder till smbndet som ger t = Z t= Z P < T < t = = e t dt = e e t t dt = t= = e t t = = e t = e t = = t = = ln. Värden för T kn vrier från mikrosekunder till miljrder år. Fördelningsfunktion, medin, kvntiler och kvr(!)tiler Av speciellt vikt är snnolikheten tt en s.v. X ntr värden mindre än eller lik med. Denn snnolikhet får ett särskilt nmn: De nition 5 Funktionen klls fördelningsfunktionen för den s.v. X. F () = P (X ) = Z f(t) dt Således, snnolikheten tt den s.v. X ntr ett värde ur intervllet melln och b ges v P ( < X b) = F (b) F () och är inget nnt än insättningsformeln vi läste om! (se nlysboken Sts 6.8 sid. 9). Med ll rätt kn ni nu även misstänk tt följnde smbnd är snt: Sts 6 Om f är kontinuerlig i punkten gäller tt F () = f(): Det betyder tt fördelninngsfunktionen F är en primitivfunktion för täthetsfunktionen f -med bägge tillhörnde förstås smm s.v. Dett är helt enkelt nlysens huvudsts, Sts 6.7 sid. 9 i nlysboken). De nitionen 5 och egenskpern () hos vrje täthetsfunktion leder till följnde llmänn observtion: Sts 7 För vrje fördelningsfunktion F gäller tt. lim! F () =, lim! F () =. F är en vände (ej nödvändigtvis strängt) funktion. F är högerkontinuerlig för vrje 5
Figure : Smbnd melln täthetsfunktion och fördelningsfunktion Noter lltså tt F behöver ej vr kontinuerlig utn br högerkontinuerlig i vrje punkt. Om F är diskontinuerlig i en punkt så är motsvrnde täthetsfunktion en distribution (se också uppgift 6). Eempel 8 Genom integrtion visr mn lätt tt den likformig fördelningen (4) hr följnde fördelningsfunktion: 8 Z < om < F () = f(t) dt = : b om b (7) om > b Se Figur.8 sid. 59 i []. Eempel 9 Smm procedur visr tt eponentilfördelningens (5) fördelningsfunktion är F () = Z f(t) dt = om < e om Oft behöver mn i sttistisk undersökningr svr på följnde fråg: givet ett värde ( [; ]), hur stort måste vr så tt snnolikheten tt den s.v. X ntr högst värdet blir ekt lik med? De nition Antg tt [; ]. Lösningen till ekvtionen P (X ) = d.v.s. till ekvtionen F () = (8) klls då -kvntilen för den s.v. X och beteckns med. 6
Figure : Kvrtil Av speciell vikt är -kvntilen :5 som heter medin och som nger det värde på för vilken snnolikheten tt en s.v. X ntr värdet är ekt =. T.e: medinlönen i en popultion är den lönenivån för vilken hälften v popultionen tjänr mindre än just medinlönen. Medinlönen beskriver lönespridningen i en popultion mycket bättre än medellönen för den påverks inte v tt enstk få personer (t.e. chefer i ett stort företg) tjänr mycket bättre än den övrig popultionen (den övrig personlen). De nition Kvntiler ;5, :5 och ;75 klls respektive för undre kvrtilen, medinen respektive övre kvrtilen. Noter tt i [] hr mn en nnn de nition v med istället v i (8). Eempel Medinen för normlfördelningen (6) är lik med : Vrför? Problem Beräkn medinen smt de övrig kvrtilern för den likformig fördelningen (4). Lösning: det går tt giss förstås tt medinen är +b. Vill vi gör det formellt löser vi ekvtionen (8) med F som i (7) och med =. Dett ger b = som ger det ngivn värdet ;5 = +b. Rent llmänt, för tt få kvntilen måste vi lös ekvtionen som ger b = ( = ) + b: (det kn också gisss!). Således: den undre kvrtilen är ;5 = 4 + 4 b = + b 4 medn den övre kvrtilen är ;75 = 4 + 4 b = b b 4. 7
4 Väntevärdet och vrins eller vd vi kn förvänt oss v en stokstisk vribel. Givet en s.v. X, vd kn vi då säg om det förväntde utfllet v vrje mätning v X? Svret ges nedn i form v följnde de nition. De nition 4 Väntevärdet E(X) för den s.v. X med täthetsfunktionen f() är tlet E(X) = En nnn benämning på tlet E(X) är förväntt värde. Problem 5 Beräkn E(X) för den likformig fördelningen (4). Lösning: E(X) = Z f() d = b Z Z b f() d (9) d = b Problem 6 Beräkn E(X) för normlfördelningen (6) med =. Lösning: E(X) = Z f() d = E(X) = p Z e b = ( + b) d = därför tt integrnden f() är en udd funktion. Rent llmänt, E(X) = för normlfördelningen (6). Problem 7 Beräkn förväntd överlevndstid för en rdioktiv tom som funktion v. Lösning: Den förväntde överlevndstiden ges v = E(T ) = Z tf(t) dt = Z te t dt = [P.I.] = ; vilket också ger tt = t = ln > t =. En rdioktiv tom fövänts lltså tt överlev hlveringstiden. Oft är vi intresserde i frågn hur pss utspridd enstk mätvärden v mätningr v en s.v. kommer tt vr. Denn utspridning mäts med hjälp v tlet som krkteriserr den stokstisk vribeln och som klls vrins. De nition 8 Vrinsen V (X) för en s.v. X med = E(X) är tlet som ges v V (X) = Z ( ) f() d Problem 9 Beräkn E(X) och V (X) för den s.v. som hr täthetsfunktionen för < f() = 4 för Lösning: E(X) = V (X) = Z Z f() d = E(X) = f() d = Z Z d = lim R! R 4 d = : : : = = lim R! R = : 4 + = 4. 8
Vi vslutr vår mycket kort res genom sttistik med en intressnt sts. Betrkt den s.v. X som lltså är en s.v. koppld till X på så sätt tt vrje gång vi mäter X och får resulttet ntr vi tt X :s värde blev. Täthetsfunktionen g() för X är knuten till täthetsfunktionen f() för X vi det knske lite oväntde smbndet för g() = p (f (p ) + f ( p () )) för som beviss vi nlysens huvudsts (beviset kn hitts i Appendi och ll studenter förvänts läs det). Mn kn då vis (se Appendi) tt E(X ) = Z f() d () vilket tolks som ett rimligt resultt. Noter tt enligt det som står ovn kn vi även skriv tt h V (X) = E (X ) i : Sts Följnde smbnd gäller där X är en s.v. med täthetsfunktionen g som i (). Bevis. Med beteckningr som ovn V (X) = E(X ) [E(X)] () V (X) = = Z Z Z Z ( ) f() d = f() d f() d + f() d = Z f() d + = E(X ) = E(X ) [E(X)] enligt (). Problem Beräkn V (X) för den likformig fördelningen (4) genom tt utnyttj smbndet (). Lösning: I Eempel 5 ck vi tt E(X) = +b. Vidre E(X ) = Z f() d = b Z b d = b (b ) = (b )(b + b + ) = (b ) Följktligen = (b + b + ): V (X) = E(X ) [E(X)] = (b + b + ) + b = (b ) : 5 Appendi Vi bevisr här formlern () och (). Vi börjr med (). Låt oss beteckn X :s fördelningsfunktion och täthetsfunktion med G() respektive g(). Vi hr då G() = P X p p P ( X ) om = ifll < 9
Således, om < hr vi tt g() = G () =. Återstår tt vis formeln () för. Vi hr då enligt formeln ovn smt nlysens huvudsts v.s.v. Dgs tt vis (): g() = G () = d d P = f p p p X p = d d f p Z p f(t)dt = p p = p f p + f p E X = Z g() d = Z p f p + f p d = Z p f p + f p d () där vi lltså uttnyttjd (). Vidre Z p f p d = y = p d = ydy = Z y f (y) dy På liknnde sätt, med hjälp v vribelbytet y = p, visr vi tt Z Z p p f d = y f (y) dy: Insättning v de två sist formlern i () ger ().
6 Uppgifter. Bestäm konstnten c så tt funktionen f() = c p + för < < nnrs blir en täthetsfunktion. Beräkn sedn snnolikheten tt en s.v. som hör till f ntr ett positivt värde. Svr: c = p. P (X > ) = p u :9:. T frm fördelningsfunktionen för s.v. i uppgift. Rit också den! Svr: 8 < F () = : för < p p + för för >. Vis tt funktionen i (5) är verkligen en täthetsfunktion. Tips: integrer f på [; [ (f = för < ). 4. En s.v. X hr fördelningsfunktionen F () = för < för Beräkn fördelningens undre kvrtil, medin och övre kvrtil. Ange även värdet för en godtycklig kvntil. Svr: 5. Vis tt funktionen :5 = p ; ;5 = p ; ;75 = ; = p f() = e för < e för är en täthetsfunktion för en stokstisk vribel X. Beräkn även de tre kvrtilern för X. Svr: - ln ; respektive ln. 6. Rit upp fördelningsfunktionen 8 < för < F () = : + ( ) för för > Beräkn P (X 5=), P (X > =); P (4= < X < 5=) och P (X = ). Svr: 7=9, =; =9 respektive = = F :s språnget i. Noter tt F är ej deriverbr här ty den inte är kontinuerlig i. Som nämndes i teten innebär dett tt f är ingen vnlig funktion utn en distribution. 7. Väntetiden X (i minuter) från öppningsdg tills dess först kund går in i en är beskrivs v en s.v. med fördelningsfunktionen: för < F () = e :4 för Beräkn snnolikheten tt först kunden dröjer ) högst minuter
b) minst 4 minuter c) melln och 4 minuter d) högst eller minst 4 minuter e) ekt minuter Svr: ) e : = ; 699 b) e :6 = ; c) e : e :6 = ; 99 d) e : + e :6 = ; 9 e) 8. Beräkn kvntilen för en s.v. X med täthetsfunktionen för < f() = e för Använd sedn miniräknre för tt få de numerisk värden för ;5, ;9 smt ;99. Svr: = p ln( ), ;5 = ; 8, ;9 = ; 57, ;99 = ; 46: 9. Beräkn E(X) och V (X) om X hr täthetsfunktionen f() = för nnrs Svr: E(X) =. V (X) = 8.. Den s.v. X hr täthetsfunktionen: för f() = nnrs ) Beräkn väntevärdet och stndrdvvikelsen = p V (X) för X. b) Beräkn P ( < X < + ) c) Beräkn P ( < X < + ) Svr: ) =, = p 8 b) ( ) = + p 9 (ty + > ) c) 6 = p 6 References [] G. Blom, J. Enger, G. Englund, J. Grndell och L. Holst, "Snnolikhetsteori och sttistikteori med tillämpningr", Studentlittertur 5. [] P. Billingsley, "Probblility nd mesure", Wiley, 986