Mer om slumpvariabler

Relevanta dokument

DATORÖVNING 2: SIMULERING

Diskreta slumpvariabler

Summor av slumpvariabler

Summor av slumpvariabler

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

4.1 Grundläggande sannolikhetslära

Föreläsning 3. Sannolikhetsfördelningar

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Lektionsanteckningar 11-12: Normalfördelningen

Grundläggande matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Föreläsning 7. Statistikens grunder.

4.2.1 Binomialfördelning

Diskussionsproblem för Statistik för ingenjörer

Statistik 1 för biologer, logopeder och psykologer

TMS136. Föreläsning 4

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Problemlösning. Måns Thulin. Uppsala universitet Statistik för ingenjörer 30/ /16

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

Kap 3: Diskreta fördelningar

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Kap 2. Sannolikhetsteorins grunder

F9 Konfidensintervall

SF1901 Sannolikhetsteori och statistik I

Statistiska metoder för säkerhetsanalys

4 Diskret stokastisk variabel

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

Introduktion till statistik för statsvetare

F10 Problemlösning och mer om konfidensintervall

Slumpvariabler och sannolikhetsfördelningar

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Övning 1 Sannolikhetsteorins grunder

Stokastiska signaler. Mediesignaler

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

Mer om konfidensintervall + repetition

F13 Regression och problemlösning

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

Föreläsning 5, Matematisk statistik Π + E

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Några extra övningsuppgifter i Statistisk teori

FÖRELÄSNING 3:

Sannolikhetsteori. Måns Thulin. Uppsala universitet Statistik för ingenjörer 23/ /14

F11 Två stickprov. Måns Thulin. Uppsala universitet Statistik för ingenjörer 26/ /11

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

1. Du slår en tärning två gånger. Låt A vara händelsen att det första kastet blir en sexa och låt B vara händelsen att summan av kasten blir sju.

F14 Repetition. Måns Thulin. Uppsala universitet Statistik för ingenjörer 6/ /15

Grundläggande matematisk statistik

Grundläggande matematisk statistik

Laboration med Minitab

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar

Föreläsning 4, Matematisk statistik för M

1.1 Diskret (Sannolikhets-)fördelning

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Övning 3 Vecka 4,

SF1911: Statistik för bioteknik

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

FÖRELÄSNING 7:

Formel- och tabellsamling i matematisk statistik

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

Hur måttsätta osäkerheter?

Väntevärde och varians

Föreläsning 12: Regression

Föreläsning 5, FMSF45 Summor och väntevärden

Demonstration av laboration 2, SF1901

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

F3 Introduktion Stickprov

Föreläsning 7: Punktskattningar

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Föreläsning 2, FMSF45 Slumpvariabel

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

SF1901 Sannolikhetsteori och statistik I

Uppgift 3: Den stokastiska variabeln ξ har frekvensfunktionen 0 10 f(x) =

Exempel för diskreta och kontinuerliga stokastiska variabler

SF1901 Sannolikhetsteori och statistik I

Statistiska metoder för säkerhetsanalys

SF1901: Sannolikhetslära och statistik

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Transkript:

1/20 Mer om slumpvariabler Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/2 2013

2/20 Dagens föreläsning Diskreta slumpvariabler Vilket kretskort ska man välja? Väntevärde och varians Hur många pakeringsplatser behövs? Summor av slumpvariabler Kontinuerliga slumpvariabler En matematisk modell för variation i hållfasthet Väntevärde och varians

3/20 Diskreta slumpvariabler Diskreta slumpvariabler: beskriver ofta antal. Binomialfördelning: antalet gånger en händelse (som inträffar med sannolikhet p) inträffar när samma försök upprepas n oberoende gånger. Poissonfördelning: räknar antalet sällsynta händelser under en tidsperiod.

4/20 Sannolikhetsfunktioner Även om binomialfördelningen och Poissonfördelningen är de viktigaste diskreta fördelningarna så är det viktigt att komma ihåg att det finns andra fördelningar också. Alla icke-negativa funktioner p(k) sådana att k=0 p(k) = 1 är sannolikhetsfunktioner som beskriver en fördelning! Vi ska återvända till två exempel från första föreläsningen och beskriva dem med diskreta slumpvariabler: kretskortsproblemet och parkeringsplatsproblemet.

Vilket kretskort ska man välja? Ett företag ska köpa in kretskort för motorstyrning till en maskin de tillverkar. Företaget erbjuder en garanti som innebär att om kretskortet går sönder inom ett år så byter de ut det utan extra kostnad för kunden. Kretskort A kostar 25 kr och går sönder det första året med sannolikhet 0.001. Kretskort B kostar 20 kr och går sönder det första året med sannolikhet 0.05. Själva arbetet med att byta kort kostar 50 kr plus kostnaden för ett nytt kretskort. Vilket kretskort ska företaget välja för att betala så lite som möjligt för kretskort? 5/20

Väntevärde Vi kan inte veta vad kostnaden kommer att bli på förhand. Kan vi säga vad kostnaden blir i genomsnitt? På första föreläsningen definierade vi läges- och spridningsmått för datamaterial x 1, x 2,..., x n : Medelvärdet: x = 1 n (x 1 + x 2 +... + x n ) = 1 n i=1 x i. För en diskret slumpvariabel X med sannolikhetsfunktion p(k) = P(X = k) definierar vi nu Väntevärdet: E[X ] = k k p(k). Vi tolkar väntevärdet som det genomsnittliga eller förväntade värdet på X. E[X ] betecknas ofta µ. Se tärningsexempel på tavlan! Se datorsimulering av tärningsexemplet! Vi kan nu lösa kretskortsproblemet. Se tavlan! 6/20

7/20 Varians Förutom det genomsnittliga läget så är vi även intresserade av att ha ett mått på osäkerheten/spridningen för en slumpvariabel. På första föreläsningen definierade vi spridningsmått för datamaterial x 1, x 2,..., x n : (Stickprovs)variansen: s 2 = 1 n 1 n i=1 (x i x) 2. För en diskret slumpvariabel X med sannolikhetsfunktion p(k) = P(X = k) definierar vi nu Variansen: V[X ] = k (k µ)2 p(k). Variansen betecknas ofta σ 2 och tolkas som ett mått på spridningen/osäkerheten/variationen för X. Se tärningsexempel på tavlan! Vi kommer att prata mer om varians och tolkning av varians på nästa föreläsning.

8/20 Väntevärde och varians Mer generellt är E[g(X )] = k g(k)p(k). En viktig räkneregel är att V[X ] = E[X 2 ] (E[X ]) 2. Se tärningsexempel på tavlan! Man kan räkna ut väntevärde och varians för våra favoritfördelningar: Fördelning Väntevärde Varians Bin(n, p) np np(1 p) Po(m) m m Fördelningarnas parametrar ger alltså all information om väntevärde och varians! Se datorsimulering av Poissonfördelningen!

Hur många parkeringsplatser? Ett företag ska bygga 100 nya lägenheter. Utifrån erfarenhet från liknande områden vet man att sannolikheten är 25 % att ett hushåll inte har någon bil, 50 % att ett hushåll har en bil och 25 % att ett hushåll har två bilar. Hur många bilar kan man förvänta sig att hushållen har tillsammans? Hur många parkeringsplatser ska man bygga vid bostäderna för att sannolikheten att alla hushålls bilar får plats ska vara 95 %? Antag att man av utrymmesskäl inte får plats med fler än 75 parkeringsplatser. Hur stor är då sannolikheten att hushållens bilar får plats? 9/20

Summor av slumpvariabler Man är ofta intresserad av en summa av slumpvariabler: X 1 + X 2 +... + X n = n i=1 X i. Exempel: En bläckfisk tippar fotbollsmatcher i fem stora mästerskap. I varje mästerskap tippar den 6 matcher med sannolikhet 1/3 att tippa rätt i varje match. Om X i =antal rätt i mästerskap i så är X i Bin(6, 1/3). Vad är P(sammanlagt minst 25 rätt)=p(x 1 + X 2 + X 3 + X 4 + X 5 25)? Antal olyckor X i på en byggarbetsplats under en månad anses vara Po(1/3)-fördelat. Ett företag har 15 byggen igång och vill veta sannolikheten att inte råka ut för någon olycka på något av byggena under en månad. Vad är P(X 1 + X 2 +... + X 15 = 0)? Se exempel med R! Varför uppstår samma mönster i båda fallen? Uppstår det alltid? Vad kan vi säga om mönstret? Svaret kommer på nästa föreläsning! 10/20

11/20 Kontinuerliga slumpvariabler En kontinuerlig slumpvariabel, ofta betecknad X, är ett tal som beskriver utfallet av ett försök vars resultat inte är givet på förhand och som kan anta alla värden i ett givet intervall. Exempel: Man mäter hållfastheten för ett material. X =den uppmätta hållfastheten. Man mäter livslängden för en elektronisk komponent. X =den uppmätta livslängden. Man mäter vindhastigheten i Falsterbo. X =den uppmätta vindhastigheten. Man provborrar en gruvborr. X =den borrade sträckan, Y =nötningen på borrstiften. Sannolikheten att X antar olika värden bestäms av dess fördelning. Fördelningen beskrivs av täthetsfunktionen f (x).

12/20 En matematisk modell för variation i hållfasthet Några materialforskare har i ett experiment gjort 50 mätningar av hållfastheten hos ett nyutvecklat ZrO 2 -TiB 2 -kompositmaterial. Mätdata (enhet MPa): 1079.2712 1259.8408 1054.0934 973.9300 1354.5684 1127.5992 1153.3179 1165.9455 1409.5526 1049.9112 1371.5842 1266.0332 1227.1399 937.7968 1224.2218 962.1297 1260.8899 1156.1487 1136.4130 1153.5300 1190.8989 1061.0457 1224.3590 1193.1320 1063.0970 1033.0977 800.4697 1283.4395 1131.2935 1442.2183 1047.4338 879.9948 1140.1950 1279.3179 1081.0325 933.3642 1195.8353 1214.6490 986.9322 1231.1889 1102.8531 985.7315 982.3293 788.3871 1057.9675 1111.1701 1013.3264 644.2754 1219.3787 934.8187 För att illustrera datamaterial ritar vi ett histogram.

Histogram för hållfasthetsdata 0.0000 0.0010 0.0020 600 800 1000 1200 1400 Hållfasthet (MPa) 13/20

14/20 En matematisk modell för variation i hållfasthet Histogrammet har skalats så att rektanglarnas sammanlagda area är 1. Andelen observation som hamnat i ett visst intervall är då lika med arean för intervallets rektangel. Om vi har väldigt många observationer så kan vi rita ett histogram med tunna rektanglar. Se tavlan! Kan en funktion beskriva histogrammets form och därmed också hållfasthetens fördelning? Vilka villkor måste en sådan funktion uppfylla? Se tavlan!

En matematisk modell för variation i hållfasthet Inom hållfasthetsläran så använder man ofta Weibullfördelningen för att beskriva (framförallt keramiska materials) variation i hållfasthet. Weibullfördelningen beskrivs av täthetsfunktionen f (x): f (x) = b a ( x a ) b 1e (x/a) b där x 0 och a och b är två parametrar som är större än noll. Funktionen får olika utseende när man ändrar parametrarnas värden. Se exempel med R! Finns det några värden på a och b som ger en kurva som passar våra hållfasthetsdata? Via statistiska metoder (som vi ännu inte känner till) kan man komma fram till att a = 1175 och b = 7.5 ger en bra kurva. 15/20

Histogram för hållfasthetsdata 0.0000 0.0010 0.0020 600 800 1000 1200 1400 Hållfasthet (MPa) 16/20

17/20 En matematisk modell för variation i hållfasthet Kurvan följer histogrammet relativt bra, vilket tyder på att Weibullfördelningen med a = 1175 och b = 7.5 kan vara bra att använda för att modellera variationen i det nya materialets hållfasthet. Därmed kan vi exempelvis räkna ut sannolikheten att materialet går sönder vid en spänning på 1000 MPa: P(X 1000) = 1000 0 1000 0 1000 b ( x ) b 1e (x/a) f (x)dx = b dx 0 a a 7.5 ( x ) 6.5e (x/1175) 7.5 dx 0.26. 1175 1175 Eftersom man ofta vill räkna ut sannolikheter av den här typen så finns det för de flesta fördelningar inbyggda funktioner i R för sådana beräkningar.

18/20 Kontinuerliga slumpvariabler Alla icke-negativa funktioner f (x) som är sådana att f (x)dx = 1 är täthetsfunktioner. Det finns oändligt många sådana funktioner, men i praktiken så är det bara ett fåtal som är intressanta för tillämpningar! För kontinuerliga slumpvariabler är man ofta intresserad av fördelningsfunktionen F (x) = P(X x) = x f (x)dx. Se exempel på tavlan!

19/20 Väntevärde och varians För en diskret slumpvariabel X är väntevärdet E[X ] = k k p(k) och variansen V[X ] = k (k µ)2 p(k). För en kontinuerlig slumpvariabel X med täthetsfunktion f (x) är: Väntevärdet: E[X ] = x x f (x)dx. Även här betecknas väntevärdet µ och tolkas som det genomsnittliga eller förväntade värdet på X. Variansen: V[X ] = x (x µ)2 f (x)dx. Som tidigare betecknas variansen ofta σ 2 och tolkas som ett mått på spridningen/osäkerheten/variationen för X. Som tidigare gäller att E[g(X )] = x g(x)f (x)dx och att V[X ] = E[X 2 ] (E[X ]) 2. Se exempel på tavlan!

20/20 Sammanfattning Väntevärde och varians: genomsnittligt värde och spridning/variation/osäkerhet. Summor av olika sorters slumpvariabler tycks följa ett och samma mönster! När man räknar med kontinuerliga slumpvariabler så ersätts summor av integraler. Nästa gång: några kontinuerliga fördelningar. Vad kan vi säga om mönstret som hör ihop med summor av slumpvariabler? Vad kan man säga mer allmänt om exempelvis väntevärden för summor av slumpvariabler? Och så kommer den rafflande avslutningen på parkeringsplatsproblemet!