MATEMATISK STATISTIK FÖR V OCH L ÖVNINGSMATERIAL CENTRUM SCIENTIARUM MATHEMATICARUM HT 2012. Matematikcentrum Matematisk statistik



Relevanta dokument
Resultatet anslås senast 10 juni på institutionens anslagstavla samt på kurshemsidan.

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Statistiska metoder för säkerhetsanalys

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Resultatet läggs in i ladok senast 13 juni 2014.

1. En kontinuerlig slumpvariabel X har följande täthetsfunktion (för någon konstant k). f.ö.

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Några extra övningsuppgifter i Statistisk teori

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Extrauppgifter i matematisk statistik

Föreläsning 12: Regression

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

0 om x < 0, F X (x) = c x. 1 om x 2.

Statistiska metoder för säkerhetsanalys

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2010

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Avd. Matematisk statistik

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Extrauppgifter - Statistik

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Laboration 4: Intervallskattning och. Hypotesprövning. 1 Förberedelseuppgifter LABORATION 4 MATEMATISK STATISTIK AK FÖR ED, FMS022, VT02

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Laboration 4: Intervallskattning och hypotesprövning

Föreläsning 12: Repetition

, s a. , s b. personer från Alingsås och n b

Tentamen i Matematisk statistik Kurskod S0001M

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Grundläggande matematisk statistik

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Tentamen MVE302 Sannolikhet och statistik

Industriell matematik och statistik, LMA /14

S0005M, Föreläsning 2

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Gamla tentauppgifter i kursen Statistik och sannolikhetslära (LMA120)

S0005M. Stokastiska variabler. Notes. Notes. Notes. Stokastisk variabel (slumpvariabel) (eng: random variable) Mykola Shykula

7.5 Experiment with a single factor having more than two levels

Föreläsning 7. Statistikens grunder.

Mer om slumpvariabler

Lunds tekniska högskola Matematikcentrum Matematisk statistik. Övningsuppgifter Matematisk statistik AK för M, FMS 035, VT Sannolikhetsteori 1

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Avd. Matematisk statistik

Diskussionsproblem för Statistik för ingenjörer

TMS136. Föreläsning 4

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Laboration 4: Intervallskattning och hypotesprövning

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 15 August 2016, 8:00-12:00. English Version

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 31 May 2016, 8:00-12:00. English Version

Matematisk statistik för B, K, N, BME och Kemister

Lektionsanteckningar 11-12: Normalfördelningen

Laboration 4: Intervallskattning och hypotesprövning

Laboration 5: Intervallskattning och hypotesprövning

Laboration 4: Hypotesprövning och styrkefunktion

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamen i Matematisk statistik Kurskod S0001M

F3 Introduktion Stickprov

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

Blandade problem från maskinteknik

bli bekant med summor av stokastiska variabler.

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Tentamen i Matematisk statistik Kurskod S0001M

träna på att använda olika grafiska metoder för att undersöka vilka fördelningar ett datamaterial kan komma från

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 17 August 2015, 8:00-12:00. English Version

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Tentamen MVE301 Sannolikhet, statistik och risk

Lärmål Sannolikhet, statistik och risk 2015

Kurskod: TAMS11 Provkod: TENB 12 January 2015, 08:00-12:00. English Version

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

TENTAMEN I STATISTIKENS GRUNDER 2

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

SF1901: Övningshäfte

Transkript:

MATEMATISK STATISTIK FÖR V OCH L ÖVNINGSMATERIAL HT 2012 Matematikcentrum Matematisk statistik CENTRUM SCIENTIARUM MATHEMATICARUM

Innehåll 1 Innehåll 1 Övningsuppgifter 3 2 Lösningar 35

2 Matematisk statistik för V och L

Övningsuppgifter 3 1 Övningsuppgifter Del 1. Inledande räkning med sannolikheter, beskrivande statistik 101. Det maximala årliga avrinningsflödet för Feather River i Californien har uppmätts för åren 1902 till 1960. Data ordnade i storleksordning är (1000 ft 3 /s): År Flöde År Flöde År Flöde (10 3 ft 3 /s) (10 3 ft 3 /s) (10 3 ft 3 /s) 1907 230 1905 81 1910 31 1956 203 1917 80.4 1918 28.2 1928 185 1930 80.1 1944 24.9 1938 185 1911 75.4 1920 23.4 1940 152 1919 65.9 1932 22.6 1909 140 1925 64.3 1923 22.4 1960 135 1921 62.3 1934 20.3 1906 128 1945 60.1 1937 19.2 1914 122 1952 59.2 1913 16.8 1904 118 1935 58.6 1949 16.8 1953 113 1926 55.7 1912 16.4 1942 110 1954 54.8 1908 16.3 1943 108 1946 54.4 1929 14 1958 102 1950 46.4 1955 13 1903 102 1947 45.6 1931 11.6 1927 94 1916 42.4 1933 8.86 1951 92.1 1924 42.4 1939 8.08 1936 85.4 1902 41 1941 84.2 1948 36.7 1957 83.1 1922 36.4 1915 81.4 1959 34.5 xi = 4144.64, xi 2 = 448184.68 20 Histogram over maximalt arligt avrinningsflode 15 antal ar 10 5 0 0 50 100 150 200 250 flode 250 Maximalt arligt avrinningsflode 200 flode 150 100 50 0 1900 1910 1920 1930 1940 1950 1960 ar (a) Studera figurerna och förvissa dig om att de beskriver det angivna datamaterialet. (b) Beräkna medianen för materialet och jämför med medelvärdet. Markera lägesmåtten i histogrammet. Observera att de två måtten skiljer sig åt! (c) Beräkna standardavvikelsen (s), variationskoefficienten ( s x ), variationsbredden (x max x min ) och variationsintervallet (x min, x max ) för materialet.

4 Matematisk statistik för V 102. Beräkna P(B) om A och B är disjunkta (andra benämningar är oförenliga, uteslutande eller icke överlappande) händelser med P(A) = 0.7, P(A B) = 0.75. 103. Låt A och B vara händelser sådana att P(A) = 0.6, P(B) = 0.7 och P(A B) = 0.8. Beräkna P(A B). 104. De möjliga sättningarna för de tre brostöden till en bro, som visas i figur 104, är enligt följande brostöd A: 0 tum, 1 tum, 2 tum brostöd B: 0 tum, 2 tum brostöd C: 0 tum, 1 tum, 2 tum Figur, uppgift 104. (a) Beskriv utfallsrummet som representerar alla möjliga sättningar hos de tre brostöden, t ex (1, 0, 2) betyder att A sätter sig 1 tum, B sätter sig 0 tum och C sätter sig 2 tum. (b) Låt E vara händelsen att man på minst ett ställe får 2 tum i sättningsskillnad mellan intilliggande stöd. Bestäm utfallen hos händelse E. 105. Tidsförloppet för att bygga två konstruktioner visas i figur 105. Byggandet av konstruktionerna A och B kan starta så snart deras gemensamma fundament är färdigt. Den möjliga tiden för komplettering för varje fas av byggnationen visas i figur 105; t ex tar fundamentets fas antingen 5 eller 7 månader. (a) Beskriv de möjliga kombinationstiderna för varje fas i projektet; t ex beskriver (5, 3, 6) företeelsen att det tar 5 månader för fundamentet, 3 månader för konstruktion A och 6 månader för konstruktion B. (b) Vilken är den möjliga totala byggtiden för fundament och konstruktion A ensam? För fundament och konstruktion B ensam? Figur, uppgift 105. (c) Vilken är den möjliga totala byggtiden för projektet? (d) Om möjligheterna i del (a) är lika sannolika, vad är sannolikheten att hela projektet kommer att vara avslutat inom 10 månader? 106. A cylindrical tank is used to store water for a town (Figure 106). The available supply is not completely predictable. In any one day, the inflow is equally likely to fill 6, 7, or 8 feet of the tank. The demand for water is also variable, and may (with equal probabilities) require an amount equivalent to 5, 6, or 7 feet of water in the tank.

Övningsuppgifter 5 (a) What are the possible combinations of inflow and outflow in a day? (b) Assuming that the water level in the tank is 7 feet at the start of a day, what are the possible water levels in the tank at the end of the day? What is the probability that there will be at least 9 feet of water remaining in the tank at the end of the day? Figur, uppgift 106. 107. The waste from an industrial plant is subjected to treatment before it is ejected to a nearby stream. The treatment process consists of three stages, namely: primary, secondary, and tertiary treatments. The primary treatment may be rated as good (G 1 ), incomplete (I 1 ) or failure (F 1 ). The secondary treatment may be rated as good (G 2 ) or failure (F 2 ), and the tertiary treatment may also be rated as good (G 3 ) or failure (F 3 ). Assume that the ratings in each treatment are equally likely (for example, the primary treatment will be equally likely to be good or incomplete or failure.) Furthermore, the performances of the three stages of treatment are statistically independent (oberoende) of one another. (a) What are the possible combined ratings of the three treatment stages? (for example, G 1, F 2, G 3 denotes a combination where there is a good primary and tertiary, but a failure in the secondary treatment). What is the probability of each of these combinations? (b) Suppose the event of satisfactory overall treatment requires at least two stages of good treatment. What is the probability of this event? E 1 = good primary treatment (c) Suppose E 2 = good secondary treatment E 3 = good tertiary treatment Determine P(E 1 ), P(E 1 E 2 ), P(E 2 E 3 ) (d) Express in terms of E 1, E 2, E 3 the event of satisfactory overall treatment as defined in part (b). Hint. E 1 E 2 is part of this event. 108. Vid flygbolaget Cheap & Easy är sannolikheten att en passagerare blir av med bagaget 1%, och sannolikheten att passageraren blir missnöjd 3%. Sannolikheten att passageraren blir missnöjd om bagaget försvinner är 95%. Antag att du träffar på en missnöjd passagerare, vad är sannolikheten att han förlorat bagaget? 109. På ett kontor arbetar 110 personer, varav 50 är kvinnor. Genom en enkät har man fått reda på vilka som är vegetarianer. Uppdelat på män och kvinnor är det Vegetarianer Ej vegetarianer Män 25 35 Kvinnor 32 18 En av de anställda på kontoret väljs ut slumpmässigt.

6 Matematisk statistik för V (a) Beräkna sannolikheten för att personen är vegetarian. (b) Antag att man vet att en kvinna valdes. Vad är sannolikheten för att hon är vegetarian? (c) Är händelserna kvinna väljs och vegetarian väljs oberoende? Motivera svaret. 110. En ubåt avfyrar två torpeder mot ett mål. Varje torped för sig träffar med sannolikheten 0.7 och sannolikheten att båda gör det är 0.64. (a) Träffar torpederna oberoende av varandra? (b) Beräkna sannolikheten för att en men inte två torpeder träffar. (c) Beräkna sannolikheten att minst en träffar. 111. Tre mätinstrument, numrerade 1, 2, 3, fungerar med sannolikheterna 0.9, 0.8 resp. 0.4. Man väljer slumpmässigt ut ett instrument. (a) Hur stor är sannolikheten att det valda instrumentet fungerar? (b) Antag att det instrument man valt visar sig fungera. Beräkna (för k = 1, 2, 3) den betingade sannolikheten att man har valt instrument nr k. 112. Från en skylt med texten MALMÖ faller det ner två slumpmässigt valda bokstäver. En vänlig analfabet sätter upp de båda bokstäverna på de tomma platserna. Beräkna med hjälp av formeln för total sannolikhet sannolikheten att skylten får korrekt text. Figur, uppgift 113. 113. Tvärsektionerna hos floderna vid A, B, och C visas i Figur 113 och flödesnivån vid A och B, över referensnivån, är som följer Flödesnivå vid A Sannolikhet (fot) 0 0.25 2 0.25 4 0.25 6 0.25 Flödesnivå vid B Sannolikhet (fot) 0 0.20 2 0.20 4 0.20 6 0.20 8 0.20 Antag att flödeshastigheterna vid A, B och C är lika. Vad är sannolikheten att flöde vid C kommer att vara mer än 6 fot över referensflödesnivån? Antag oberoende mellan flödesnivåerna vid A och B och att strömningen är stationär. 114. Ett nytt test för att avslöja en allvarlig sjukdom har tagits fram. Det ger positivt utslag med sannolikheten 0.99 om personen har sjukdomen fast med sannolikheten 0.05 även om personen inte har den. Det anses vara känt att 1 % av patientmaterialet har sjukdomen.

Övningsuppgifter 7 (a) Beräkna den intressanta sannolikheten att en patient har sjukdomen om testet är positivt. (b) Vilken egenskap hos testet ska man försöka ändra för att få en högre sannolikhet i a)? Ska man försöka få 0.05 att bli 0 eller 0.99 att bli 1? (c) Antag att testet istället används i ett land där 50 % har sjukdomen. Vilket svar ger då frågan i a)? 115. Two cables are used to lift a load W. However, normally only cable A will be carrying the load; cable B is slightly longer than A, so normally it does not participate in carrying the load. But if cable A breaks, then B will have to carry the full load, until A is replaced. Fig 115 The probability that A will break is 0.02. The probability that B will fail if it has to carry the load by itself is 0.30, but is 0 as long as A carries the load. (a) What is the probability that both cables will fail? (b) If the load remains lifted, what is the probability that none of the cables have failed? 116. Transportmöjligheter skall upprättas mellan två städer som ligger 200 mil ifrån varandra. Alternativen är motorväg (H), järnväg (R), eller flyg (A); Fig 116 det sista betyder anläggandet av flygplatser i de bägge städerna. På grund av de relativa förtjänsterna och kostnaderna, är chansen att planeringskommitén kommer att besluta sig for R, H, eller A är 1 till 2 till 3. Bara ett av dessa tre alternativ kan byggas. Emellertid, om kommittén beslutar att bygga en järnväg R, så är sannolikheten 50% för att denna kommer att vara klar inom ett år; om de beslutar sig för en motorväg H, är motsvarande sannolikhet 75%; och om de beslutar sig för flyg, är sannolikheten 90% att flygplatserna kommer att vara klara inom ett år. (a) Vad är sannolikheten att de två städerna kommer att ha någon förbindelse inom ett år? (b) Om en förbindelse är upprättad inom ett år mellan de två städerna, vad är då sannolikheten att denna är en flygkommunikation A? (c) Om kommittén beslutar till fördel för landkommunikation, vad är sannolikheten att det slutliga beslutet kommer att vara en motorväg H?

8 Matematisk statistik för V 117. In order to repair the cracks that may exist in a 10-feet weld, a nondestructive testing (NDT ) device is first used to detect the location of cracks. Because cracks may exist in various shapes and sizes, the probability that a crack will be detected by the NDT device is only 0.8. Assume that the events of each crack being detected are statistically independent and that the NDT does not give false alarms. (a) If there are two cracks in the weld, what is the probability that they would not be detected? (b) The actual number of cracks N in the weld is not known. However, the probabilities P(N = 0), P(N = 1), P(N = 2) are given in Figure 117. p N (n) 0.6 0.3 0.1 0 1 2 n, number of cracks Figur, uppgift 117. What is the probability that the NDT device will detect 0 cracks in this weld? (c) If the device detects 0 cracks in the weld, what is the probability that the weld is flawless (that is, no crack at all)? 118. En låda innehåller två mynt, ett vanligt med krona på ena sidan och klave på den andra samt ett med krona på båda sidorna. Ett mynt väljs slumpvis och kastas varvid krona kommer upp. Med vilken sannolikhet är den andra sidan på myntet också krona? 119. I en preliminär studie anges designnivån för en bro sådan att 30 % anses som en acceptabel sannolikhet för att bron ska översvämmas av flod minst en gång under de närmaste 25 åren. (a) Om p betecknar sannolikheten att brons designnivå överskrids under 1 år, vilken värde på p uppfyller designkriteriet ovan? (b) Vad är återkomstiden för denna designflod? Ledning: Om p är sannolikheten att brons designnivå överskrids under 1 år beräknas återkomstiden som 1 p år. Tolkningen av en återkomsttid på 100 år för designfloden är att i genomsnitt kommer en designflod vart 100:de år. Del 2. Diskreta fördelningar 201. Vid ett tärningsspel får man flytta en spelpjäs det antal steg som tärningen visar, utom då den visar 1, då får man flytta sex steg. LåtÜvara det antal steg man får flytta spelpjäsen. (a) Bestäm sannolikhetsfunktionen förüoch skissa den. (b) Bestäm fördelningsfunktionen förü, F(x) = P(Ü x), för olika värden på x: beräkna t.ex. F(1), F(2), F(3), F(3.5), F(4) och F(6). Försök skissa funktionen F(x). 202. En s.v.üär Poissonfördelad och har variationskoefficienten R(Ü) = 0.50. Beräkna sannolikheten att Üantar värdet 0. Variationskoefficienten R(Ü) för en stokastisk variabelüdefineras som kvoten mellan variabelns standardavvikelse och väntevärde, d.v.s. R(Ü) = D(Ü) E(Ü).

Övningsuppgifter 9 203. OmÜ Po(7.5), ange P(Ü 4), P(6 Ü 11), P(Ü 10) samt P(Ü=8). 204. Antag attü Bin(16, 0.40). Beräkna P(4 <Ü< 8) och P(Ü= 6). 205. På en fröpåse står tryckt grobarhet 75 %. Om man sår 15 frön, hur stor är sannolikheten att mellan 65 % och 90 % av dem gror? 206. Fortsättning från uppgift 201: Vid ett tärningsspel får man flytta en spelpjäs det antal steg som tärningen visar, utom då den visar 1, då får man flytta sex steg. Beräkna väntevärdet av det antal steg man får flytta. 207. Avloppen i en stad är dimensionerade efter regnmängder med en återkomsttid på 10 år. Antag att översvämningar olika år inträffar oberoende av varandra. (a) Vad är sannolikheten - enligt dimensioneringen - att det sker en översvämning ett slumpmässigt valt år? Ledning: se uppgift 119(b). (b) Vad är sannolikheten - enligt dimensioneringen - för minst 2 översvämningsår under en 15- årsperiod? (c) Dimensioneringen gjordes redan 1985. De senaste 20 åren tycker man att det har regnat mer än tidigare eftersom antalet år med översvämningar varit 5. Beräkna sannolikheten att man får minst 5 översvämningar under 20 år enligt den gamla dimensioneringen. Inför statistikdelen av kursen: Tyder detta på att det regnat mer de senaste decennierna så att sannolikheten för översvämning har ökat? 208. (a) Översvämningar modelleras av en poissonprocess, d.v.s.ü, antalet översvämningar under t år, är poissonfördelat Po(Ð t) därðär genomsnittliga antalet översvämningar per år. Om medelintensiteten för översvämningar för en region A är en gång per åtta år, bestäm sannolikheten för att det inte blir några översvämmningar under en tioårsperiod; en översvämmning under tioårsperioden; mer än tre översvämmningar under tioårsperioden. (b) En byggnad är placerad i området A. Sannolikheten att den kommer att vattenskadas, när en översvämning inträffar, är 0.05. Beräkna sannolikheten att byggnaden kommer att klara sig om översvämning ej inträffar; om en översvämning inträffar; om n översvämningar inträffar. Antag statistiskt oberoende mellan översvämningarna. (c) Beräkna sannolikheten att byggnaden kommer att klara sig från vattenskador över en 10-årsperiod. 209. Man studerade trafikflödet på en enkelriktad väg som leder fram till en betalstation. I genomsnitt kom det 120 fordon per timme och av dessa var 2/3 passagerarbilar och 1/3 lastbilar. Varje bilförare får betala $0.50 medan kostnaden för en lastbil är $2. Antag att antalet bilar under tidsperioden (0,t) kan beskrivas med en poissonfördelning. (a) Vad är sannolikheten att det under en minut kommer fler än 3 fordon till betalstationen? (b) Vad är den förväntade summan av betalning vid stationen under 3 timmar? 210. Strejker bland byggnadsarbetare inträffar i enlighet med poissonprocessen i genomsnitt en strejk vart 3:dje år. Det motsvarar att antalet strejker efter x år är poissonfördelat med väntevärdeðx, medð=1/3 strejk/år. Genomsnittsvaraktigheten hos en strejk är 15 dagar, och motsvarande standardavvikelse är 5 dagar. Om strejken kostar (i förlorad tid) en entreprenör $10,000 per dag, svara på följande (a) Vad skulle entreprenören väntas förlora under en strejk? (b) Om strejkens längd är normalfördelad variabel, vad är då sannolikheten att entreprenören förlorar mer än $20,000 under en strejk?

10 Matematisk statistik för V (c) Om ett projekt tar 2 år att slutföra, vad blir entreprenörens förväntande förlust orsakad av strejker? 211. A large radio antenna system consisting of a dish mounted on a truss (see Figure 211) is designed against wind load. Since damaging wind storms rarely occur, their occurrences may be modeled by a Poisson process. Local weather records show that during the past 50 years only 10 damaging wind storms have been reported. Assume that if damaging wind storm (or storms) occur in this period, the probabilities that the dish and the truss will be damaged in a storm are 0.2 and 0.05, respectively, and that damage to the dish and truss are statistically independent. Determine the probabilities, during the Figur 211 a). next 10 years, for the following events. (a) There will be more than 2 damaging wind storms. (b) The antenna system will be damaged, assuming the occurrence of at most 2 damaging storms. (c) The antenna system will be damaged. 212. Antalet jordskalv under ett år i ett område anses vara poissonfördelat med parameterñ, dvs om Ü= antalet jordskalv under ett år gällerü Po(Ñ). (a) Gör en konkret tolkning av parameternñ. (b) Antag attñ=1.6. Vad är sannolikheten för högst 2 jordskalv under ett år? (c) Antag attñ=1.6. Vad är sannolikheten för ett jordskalvsfritt decennium i området? 213. Ett sätt att mäta radonkoncentrationen i inomhusluft är att hänga upp en film känslig för alfa-partiklar. När filmen träffas av en partikel uppstår efter framkallning ett hål i filmen. OmÜär antalet hål i en film är det rimligt att anta attüär poissonfördelat med ett väntevärde som är proportionellt mot radonkoncentrationenð, dvsü Po(KÐ). Då man gör mätningar i Wilmas hus är i denna mätsituation K = 0.1. (a) Nyligen rekommenderade världshälsoorganisationen WHO att gränsvärdet för radon i bostäder sänks tillð=100 Bq/m 3 (idag är gränsenð=200 Bq/m 3 i Sverige). Antag att radonkoncentrationen i Wilmas hus ligger precis på det av WHO rekomenderade gränsvärdet, vad är då det förväntade antalet hål i en film i detta hus? (b) I huset uppmätte man 15 hål på en film. Beräkna sannolikheten att det finns 15 hål eller fler på en film omð=100. Inför statistikdelen av kursen: Verkar det finnas fog för påståendet att WHO-gränsvärdet är överskridet i Wilmas hus?

Övningsuppgifter 11 Del 3. Kontinuerliga fördelningar 301. VäntetidenÜ(enhet: min) från öppningsdags till dess första kunden kommer in i en affär, antas vara en s.v. med fördelningsfunktionen FÜ(x) = { 0, om x < 0, 1 e 0.4x, om x 0. Beräkna sannolikheten att första kunden dröjer (a) högst 3 minuter (b) minst 4 minuter (c) mellan 3 och 4 minuter (d) högst 3 eller minst 4 minuter (e) precis 2.5 minuter 302. Ett lokaltåg skall ankomma till en station kl 13.03 men brukar vara något försenat. Förseningen (enhet: minut) varierar så att den kan betraktas som en s.v.üvilken har frekvensfunktionen (täthetsfunktionen) fü(x) = 1/5, 0 x 5. Hur stor är sannolikheten att tåget kommer senare än 13.06? Hur stor är sannolikheten att det kommer mellan 13.04 och 13.05? Skissa gärna frekvensfunktion respektive fördelningsfunktion och markera de sökta sannolikheterna i figurerna. 303. The settlement of a structure has the probability density function shown in Figure 303. (a) What is the probability that the settlement is less than 2 cm? (b) What is the probability that the settlement is between 2 and 4 cm? f X (x) h 0 2 4 6 x, settlement in cm Figur, uppgift 303. 304. En s.v.üär N(0, 1). Ange P(0.21 <Ü< 0.29), P( 0.21 <Ü< 0.29) och P( 0.29 <Ü< 0.21). 305. ÅrsnederbördenÜien stad är en normalfördelad variabel med ett väntevärde på 50 tum och en variationskoefficient på 0.2. Variationskoefficienten R(Ü) för en stokastisk variabelüdefineras som kvoten mellan variabelns standardavvikelse och väntevärde, d.v.s. R(Ü) = D(Ü) E(Ü). Beräkna följande: (a) Standardavvikelsen förü. (b) P(Ü<30). (c) P(Ü>60).

12 Matematisk statistik för V (d) P(40 <Ü 55). (e) Sannolikheten attüär inom 5 tum från väntevärdet (d.v.s. förväntad årsnederbörd). 306. En s.v.üär N(0, 1). Bestäm talet x så att (a) P(Ü>x) = 0.001 (b) P(Ü>x) = 0.999 (c) P( Ü < x) = 0.95 (d) P(Ü< x) = 0.10 307. I marsklandet på sydöstra Jylland ligger stora områden under havsytans nivå skyddade av vallar. Det maximala vattenståndet under ett år vid Höjer räknat från en given referensnivå kan antas vara normalfördelat med väntevärde 300 och standardavvikelse 75 (enhet: cm). Skyddsvallarnas höjd är 500 cm över referensnivån. Översvämning inträffar när vattenståndet når över skyddsvallarna. (a) Beräkna sannolikheten för översvämning ett år. (b) Beräkna sannolikheten för minst en översvämning under 100 år. 308. Two reservoirs are located upstream of a town; the water is held back by two dams A and B. Dam B is 40 m high. (See Figure 308a). During a strong-motion earthquake, dam A will suffer damage and water will flow downstream into the lower reservoir. Depending on the amount of water in the upper reservoir when such an earthquake occurs, the lower reservoir water may or may not overflow dam B. Figur 308 a). p Y (y) f X (x) 0.7 a 0.3 0 25 35 y (m) Figur 308 b), c). 0 5 10 15 20 x, Increase in Water Level in Reservoir B Suppose that the water level at reservoir B, during an earthquake, is either 25 m or 35 m, as shown in Figure 308 b); and the increase in the elevation of water level in B caused by the additional water from reservoir A is a continuous random variable with the probability density function given in Figure 308 c). (a) Determine the value of a in Figure 308 c). (b) What is the probability of overflow at B during a strong-motion earthquake?

Övningsuppgifter 13 (c) If there were no overflow at B during an earthquake, what is the probability that the original water level in reservoir B is 25 m? 309. Beteckna medümaximala snödjupet (enhet meter) under en vinter på en viss ort. Antag attühar täthetsfunktionen fü(x) = 2xe x2, x 0. Beräkna kvantilen x ; utför numerisk beräkning för =0.5, 0.1 och 0.01. 310. Karakteristisk bärförmåga definieras som 95%-kvantilen av bärförmågan, dvs. sannolikheten att den verkliga bärförmågan överstiger den karakteristiska är 0.95. Bestäm den karakteristiska bärförmågan om bärförmågan är Weibullfördelad med fördelningsfunktionen F(x) = 1 e (x/a)k, x > 0 där parametrarna a = 10, k = 5. 311. Antag att det årliga maximivärdetüav vindhastigheten har väntevärdet m och standardavvikelsen, och fördelningen + är extremvärdesfördelad av typ 1 (alternativt namn: Gumbelfördelning), dvs. FÜ(x) = exp( e (x b)/a ), < x <. Sambandet mellan parametrarna a, b, och m, är m = b = aô6 där 0.577 (Eulers konstant). Definiera k-årsvinden x k genom P(Ü>x k ) = 1/k. Antag att variationskoefficienten /m = 0.12, vilket är ett realistiskt värde under europeiska förhållande. Variationskoefficienten för en s.v. är kvoten mellan variabelns standardavvikelse och dess väntevärde. (a) Bestäm kvoten x 100 /x 50 mellan 100-årsvinden och 50-årsvinden. (b) I vindbelastningsnormer kan 100-årsvinden beräknas enligt formeln x k = x 50 0.57 + 0.11 ln k. Beräkna samma kvot som i föregående deluppgift och jämför dina svar! 312. Den s.v. är lognormalfördelad enligt ln N(2.5, 1.8). Beräkna P( <10). Ledning. Logaritmera på båda sidor i olikheten <10. 313. I Buffalo, NY, USA, har man registerat årliga mängden nederbörd i form av snö. Data finns för åren 1910-1972. För datamaterialet har man funnit medelvärdet 80.3 (inches) och standardavvikelsen 23.7 (inches). Vi antar här att en lognormalfördelning är en lämplig modell för data. (a) Bestäm parametrarna i lognormalfördelningen genom att utnyttja medelvärde och standardavvikelse från data. (b) Beräkna sannolikheten för årlig mängd snö större än 130 inches.

14 Matematisk statistik för V 314. En enkel betongpelare utsätts för en axiell belastning som är en lognormalfördelad variabel med väntevärdeñ = 3000 kn och variationskoefficient R( ) = 0.20. Variationskoefficienten för en s.v. är kvoten mellan variabelns standardavvikelse och dess väntevärde. Den genomsnittliga krosshållfastheten hos betong är E(s c ) = 35.000 kn/m 2 med variationskoefficient V (s c ) = 0.20. Antag likformig belastning över tvärsektionsytan hos pelaren, så att pålagda belastningen blir s = A där A = tvärsektionsytan hos kolonnen. (a) Vad är täthetsfunktionen hos den pålagda belastningen s. (b) Beräkna sannolikheten för brott (krossning) hos en 0.40 m 0.40 m kolonn. Antag en lognormalfördelning för s c. (c) Om en krossannolikhet på högst 10 3 tillåts, bestäm den nödvändiga tvärsektionsytan hos kolonnen. f T (t) b a t 2 0 12 16 t, sec. Figur, uppgift 315. 315. Den tid som en kraft belastar en viss konstruktion varierar på ett sätt som beskrivs av täthetsfunktionen i Figur 315. (a) Bestäm konstanterna a och b. (b) Beräkna väntevärde och median för belastningstiden T. (c) Beräkna sannolikheten att T är minst 6 sek, dvs P(T 6). (d) Beräkna variansen för belastningstiden T. (e) Beräkna standardavvikelsen för belastningstiden T. 316. Sidobelastningen hos en liten byggnadsställning är slumpmässig med en täthetsfunktion f R (r) = { 3 500 (r 10)(20 r), 10 r 20 0, annars (a) Skissa frevensfunktionen (täthetsfunktionen) f R (r) och fördelningsfunktionen F R (r).

Övningsuppgifter 15 (b) Beräkna i. Väntevärdet för R. ii. Medianen för R. iii. Typvärdet (moden) för R. iv. Standardavvikelsen för R. v. Variationskoefficienten för R, d.v.s. V (R) E(R). 317. I en kemisk industri mäts dagligen koncentrationen (mg/10 3 liter) av en viss förorenande substans i avloppsvattnet. På grundval av många tidigare mätningar anser man att koncentrationen en slumpmässigt vald dag kan beskrivas med en slumpvariabelüsom är exponentialfördelad { 0.5e f (x) = 0.5x x 0 0 x < 0. enligt figur 317 där alltså konstanten c är 0.5. (a) Om koncentrationen överstiger 6 mg/10 3 liter anses vattnet vara förorenat. Vad är sannolikheten att detta inträffar en dag? (b) Vad är återkomsttiden (i dagar) för koncentrationsnivåer som överstiger 6 mg/10 3? (c) Vad är sannolikheten att man under de nästkommande tre dagarna får förorenat vatten vid högst en av dagarna? Antag att koncentrationen av ämnet är oberoende för olika dagar. f X (x) f X (x)=ce cx ; c = constant 0 2 4 6 8 x, concentration (mg/10 3 l) Figur 317 a). 318. I uppgift 101 finns maximala årliga avrinningsflödet för Feather River under perioden 1902 till 1960 angivet och motsvarande histogram utritat. Hydrologerna ville skatta 10- och 100-årsflödet i floden och gjorde en så kallad frekvensanalys. (100-årsflödet är det flöde som återkommer i genomsnitt vart 100:de år. Det innebär att sannolikheten att få ett 100-årsflöde ett år är 1 100 = 0.01) (a) Första steget vara att hitta en lämplig statistisk fördelning som passade till data. Man kunde tänka sig någon av dessa fördelningar: normalfördelning (se kap 4.2.4. i Vännman), lognormalfördelning (logaritmerade data är normalfördelade), weibullfördelning (se kap 4.2.3 i Vännman) eller gumbelfördelning som har fördelningsfunktionen FÜ(x) = exp( e (x b)/a ), < x <. Maximala årsflödet ritades in i respektive fördelningspapper, se figur 318(a). Hur ett fördelningspapper är konstruerat finns beskrivet i kap. 10 i Vännman men kortfattat anges data på x-axeln medan y-axeln oftast anger fördelningsfunktionen i en speciell skala. Om data passar bra till fördelningen kommer de att ligga på en någorlunda rät linje i motsvarande fördelningspapper. Vilken fördelning tycker ni passar bäst till data?

16 Matematisk statistik för V Normal Probability Plot Lognormal Probability Plot Probability 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 50 100 150 200 Data Probability 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 3 4 5 Data Probability 0.99 0.96 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 Weibull Probability Plot 10 1 10 2 Data log( log(f)) 5 4 3 2 1 0 1 Gumbel Probability Plot 2 0 50 100 150 200 250 Data Figur 318 (a). (b) Man tyckte att en Gumbelfördelning (alternativt namn: extremvärdesfördelning av typ 1) var den bästa av de fyra föreslagna fördelningarna. Man skattade parametrarna a och b i fördelningen utifrån data (kommer senare i kursen) och kunde sedan anpassa frekvensfunktionen till ett normerat histogram (överst i figur 318 (b)) och fördelningsfunktionen till empirisk fördelningsfunktion (underst i figur 318 (b). Använd den anpassade fördelningen för att uppskatta hur stor sannolikheten är att maximala årsflödet överstiger 100 ft 3 /s. Markera i båda figurerna hur denna sannolikhet beräknas. (c) Vad är motsvarande återkomstid till flödet 100 ft 3 /s? (d) Uppskatta flödet med återkomsttid 10 år, respektive 100 år? Här blir skattningarna förstås grova eftersom ni bara har en dålig bild att utgå ifrån (dator rekommenderas!) men det väsentliga är att ni förstår principen. 319. Myndigheter (Naturvårdsverk, länstyrelser, kommuner osv) har under de senaste åren genomfört omfattande övervakningsprogram av mark, luft och vatten i Sverige. En rad kvalitetsvariabler mäts med jämna mellanrum, i bästa fall går mätningarna tillbaka till 1960-talet. Numera kan många av mätningarna hittas på internet, vi ska titta på mätningar av vattenkvalitet i vattendrag. Institutionen för miljöanalys vid Statens Lantbruksuniversitet har skapat en databank för en rad mätningar i vatten, data kan nås på http://info1.ma.slu.se/db.html. I figuren nedan gäller det mätningar av totalt fosfor från station Ljungbyholm vid mynningen av Ljungbyån i sydöstra Småland, söder om Kalmar där man mätt en gång i månaden sedan 1965.

Övningsuppgifter 17 0.014 Normerat histogram och anpassad frekvensfunktion, Gumbelfrdelning f(x) 0.012 0.01 0.008 0.006 0.004 0.002 0 0 50 100 150 200 250 Data 1 Empirical and Gumbel estimated cdf 0.8 F(x) 0.6 0.4 0.2 0 0 50 100 150 200 250 Data Figur, uppgift 318 (b). Institutionen för miljöanalys Ljungbyån Ljungbyholm Latitud/longitud: 563790 161055, RAK X/Y: 627831 152255, karta: 04G-NV (6,6 ; 45,1) Län/kommun: 08 80, avrinningsområde: 735 km2 Visanärområde Urval: tidsperiod 1965-2002, säsongsperiod 01-12, djupnivå 0,5 m tidsperiod 1965-1973 (blå graf) jämföres med tidsperiod 1974-2002 (röd graf) Tot-P µg/l Figur, uppgift 319.

18 Matematisk statistik för V (a) Den översta grafen visar samtliga mätningar under den 35 år långa tidsperioden ( Graf över analysvärden ). Ser de homogena ut under hela tidsperioden? Den andra grafen visar den empiriska fördelningsfunktionen ( Fördelningsfunktion för stickprov ) för dessa data. Hur ska man tolka den? Vad har du på x-axel respektive y-axel? Vad innebär det t.ex. att funktionen vid 100 har värdet 0.9? Vad är medianen för data? Den streckade lodräta linjen motsvarar medelvärdet, vad innebär det om data då medelvärde och median skiljer sig mycket åt? (b) När du tittar på tidsserien (dvs samtliga data utritade i tidsföljd) över fosforvärden kan du nog urskilja två tidsperioder där fosformätningarna inte riktigt beter sig på samma sätt. I den understa grafen har man gjort en jämförelse mellan två tidsperioder och separata grafer över de två empiriska fördelningsfunktionerna. Tolkning? (Orsaken till skillnaden i fosforhalt mellan tidsperioderna är att under början av 1970-talet förbättrades reningstekniken avsevärt vid det största reningsverket i avrinningsområdet.)