Lunds tekniska högskola Matematikcentrum Matematisk statistik. Övningsuppgifter Matematisk statistik AK för M, FMS 035, VT-13. 1 Sannolikhetsteori 1



Relevanta dokument
Lunds tekniska högskola Matematikcentrum Matematisk statistik. Övningsuppgifter Matematisk statistik AK för M, FMS 035, VT Sannolikhetsteori 1

1 Sannolikhetsteori 1. 2 Inferensteori Svar 20

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 17 August 2015, 8:00-12:00. English Version

Kurskod: TAMS11 Provkod: TENB 28 August 2014, 08:00-12:00. English Version

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 15 August 2016, 8:00-12:00. English Version

Kurskod: TAMS11 Provkod: TENB 12 January 2015, 08:00-12:00. English Version

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 31 May 2016, 8:00-12:00. English Version

Resultatet anslås senast 10 juni på institutionens anslagstavla samt på kurshemsidan.

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

Resultatet läggs in i ladok senast 13 juni 2014.

F ξ (x) = f(y, x)dydx = 1. We say that a random variable ξ has a distribution F (x), if. F (x) =

English Version. 1 x 4x 3 dx = 0.8. = P (N(0, 1) < 3.47) = =

S0005M. Stokastiska variabler. Notes. Notes. Notes. Stokastisk variabel (slumpvariabel) (eng: random variable) Mykola Shykula

Tentamen MVE301 Sannolikhet, statistik och risk

S0005M, Föreläsning 2

Tentamen MVE302 Sannolikhet och statistik

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Chapter 2: Random Variables

Tentamen MVE301 Sannolikhet, statistik och risk

Kurskod: TAMS11 Provkod: TENB 07 April 2015, 14:00-18:00. English Version

Statistical Quality Control Statistisk kvalitetsstyrning. 7,5 högskolepoäng. Ladok code: 41T05A, Name: Personal number:

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE302 Sannolikhet och statistik

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Föreläsning 12: Regression

Module 6: Integrals and applications

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

7.5 Experiment with a single factor having more than two levels

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

English Version. + 1 n 2. n 1

Hur måttsätta osäkerheter?

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Några extra övningsuppgifter i Statistisk teori

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Blandade problem från elektro- och datateknik

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik,

Kurskod: TAMS24 / Provkod: TEN (8:00-12:00) English Version

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Tentamen MVE301 Sannolikhet, statistik och risk

English Version. Number of sold cakes Number of days

Tentamen MVE301 Sannolikhet, statistik och risk

Matematisk statistik för B, K, N, BME och Kemister

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2010

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

1. En kontinuerlig slumpvariabel X har följande täthetsfunktion (för någon konstant k). f.ö.

0 om x < 0, F X (x) = c x. 1 om x 2.

Tentamen i Matematik 2: M0030M.

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Blandade problem från maskinteknik

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Metod och teori. Statistik för naturvetare Umeå universitet

6. a) Visa att följande vektorer är egenvektorer till matrisen A = , och ange motsvarande

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

12.6 Heat equation, Wave equation

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 08 June 2015, 14:00-18:00. English Version

Tentamen i matematisk statistik

Föreläsning 12: Repetition

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

F13 Regression och problemlösning

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

F3 Introduktion Stickprov

Tentamen i Matematisk statistik Kurskod S0001M

LUNDS TEKNISKA HÖGSKOLA Institutionen för Elektro- och Informationsteknik

Tentamen i Matematisk statistik Kurskod S0001M

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Föreläsning 7: Punktskattningar

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

SF1911: Statistik för bioteknik

Statistiska metoder för säkerhetsanalys

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Statistik för teknologer, 5 poäng Skrivtid:

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Föreläsning 7: Punktskattningar

Avd. Matematisk statistik

Laboration 5: Intervallskattning och hypotesprövning

Transkript:

Lunds tekniska högskola Matematikcentrum Matematisk statistik Övningsuppgifter Matematisk statistik AK för M, FMS 035, VT-13 Innehåll 1 Sannolikhetsteori 1 2 Inferensteori 15 3 34 4 Fullständiga lösningar till -märkta uppgifter 40 1 Sannolikhetsteori 1. De möjliga sättningarna för de tre brostöden till en bro, som visas i figuren, är enligt följande brostöd A: 0 tum, 1 tum, 2 tum brostöd B: 0 tum, 2 tum brostöd C: 0 tum, 1 tum, 2 tum (a) Beskriv utfallsrummet som representerar alla möjliga sättningar hos de tre brostöden, t.ex. (1, 0, 2) betyder att A sätter sig 1 tum, B sätter sig 0 tum och C sätter sig 2 tum. (b) Låt E vara händelsen att man på minst ett ställe får 2 tum i sättningsskillnad mellan intilliggande stöd. Bestäm utfallen hos händelse E. 2. A cylindrical tank is used to store water for a town (see figure). The available supply is not completely predictable. In any one day, the inflow is equally likely to fill 6, 7, or 8 feet of the tank. The demand for water is also variable, and may (with equal probabilities) require an amount equivalent to 5, 6, or 7 feet of water in the tank. (a) What are the possible combinations of inflow and outflow in a day? (b) Assuming that the water level in the tank is 7 feet at the start of a day, what are the possible water levels in the tank at the end of the day? What is the probability that there will be at least 9 feet of water remaining in the tank at the end of the day?

1 SANNOLIKHETSTEORI 3. En ubåt avfyrar två torpeder mot ett mål. Varje torped för sig träffar med sannolikheten 0.7 och sannolikheten att båda gör det är 0.64. (a) Träffar torpederna oberoende av varandra? (b) Beräkna sannolikheten för att en men inte två torpeder träffar. (c) Beräkna sannolikheten att minst en träffar. 4. En viss typ av förkylning för med sig vissa symptom. Det har visat sig att den som råkar ut för denna förkylning får feber med sannolikheten 0.35 och halsont med sannolikheten 0.85. Sannolikheten att den som fått förkylningen råkar ut för båda symptomen är 0.18. Vad är sannolikheten att den person som fått förkylningen får feber givet att personen fått halsont? 5. På vägverkets hemsida kan följande läsas: År 2008 inträffade 355 olyckor i vägtrafiken med dödlig utgång. 20 procent var alkoholrelaterade. Om bara 20% av de som dog var alkoholpåverkade, betyder det att det är säkrare at köra alkoholpåverkad? (a) Börja med att teckna lämpliga händelser. Försök sedan med begreppet betingad sannolikhet förstå vilken händelse som man har fått sannolikheten för. (b) Vilken händelses sannolikhet berättar om det är farligt att köra alkoholpåverkad? 6. Vid flygbolaget Cheap & Easy är sannolikheten att en passagerare blir av med bagaget 1%, och sannolikheten att passageraren blir missnöjd 3%. Sannolikheten att passageraren blir missnöjd om bagaget försvinner är 95%. Antag att du träffar på en missnöjd passagerare, vad är sannolikheten att han förlorat bagaget? 7. (a) En villaägare köpte en stor påse blandade lökar i höstas. Enligt förpackningen är en tredjedel påskliljor och resten tulpaner. Alla påskliljorna och en fjärdedel av tulpanerna är gula, resten är röda. Villaägaren grävde ner en slumpmässigt vald lök utanför köksfönstret. Hur stor är sannolikheten att blomman är gul? (b) För händelserna A och B gäller att P(A) = 1/3, P(B A) = 1 och P(B A ) = 1/4. Beräkna P(B). (c) Övertyga dig själv om att (a) och (b) egentligen är exakt samma uppgift. [Båda gavs samtidigt på samma tentamen för V och L (och M) 2002-03-08. Det var inte alla skrivande som hade samma svar på båda.] (d) (Forts. på (a)) Hur stor är den betingade sannolikheten att blomman är en påsklilja, givet att den är gul? 2

1 SANNOLIKHETSTEORI 8. [ ] Vid en bestämd plats kommer kraftiga vindar från någon riktning mellan rakt östligt (θ = 0 ) och rakt nordligt (θ = 90 ). Alla icke-negativa värden på vindhastigheten V är möjliga. (a) Beskriv utfallsrummet för vindhastigheten och vindriktningen, t.ex. genom att rita en figur. (b) Låt A = {V > 20 km/h} B = {12 km/h < V 30 km/h} C = {θ 30 } Identifiera händelserna A, B, C och A i utfallsrummet beskrivet i (a). (c) Identifiera följande händelser D = A C E = A B F = A B C (d) Är händelserna D och E oförenliga? Hur är det med händelserna A och C?, Lösning 9. [ ] En låda innehåller två mynt, ett vanligt med krona på ena sidan och klave på den andra samt ett med krona på båda sidorna. Ett mynt väljs slumpvis och kastas varvid krona kommer upp. Med vilken sannolikhet är den andra sidan på myntet också krona?, Lösning 10. [ ] Before the design of a tunnel through a rocky region, geological exploration was conducted to investigate the joints and the potential slip surface that exists in the rock strata (see figure). For economic reasons, only portions of the strata are explored. In addition the measurement recorded by the instruments are not perfectly reliable. Thus the geologist can only conclude that the condition of the rock may be either highly fissured (H), medium fissured (M), or slightly fissured (L) with relative likelihoods of 1:1:8. Based on this information, the engineer designs the tunnel and estimate that if the rock condition is L, the reliability of the proposed design is 99.9 %. However, if it turns out that the rock condition is M, the probability of failure will be doubled; similarly, if the rock condition is H, the probability of failure will be 10 times that for condition L. (a) What is the reliability of the proposed tunnel design? 3

1 SANNOLIKHETSTEORI (b) A more reliable device is subsequently used to improve the prediction of rock condition. Its results indicate that a highly fissured condition for the rock around the tunnel is practically impossible, but it cannot give better information on the relative likelihood between rock conditions M and L. In light of this new information, what would be the revised reliability of the proposed tunnel design? (c) If the tunnel collapsed, what should be the updated probabilities of M and L?, Lösning 11. [ ] The preliminary design of a bridge spanning a river consists of four girders and three piers as shown in the figure. From consideration of the loading and resisting capacities of each structural element the failure probability for each girder is 10 5 and for each pier 10 6. Assume that failures of the girders and piers are statistically independent. Determine: (a) The probability of failure in the girder(s). (b) The probability of failure in the pier(s). (c) The probability of failure of the bridge system. It seems as if the answers are the sum of the probabilities. Why does it seem so? Recalculate with other much higher probabilities., Lösning 12. [ ] Transportmöjligheter skall upprättas mellan två städer som ligger 200 mil ifrån varandra. Alternativen är motorväg (H), järnväg (R), eller flyg (A); det sista betyder anläggandet av flygplatser i de bägge städerna, se figur. På grund av de relativa förtjänsterna och kostnaderna, är chansen att planeringskommitén kommer att besluta sig for R, H, eller A är 1 till 2 till 3. Bara ett av dessa tre alternativ kan byggas. Emellertid, om kommittén beslutar att bygga en järnväg R, så är sannolikheten 50 % för att denna kommer att vara klar inom ett år; om de beslutar sig för en motorväg H, är motsvarande sannolikhet 75 %; och om de beslutar sig för flyg, är sannolikheten 90 % att flygplatserna kommer att vara klara inom ett år. (a) Vad är sannolikheten att de två städerna kommer att ha någon förbindelse inom ett år? (b) Om en förbindelse är upprättad inom ett år mellan de två städerna, vad är då sannolikheten att denna är en flygkommunikation A? (c) Om kommittén beslutar till fördel för landkommunikation, vad är sannolikheten att det slutliga beslutet kommer att vara en motorväg H? 4

1 SANNOLIKHETSTEORI, Lösning 13. [ ] At a quarry, the time required to load crushed rocks onto a truck is equally likely to be either 2 or 3 minutes (see figure). Also the number of trucks in a queue waiting to be loaded at any time varies considerably, as reflected in the following set of 30 observations taken at random. The time No of trucks No of Relative in queue observations frequency 0 6 0.2 1 3 0.1 2 9 0.3 3 9 0.3 4 3 0.1 5 0 0.0 Total: 30 required to load a truck is statistically independent of the queue size. Use the relative frequencies as estimates of the corresponding probabilities. (a) If there are two trucks in the queue when a truck arrives at the quarry, what is the probability that its waiting time will be less than 5 minutes? (b) Before arriving at the quarry (and thus not knowing the size of the queue), what is the probability that the waiting time of a particular truck will be less than 5 minutes?, Lösning 14. [ ] Two cables are used to lift a load W (see figure). However, normally only cable A will be carrying the load; cable B is slightly longer than A, so normally it does not participate in carrying the load. But if cable A breaks, then B will have to carry the full load, until A is replaced. The probability that A will break is 0.02. The probability that B will fail if it has to carry the load by itself is 0.30, but is 0 as long as A carries the load. (a) What is the probability that both cables will fail? (b) If the load remains lifted, what is the probability that none of the cables have failed?, Lösning 15. Sjukdomsdiagnostik: I befolkningen har 2 % sjukdomen S. Det diagnostiska test som används för att avgöra om en person har S är dock inte perfekt utan man har följande felklassificeringar: En frisk person klassas som sjuk i S med sannolikheten 0.05. En person med sjukdomen S klassas som frisk med sannolikheten 0.01. (a) Vi väljer en person slumpmässigt ur befolkningen. Vad är sannolikheten att testet visar att personen har S? 5

1 SANNOLIKHETSTEORI (b) Max har just genomgått testet och testresultatet var positivt, dvs enligt testet har han S. Vad är sannolikheten att han verkligen har sjukdomen? Se uppgiften LÖSAS på en SKÄRMINSPELNING via kurshemsidan. 16. [ ] Ett nytt test för att avslöja en allvarlig sjukdom har tagits fram. Det ger positivt utslag med sannolikheten 0.99 om personen har sjukdomen fast med sannolikheten 0.05 även om personen inte har den. Det anses vara känt att 1 % av patientmaterialet har sjukdomen. (a) Beräkna den intressanta sannolikheten att en patient har sjukdomen om testet är positivt. (b) Vilken egenskap hos testet ska man försöka ändra för att få en högre sannolikhet i (a)? Ska man försöka få 0.05 att bli 0 eller 0.99 att bli 1? (c) Antag att testet istället används i ett land där 50 % har sjukdomen. Vilket svar ger då frågan i (a)?, Lösning 17. Vid ett tärningsspel får man flytta en spelpjäs det antal steg tärningen visar, utom då den visar 1, då får man flytta sex steg. Låt X vara det antal steg man får flytta spelpjäsen. (a) Vilka värden kan X anta? (b) Vad är sannolikhetsfunktionen, p X (x) = P (X = x) för X, d.v.s. vad är p X (x) för olika värden på x? Skissa funktionen i ett koordinatsystem! (c) Vad är sannolikheten för att man får flytta precis sex steg, d.v.s. vad är p X (6) = P (X = 6)? (d) Vad är sannolikheten för att man får flytta högst tre steg, d.v.s. vad är P (X 3)? (e) Ange fördelningsfunktionen F X (x) = P (X x) för X. Försök att skissa den i ett koordinatsystem! (f) Vad är det förväntade värdet för X, d.v.s. vad är E(X)? 18. A contractor is submitting bids to 3 jobs, A, B and C. The probabilities that he will win the jobs are P(A) = 0.5, P(B) = 0.8 and P(C) = 0.2, respectively. Assume events A, B, C are statistically independent. Let X be the total number of jobs the contractor will win. (a) What are the possible values of X? Compute and plot the probability mass function (sannolikhetsfunktionen) of the random variable X. (b) Determine P(X 2). (c) Determine P(0 < X 2). 6

1 SANNOLIKHETSTEORI 19. Ett lokaltåg skall ankomma till en station kl 13.03 men brukar vara något försenat. Förseningen (enhet: minut) varierar så att den kan betraktas som en s.v. X, som har täthetsfunktionen f X (x) = 1/5 om 0 x 5. Hur stor är sannolikheten att tåget kommer senare än 13.06? Hur stor är sannolikheten att det kommer mellan 13.04 och 13.05? 20. The settlement of a structure has the probability density function (täthetsfunktion) shown in the figure. (a) What is the probability that the settlement is less than 2 cm? (b) What is the probability that the settlement is between 2 and 4 cm? f X (x) h 0 2 4 6 x, settlement in cm (c) If the settlement is observed to be more than 2 cm, what is the probability that it will be less than 4 cm? 21. Antalet förbipasserande bilar under tidsintervallet [0, t] är poissonfördelat med väntevärde λt. (a) Beräkna sannolikheten att inga bilar passerar under tidsintervallet [0, t]. (b) Beräkna sannolikheten att minst en bil passerar under tidsintervallet [0, t]. (c) Låt T vara den slumpmässiga tid det tar tills första bilen dyker upp. Bestäm täthetsfunktionen f T (t) för T. (d) Vilken slags fördelning har T? 22. Ett sätt att mäta radonkoncentrationen i inomhusluft är att hänga upp en film känslig för alfa-partiklar. När filmen träffas av en partikel uppstår efter framkallning ett hål i filmen. Om X är antalet hål i en film är det rimligt att anta att X är poissonfördelat med ett µ som är proportionellt mot radonkoncentrationen λ, dvs X P o(kλ). Då man gör mätningar i Wilmas hus är i denna mätsituation K = 0.1. (a) Nyligen rekommenderade världshälsoorganisationen WHO att gränsvärdet för radon i bostäder sänks till λ=100 Bq/m 3. Antag att radonkoncentrationen i Wilmas hus ligger precis på det av WHO rekomenderade gränsvärdet, vad är då µ i Poissonfördelningen som beskriver antal hål i filmen? (b) I Wilmas hus uppmätte man 15 hål på en film. Beräkna sannolikheten att det finns 15 hål eller fler på en film om λ = 100? Inför statistikdelen av kursen: Verkar det finnas fog för påståendet att WHO-gränsvärdet är överskridet i Wilmas hus? 7

1 SANNOLIKHETSTEORI 23. Karakteristisk bärförmåga definieras som 5 %-kvantilen av bärförmågan, dvs sannolikheten att den verkliga bärförmågan understiger den karakteristiska är 0.95. Bestäm den karakteristiska bärförmågan om bärförmågan är Weibullfördelad med fördelningsfunktionen { 0 för x 0, F X (x) = P(X x) = 1 e (x/10)5 för x > 0. 24. [ ] Suppose the duration (in months) of a construction job can be modeled as a continuous random variable T whose cumulative distribution function (fördelningsfunktion) is given by F T (t) = P(T t) = t 2 2t + 1, 1 t 2 0, t < 1 1, t > 2 (a) Determine the corresponding density function (täthetsfunktion) f T (t). (b) Compute P(T > 1.5)., Lösning 25. [ ] In order to repair the cracks that may exist in a 10-feet weld, a nondestructive testing device (NDT) is first used to detect the location of cracks. Because cracks may exist in various shapes and sizes, the probability that a crack will be detected by the NDT device is only 0.8. Assume that the events of each crack being detected are statistically independent and that the NDT does not give false alarms. (a) If there are two cracks in the weld, what is the probability that they would not be detected? p N (n) 0.3 0.6 (b) The actual number of cracks N in the weld is not known. However, its P MF (sannolikhetsfunktion) is given as in the figure. What is the probability that the NDT device will detect 0 cracks in this weld? 0.1 0 1 2 n, number of cracks (c) If the device detects 0 cracks in the weld, what is the probability that the weld is flawless (that is, no crack at all)?, Lösning 26. [ ] Two reservoirs are located upstream of a town; the water is held back by two dams A and B. Dam B is 40 m high. (See figure) During a strong-motion earthquake, dam A will suffer damage and water will flow downstream into the lower reservoir. Depending on the amount of water in the upper reservoir when such an earthquake occurs, the lower reservoir water may or may not overflow dam B. Suppose that the water level at reservoir B, during 8

1 SANNOLIKHETSTEORI an earthquake, is either 25 m or 35 m, as shown in the bottom left figure; and the increase in the elevation of water level in B caused by the additional water from reservoir A is a continuous random variable with the probability density function (täthetsfunktion) given in the bottom right figure. p Y (y) f X (x) 0.7 a 0.3 0 25 35 y (m) 0 5 10 15 20 x, Increase in Water Level in Reservoir B (a) Determine the value of a in the bottom right figure. (b) What is the probability of overflow at B during a strong-motion earthquake? (c) If there were no overflow at B during an earthquake, what is the probability that the original water level in reservoir B is 25 m?, Lösning 27. [ ] The bearing capacity of the soil under a column-footing foundation is known to vary between 6 and 15 kn/m 2. Its probability density (täthetsfunktion) within this range is given as { 1 f X (x) = 2.7 (1 x ), 6 x 15 15 0, elsewhere If the column is designed to carry a load of 7.5 kn/m 2, what is the probability of failure of the foundation?, Lösning 28. Den tid som en kraft belastar en viss konstruktion varierar på ett sätt som beskrivs av täthetsfunktionen i figuren. (a) Bestäm konstanterna a och b. f T (t) b a t 2 (b) Beräkna väntevärde och median för belastningstiden T. 0 12 16 t, sec. (c) Beräkna sannolikheten att T är minst 6 sek, dvs P(T 6). 9

1 SANNOLIKHETSTEORI 29. The delay time of a construction project is described with a random variable X. Suppose that X is a discrete variate with probability mass function (sannolikhetsfunktionfunktion) given in the table. The penalty for late completion of the project depends on the number of day of delay; that is, penalty = g(x i ). The penalty function is also given in the table, in unit of $100, 000. PMF of X Penalty funktion x i p X (x i ) g(x i ) (in days) ($100, 000) 1 0.5 5 2 0.3 6 3 0.1 7 4 0.1 7 (a) Calculate the mean penalty for this project. (b) Calculate the standard deviation of the penalty. 30. Låt X ha sannolikhetsfunktionen k 0 1 3 5 p X (k) 0.1 0.2 0.3 0.4 (a) Beräkna P(2 X 7). (b) Beräkna väntevärdet E(X). (c) Beräkna variansen V(X). (d) Beräkna standardavvikelsen D(X). (e) Beräkna E(e X ). 31. Låt X vara en stokastisk variabel med täthetsfunktion f X (x) = 2x för 0 x 1, och 0 för övrigt, och beräkna väntevärde, varians och täthetsfunktion för Y = (1 X) 2. 32. Vid vätskekontrollen i Mångsbodarna dricker var och en av Vasaloppsåkare 0, 1 eller 2 muggar blåbärssoppa med sannolikheterna 0.3, 0.1 respektive 0.6, oberoende av de andra åkarna. (a) Beräkna väntevärde och varians för antalet muggar en slumpmässigt vald åkare dricker. (b) Beräkna sannolikheten att skidåkare A dricker färre muggar blåbärssoppa än skidåkare B. (c) Beräkna sannolikheten att skidåkare A och skidåkare B dricker precis lika många muggar blåbärssoppa. (d) Beräkna sannolikheten att skidåkare A och skidåkare B tillsammans dricker minst 2 muggar blåbärssoppa. 10

1 SANNOLIKHETSTEORI 33. [ ] (a) Surhetsgraden i ett vattendrag bestäms varje måndag med hjälp av en ph-meter. Därvid uppstår ett fel Y med väntevärdet δ och standardavvikelsen σ = 0.05. Här bör δ vara 0 men på grund av att kalibrering ej gjorts är detta systematiska fel 0.4. Beräkna väntevärde och standardavvikelse för mätresultatet om det rätta ph-värdet är 5.8. (b) Antag att vattnets sanna surhetsgrad varierar från måndag till måndag som en s.v. X med väntevärdet 5.8 och standardavvikelsen 0.5. Beräkna väntevärde och standardavvikelse för mätresultatet, Z, en godtycklig måndag. (c) Antag att man varje måndag tar ett vattenprov ur ån. På detta vattenprov gör man sedan tre mätningar Z 1, Z 2 och Z 3 och bildar medelvärdet. Beräkna standardavvikelsen för detta medelvärde om de slumpmässiga felen vid de tre mätningarna är oberoende och X varierar från måndag till måndag som i (b). (d) Det finns tre källor till avvikelser från 5.8 hos värdet Z i (b). Vilka? Vilken/vilka av dessa går att påverka genom den medelvärdesbildning som sker i (c)?, Lösning 34. [ ] Antalet avåkningar under en snöstorm kan beskrivas av en Poissonprocess med intensitet λ avåkningar per kilometer vägsträcka. Det innebär bland annat att antalet avåkningar, X t, på en t km lång sträcka är Po(λt)-fördelat. Man räknar antalet olyckor på tre olika vägsträckor som är 2, 3 resp. 5 km långa och får alltså oberoende observationer av X 2 Po(2λ), X 3 Po(3λ) och X 5 Po(5λ). Man vill uppskatta intensiteten λ och väljer mellan två varianter. Antingen uppskattar man först λ på var och en av vägsträckorna och bildar sedan medelvärdet av de tre uppskattningarna (Y ). Eller så betraktar man de tre sträckorna som en lång sträcka och gör en gemensam uppskattning (Z). Uttryckt i formler blir det alltså Y = 1 3 ( X2 2 + X 3 3 + X ) 5 5 (a) Beräkna väntevärdet av Y och av Z. och Z = X 2 + X 3 + X 5. 2 + 3 + 5 (b) Beräkna variansen av Y och av Z. Vilken av de två varianterna verkar lämpligast? (c) Under den senaste snöstormen fck man observationerna x 2 = 8, x 3 = 5 och x 5 = 14. Använd λ = Z för att konstruera ett approximativt 95 % konfidensintervall för λ., Lösning 35. Om årsnederbörden X i en stad är en normalfördelad variabel med ett väntevärde på 50 tum och en variationskoefficient på 0.2, beräkna följande: (a) standardavvikelsen för X, (b) P(X < 30), 11

1 SANNOLIKHETSTEORI (c) P(X > 60), (d) P(40 < X 55), (e) sannolikheten att X är inom 5 tum från medelårsnederbörden, (f) värdet x 0 sådant att sannolikheten av årsnederbörden överskrider x 0 är bara 1/4 av den att inte överskrida x 0. 36. The force in the cable of the truss shown in the figure, when subjected to a load W given by F ac = h2 + l 2 W h (a) If the load W is a normal variate N(µ W, σ W ), determine the distribution of the force F ac. (b) If µ W = 20 metric tons, σ W = 5 metric tons, and h = 1 l, what is the probability that 2 the force F ac will exceed 30 tons? 37. [ ] A simple structure consisting of a cantilever beam AB and a cable BC is used to carry a load S (see figure). The magnitude of the load varies daily, and its monthly maximum has been observed to be Gaussian with a mean of 25 000 kg, and a coefficient of variation of 30 %. (a) If the cable BC and beam AB are designed to withstand a 10-month maximum load (that is, a maximum load with a return period of 10 months) with factors of safety of 1.25 and 1.40, respectively, what are the probabilities of failure of the cable and of the beam? (c) Assuming statistical independence between the failures of the beam and cable, what is the probability of failure of the structure (that is, that it will be unable to carry the load)? (d) If (instead of part (a)) the strength of the cable were random N(50 000 kg, 10 000 kg), what would be its failure probability under the load S?, Lösning 38. [ ] The cantilever beam shown in the figure is subjected to a random concentrated load P and a random distributed load W. Assume 12

1 SANNOLIKHETSTEORI P is N(5, 1), in kn W is N(1, 0.2), in kn/m (a) Determine the mean and variance of the applied bending moment M a = 50W + 10P. Assume that ρ W,P = 0.5 (that is, the loads are correlated). (b) The resisting moment of the beam M r which is statistically independent of the applied moment M a, is also Gaussian N(200, 50) in knm. Determine the probability of failure of the beam, P(M r < M a ) assuming that M a is Gaussian., Lösning 39. [ ] The figure shows a schematic procedure of the treatment system for the waste from a factory before it is dumped into a nearby river. Here X denotes the concentration of a pollutant feeding into the treatment system, and Y denotes the concentration of the same pollutant leaving the system. Suppose that for a normal day, X has a log-normal distribution with median 4 mg/l and the coefficient of variation (COV, variationskoefficient) is 20 %. Because of the erratic nature of biological and chemical reactions, the efficiency of the treatment system is unpredictable. Hence the fraction of the influent pollutant remaining untreated, denoted by F, is also a random variable. Assume F is also a log-normal variate with a median of 0.15 and COV of 10 %. Assume X and F are statistically independent. (a) Determine the distribution of Y and the values of its parameters. Note that Y = F X. (b) Suppose that the maximum concentration of the pollutant permitted to be dumped into the river is specified to be 1 mg/l. What is the probability that this specified standard will be exceeded on a normal day? (c) On some working days, owing to heavy production in the factory, the influent X will have a median of 5 mg/l instead. Assume that the distribution of X is still log-normal with the same coefficient of variation and that the efficiency of the treatment system does not change statistically. Suppose that such a heavy work day happens only 10 % of the time. Then, on a given day selected at random, what is the probability that the specified standard of 1 mg/l for Y will be exceeded?, Lösning 40. The maximum annual flood level of a river is denoted by H (in meters). Assume that the probability density of H is described by the triangular distribution shown in the figure. f H (h) (a) Determine the flood height h 20 which has a mean recurrence interval (return period) of 20 years. (P(H > h 20 ) = 1/20) 5 6 7 h, m 13

1 SANNOLIKHETSTEORI (c) What is the probability that during the next 20 years the river height H will exceed h 20 at least once? (d) What is the probability that during the next 5 years the value of h 20 will be exceeded exactly once? (e) What is the probability that h 20 will be exceeded at most twice during the next 5 years? 41. (a) Översvämningar modelleras av en Poissonprocess. Om medelintensiteten för översvämningar för en region A är en gång per åtta år, bestäm sannolikheten för att det inte blir några översvämmningar under en tioårsperiod; en översvämmning under tioårsperioden; mer än tre översvämmningar under tioårsperioden. (b) En byggnad är placerad i området A. Sannolikheten att den kommer att vattenskadas, när en översvämning inträffar, är 0.05. Beräkna sannolikheten att byggnaden kommer att klara sig om översvämning ej inträffar; om en översvämning inträffar; om n översvämningar inträffar. Antag statistiskt oberoende mellan översvämningarna. (c) Beräkna sannolikheten att byggnaden kommer att klara sig från vattenskador över en 10-årsperiod. 42. [ ] The following is a 20-year record of the annual maximum wind velocity V in town A (in kilometers per hour, kph). Year V (kph) Year V (kph) 1950 78.2 1960 78.4 1951 75.8 1961 76.4 1952 81.8 1962 72.9 1953 85.2 1963 76.0 1954 75.9 1964 79.3 1955 78.2 1965 77.4 1956 72.3 1966 77.1 1957 69.3 1967 80.8 1958 76.1 1968 70.6 1959 74.8 1969 73.5 (a) Based on this record, estimate the probability that V will exceed 80 kph in any given year. (b) What is the probability that in the next 10 years there will be exactly 3 years with annual maximum wind velocity exceeding 80 kph? (c) A temporary structure is designed to resist a maximum wind velocity of 80 kph. What is the probability that this wind velocity will be exceeded during the 3 year lifetime of the structure? (d) How would the answer in part (c) change, if the design wind velocity is increased to 85 kph? 14

2 INFERENSTEORI, Lösning 43. [ ] Den genomsnittliga livslängden per mil vägbeläggning, se figuen, beskrivs som en lognormalvariabel med en median på 3 år och variationskoefficient på 50 %. Livslängden anger den användbara tiden till dess reparationer fordras. Antag att livslängderna hos två olika vägavsnitt på vardera en mil är statistiskt oberoende. Density Lognormal µ=3 δ=50% 0 2 4 6 8 Life per mil, years (a) Vad är sannolikheten att en vägsträcka på en mil kommer att behöva repareras inom ett år? (b) Antag att dimensioneringstiden utgörs av 5 %-percentilslivslängden x 0.05 (dvs, vägens livslängd kommer att vara mindre än dimensioneringstiden med sannolikheten 5 %). Beräkna dimensioneringstiden. (c) Vad är sannolikheten att det inte kommer att behövas några reparationer inom det första året av en 4-mils sträcka av vägen? (d) Vad är sannolikheten att 2 av de 4 milen kommer att behöva repareras inom det första året? (e) Vad är sannolikheten för att reparation behövs av 4-milssträckan inom de första 3 åren? (f) Vad är sannolikheten att den första reparationen av 4-milssträckan kommer att inträffa inom 2:a året? (Notera att förhållandena vid 2:a året inte är oberoende av det 1:a året.), Lösning 44. [ ] Traffic on a one-way street that leads to a toll bridge is to be studied. The volume of the traffic is found to be 120 vehicles per hour on the average and out of which 2/3 are passenger cars and 1/3 are trucks. The toll at the bridge is $0.50 per car and $2 per truck. Assume that the arrivals of vehicles constitute a Poisson process. (a) What is the probability that in a period of 1 minute, more than 3 vehicles will arrive at the toll bridge? (b) What is the expected total amount of toll collected at the bridge in a period of 3 hours?, Lösning 2 Inferensteori 45. Vid Lunds lasarett låter man X beteckna sänkan hos en slumpmässigt vald inneliggande patient en dag i Juni. Vilken eller vilka metoder ger ett slumpmässigt stickprov av X? (a) Notera sänkan på alla nyinskrivna patienter den givna dagen. 15

2 INFERENSTEORI (b) Notera resultatet av samtliga bestämningar av sänkan som utförs vid lasarettet den givna dagen. (c) Titta den givna dagen i lasarettets register över inneliggande patienter och välj med samma sannolikhet slumpmässigt ut patienter och ta sänkan på dessa. 46. I en kursomgång några år tillbaka mättes längden (mm) på 17 kvinnliga M-teknologer som kom till ett övningstillfälle genom att använda ett mätinstrument som var uppsatt i dörren på övningslokalen: 1762 1741 1710 1655 1795 1720 1620 1695 1700 1725 1532 1671 1740 1720 1680 1750 1800 (a) Fundera över om det kan finnas något systematiskt fel eller med ett annat ord bias i mätningarna. Systematiskt fel är något som gör att mätningarna i medel visar fel. Kan ni tänka ut några anledningar till systematiskt fel i mätningarna för längd? (b) Det vore önskvärt om ni med era mätningar för längder på KVINNA kunde dra generella slutsatser för en större population utöver de som finns i klassrummet. Tror ni att datamaterialet är representativt för exempelvis Sveriges kvinnliga befolknings längd? Sveriges vuxna kvinnliga befolkning? Om ni tycker det, motivera. Om inte, vilken population kan ni tänka att datamaterialet kan beskriva? Bestäm en. (c) Vad skulle hända om ni sade att ert datamaterial är ett representativt urval för längden för flickor mellan 6 och 8 år? Relatera detta till systematiskt fel. (d) I materialet ovan finns det några värden som avviker mycket från vad ni skulle förvänta er i den population som datamaterialet beskriver, så kallade outliers. För att komma runt detta, skulle det vara bättre att istället för att mäta alla som är i klassrummet, välja ut några själva som man tror passar som urval till populationen? Varför är ett slumpmässigt stickprov ett bra sätt att välja ut sina element som ska representera populationen? (e) Är ert data för KVINNA taget som slumpmässiga stickprov ur den population ni sagt att den ska beskriva? Om inte, tänk ut hur ni skulle valt personer för att få data taget som slumpmässiga stickprov. (saknas) 47. Antag att maximala våghöjden (H) på ett visst ställe ett visst år kan anses vara Rayleighfördelad, dvs täthetsfunktionen ges av { x /(2a) f H (x) = a e x2 för x 0, 0 för x < 0. där a är en okänd positiv parameter. Man har under 8 år observerat följande maximala våghöjder (i meter): 2.5 2.9 1.8 0.9 1.7 2.1 2.2 2.8 16

2 INFERENSTEORI (a) Beräkna ML-skattningen av a under förutsättning att de åtta observationerna kan anses vara oberoende observationer av H. (b) Beräkna med hjälp av skattningen av a, en skattning av 1000-årsvågen, med vilket menas en våg som är så hög att den i genomsnitt bara inträffar en gång per 1000 år. 48. (forts. på 11.24) Ange skattningens väntevärde och beräkna dess medelfel. 49. Ett mycket stort parti av enheter har felkvoten p, där p är högst 0.04. Man vill ta ut n enheter slumpmässigt ur partiet och på grundval härav konstruera en skattning av p med en standardavvikelse på högst 0.02. Hur stort måste n vara? 50. Ett föremål består av två delar A och B som har vägts ett antal gånger varvid man fick resultaten: A 12.07 12.01 12.04 B 18.34 18.36 18.35 18.32 Vidare har hela föremålet vägts två gånger varvid man fick: A+B 30.35 30.39 Vägningarna är behäftade med oberoende slumpmässiga fel från samma fördelning. Beräkna med minsta-kvadrat-metoden en skattning av vikten hos hela föremålet. 51. In the measurement of daily dissolved oxygen (DO) concentrations in a stream, let p denote the probability that the DO-concentration will fall below the required standard on a single day. DO-concentration is measured daily until unsatisfactory stream quality is encountered, and the number of days in this sequence of measurement is recorded. Suppose 10 sequences have been observed and the length of each sequence is 2, 5, 6, 4, 6, 6, 8, 5, 10, 1 days. Determine the maximum likelihood estimator for p, and estimate p on the basis of the observed data. 52. [ ] The distribution of wave height has been suggested to follow a Rayleigh density function (täthetsfunktion), h 1 f H (h) = α 2 e 2 (h/α)2, h 0, 0, h < 0. with parameter α. Suppose the following measurements on wave heights were recorded: 1.5, 2.8, 2.5, 3.2, 1.9, 4.1, 3.6, 2.6, 2.9, 2.3 m. Estimate the parameter α by the method of maximum likelihood., Lösning 17

2 INFERENSTEORI 53. [ ] De oberoende stokastiska variablerna X i och Y j har väntevärden E(X i ) = 2a respektive E(Y j ) = a och känd varians V(X i ) = V(Y j ) = 1. Man vill skatta a med hjälp av n x mätningar av X i och n y mätningar av Y j. (a) Visa att (den oviktade) minsta-kvadrat-skattningen, a av a ges av a = 2 n x i=1 x i + n y j=1 y j 4n x + n y. (b) Beräkna väntevärde och varians för a och ange en approximativ fördelning för a, under förutsättning att man gör många mätningar av X i och Y j. (c) Man har gjort 150 mätningar av X i och fått x = 14.5. Man har också gjort 100 mätningar av Y j och fått ȳ = 6.4. Beräkna ett värde på a tillsammans med ett approximativt 95 % tvåsidigt konfidensintervall för a., Lösning 54. Data på nederbördens intensitet (i tum) är samlat mellan åren 1918 och 1946 i ett flodområde, enligt följande: År intensitet År intensitet År intensitet År intensitet 1918 43.30 1925 43.90 1932 50.37 1939 42.96 1919 53.02 1926 46.77 1933 54.91 1940 55.77 1920 63.52 1927 59.12 1934 51.20 1941 41.31 1921 45.93 1928 54.49 1935 39.91 1942 58.83 1922 48.26 1929 47.38 1936 53.29 1943 48.21 1923 50.51 1930 40.78 1937 67.59 1944 44.67 1924 49.57 1931 45.05 1938 58.71 1945 67.72 1946 43.11 Räknehjälp: 29 1=1 x i = 1470.16; 29 1=1 x2 i = 76193.20 (a) Beräkna punktskattningar för väntevärdet µ och variansen σ 2. Använd räknehjälpen ovan eller knappa in data på din räknare och utnyttja de färdiga rutiner som finns där, se lathund för miniräknare. Du kan också hämta data som matlabfil: nederbord.mat. (b) Beräkna ett 95 % konfidensintervall för väntevärdet µ. Antag att årsnederbördens intensitet är normalfördelad, och att σ är känd; σ = 8. (c) Är det troligt att förväntad nederbörd ett år är 45 tum? (d) Antag nu, lite mer realistiskt, att σ är okänd och gör ett 95 % konfidensintervall för väntevärdet µ. 55. The daily dissolved oxygen concentration (DO) for a location A downstream from an industrial plant has been recorded for 10 consecutive days. 18

2 INFERENSTEORI Day DO (mg/l) 1 1.8 2 2.0 3 2.1 4 1.7 5 1.2 6 2.3 7 2.5 8 2.9 9 1.6 10 2.2 (a) Assume that the daily DO-concentration has a normal distribution N(µ, σ); estimate the values of µ and σ. (b) Determine the 95 % confidence interval for the true mean µ. (c) Determine the 95 % lower confidence limit of µ. (d) Could we, with some certainty, assert that µ exceeds 1.7 mg/l? 56. Consider the annual maximum wind velocity (V ) data are given in the following table. Year V (kph) Year V (kph) 1950 78.2 1960 78.4 1951 75.8 1961 76.4 1952 81.8 1962 72.9 1953 85.2 1963 76.0 1954 75.9 1964 79.3 1955 78.2 1965 77.4 1956 72.3 1966 77.1 1957 69.3 1967 80.8 1958 76.1 1968 70.6 1959 74.8 1969 73.5 (a) Calculate the sample mean and sample variance of V. (b) Determine an approximate 99 % confidence interval for the mean velocity. 57. Två maskiner A och B levererar under en viss dag enheter som har dimensionerna N(m 1, σ) resp N(m 2, σ), okända parametrar. Man vill jämföra medeldimensionerna m 1 och m 2 och samlar därför in följande material: A 12.37 12.32 12.41 12.34 12.23 12.36 B 12.41 12.39 12.46 12.35 12.39 12.33 19

2 INFERENSTEORI (a) Bestäm ett 95 % konfidensintervall för differensen m 2 m 1. (b) Finns det anledning att tro att maskinerna levererar enheter med två olika medeldimensioner? 58. [ ] En konstruktion är dimensionerad att vila på 100 stolpar. Nio provstolpar drevs ner vid slumpvis valda platser i marken till de knäcktes. Resultatet finns i följande tabell. Provstolpar Stolpkapacitet (ton) 1 82 2 75 3 95 4 90 5 88 6 92 7 78 8 85 9 80 (a) Beräkna medelvärdet och standardavvikelsen för de individuella stolparnas kapacitet. (b) Bestäm ett 98 % konfidensintervall för medelstolpskapaciteten. Antag σ = 6 är känd och att variationen i stolpkapaciteten är normalfördelad. (c) Beräkna ett 98 % konfidensintervall för medelstolpskapaciteten på grundval av okänd varians men med normalfördelad stolpkapacitet., Lösning 59. [ ] En fysiker har gjort fem mätningar för att bestämma en fysikalisk konstant m. Mätningarna kan anses vara observationer av en normalfördelad stokastisk variabel med väntevärde m och känd standardavvikelse. Hon fick ett 90 % konfidensintervall (7.02, 7.14), vilket hon tyckte var för brett och hade för låg konfidensgrad. Hur många fler mätningar behövs för att få ett konfidensintervall som har konfidensgrad (a) 90 % och som är hälften så brett? (b) 95 % och som har ungefär samma bredd?, Lösning 60. [ ] The distance between A and C is measured in 2 stages: namely, AB and BC as shown in the figure. Measurements on AB and BC are recorded as follows: AB: 100.5, 99.6, 100.1, 100.3, 99.5 m BC: 50.2, 49.8, 50.0 m (a) Compute the sample mean and sample variance of the measured distances for AB. 20

2 INFERENSTEORI (b) Compute the standard error of the estimated distance of AB. (c) Establish an approximate 98 % confidence interval for the actual distance AB. (d) If the distance AC is given by the sum of the estimated distances AB and BC, that is AC = AB + BC, what is the standard error of the estimated total distance between A and C? (e) Establish an approximate 98 % confidence interval on the actual length AC., Lösning 61. Antag att data på vattenkonsumtion per dag och per capita har insamlats för fyra städer och sammanställts i tabell enligt följande (se också figur) x y Stad Befolkning Vattenkonsumtion (i 10 4 ) per capita (i 100 liter/dag) 1 1.0 1.0 2 4.0 1.3 3 6.0 1.3 4 9.0 1.4 Vattenkonsumtion per capita y 1.4 1.3 1.2 1.1 1 0 5 10 Befolkning / 10 4 x (a) Om befolkningsstorleken ignoreras, vad blir då stickprovsvariansen s 2 y? (b) Från observerade data tycks finnas en generell trend att vattenkonsumptionen per capita ökar med befolkningen i staden. Använd regressionsmodellen Y (x i ) = α + βx i + ɛ i där ɛ i N(0, σ) och antas vara oberoende av varandra. i. Beräkna minsta-kvadrat-skattningarna av α och β. ii. Uppskatta σ. 62. Sträckgränsen för betong kan mätas i ett splittertest i vilken en betongcylinder placeras i en testanordning där den utsätts för diametral kompression (ASTM C496-66). Kompression och sträckstyrka hos lättbetong och ordinär betong som funktion av ålder för en speciell blandning rapporteras av J. A. Hanson 1 : 1 J. A. Hanson: Effects of Curing and Drying Environments on Splitting Tenside Strength of Concrete, ACI J., Table 3, July 1968 21

2 INFERENSTEORI Lättbetong Betong Ålder Kompressions- Sträck- Kompressions- Sträck- (dagar) styrka gräns styrka gräns 3 2620 276 2050 232 7 3300 343 3250 282 14 4320 407 3830 373 28 5120 420 4560 336 90 5850 458 5240 448 180 6620 494 5390 454 365 6840 513 5530 524 2år 6760 492 5570 506 (a) Gör en regressionsanalys av tillväxten av kompressionsstyrka med tiden. Använd en modell av formen: Styrka = a tid b ɛ där ɛ är en lognormalfördelad stokastisk variabel. (b) Skatta standardavvikelsen hos kompressionsstyrkan som funktion av tiden. Hämta data som matlabfil: betong.mat. 63. [ ] Ett belastningstest har utförts på ett aluminiumprov. Den applicerade belastningen och motsvarande förlängning av prov vid olika etapper av testen är registrerat enligt följande. Belastning Förlängning (kn) (10 3 tum) x y 1 9 2 20 3 28 4 41 5 52 6 63 (a) Antag att belastningsförlängningsrelationen hos aluminium över den här räckan av last är linjär. Beräkna minstakvadratskattningarna av Youngmodulen för det här aluminiumprovet. Tvärsektionsytan hos provet är 0.1 tum 2 och längden är 10 tum. Youngmodulen ges av lutningen hos belastningsförlängningskurvan. (tum/kn). (b) Antag förutom en linjär relation mellan styrka och förlängning att ingen belastning skulle motsvarande ingen förlängning; dvs regressionslinjen som antas vara E(Y (x)) = βx Vad blir minsta-kvadrat-uppskattningen av Youngmodulen i det här fallet?, Lösning 22

2 INFERENSTEORI 64. Det stryker omkring mårror i Ensliga bergen. Mårror är kalla och ju ensammare en mårra känner sig desto snabbare sprider sig kölden ut från henne. Hemulen (som har tröttnat på att samla frimärken och nu samlar på mårror istället) misstänker att det finns ett samband mellan en mårras storlek (mätt i hennes bottenyta x m 2 ) och hur ensam hon känner sig (mätt i köldutbredningshastighet i marken y m 2 /h). Hemulen har samlat in följande material från några slumpmässigt valda mårror vid olika tillfällen: mårra (i) 1 2 3 4 5 6 7 8 9 10 bottenyta (x i ) 2.7 2.0 2.7 2.4 2.3 1.7 1.6 1.9 2.0 2.5 köldutbredningshastighet (y i ) 5.1 6.1 5.3 3.6 4.7 6.1 5.4 5.2 4.6 5.1 kldutbredningshastighet, y (m 2 /h) 7 6 5 4 3 1 1.5 2 2.5 3 bottenyta, x (m 2 ) Han har dessutom räknat ut 10 10 10 i=1 (x i x) 2 = 1.416, i=1 (x i x)(y i ȳ) = 1.046, i=1 (y i ȳ) 2 = 4.796. Testa, på något lämpligt sätt, om det finns ett signifikant linjärt samband mellan köldutbredning och storlek hos mårror. Ange tydligt modell, hypoteser och vald signifikansnivå. 65. I ett försök mätte man hur värmeutvecklingen i stelnad cement påverkas av viktprocenten av trikalciumsilikat. För 13 olika cementblock, med varierande viktprocent trikalciumsilikat, noterade man värmeutvecklingen (enhet: kalorier per gram cement). Resultat: viktprocent 26 29 56 31 52 55 71 31 54 47 40 66 6 värmeutveckling 78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109 Man ansatte en modell där värmeutvecklingen (y) berodde linjärt på viktprocenten (x): y i = α + β x i + ɛ i, i = 1,..., 13 där ɛ 1,..., ɛ 13 är oberoende och N((, 0), σ). Man analyserade data med ett beräkningsprogram och fick följande resultat: Koefficient Skattning Konfidensintervall (95%) α 57.42 (38.74, 76.11) β 0.789 (0.42, 1.16) Vidare fick man skattningen av σ till 9.08 och förklaringsgraden R 2 =0.67. Man ritade också ut några figurer, se nedan. (a) Är den antagna modellen lämlig att ansätta för data? Motivera ditt svar! (b) Påverkas värmutvecklingen av viktprocenten av trikalciumsilikat? Motivera ditt svar! (c) Man vill veta hur mycket värmeutvecklingen ändras då trikalciumsilikatinnehållet ökas med 10 viktprocent. Gör ett 95% konfidensintervall för denna förändring. 23

2 INFERENSTEORI (d) Avgör om följande påståenden är sanna eller falska. Du behöver inte motivera dina svar här. (i) Om vi ökar konfidensgraden från 95% till i 99% i intervallet för β kommer intervallet att bli bredare. (ii) I nästa vecka ska vi göra ett nytt experiment där viktprocenten trikalciumsilicat i cementblocket är 30. Med 95% säkerhet kommer värmeutvecklingen i detta cementblock att vara mellan ungefär 60 och 103 kalorier per gram cement. (iii) Från plotten över residualerna i figuren kan vi dra slutsatsen att värmeutvecklingen inte verkar påverkas av viktprocenten trikalciumsilicat. (iv) Det är det bredare bandet i den övre plotten som anger konfidensintervallet för linjens läge. (v) Om observationerna hade varit mer samlade kring den skattade linjen hade skattningen av σ varit lägre., Lösning Hämta data som matlabfil: cement.mat. 24

2 INFERENSTEORI 140 Linear Regression 120 varmeutv 100 80 60 40 20 30 40 50 60 70 80 40 Residuals viktprocent Normplot of Residuals 0.95 0.90 20 0.75 0 20 20 40 60 80 0.50 0.25 0.10 0.05 20 0 20 40 25

2 INFERENSTEORI 66. Vid en undersökning av biomassans djupfördelning i Marianergraven fick man följande resultat: vattendjup, x i (1000 m) 0.1 0.5 1.0 1.5 2.5 4.0 5.0 7.0 9.0 biomassa, y i (g/m 3 ) 200 40 25 20 5.0 2.0 0.3 0.03 0.01 För att beskriva sambandet mellan vattendjup och biomassa kan man använda någon av följande regressionsmodeller, den linjära (modell 1): där ɛ 1,..., ɛ 9 är oberoende och N((, 0), σ 1 ); eller den transformerade linjära (modell 2): y i = α 1 + β 1 x i + ɛ i, i = 1,..., 9 där e 1,..., e 9 är oberoende och N((, 0), σ 2 ). ln(y i ) = α 2 + β 2 x i + e i, i = 1,..., 9 För var och en av modellerna analyserade man data med ett beräkningsprogram och fick följande resultat och figurer: Modell 1: Koefficient Skattning Konfidensintervall (95%) α 1 71.33 (1.77, 140.9) β 1-11.43 (-26.95, 4.09) Q 0 = 2.314 10 4 ; σ 1 = 57.5; R 2 1 = 0.3021 250 Linear Regression 200 150 100 50 biomassa 0 50 100 150 200 250 2 0 2 4 6 8 10 djup 140 Residuals Normplot of Residuals 120 100 80 60 40 20 0 20 40 0 2 4 6 8 10 0.95 0.90 0.75 0.50 0.25 0.10 0.05 50 0 50 100 150 26

y 2 INFERENSTEORI Modell 2: Koefficient Skattning Konfidensintervall (95%) α 2 4.59 (3.96, 5.21) β 2-1.08 (-1.22, -0.94) Q 0 = 1.858; σ 2 = 0.5152; R 2 2 = 0.9797 8 Linear Regression 6 4 2 0 2 4 6 8 2 0 2 4 6 8 10 djup 1 Residuals Normplot of Residuals 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0 2 4 6 8 10 0.95 0.90 0.75 0.50 0.25 0.10 0.05 1 0.5 0 0.5 1 (a) Betrakta resultatet från analysen av modell 1. Kan vi utifrån detta resultat påvisa ett samband mellan vattendjup och biomassa? Besvara frågan genom att sätta upp lämpliga hypoteser och utföra testet på 5% signifikansnivå. (b) Vilken av de två modellerna bör fungera bäst? I din motivering ska det klart framgå vilka egenskaper i plottarna och tabellerna du baserar ditt modellval på. Rätt val i denna deluppgift är en förutsättning för att kunna få full poäng på efterföljande deluppgifter. (c) Gör en skattning av den förväntade biomassan på 3000 meters djup och använd det medföljande bladet för att uppskatta ett lämpligt 95% intervall för denna storhet. Det måste klart framgå hur uppskattningen är gjord. (d) Om biomassan i ett vattenprov bestämdes till 1.0 g/m 3, från vilket vattendjup har provet tagits? Uppskatta ett lämpligt 95% intervall för det efterfrågade djupet., Lösning Hämta data som matlabfil: Marianergrav.mat. 67. Vid en undersökning från 1992 studerades samband mellan bilars bränsleförbrukning (liter/mil) och andra variabler. I tabellen på nästa sida ges data för 12 olika bilmodeller av årsmodell 1991. Bland flera tänkbara förklarande variabler visas här cylindervolym (cm 3 ) 27

2 INFERENSTEORI och motoreffekt (kw). Tre olika regressionsmodeller prövades för att försöka förklara variationen hos bränsleförbrukningen. Nedan anges sammanställningar från datorutskrifter för de tre olika modellerna. (a) Ange modellantagandena för de tre olika modellerna. (b) Jämför de tre skattade modellerna. Redovisa tydligt hur du jämför de statistiska modellerna. Vilken modell skulle du föredra och varför? (c) Om man utgår från modell 1, vilken effekt på bränsleförbrukningen har en ökning av cylindervolymen med 500 cm 3? Besvara frågan med ett lämpligt 95% konfidensintervall. (d) Om man utgår från modell 1, uppskatta bränsleförbrukningen hos en bilmodell med en cylindervolym på 1600 cm 3. (e) Bilmodellen Opel Kadett GSI utmärker sig från övriga data i materialet eftersom den, trots sin höga motoreffekt och förhållandevis stora cylindervolym, ändå har en låg bränsleförbrukning. Utgå från modell 1 och anta att vi gör om analysen utan bilmodellen Opel Kadett GSI. Avgör om följande påståenden är sanna eller falska. (i) Den nya skattningen av σ blir lägre än den skattning av σ som är baserad på samtliga bilmodeller. (ii) Det nya intervallet för β blir smalare än det intervall för β som är baserad på samtliga bilmodeller. (iii) Den nya förklaringsgraden blir högre än den förklaringsgrad som är baserad på samtliga bilmodeller. MODELL 1: Enkel linjär regression med bränsleförbrukning som responsvariabel (beroende variabel) och cylindervolym som förklarande variabel (oberoende variabel). Parameter Skattning 95% intervall α 0.3091 (0.0953, 0.5229) β 0.0002772 (0.0001668, 0.0003876) σ 0.07442 R 2 = 0.758 MODELL 2: Enkel linjär regression med bränsleförbrukning som responsvariabel (beroende variabel) och motoreffekt som förklarande variabel (oberoende variabel). Parameter Skattning 95% intervall α 0.4021 (0.0484, 0.7558) β 0.00505 (0.000990, 0.00911) σ 0.1138 R 2 = 0.4344 MODELL 3: Multipel linjär regression med bränsleförbrukning som responsvariabel (beroende variabel) samt cylindervolym och motoreffekt som förklarande variabler (oberoende variabler). 28

2 INFERENSTEORI Parameter Skattning 95% intervall β 0 0.3530 (0.1178, 0.5883) β 1 (cylindervolym) 0.0003631 (0.0001, 0.0006) β 2 (motoreffekt) 0.00242 ( 0.0076, 0.0027) σ 0.0702 R 2 = 0.785 TABELL över data från undersökningen: Bilmärke Bränsleförbukning Cylindervolym Motoreffekt Alfa 33 1.5i 0.76 1490 71.5 BMW 318i 0.81 1796 83.0 Citroen BX19 Kombi 0.95 1904 90.0 Ford Sierra 2.9i 1.11 2933 107.0 Mazda 323 0.74 1598 64.0 MB 190E 2.6 1.06 2597 118.0 Mitsubishi Lancer 0.69 1468 66.0 Opel Kadett GSI 0.68 1998 110.0 Peugeot 405 GLI 0.77 1580 65.0 SAAB 9000 0.92 1985 96.0 Toyota Corolla 0.71 1587 77.0 Volvo 480 ES 0.79 1721 75.0, Lösning Hämta data som matlabfil: bransleforbr.mat. 68. Under perioden 1988 1997 hände det att det var minusgrader i Målilla under 187 av de 310 marsdagarna och 64 av de 310 majdagarna. Antag, lite orealistiskt, att det blir minusgrader olika dagar oberoende av varandra. (a) Beräkna ett tvåsidigt, approximativt 95 % konfidensintervall för skillnaden mellan sannolikheten att det blir minusgrader en slumpmässigt vald dag i mars jämfört med en dag i maj. (b) Beräkna ett tvåsidigt, approximativt 95 % konfidensintervall för den förväntade skillnaden i totala antalet dagar med minusgrader i mars och maj ett visst år. 69. Vi vill uppskatta hur vanligt det är att det snöar i april i Målilla och konstaterar att under de 300 aprildagarna under perioden 1988 1997 så snöade det under 71 dagar. Antag att olika dagar är oberoende av varandra. (a) Beräkna ett approximativt 95 % konfidensintervall för sannolikheten att det snöar en slumpmässigt vald aprildag i Målilla. (b) Skatta sannolikheten att det inte snöar alls i april ett visst år och utnyttja intervallet i (a) till att göra ett 95 % tvåsidigt konfidensintervall för denna sannolikhet. 29