Extrauppgifter Uppgifter 1. Den stokastiska variabeln Y t(10). Bestäm c så att P ( c < Y < c) = 0.95. 2. De stokastiska variablerna X och Y är oberoende och χ 2 (5) respektive χ 2 (7). (a) Bestäm a och b så att P (X + Y a) = 0.005) och P (X + Y b) = 0.995). Vad är E(X + Y )? (b) Låt V = X/5. Bestäm c och d så att P (V c) = 0.025 och Y/7 P (V d) = 0.975 3. Vid tillverkning av en viss sorts färg tillsätts färgpigmentet med hjälp av en doseringsapparat, men man är inte säker på om den har tillräcklig precision. Om man ställer in apparaten på dosen µ blir den verkliga dosen X = µ+ɛ, där ɛ N(0, σ 2 ). Man vill att minst 99% av burkarna ska ha en acceptabel pigmentdos, dvs en dos i intervallet (µ 0.2, µ + 0.2), i det långa loppet. Man genomförde 51 provdoseringar med µ = 10 och ck stickprovsstandardavvikelsen s = 0.0629. Uppfyller apparaten precisionskravet vid µ = 10? Besvara frågan med hjälp av ett lämpligt 95 % kondensintervall. 1
4. För att jämföra eekterna hos tre olika blodtryckssänkande mediciner behandlades tre grupper om vardera 10 patienter med de olika medicineran. Efter en månad mättes sänkningen av blodtrycket. Medelvärde Stickprovsstandardavvikelse Medicin 1 17.3 6.19 Medicin 2 21.1 7.26 Medicin 3 10.8 5.23 Modell: Tre oberoende stickprov från N(µ i, σ 2 ), i = 1, 2, 3. Konstruera ett kondensintervall för σ av typen (0, a) med kondensgrad 0.95. 5. Betjäningstiderna för ett kösystem är exponentialfördelade med väntevärde µ. Man har observerat 80 oberoende betjäningstider och fått medelvärdet x = 4.5 minuter. (a) Konstruera ett kondensintervall för µ med kondensgraden approximativt 0.95. (b) Låt p vara sannolikheten att en betjäningstid är mer än tio minuter. Konstruera ett kondensintervall för p med kondensgraden approximativt 0.95. 6. På misstänkta rattfyllerister gör man tre bestämningar av alkoholhalten i blodet. Resultaten x 1, x 2 och x 3 antas utgöra ett slumpmässigt stickprov från N(µ, 0.05 2 ) där µ är den verkliga alkoholhalten i blodet ( ). Om µ > 0.2 har personen gjort sig skyldig till rattonykterhet. Låt oss anta att den domstol som skall döma tar hänsyn till osäkerheten i mätningarna genom att beräkna det aritmetiska medelvärdet x av de tre analysresultaten och därefter förklara personen skyldig om x > 0.2 + λ 0.01 0.05/ 3 men oskyldig annars. Med statistisk terminologi kan man säga att domstolen prövar H 0 : µ = 0.2 mot H 1 : µ > 0.2 på nivån 0.01. Vilka av följande påståenden ger en någorlunda korrekt beskrivning av vad som kommer hända i det långa loppet?
(a) högst 1% av alla frikända är skyldiga (b) högst 1% av alla oskyldigs blir dömda (c) högst 1% av alla skyldiga blir frikända (d) högst 1% av alla dömda är oskyldiga 7. Med en viss mätutrustning registreras den radioaktiva bakgrundsstrålningen på en ort. Det är rimligt att anta att antalet registrerade partiklar under t minuter är P o(λt) där λ = 5 (min 1). Efter ett radioaktivt utsläpp misstänker man att strålningen har ökat. Hur länge behöver man mäta strålningen om man vill pröva H 0 : λ = 5 mot H 1 : λ > 5 på nivån 0.01 med ett test som ger utslag med säkerheten 0.99 om strålningen ökat 50%. Lä,plig approximation får utnyttjas. 8. Man har mätt en viss föroreningshalt i jordprover tagna dels i närheten av en industri och dels i ett rent område med motsvarande jordmån. Det förutsätts att en mätning ger ett lognormalfördelat värde och därför är nedanastående medelvärden beräknade för de logaritmerade mätvärdena. antal obs. medelvärde standardavvikelse Nära industrin 8 1.8 0.49 Rent område 9 1.1 0.46
Undersök om föroreningshalten kan anses vara högre i det förorenade området. 9. Ett företag tillverkar reläer vid fyra olika fabriker; A, B, C och D. För att undersöka om fabrikerna har samma kvalitet på sina reläer undersökte man 200 enheter från var och en av fabrikerna och räknade antalet defekta och korrekta enheter. A B C D Defekta 6 4 4 16 Korrekta 194 196 196 184 Det förefaller rimligt att anta att A,B och C har samma defektsannolikhet p 1 medan D har en annan defektsannolikhet p 2. Konstruera ett 95 % kondensintervall för p 1 p 2. 10. Genotyperna AA, Aa och aa för en viss allel förekommer med sannolikhet θ 2, 2θ(1 θ) och (1 θ) 2 i en population. Man har på måfå valt ut ett antal individer och fått följande resultat: Typ AA Aa aa Antal 34 50 19 ML-skatta andelen A-gener i populationen, dvs θ. 11. Använd ML-skattningen av θ från uppgift 10 och utför ett χ 2 -test för att pröva om den angivna modellen är rimlig. 12. En kaeleverantör påstår att mängden kae i ett 500g-paket kan betraktas som en stokastisk variabel X N(500, 10 2 ). Vid en undersökning av 100 paket ck man följande resultat: Vikt <495 g 495-404 g >505g Antal paket 39 45 16
Kaemängder i olika paket kan anses vara oberoende stokastiska variabler. Pröva med hjälp av ett χ 2 -test på nivån 0.01 hypotesen att kaemängderna är normalfördelade som leverantören påstår. 13. Störningarna ɛ 1, ɛ 2, ɛ 3 vid tre på varandra följande signalöverföringar i en kommunikationssystem kan anses utgöra komponenterna i en normalfördelad vektor med väntevärdesvektor µ och kovariansmatris C enligt 0 1.5 0.9 0.54 µ = 0 C = 0.9 1.5 0.9 0 0.54 0.9 1.5 Beräkna sannolikheten att medelvärdet ɛ = (ɛ 1 + ɛ 2 + ɛ 3 )/3 av de tre störningarna till sitt belopp överstiger 2 enheter. 14. De stokastiska variablerna X 1, X 2,..., X 5 är oberoende och N(10, 2 2 ). Betrakta Y 1 = 1 5 (X 1 + X 2 +... + X 5 ) Y 2 = 4X 1 + X 2 X 3 X 4 X 5 (a) Bestäm simultana fördelningen för (Y 1, Y 2 ). (b) Beräkna P (Y 1 > Y 2 ). (c) Beräkna korrelationskoecienten mellan Y 1 och Y 2. 15. I följande tabell är y i observerade värden på en stokastisk variabel Y i = β 0 + β 1 x i + ɛ i, där ɛ 1,... ɛ n är oberoende och N(0, σ 2 ). x i 1 2 3 4 5 6 7 8 9 10 y i 11.5 9.8 7.0 5.5 3.9 2.0 0.4 1.4 3.1 5.0 (a) Beräkna punktskattningarna av β 0, β 1, och σ. (b) Rita in värdena tillsammans med den beräknade regressionslinjen i ett koordinatsystem.
Extra information till uppgifter i Devore 12.16 Characterization of Highway Runoff runoff volume (m^3) 20 40 60 80 100 20 40 60 80 100 120 rainfall volume (m^3) Figur 1: Skatterplot för data i uppgift 12.16. Kommandot summary(lm(y x)) i R producerar följande information: Call: lm(formula = y ~ x) Residuals: Min 1Q Median 3Q Max -8.279-4.424 1.205 3.145 8.261 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) -1.12830 2.36778-0.477 0.642 x 0.82697 0.03652 22.642 7.9e-12 ***
--- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 5.24 on 13 degrees of freedom Multiple R-Squared: 0.9753, Adjusted R-squared: 0.9734 F-statistic: 512.7 on 1 and 13 DF, p-value: 7.896e-12 Kommandot anova(lm(y x)) i R producerar följande information: Analysis of Variance Table Response: y Df Sum Sq Mean Sq F value Pr(>F) x 1 14078.7 14078.7 512.65 7.896e-12 *** Residuals 13 357.0 27.5 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 12.39 Kommandot summary(lm(y x)) i R producerar följande information: Call: lm(formula = y ~ x) Residuals: Min 1Q Median 3Q Max -1.39527-0.27670 0.03572 0.42922 1.09940 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 72.957514 0.697676 104.572 < 2e-16 *** x 0.041040 0.004838 8.483 1.05e-07 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Moisture control of compressed pellets Moisture content (%) 77 78 79 80 81 80 100 120 140 160 180 200 Filtration rate (kg DS/m/hr) Figur 2: Skatterplot för data i exempel 12.6 som används i uppgift 12.39. Residual standard error: 0.6654 on 18 degrees of freedom Multiple R-Squared: 0.7999, Adjusted R-squared: 0.7888 F-statistic: 71.97 on 1 and 18 DF, p-value: 1.052e-07 Kommandot anova(lm(y x)) i R producerar följande: Analysis of Variance Table Response: y Df Sum Sq Mean Sq F value Pr(>F) x 1 31.859 31.859 71.967 1.052e-07 *** Residuals 18 7.969 0.443 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Facit 1. Tabell ger c = 2.23. 2. (a) Tabell ger a=3.06 och b=28.3. E(X + Y ) = 12 (b) Tabell ger c = 0.146 och d = 5.29 3. Man vill att σ 0.0775. Det observerade värdet på s ger I σ = (0, 0.0754). Kravet är med stor sannolikhet uppfyllt. 4. I σ = (0, 8.12) 5. (a) I µ = ( ˆµ 1+1.96/, ˆµ 80 1 1.96/ 80 (b) I p = (0.067, 0.176) 6. Endast påstående 2. ) (3.69, 5.76) 7. t = 21.5 min. Använd normalapproximation. 8. I µ1 µ 2 = (0.3, ). Föroreningshalten nära industrin är signikant högre än i det rena området. 9. I p1 p 2 ( 0.096, 0.017). Fabrik D tycks ha högre defektsannolikhet än övriga fabriker. 10. ˆθ = 118 206 0.573. 11. Hypotesen att modellen gäller kan inte förkastas. 12. χ 2 -test: Q = 10.47. Kritisk gräns är 9.22 från χ 2 (2)-tabell. Normalfördelning förkastas på nivå 0.01. 13. ɛ N(0, 1.02). P ( ɛ > 2) = 0.0478. (( ) ( )) 10 0.8 1.6 14. (a) Y N, 20 1.6 80 (b) 1 Φ(1.135) 0.13 (c) ρ = 0.2. 15. ˆβ0 = 13.0, ˆβ1 = 1.81, ˆσ = 0.3.