Avd. Matematisk statistik TENTAMEN I 5B57 MATEMATISK STATISTIK FÖR T och M ONSDAGEN DEN 9 OKTOBER 25 KL 8. 3.. Examinator: Jan Enger, tel. 79 734. Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik. Formelblad statistisk kvalitetsstyrning. Räknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Varje korrekt lösning ger poäng. Gränsen för godkänt är preliminärt 24 poäng. Den som fått 22 eller 23 poäng på tentamen har möjlighet till komplettering. Kompletteringen skall göras inom två veckor efter det att resultatet av denna tentamen publicerats. Den som är aktuell för komplettering skall till examinator anmäla önskan att få en sådan inom en vecka från publicering av tentamensresultatet. Den som fått godkänt på lappskrivning nummer från den 23 september 25, får uppgift a) tillgodoräknad. Den som fått godkänt på lappskrivning nummer 2 från den 5 oktober 25, får uppgift 4 a) tillgodoräknad. Tillgodoräknade uppgifter skall inte lösas. Resultatet anslås senast onsdagen den 9 november 25 på Matematisk statistiks anslagstavla i entréplanet, Lindstedtsvägen 25, rakt fram innanför porten. Tentamen kommer att finnas tillgänglig på elevexpeditionen sju veckor efter skrivningstillfället. Uppgift a) En kontinuerlig stokastisk variabel X har fördelningsfunktion om x < F X (x) om x x 4 Beräkna väntevärdet E(2X ) och variansen V (2X ). (5 p) b) En urna innehåller 52 kulor, fyra av dem numrerade, fyra numrerade 2,..., och fyra numrerade 3. En person drar 5 kulor, en efter en och konstaterar att de tre första kulorna har olika nummer. Vad är, givet detta, sannolikheten att av de fem dragna kulorna minst ett par eller triss dragits. Ett par innebär att två av de dragna kulorna har samma nummer och triss innebär att tre kulor har samma nummer. Anm. Detta problem är naturligtvis ekvivalent med problemet att beräkna sannolikheten att få minst ett par eller triss i en pokerhand, givet att de tre första korten är olika. (5 p)
forts tentamen i 5B57 5--9 2 Uppgift 2 a) Ett mycket stort varuparti undersöks genom att man slumpmässigt drar 4 enheter ur partiet och accepterar partiet om högst 25 enheter av dessa är defekta. Om andelen defekta enheter i partiet är 5 %, vad är sannolikheten att det accepteras. Välmotiverade approximationer får användas. (5 p) b) Anta att man räknar antal fel på enheter och att antalet fel på en enhet är Poissonfördelat med väntevärde µ.3. Antalet fel på olika enheter antas vara oberoende av varandra. Beräkna sannolikheten att totala antalet fel på 4 enheter är högst 5. (5 p) Uppgift 3 Ett system utgörs av en parallellkoppling av tre komponenter och fungerar så länge som minst en av komponenterna fungerar. Komponenternas livslängder, X, X 2 och X 3 är oberoende stokastiska variabler, alla exponentialfördelade med parameter λ.2 (per år, λ är felintensiteten). a) Låt T vara systemets livslängd. Beräkna fördelningsfunktionen F T (x) till T. (5 p) b) Beräkna systemets förväntade livslängd. Anm. Man kan ha nytta av att x n e x dx n! om n är icke-negativt heltal. (5 p) Uppgift 4 a) x och x 2 är observationer på oberoende stokastiska variabler X och X 2 som båda har väntevärde µ, och varians σ 2. Beräkna a och b så att de två skattningarna µ,obs ax + 3bx 2 och µ 2,obs 4ax + bx 2 båda blir väntevärdesriktiga skattningar av µ och avgör vilken som är effektivast. (5 p) b) För att undersöka draghållfastheten hos två olika sorters ståltrådar gjordes provningar av hållfastheten. Mätvärden (i lämplig enhet): Ståltråd : 2.7 2.9 2.5 2.8 2.2 Ståltråd 2:.6.5.7.4.8.6 Modell: Mätvärdena på ståltråd resp. ståltråd 2 antas vara oberoende observationer av stokastiska variabler X resp. Y som är N(µ, σ)- resp. N(µ 2, σ)-fördelade, där parametrarna µ, µ 2 och σ är okända. Beräkna ett 95% konfidensintervall för µ µ 2. (4 p) c) Testa på 5 % signifikansnivå hyptesen µ µ 2.. Motivering av svaret krävs. ( p)
forts tentamen i 5B57 5--9 3 Uppgift 5., 2.4 och 3.6 är tre oberoende observationer från en fördelning med fördelningsfunktion { för x < F X (x) e x3 /θ för x. a) Beräkna maximum-likelihoodskattningen av θ. (5 p) b) Undersök om skattningen är väntevärdesriktig. (5 p) Uppgift 6 En anläggning producerar syre, kväve och argon från flytande luft. Renheten i syret antas bero linjärt på luftföroreningarna som räknas i ppm (parts per million). Data: Renhet y (%) 93.3 92.2 92.4 9.7 94. 94.6 93.6 93. 93.2 92.9 92.2 9.3 9. 9.6 9.9 Förorening x..45.36.59.8.75.5.99.98.22.47.8 2.3.75.68 Hjälpsummor: i x2 i 29.3933, x.354. i (y i ȳ) 2 8.696, i x iy i 873.762, ȳ 92.54, a) Ansätt en linjär regressionsmodell samt skatta regressionslinjens ekvation. Skatta också variansen σ 2. (3 p) b) Ge ett 95% konfidensintervall för lutningen av regressionslinjen. (2 p) c) En person menar att då föroreningen är skall renheten vara % och ansätter därför en modifierad regressionsmodell: Y + βx + ε, ε N(, σ). Med data enligt ovan, beräkna minsta-kvadratskattningen av β i denna modell. (5 p)
Avd. Matematisk statistik FÖRSLAG TILL LÖSNINGAR TENTAMEN I 5B57 MATEMATISK STATISTIK FÖR T och M 25 9 a) Täthetsfunktionen för X blir f X (x) F X (x) 4/x5 för x. Härav erhålls och E(X) E(X 2 ) xf X (x)dx x 2 f X (x)dx 4/x 4 dx 4[ x 3 /3] 4/3. 4/x 3 dx 4[ x 2 /2] 2. Det ger att V (X) E(X 2 ) (E(X)) 2 2 (4/3) 2 2/9 och således E(2X ) 2E(X) 5/3 och V (2X ) 2 2 V (X) 8/9. b) Vi beräknar först sannolikheten att inte få något par eller triss d.v.s att kulorna (korten) har olika valör. Sätt Bhändelsen att fjärde kulan (kortet) är olika de tre förstas valör och Chändelsen att sista kulan (kortet) är olika de fyra förstas valör och låt A vara händelsen att de tre första kulorna (korten) har olika valör. Då har vi P (B C A) P (B A) P (C A B) 4 49 36 48 3 49 Den sökta sannolikheten är alltså 3 49 9 49. Uppgift 2 a) Låt X vara antalet defekta enheter i stickprovet. X är Bin(4,.5) som är approximativt N(2, 9), eftersom np( p) 4.5.95 9 >. Det ger 25 2 P (X 25) Φ( ) φ(.47).874. 9 Med halvkorrektion erhålls värdet.896. (Exakt svar är.894.) b) Låt X i vara antal fel på enhet nr i, i, 2,..., 4 och Y totala antalet fel. Då är Y X + X 2 + + X 4 Poissonfördelat med väntevärde 4.3 2. Tabell ger nu att P (Y 5).8444
forts tentamen i 5B57 5--9 2 a) Man har att T max(x, X 2, X 3 ) och Uppgift 3 F T (x) P (T x) P (X x, X 2 x, X 3 x) (oberoendet) P (X x) P (X 2 x) P (X 3 x) F X (x) 3 ( e.2x ) 3, eftersom F X (x) x f X(t)dt x.2 e.2t dt e.2x. b) Täthetsfunktionen till T är och således får man E(T ) xf T (x)dx.6 f T (x) F T (x) 3.2 e.2x ( e.2x ) 2 xe.2x dx.2 x.6 e.2x ( e.2x ) 2 xe.4x dx +.6 x.6 (e.2x 2e.4x +e.6x ) xe.6x dx (variabelsubstituera och utnyttja anmärkningen) 5 5 2 + 6 55 6 Uppgift 4 a) Beräkna väntevärdena stickprovsvariablerna. Vi erhåller E(µ ) E(aX + 3bX 2 ) ae(x ) + 3bE(X 2 ) (a + 3b)µ E(µ 2) E(4aX + bx 2 ) (4a + b)µ De är väntevärdesriktiga om a + 3b 4a + b, vilket ger lösningen a 2 och b 3. Varianserna blir V (µ ) a 2 V (X ) + (3b) 2 V (X 2 ) 85 2 σ2 V (µ 2) (4a) 2 V (X ) + b 2 V (X 2 ) 73 2 σ2 Således har µ 2 minst varians och är effektivast. b) Två oberoende stickprov. Låt x,... x 5 och y,... y 6 vara observationerna. Enligt 2.2 och.2 d) i formelsamlingen fås konfidensintervall för µ µ 2 som x ȳ ± t α/2 (n + n 2 2)s /n + /n 2. Man får x 5 5 x k 2.8, ȳ 6 6 y k.6, s 2 4 5 (x k x) 2 5 4 k k k och s 2 2 5 6 (y k ȳ) 2 2 4. k
forts tentamen i 5B57 5--9 3 Den sammanvägda stickprovsvariansen fås av s 2 (5 )s2 + (6 )s 2 2 5 + 6 2 3.33 4, vilket ger s.83. Man har vidare att x ȳ 2.8.6.2 vilket ger I µ µ 2 x ȳ ± t.25 (9)s 5 + 6.2 ± 2.26.83 5 + 6.2 ±.25. c). ligger inte i det 95 %:iga konfidensintervallet och hypotesen förkastas. Uppgift 5 Kalla observationerna x, x 2 och x 3. Täthetsfunktionen är f X (x) 3x2 θ e x3 /θ och likelihoodfunktionen blir L(θ) f X (x )f X (x 2 )f X (x 3 ) 33 θ 3 (x x 2 x 3 ) 2 e (x3 +x3 2 +x3 3 )/θ skall maximeras. Maximera logaritmen: ln L ln(3 3 (x x 2 x 3 ) 2 ) (x 3 + x 3 2 + x 3 3)/θ 3 ln(θ). Dess derivata är d ln L (x 3 + x 3 2 + x 3 dθ 3)/θ 2 3 θ som är för θ θ obs x3 + x 3 2 + x 3 3 3 (ger maximum). Med siffror insatta får θ obs 2.5. b) Beräkna E((X 3 + X 3 2 + X 3 3)/3). Vi har att E(X 3 ) x 3 f X (x)dx 3 θ x 5 e x3 /θ dx (x 3 /θ t, 3x 2 dx θdt) θ te t dt θ (se anm uppgift 3b)). Det ger även E(θ ) θ, d.v.s. skattningen är väntevärdesriktig. Uppgift 6 a) Vi ansätter regressionsmodellen y i α + βx i + ε. På sedvanligt sätt erhålls skattningarna β obs i(x i x)y i i (x i x) 2 i x iy i n xȳ i x2 n x 2 αobs ȳ β x 92.54 ( 3.236).354 96.63 (σ 2 ) obs s 2 ( (y i ȳ) 2 β 2 (x i x) 2).65 3 i i 873.762 5.354 92.54 29.3933 5.354 2 3.236 Den skattade regressinslinjens ekvation blir alltså y 96.63 3.236x. b) Konfidensintervall för β ges av β obs ± t.25(5 2)s/ i (x i x) 2 ) vilket ger intervallet 3.2 ±.5 eftersom t.25 (3) 2.6.
forts tentamen i 5B57 5--9 4 c) Man skall minimera med avseende på β. Derivera Q i (y i ( + βx i )) 2 Q 2 i (y i βx i )x i som är om β βobs i (y i )x i i x2 i i y ix i i x i i x2 i 873.762 5.354 29.3933 5.349.