1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Relevanta dokument
FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Föreläsning 11, FMSF45 Konfidensintervall

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

0 om x < 0, F X (x) = c x. 1 om x 2.

Matematisk statistik för B, K, N, BME och Kemister

SF1911: Statistik för bioteknik

SF1901 Sannolikhetsteori och statistik I

Lufttorkat trä Ugnstorkat trä

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 11, Matematisk statistik Π + E

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 12: Regression

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Thomas Önskog 28/

9. Konfidensintervall vid normalfördelning

Föreläsning 12: Linjär regression

F9 Konfidensintervall

Matematisk statistik KTH. Formelsamling i matematisk statistik

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Matematisk statistik för B, K, N, BME och Kemister

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Avd. Matematisk statistik

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Föreläsning 12: Repetition

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

f(x) = 2 x2, 1 < x < 2.

Grundläggande matematisk statistik

Avd. Matematisk statistik

Lycka till!

Matematisk statistik för D, I, Π och Fysiker

Mer om konfidensintervall + repetition

Grundläggande matematisk statistik

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Tentamen MVE302 Sannolikhet och statistik

Avd. Matematisk statistik

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Avd. Matematisk statistik

Tentamentsskrivning: Matematisk Statistik TMA321 1

Avd. Matematisk statistik

Tenta i Statistisk analys, 15 december 2004

Lektionsanteckningar 11-12: Normalfördelningen

Avd. Matematisk statistik

Föreläsning 4: Konfidensintervall (forts.)

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Kap 2. Sannolikhetsteorins grunder

Lärmål Sannolikhet, statistik och risk 2015

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Matematisk statistik TMS064/TMS063 Tentamen

SF1901 Sannolikhetsteori och statistik I

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Avd. Matematisk statistik

Föreläsning 5, FMSF45 Summor och väntevärden

Avd. Matematisk statistik

SF1901: Sannolikhetslära och statistik

AMatematiska institutionen avd matematisk statistik

F13 Regression och problemlösning

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

FÖRELÄSNING 8:

Matematisk statistik för B, K, N, BME och Kemister

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

FACIT: Tentamen L9MA30, LGMA30

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

Repetition. Plus lite av det om faktorförsök som inte hanns med förra gången

Föreläsning 5, Matematisk statistik Π + E

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Tentamen i Matematisk Statistik, 7.5 hp

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

TMS136. Föreläsning 5

Detta formelblad får användas under både KS2T och KS2D, samt ordinarie tentamen. x = 1 n. x i. with(stats): describe[mean]([3,5]); 4.

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Repetition 2, inför tentamen

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Matematisk statistik för B, K, N, BME och Kemister

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TMS136. Föreläsning 10

Matematisk statistik för D, I, Π och Fysiker

Formel- och tabellsamling i matematisk statistik

SF1901 Sannolikhetsteori och statistik I

Föreläsning 12, FMSF45 Hypotesprövning

TMS136: Dataanalys och statistik Tentamen

Repetitionsföreläsning

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Transkript:

LÖSNINGAR TILL Matematisk statistik Tentamen: 29 7 kl 8 3 Matematikcentrum FMSF45 Matematisk statistik AK för D,I,Pi,F, 9 h Lunds universitet MASB3 Matematisk statistik AK för fysiker, 9 h. För tiden mellan två besök gäller X i Ex λ EX i λ 5s λ 5 VX i λ 2 25 a Eftersom tiden för att nå u till n 2 besökare ges av en summa av många oberoende likafördelade stokastiska variabler ger centrala gränsvärdessatsen att T n är aroximativt normalfördelad med: T n X i med ET n E X i E X i 5 n VT n V X i Eller T n N 5 n, 5 n och den sökta sannolikheten är V X i 25 n Tn 5 n PT n < 5 6 P 5 n 5 6 5 n < 5 n [n 2] Tn 9 P < Φ.442.786 7.7 7.7 Eller Φ.442 Φ.4.927.793 enl. Tabell b För ett maximum har vi 2. Vi har att Pmax X i > 3 Pmax X i < 3 [max X i < 3 alla X i < 3] För en exonentialfördelning är P X < 3 P X < 3 X 2 < 3... X n < 3 [oberoende] n n P X i < 3 P X < 3 3 f X x dx Vilket tillsammans med n 2 ger 3 λe λ x dx [ e λ x] 3 e λ 3 [λ 5 ] e 6.9975 2 Pmax X i > 3 P X < 3 e 6 2.687.393 X i λ Ex λ f x λ x λ λe λ x, x λ R.,.3 f λ λ 5,. λ.3.2

a Den gemensamma tätheten, genom att vända å formeln för betingad fördelning, är f x,λ x, λ f x λ x λ f λ λ λe λ x 5 5λe λ x x,. λ.3 b För väntevärdet, EX, är det enklast att använda väntevärde av betingad fördelning EX E EX λ EX λ f λ λ dλ Väntevärde av exonentialfördelning ger EX λ λ och EX.3. Alternativt fås en dubbel integral: EX.3..3..3 5 dλ [5 lnλ].3. λ 5 ln.3 5 ln. 5 ln 5 ln3 5.493. x f x,λ x, λ dλ dx [ 5xe λ x] [ 5 λ e λ x ]. +.3 dλ c För en multivariat fördelning har vi att PX < 3 f x,λ x, λ dλ dx A.3. 5xλe λ x dx dλ [artial integration] 5e λ x dx dλ 5 dλ [enl. ovan] 5 ln3 λ där integrationsområdet är A {x > 3}. Eftersom λ kan anta alla värden blir integralen PX < 3 3 f x,λ x, λ dλ dx 3.3. 5λe λ x dλ dx Integration med avseende å x först verkar lämligt och bekant från b PX < 3.3 3..3 5λe λ x dx dλ 5 5e 3λ dλ.3 [ 5e λ x] 3. [ 5λ + 5 ].3 dλ. 3 e 3λ..5 + 5 e 3.3.5 + 53 e 3. + e 9 e 3.997 3 6 Att först räkna ut marginalfördelningen f x x, eller att först integrera m.a.. λ, resulterar i långa och tråkiga artial integrationer. 3. Eftersom det är samma atienter före och efter en behandling är det lämligt att analysera exerimentet enligt modellen för stickrov i ar. En lämlig model är då att X i N μ i, σ x Y i N μ i + Δ, σ y Z i Y i X i N Δ, σ där X i är kolesterolvärden före dieten, Y i är efter dieten, och Z i Y i X i är förändringen till följd av dieten. För att undersöka en minskning vill vi testa H : Δ mot H : Δ < å signifikansnivån 5%. 2

Från den erhållna datan och enkla räkningar har vi att Δ z.26 s 2 Q z n 7.24.3667 f n 24 25 s.549242 dδ s s n 5.9848 Vi kan nu genomföra testet med något av Intervall: Ensidigt test ger ett ensidigt, uåt begränsat intervall I Δ, Δ + t.5 f dδ,.26 +.78.9848,.72 Intervallet innehåller inte H Δ. Test-storhet: Test-storheten ges av T Δ Δ dδ.26.9848 2.3669 Vilket ska jämföras med en undre t-kvantil t.95 f t.5 f.78. Vi noterar att T är mindre än kvantilen. I båda fallen kan vi alltså förkasta H och dieten har sänkt kolesterolvärdena. 4. Enligt ugiften har vi två skattningar med Eμ x μ Eμ y μ Vμ x σ2 Vμ y σ2 2 3 μ x.5 μ y.8 sx 2.8 sy 2.2 n x 2 n y 3 som ska kombineras enligt μ a μ x + a μ y a Väntevärdet av skattningen μ är Eμ E a μ x + a μ y aeμ x + aeμ y aμ + aμ μ Skattningen är alltid väntevärdesriktig oavsett värde å a. b Variansen av skattningen är Vμ V a μ x + a μ y [oberoende] a 2 Vμ x + a 2 Vμ y a 2 σ2 σ2 + a2 2 3 c En effektiv skattningen av μ minimerar variansen i skattningen. Alltså bör vi välja det a som minimerar variansen i föregående ugift Vμ a 2 σ2 σ2 2 + a2 3. Derivera uttrycket med avseende å a ger: 2a σ2 2 aσ2 2 3 a 2 3 + a 3 a 2 + 5a 3 6 3 2σ2 förkorta bort a 2 5 3

d En lämlig model är att de båda skattningarna, μ x och μ y, är normalfördelade med lika, men okänd, varians: μ σ σ x N μ, N μ, μ σ σ y N μ, N μ, nx 2 ny 3 Troligen beroende å att de ingående observationerna X i och Y i varit normalfördelade. Den gemensamma skattningen av μ är { 2 μ a μ x + a μ y 5.5 + 3 5.8.68 med a från 4c 3.5 + 2 3.8.7 med a /3 och den okända variansen ges av en oolad variansskattning s 2 s2 x n x + s 2 y n y n x + n y.47 s.26 som har f 9+29 48 frihetsgrader eftersom det är två skattade medelvärden. Och medelfelet i skattningen μ är { dμ a 2 s2 2 + s2 a2 3 s.2.443 med a från 4c s.237.457 med a /3 Ett intervall för den normalfördelade skattningen μ normal eftersom den är en linjär-kombination av normalvariabler blir nu { I μ μ ± t.25 f dμ.68 ± 2.6.443.3899,.97 med a från 4c.7 ± 2.6.457.47,.9929 med a /3 Baserat å Tabell 3 är t.25 48 2. rimligt eftersom tabellen endast ger t.25 4 2.2 och t.25 6 2.. 5. a Model och/eller Model 2 uvisar residualer som Inte har konstant varians minskande sridning med åren. Inte är normalfördelade eftersom normloten inte följer en linje Model 2 är sämre än Model men båda är dåliga. Residualerna i Model har en svag kvadratisk trend fler ositiva värden för 98 och 2 samt fler negativa residualer för 995. Model 3 å andra sidan uvisar residualer med jämn sridning utan tydliga mönster och som väl följer ett normalfördelnings antagande. b För arametrarn i Model 3 har vi att β S xz 3 986 52 42.764 α z β x.2244 995.7 S 2 xz 3 986 52 42 53.79 s 2 Q n 2 S zz.788 s.4228 523 2 Och konfidensintervallen för α och β är I β β ± t.25 n 2 dβ β s ±.96.764 ±.96.9.8,.728 I α α ± t.25 n 2 dα α ±.96 s n + x2 53.79 ±.96 3.6956 46.5, 6. 4

Där vi använt att t.25 n 2 t.25 25 λ.25.96. c Frågan om vilket år som blyhalten unår ett visst värde svara mot ett kalibreringsintervall. Vi har att kom ihåg ln-skalan blyhalten kommer unås z ln y ln.5.693 x z α β 22.8 med ett intervall å I x x ± t.25 n 2 dx x ±.96 22.8 ±.96.4228.764 29.9, 23.7 + 253 + 25.8322 52 42 s β + n + x x2 22.8 ±.96 5.5697 6. a Malins model leder till en binomial-fördelade model, X Bin n,, där n antalet aket som undersöks fixt och bestämt i förväg sannolikheten att ett aket är hårt. x antalet hårda aket som utäcks. Den stora skillnaden mot Kalles förslag är att att Malin i förväg bestämmer sig för hur många aket som ska undersökas. För att vara exakt är Malins model hyergeometrisk vilket blir aroximativt binomial om antalet undersökta aket, n, är mycket mindre än totalt antal aket. b För ureade observationer från en geometrisk-fördelning har vi att X i Ge med X x x Vilket ger att likelihood funktionen är L n X x i n x i som alltid är det lättare att räkna med log-likelihood funktionen n l log L log X x i log x i log + xi log Eftersom endast observationerna, x i, beror av i kan resten av termerna brytas ut ur summan l log + xi log n log + log x i Notera att log förekommer n gånger i summan. Derivering ger nu l n n x i n n x i n x i n n + x i n n + n x i x + Vilket är ML-skattningen av att lösningen faktiskt utgör ett maximum är enkelt att kontrollera. 5

c För en geometrisk fördelning har vi att EX VX 2 om X Ge vilket ger enligt känd formel för väntevärde och varians av medelvärde EX EX i VX VX i n n 2 d Aroximativt väntevärde för skattningen x+ blir nu E E X + EX + + + Och för varians har vi att skattningen som funktion av x ges av x x + med derivata x x + 2 vilket ger V x V X + + EX 2 VX 2 2 EX + 2 2 VX n 2 4 n + 2 2 n Noterat att vi inte visat att skattningen är väntevärdesriktig eftersom vi räknar med en Gaussaroximation. 6