English Version. 1 f(x) = if 0 x θ; 0 otherwise, ) = V (X) = E(X2 ) (E(X)) 2 =

Relevanta dokument
Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

Kurskod: TAMS24 / Provkod: TEN (8:00-12:00) English Version

Kurskod: TAMS11 Provkod: TENB 12 January 2015, 08:00-12:00. English Version

Kurskod: TAMS11 Provkod: TENB 28 August 2014, 08:00-12:00. English Version

English Version. Number of sold cakes Number of days

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 17 August 2015, 8:00-12:00. English Version

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 08 June 2015, 14:00-18:00. English Version

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 31 May 2016, 8:00-12:00. English Version

Kurskod: TAMS11 Provkod: TENB 07 April 2015, 14:00-18:00. English Version

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 16 January 2015, 8:00-12:00. English Version

English Version. 1 x 4x 3 dx = 0.8. = P (N(0, 1) < 3.47) = =

English Version. + 1 n 2. n 1

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 15 August 2016, 8:00-12:00. English Version

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 20 August 2014, English Version

Kurskod: TAMS11 Provkod: TENB 22 April 2014, 14:00am-18:00noon. English Version

Tentamen MVE301 Sannolikhet, statistik och risk

Exam MVE265 Mathematical Statistics,

F ξ (x) = f(y, x)dydx = 1. We say that a random variable ξ has a distribution F (x), if. F (x) =

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 01 June 2015, 8:00-12:00. English Version

Chapter 2: Random Variables

Tentamen MVE302 Sannolikhet och statistik

7.5 Experiment with a single factor having more than two levels

Tentamen MVE302 Sannolikhet och statistik

Tentamen MVE301 Sannolikhet, statistik och risk

MVE051/MSG810 Matematisk statistik och diskret matematik

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

MVE051/MSG810 Matematisk statistik och diskret matematik

Tentamen i Matematik 2: M0030M.

Tentamen i matematisk statistik

LINKÖPINGS UNIVERSITET Matematiska Institutionen Matematisk Statistik HT TAMS24

Kurskod: TAMS11 Provkod: TENB 12 June 2014, 14:00-18:00. English Version

Tentamen MVE300 Sannolikhet, statistik och risk

1. Compute the following matrix: (2 p) 2. Compute the determinant of the following matrix: (2 p)

TAMS65 - Föreläsning 8 Test av fördelning χ 2 -test

Tentamen MVE301 Sannolikhet, statistik och risk

denna del en poäng. 1. (Dugga 1.1) och v = (a) Beräkna u (2u 2u v) om u = . (1p) och som är parallell

Pre-Test 1: M0030M - Linear Algebra.

TAMS65 - Föreläsning 12 Test av fördelning

Solutions to exam in SF1811 Optimization, June 3, 2014

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk

Högskolan i Skövde (SK, JS) Svensk version Tentamen i matematik

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER OM χ 2 -TEST OCH LIKNANDE. Jan Grandell & Timo Koski

Tentamen MVE300 Sannolikhet, statistik och risk

TAMS65 - Föreläsning 12 Test av fördelning

12.6 Heat equation, Wave equation

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i Matematik 2: M0030M.

Formler och tabeller till kursen MSG830

Metod och teori. Statistik för naturvetare Umeå universitet

Rastercell. Digital Rastrering. AM & FM Raster. Rastercell. AM & FM Raster. Sasan Gooran (VT 2007) Rastrering. Rastercell. Konventionellt, AM

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

Formel- och tabellsamling i matematisk statistik

Tentamen MVE301 Sannolikhet, statistik och risk

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

TAMS65 - Föreläsning 6 Hypotesprövning

Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik,

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

8 < x 1 + x 2 x 3 = 1, x 1 +2x 2 + x 4 = 0, x 1 +2x 3 + x 4 = 2. x 1 2x 12 1A är inverterbar, och bestäm i så fall dess invers.

S0005M. Stokastiska variabler. Notes. Notes. Notes. Stokastisk variabel (slumpvariabel) (eng: random variable) Mykola Shykula

Matematisk statistik KTH. Formelsamling i matematisk statistik

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

6. a) Visa att följande vektorer är egenvektorer till matrisen A = , och ange motsvarande

Matematisk statistik för B, K, N, BME och Kemister

χ 2 -test χ 2 -test med skattade parametrar små talens lag (Bortkiewicz) homogenitetstest oberoendetest

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

S0005M, Föreläsning 2

Tentamen i Matematik 3: M0031M.

TAMS65 - Föreläsning 6 Hypotesprövning

Avd. Matematisk statistik

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

English Version P (A) = P (B) = 0.5.

Föreläsning 11: Mer om jämförelser och inferens

Isometries of the plane

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

S 1 11, S 2 9 and S 1 + 2S 2 32 E S 1 11, S 2 9 and 33 S 1 + 2S 2 41 D S 1 11, S 2 9 and 42 S 1 + 2S 2 51 C 52 S 1 + 2S 2 60 B 61 S 1 + 2S 2 A

Matematisk statistik för B, K, N, BME och Kemister

and u = och x + y z 2w = 3 (a) Finn alla lösningar till ekvationssystemet

Statistik för teknologer, 5 poäng Skrivtid:

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Tentamen MVE301 Sannolikhet, statistik och risk

Avd. Matematisk statistik

2(x + 1) x f(x) = 3. Find the area of the surface generated by rotating the curve. y = x 3, 0 x 1,

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen i Matematisk Statistik, 7.5 hp

TENTAMEN I MATEMATISK STATISTIK

x 2 2(x + 2), f(x) = by utilizing the guidance given by asymptotes and stationary points. γ : 8xy x 2 y 3 = 12 x + 3

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

8.1 General factorial experiments

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

1. Find the 4-tuples (a, b, c, d) that solves the system of linear equations

1 Find the area of the triangle with vertices A = (0,0,1), B = (1,1,0) and C = (2,2,2). (6p)

Transkript:

Kurskod: TAMS24 (Statistisk teori) / Provkod: TEN1 2017-01-03 14:00-18:00 Examinator/Examiner: Zhenxia Liu (Tel: 070 0895208). Please answer in ENGLISH if you can. a. You are permitted to bring: a calculator; formel -och tabellsamling i matematisk statistik (from MAI); TAMS24: Notations and Formulas (by Xiangfeng Yang) b. Scores rating: 8-11 points giving rate 3; 11.5-14.5 points giving rate 4; 15-18 points giving rate 5. 1 (3 points) English Version Suppose that the distribution of a population has the probability density function 1 f(x) = θ if 0 x θ; 0 otherwise, where θ > 0 is an unknown parameter. A sample x 1, x 2,..., x 4 } from this population is now given. (1.1). (1p) Find a point estimate ˆθ MM of θ using Method of Moments. (1.2). (1p) Is ˆΘ MM unbiased? (1.3). (1p) Which of the estimates ˆΘ MM in (1.1.) and ˆΘ = X 1 + X 2 is more effective? Solution. (1.1) The first equation from the Method of Moments is E(X) = x. Since E(X) = θ 0 xf(x)dx = θ 2, we have (1.2) The point estimator ˆΘ MM = 2 X. Then we have Therefore, ˆΘ MM is unbiased. (1.3) Because θ 2 = x, thus ˆθ MM = 2 x. E( ˆΘ MM ) = E(2 X) = 2E(X) = 2 θ 2 = θ V ( ˆΘ MM ) = V (2 X) = V (2 X 1 + X 2 + X 3 + X 4 ) = 1 4 2 2 4 V (X) = E(X2 ) (E(X)) 2 = and V ( ˆΘ) = V (X 1 + X 2 ) = 2 V (X) = 2(E(X 2 ) (E(X)) 2 ) = 2 θ2 12 = θ2 6 So ˆΘ MM is more effective than ˆΘ since V ( ˆΘ MM ) < V (Θ). θ 0 x 2 f(x)dx ( θ 2 )2 = θ2 12 2 (3 points) At a comparison of two opinion surveys it was seen that out of 1704 participants 46.5% supported the borgerliga parties in October. In November, 45.6% out of 1689 participants supported the borgerliga parties. Find a confidence interval with approximate confidence level 95% for the change of the support proportion between the two surveys. The number of eligible voters can be thought of as infinite compared to the sample sizes. Page 1/4

Solution. Here we have two Binomial distributions: X Bin(N 1, p 1 ) and Y Bin(N 2, p 2 ) with unknown p 1 and p 2. Then we have the following formula for the confidence interval of p 1 p 2 which is ˆp 1 (1 ˆp 1 ) Ip 1 p 2 = ( ˆp 1 ˆp 2 ) ± λ α/2 + ˆp 2(1 ˆp 2 ) = ( 0.025, 0.043). N 1 N 2 Here ˆp 1 = 46.5%, ˆp 2 = 45.6%, N 1 = 1704, N 2 = 1689 and λ α/2 = λ 0.025 = 1.96. 3 (3 points) Lucas plays on a slot machine that gives a prize with the unknown probability p. The number of games X including the one when the first prize is awarded has the probability function p X (k) = p(1 p) k 1, for k = 1, 2, 3... It is claimed that p = 0.1 but Lucas doubts that p is too small and wishes to test the hypothesis H 0 : p = 0.1 against H 1 : p > 0.1. Is it possible, using the significance level 0.05, to reject H 0 if he loses the first three games and wins on the fourth? Use the P -value method. Solution. Let X be the distribution with the probability function p X (k) = p(1 p) k 1, for k = 1, 2, 3..., then we assume H 0 is ture, then p = 0.1, so we have P value = P (X 4) = 4 p(1 p) k 1 = 34.39% > α Here α = 0.05, so we don t reject H 0. Namely, it is not possible to reject H 0. k=1 4 (3 points) Sample results of car preferences for male and female users (observed frequencies) are as follows Saab Volvo Toyota Male 30 40 20 Female 20 30 30 Do Male and Female show different preferences (with a significance level α = 5%)? Solution. It is easy to get H 0 : Male and Female have the same preference; H 1 : Male and Female have different preferences. Male proportion: p male = 90 Female proportion: p female = 80 Saab proportion: q saab = 50 Volvo proportion: q volvo = 70 Toyota proportion: q toyota = 50 170. Page 2/4

Thus np 11 = 170 p male q saab = 26.47; np 12 = 170 p male q volvo = 37.06; np 13 = 170 p male q toyota = 26.47; np 21 = 170 p female q saab = 23.53; np 22 = 170 p female q volvo = 32.94; np 23 = 170 p female q toyota = 23.53. What is more, N 11 = 30, N 12 = 40, N 13 = 20, N 21 = 20, N 22 = 30 and N 23 = 30. Therefore, T S = 3 2 j=1 i=1 (N ij np ij ) 2 np ij = 4.86. C = (χ 2 α((2 1)(3 1)), + ) = (5.99, + ). Since T S / C, we don t reject H 0. Namely, we don t know if Male and Female have different preferences 5 (3 points) At a certain moment in a communications system the received signal Y can be written on the form Y = X + Z, where X is the transmitted signal and Z is noise independent of X. Furthermore X N(5, 2) and Z N(0, 1). (5.1). (1.5p) Find the distribution for the random vector with the components X and Y. (5.2). (1.5p) We wish to reconstruct X by using a linear function ay + b of the received signal. Find constants a and b such that E[aY + b] = E[X] and such that V [X ay b] is minimized. Solution. (5.1). We let W be the random vector with the components X and Y, then we have ( ) ( ) ( ( ) ( ) X X 1 0 X X W = = = = A. Y X + Z 1 1) Z Z We know that X and Z are independent, and we let U = Thus for W = AU with Therefore W = ( ) X is a normal vector with Y µ U = µ W = Aµ U = ( 5 0), C U = A = ( X Z ), it is known that ( ) 1 0, 1 1 ( ) 2 2 0. 0 1 ( 5 5), C W = AC U A = (5.2). According to the equation E[aY + b] = E[X], we get 5a + b = 5. ( ) 4 4. 4 5 V [X ay b] = V [(1 a)x az b] = (1 a) 2 V (X) + ( a) 2 V (Z) = 2 2 (1 a) 2 + a 2 To get the minimal value of V [X ay b], we get the critical point a = 0.8 by finding the first derivative. Then we can get 5 0.8 + b = 5, which produce b = 1. Page 3/4

6 (3 points) In a study of the profitability of movie companies, 20 Hollywood films were selected randomly and for each film we observed values on y = gross revenue (unit: million dollar), x 1 = production costs (unit: million dollar), x 2 = marketing costs (unit: million dollar), 1, for a film based on a book, x 3 = 0, others. There is a data which has been analyzed according to the model Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + ε, where ε is assumed to be N(0, σ). The analysis of variances is as follows: Estimated regression line: y = 7.84 + 2.85x 1 + 2.28x 2 + 7.17x 3 i ˆβi d( ˆβ i ) 0 7.836 2.333 1 2.8477 0.3923 2 2.2782 0.2534 3 7.166 1.818 Degrees of freedom Sum of squares REGR 3 6325.2 RES?? TOT 19 6542.9 (6.1). (1p) Estimate σ 2. (6.2). (1p) Test H 0 : β 1 = β 2 = β 3 = 0 against H 1 : at least one of β 1, β 2 and β 3 0 with a significance level α = 5%. (6.3). (1p) Is the variable x 3 useful/important for the model? Answer the question by an appropriate test with a significance level α = 1%. SS E Solution. (6.1). ˆσ 2 = s 2 = n k 1 = SS T OT SS R 20 3 1 = 13.61. (6.2). According the hypothesis testing, we have the following test statistic T S and rejection region (critical region) C: T S = SS R /k SS E /(n k 1) = 6325.2/3 = 154.92 and C = (F α (k, n k 1), ) = (F 0.05 (3, 16), ) = (3.24, ) 13.61 Since T S C, we reject H 0. (6.3). We have the hypothesis testing H 0 : β 3 = 0 against H 1 : β 3 0 T S = ˆβ 3 0 d( ˆβ 3) = 7.166/1.818 = 3.94, and C = (, t α/2(n k 1)) (t α/2 (n k 1), + ) = (, 2.92) (2.92, + ). Since T S C, we reject H 0. So we believe that β 3 0, and the variable x 3 is useful/important. Page 4/4

Svensk Version 1 (3 poäng) Antag att fördelningen för en population har täthetsfunktionen 1 f(x) = θ om 0 x θ; 0 annars, där θ > 0 är en okänd parameter. x 1, x 2,..., x 4 } är ett stickprov från populationen. (1.1). (1p) Hitta en punktskattning ˆθ MM av θ genom att använda momentmetoden. (1.2). (1p) Är ˆΘ MM väntevärdesriktig? (1.3). (1p) Vilken av skattningarna ˆΘ MM i (1.1.) och ˆΘ = X 1 + X 2 är effektivare? 2 (3 poäng) Vid jämförelse av två opinionsundersökningar framgår att av de 1704 intervjuade i oktober sympatiserade 46.5% med det borgerliga blocket och 45.6% av de 1689 i november. Beräkna ett konfidensintervall för förändringen av andelen mellan de två undersökningarna med approximativ konfidensgrad 95%. Väljarkåren kan betraktas som oändligt stor jämfört med urvalens storlek. 3 (3 poäng) Lucas spelar på en spelautomat som ger vinst med den okända sannolikheten p. Antalet spel X till och med första vinsten har då sannolikhetsfunktionen p X (k) = p(1 p) k 1, för k = 1, 2, 3... Det påstås att p = 0.1 men Lucas betvivlar att p är så liten och vill pröva hypotesen H 0 : p = 0.1 mot H 1 : p > 0.1. Kan han på signifikansnivån 0.05 förkasta H 0 om han finner att han förlorar de tre första spelen och vinner det fjärde? Använd P -värdesmetoden. 4 (3 points) Resultat från bil preferenser för manliga och kvinnliga användare (observerade frekvenser) finns nedan Saab Volvo Toyota Male 30 40 20 Female 20 30 30 Har man och kvinna olika preferenser (med nivån α = 5%)? 5 (3 poäng) I ett kommunikationssystem kan den i ett visst ögonblick mottagna signalen Y skrivas på formen Y = X + Z, där X är den verkliga utsända signalen och Z en störning som är oberoende av X. Vidare gäller att X N(5, 2) och Z N(0, 1). (5.1). (1.5p) Bestäm fördelningen för den stokastiska vektorn med komponenter X och Y. (5.2). (1.5p) Man vill rekonstruera X med hjälp av en linjär funktion ay + b av den mottagna signalen. Bestäm konstanterna a och b så att E[aY + b] = E[X] och V [X ay b] är minimal. Page 1/2

6 (3 poäng) I en studie av lönsamheten för filmbolag har man valt ut 20 hollywoodfilmer slumpmässigt och för varje film tagit fram observerade värden på Det finns en data som har analyserats enligt modellen där ε antas vara N(0, σ). Variansanalyser finns nedan: y = bruttointäkt (enhet: miljoner dollar), x 1 = produktionskostnad (enhet: miljoner dollar), x 2 = marknadsföringskostnad (enhet: miljoner dollar), 1, för film baserad på en bok, x 3 = 0, annars. Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + ε, Skattad regressionslinje: y = 7.84 + 2.85x 1 + 2.28x 2 + 7.17x 3 i ˆβi d( ˆβ i ) 0 7.836 2.333 1 2.8477 0.3923 2 2.2782 0.2534 3 7.166 1.818 Frihetsgrader Kvadratsumma REGR 3 6325.2 RES?? TOT 19 6542.9 (6.1). (1p) Skatta σ 2. (6.2). (1p) Pröva på nivån 0.05 H 0 : β 1 = β 2 = β 3 = 0 mot H 1 : minst en av β 1, β 2 och β 3 0. (6.3). (1p) Är den x 3 nyttiga/viktiga för modellen? Motivera svaret med ett lämpligt test på nivån α = 1%. Page 2/2