Tentamen för kursen. Linjära statistiska modeller. 13 januari

Relevanta dokument
Tentamen för kursen. Linjära statistiska modeller. 22 februari

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Lycka till!

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14

Föreläsning 15: Faktorförsök

AMatematiska institutionen avd matematisk statistik

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Matematisk statistik, Föreläsning 5

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, ONSDAGEN DEN 17 MARS 2010 KL

Statistisk försöksplanering

Tentamen för kursen. Linjära statistiska modeller. 14 januari

Föreläsning 12: Linjär regression

Matematisk statistik för B, K, N, BME och Kemister

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Exempel på tentamensuppgifter

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

Avd. Matematisk statistik

Matematisk statistik för B, K, N, BME och Kemister

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 11: Mer om jämförelser och inferens

Statistisk försöksplanering

Enkel och multipel linjär regression

F13 Regression och problemlösning

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för B, K, N, BME och Kemister

MVE051/MSG Föreläsning 14

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Matematisk statistik KTH. Formelsamling i matematisk statistik

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen i Matematisk statistik Kurskod S0001M

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Matematisk statistik för B, K, N, BME och Kemister

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Tentamen MVE301 Sannolikhet, statistik och risk

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Tentamen MVE301 Sannolikhet, statistik och risk

SF1901 Sannolikhetsteori och statistik I

Tentamen MVE301 Sannolikhet, statistik och risk

Matematisk statistik för D, I, Π och Fysiker

Lufttorkat trä Ugnstorkat trä

1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg.

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Tentamen i Matematisk statistik Kurskod S0001M

oberoende av varandra så observationerna är

Föreläsning 15, FMSF45 Multipel linjär regression

Föreläsning 12, FMSF45 Hypotesprövning

Grundläggande matematisk statistik

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Tentamentsskrivning: Matematisk Statistik TMA321 1

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Repetition 2, inför tentamen

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen i Matematisk statistik Kurskod S0001M

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Tentamen för kursen Statistik för naturvetare. Tisdagen den 14 december

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Matematisk statistik för B, K, N, BME och Kemister

Tentamen för kursen. Linjära statistiska modeller. 20 mars

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Uppgift 1. f(x) = 2x om 0 x 1

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

TAMS65 - Seminarium 4 Regressionsanalys

b) Förekommer A- och B-fel oberoende av varandra? (Motivering krävs naturligtvis!) (5 p)

9. Konfidensintervall vid normalfördelning

Föreläsning 11, FMSF45 Konfidensintervall

Föreläsning 11, Matematisk statistik Π + E

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

SF1901: Medelfel, felfortplantning

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Avd. Matematisk statistik

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Tillämpad matematisk statistik LMA521 Tentamen

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Härledning av Black-Littermans formel mha allmänna linjära modellen

Repetitionsföreläsning

Transkript:

STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 13 januari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida och webbaserat kursforum. Tillåtna hjälpmedel: Miniräknare och formelsamling delas ut vid tentamenstillfället. Tabell över F-kvantiler återfinns nedan. Det gäller även att χ 2 0.05 (1) 3.8. Resonemang skall vara tydliga och lätta att följa. Varje korrekt och fullständigt löst uppgift ger 10 poäng. Följande gränser gäller för betygen A-E: A B C D E 45 40 35 30 25 Uppgift 1 För att undersöka prisutvecklingen hos en viss typ av äpplen uppskattades det genomsnittliga kilopriset y i i Sverige under nio på varandra följande år (x 1 = 2006, x 2 = 2007,..., x 9 = 2014). Man ansatte en enkel linjär regressionsmodell Y i = α + β(x i x) + ε i, i = 1,..., 9, där y i är en observation av Y i, x = 9 i=1 x i /9 och ε i N(0, σ 2 ) är oberoende feltermer. a) Beräkna en skattning av det förväntade kilopriset år 2016 om ȳ = 9i=1 y i /9 = 16.9 och 9 i=1 y i (x i x) = 27.3. (4 p) b) Beräkna medelfelet d för skattningen i a), om kvadratsumman för variationskällan Residual i variansanalystabellen ges av Kvs = 0.9274. (3 p) c) Ange ett 95% konfidensintervall för det förväntade kilopriset år 2016. (Ledning: Intervallet innehåller kvantilen t 0.025 (7) = 2.3646.) (3 p)

Linjära statistiska modeller, 13 januari 2017 2 Uppgift 2 Ett läkemedelsföretag har sedan länge astmamedicinen 1 på marknaden och vill undersöka om en annan, nyutvecklad medicin 2 har samma effekt. För respektive medicin uppmättes syreupptagningsförmågan Y hos 5 patienter en timme efter att de tagit en dos (olika för de 5 patienterna). Sedan antogs en linjär dos respons-kurva för respektive medicin. Det svarar mot en linjär modell Y ij = α i + β i x j + ε ij, i = 1, 2, j = 1,..., 5, (1) för syreupptagningsförmågan hos den patient som tagit dosen x j mg av medicin i, där feltermerna ε ij N(0, σ 2 ) antas vara oberoende. a) Ange observationsvektor Y, designmatris A, parametervektor θ och feltermsvektor ε för den linjära modellen Y = Aθ + ε. som svarar mot (1). (Ledning: θ har fyra element, två intercept och två effektparametrar.) (3 p) b) Nollhypotesen H 0 : α 1 = α 2, β 1 = β 2 att de två medicinerna har samma effekt kan formuleras som θ = Bλ för lämpligt valda B och λ. Ange B och λ. (3 p) c) Nedan anges ett utdrag ur variansanalystabellen för försöket. Använd det för att testa nollhypotesen på nivån 5%. Variationskälla Kvs Avvikelse från H 0 6.8910 Residual 1.1060 Totalt 7.9970 (4 p) Uppgift 3 Ett byggföretag utför en kvalitetskontroll genom att mäta fuktigheten i ett betongparti som består av ett antal olika betongblock. Man väljer ut ett stickprov på 5 block och genomför 3 mätningar på varje block. De uppmätta fuktigheterna Y i1, Y i2, Y i3 för block i = 1,..., 5 antas följa en ensidig variansanalysmodell Y ij = µ + δ i + ε ij av typ II, med väntevärde µ, oberoende blockeffekter δ i N(0, σδ 2) och mätfel ε ij N(0, σε). 2 Resultatet sammanfattas i följande tabell, i form av stickprovsmedelvärden Ȳi och stickprovsvarianser s 2 i för mätningarna inom respektive betongblock:

Linjära statistiska modeller, 13 januari 2017 3 Block Ȳ i s 2 i 1 3.1 0.035 2 2.6 0.031 3 2.8 0.020 4 3.3 0.046 5 2.7 0.023 a) Skatta de två varianskomponenterna σδ 2 och σ2 ε. (5 p) b) Ange ett 95% konfidensintervall för µ. (5 p) Uppgift 4 De två tabellerna nedan visar var sitt fraktionellt 2 3 1 -försök, som utgår från samma fullständiga 2 3 -försök utan replikat. Responsvariabeln Y ijk beror av tre faktorer A, B och C som var och en varieras på två nivåer, låg (-) och hög (+). De tre indexen i, j, k {, +} markerar om A, B respektive C är på sin låga eller höga nivå. A B C Y ijk - - - 10.1 + - - 19.1 - + + 16.4 + + + 25.7 A B C Y ijk + - - 19.1 - + - 11.7 - - + 14.3 + + + 25.7 a) Bestäm kopplingsschemat för de båda försöken. (3 p) b) Vi antar nu att alla interaktioner av ordning 2 och 3 mellan de tre faktorerna kan försummas, och ansätter en additiv modell Y ijk = µ + Ā i + B j + C k + ε ijk, där µ anger försökens totala väntevärde, och Ā, B, C effekten av respektive faktor. Feltermerna ε ijk N(0, σ 2 ) antas vara oberoende. För vilket av de två fraktionella försöken ovan kan minsta kvadrat-skattningar av de tre huvudeffekterna Ā, B, C beräknas? Beräkna dessa skattningar Â, ˆB, Ĉ för det försök du valde. (4 p) c) Beräkna variansen för de tre skattningarna i deluppgift b). Går det att skatta denna varians utifrån det givna fraktionella försöket? (3 p) Uppgift 5 Anta att vi har en multipel linjär regressionsmodell Y = Aθ + ε med observationsvektor Y = (Y 1,..., Y N ) T, designmatris A, regressionsparametrar θ = (α, β 1,..., β k 1 ) T och feltermsvektor ε N(0, σ 2 I N ), där

Linjära statistiska modeller, 13 januari 2017 4 I N är en identitetsmatris av ordning N. Minsta kvadrat-skattningen ˆµ = (ˆµ 1,..., ˆµ N ) T av väntevärdesvektorn µ = Aθ kan skrivas med hjälp av hattmatrisen H = (h ij ) N i,j=1 som ˆµ = HY. (2) a) Visa att hattmatrisen kan uttryckas endast med hjälp av designmatrisen enligt H = A(A T A) 1 A T. b) Låt e i = Y i ˆµ i vara residualen för observation i. Visa att (3 p) E(e 2 i ) = σ 2 (1 h ii ). (3) (Ledning: Det kan vara enklast att utnyttja (2) och först undersöka kovariansmatrisen för hela residualvektorn e = (e 1,..., e N ) T = Y ˆµ.) (3 p) c) Härled hattmatrisen för enkel linjär regression, där de förklarande variablerna före centrering har värdena x 1,..., x N. Använd sedan (3) för att först ge ett uttryck för E(e 2 i ), och sedan diskutera vilka observationspunkter (x i, Y i ) som kan förväntas vara inflytelserika. (Ledning: Börja med att ställa upp designmatrisen. När du gör det får du enklast räkningar om du först centrerar de förklarande variablerna i regressionsmodellen.) (4 p)

Linjära statistiska modeller, 13 januari 2017 5 f 1 = 1 2 3 4 5 6 7 8 9 10 f 2 = 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 2 18.5 19.0 19.2 19.2 19.3 19.3 19.4 19.4 19.4 19.4 3 10.1 9.6 9.3 9.1 9.0 8.9 8.9 8.8 8.8 8.8 4 7.7 6.9 6.6 6.4 6.3 6.2 6.1 6.0 6.0 6.0 5 6.6 5.8 5.4 5.2 5.1 5.0 4.9 4.8 4.8 4.7 6 6.0 5.1 4.8 4.5 4.4 4.3 4.2 4.1 4.1 4.1 7 5.6 4.7 4.3 4.1 4.0 3.9 3.8 3.7 3.7 3.6 8 5.3 4.5 4.1 3.8 3.7 3.6 3.5 3.4 3.4 3.3 9 5.1 4.3 3.9 3.6 3.5 3.4 3.3 3.2 3.2 3.1 10 5.0 4.1 3.7 3.5 3.3 3.2 3.1 3.1 3.0 3.0 11 4.8 4.0 3.6 3.4 3.2 3.1 3.0 2.9 2.9 2.9 12 4.7 3.9 3.5 3.3 3.1 3.0 2.9 2.8 2.8 2.8 13 4.7 3.8 3.4 3.2 3.0 2.9 2.8 2.8 2.7 2.7 14 4.6 3.7 3.3 3.1 3.0 2.8 2.8 2.7 2.6 2.6 15 4.5 3.7 3.3 3.1 2.9 2.8 2.7 2.6 2.6 2.5 16 4.5 3.6 3.2 3.0 2.9 2.7 2.7 2.6 2.5 2.5 17 4.5 3.6 3.2 3.0 2.8 2.7 2.6 2.5 2.5 2.4 18 4.4 3.6 3.2 2.9 2.8 2.7 2.6 2.5 2.5 2.4 19 4.4 3.5 3.1 2.9 2.7 2.6 2.5 2.5 2.4 2.4 20 4.4 3.5 3.1 2.9 2.7 2.6 2.5 2.4 2.4 2.3 21 4.3 3.5 3.1 2.8 2.7 2.6 2.5 2.4 2.4 2.3 22 4.3 3.4 3.0 2.8 2.7 2.5 2.5 2.4 2.3 2.3 23 4.3 3.4 3.0 2.8 2.6 2.5 2.4 2.4 2.3 2.3 24 4.3 3.4 3.0 2.8 2.6 2.5 2.4 2.4 2.3 2.3 25 4.2 3.4 3.0 2.8 2.6 2.5 2.4 2.3 2.3 2.2 26 4.2 3.4 3.0 2.7 2.6 2.5 2.4 2.3 2.3 2.2 27 4.2 3.4 3.0 2.7 2.6 2.5 2.4 2.3 2.3 2.2 28 4.2 3.3 2.9 2.7 2.6 2.4 2.4 2.3 2.2 2.2 29 4.2 3.3 2.9 2.7 2.5 2.4 2.3 2.3 2.2 2.2 30 4.2 3.3 2.9 2.7 2.5 2.4 2.3 2.3 2.2 2.2 Table 1: F-kvantiler F 0.05 (f 1, f 2 ) avrundade till en decimals noggrannhet