Tentamen för kursen. Linjära statistiska modeller. 22 februari

Relevanta dokument
Tentamen för kursen. Linjära statistiska modeller. 13 januari

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Lycka till!

AMatematiska institutionen avd matematisk statistik

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Föreläsning 15: Faktorförsök

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Tentamen för kursen. Linjära statistiska modeller. 14 januari

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Statistisk försöksplanering

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 12: Linjär regression

Statistisk försöksplanering

Matematisk statistik, Föreläsning 5

Matematisk statistik för D, I, Π och Fysiker

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

Matematisk statistik för B, K, N, BME och Kemister

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

F13 Regression och problemlösning

MVE051/MSG Föreläsning 14

Enkel och multipel linjär regression

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, ONSDAGEN DEN 17 MARS 2010 KL

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Föreläsning 11: Mer om jämförelser och inferens

Matematisk statistik KTH. Formelsamling i matematisk statistik

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Avd. Matematisk statistik

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Grundläggande matematisk statistik

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Tentamen för kursen. Linjära statistiska modeller. 20 mars

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Lufttorkat trä Ugnstorkat trä

Exempel på tentamensuppgifter

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

TENTAMEN I MATEMATISK STATISTIK

Matematisk statistik för B, K, N, BME och Kemister

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Avd. Matematisk statistik

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

Tisdagen den 16 januari

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 13: Multipel Regression

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

Tentamen i Matematisk statistik Kurskod S0001M

TAMS65 - Seminarium 4 Regressionsanalys

Avd. Matematisk statistik

Finansiell statistik. Multipel regression. 4 maj 2011

Repetition 2, inför tentamen

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Tentamen i Matematisk statistik Kurskod S0001M

Avd. Matematisk statistik

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Föreläsning 15, FMSF45 Multipel linjär regression

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Tenta i Statistisk analys, 15 december 2004

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Matematisk statistik för B, K, N, BME och Kemister

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Tentamen MVE301 Sannolikhet, statistik och risk

0 om x < 0, F X (x) = c x. 1 om x 2.

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Matematisk statistik för B, K, N, BME och Kemister

Tentamen i Tillämpad statistisk analys, GN, 7.5 hp. 23 maj 2013 kl. 9 14

Tentamen för kursen Statistik för naturvetare. Tisdagen den 14 december

TENTAMEN GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

Tentamen i Matematisk statistik Kurskod S0001M

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Examinationsuppgifter del 2

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Stockholms Universitet Statistiska institutionen Termeh Shafie

Tentamen MVE301 Sannolikhet, statistik och risk

oberoende av varandra så observationerna är

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

Avd. Matematisk statistik

Lösningar till tentamen i Matematisk Statistik, 5p

Uppgift 1. f(x) = 2x om 0 x 1

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Tentamentsskrivning: Matematisk Statistik TMA321 1

Transkript:

STOCKHOLMS UIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 februari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida och webbaserat kursforum. Tillåtna hjälpmedel: Miniräknare och formelsamling delas ut vid tentamenstillfället. Tabell över F-kvantiler återfinns nedan. Det gäller även att χ 2 0.05 (1) 3.8. Resonemang skall vara tydliga och lätta att följa. Varje korrekt och fullständigt löst uppgift ger 10 poäng. Följande gränser gäller för betygen A-E: A B C D E 45 40 35 30 25 Uppgift 1 En forskargrupp ville undersöka om mindre träd av en viss art lättare drabbades av svampangrepp än större. Man delade upp trädbeståndet i sju grupper x = 1, 2, 3, 4, 5, 6, 7. Dessa värden var proportionella mot den genomsnittliga diametern hos trädstammarna i respektive grupp. Man uppmätte graden av svampangrepp Y i för = 7 träd, ett från varje grupp. Därefter ansattes en enkel linjär regressionsmodell Y i = α + β(x i x) + ε i, i = 1,..., 7, med x i = i och x = 7 i=1 x i /7. För att testa nollhypotesen H 0 : β = 0 användes följande utdrag ur en variansanalystabell: Variationskälla Kvs Regression 9.20 Residual 5.75 Totalt 14.95

Linjära statistiska modeller, 22 februari 2017 2 a) Genomför ett test av H 0 mot alternativhypotesen H 1 : β 0 på signifikansnivån 5%. (6 p) b) Beräkna minsta kvadrat-skattningen ˆβ av β, givet extrainformationen ˆβ < 0. (Ledning: Börja med att beräkna ˆβ 2 med hjälp av variansanalystabellen.) (4 p) Uppgift 2 Vid en industri undersöktes huruvida utbytet av en kemisk reaktion påverkades av tre olika katalysatorer. Utbytet Y i och koncentrationerna x 1i, x 2i, x 3i av de tre katalysatorerna registrerades vid = 10 olika experiment (i = 1,..., 10). De tre katalysatorerna antogs verka oberoende av varandra. Därför bortsåg man från samspel och jämförde olika linjära regressionsmodeller med ingen, en, två eller tre katalysatorkoncentrationer som förklarande variabler. Dessutom var försöket upplagt så att effekterna av de olika förklarande variablerna var ortogonala mot varandra, det vill säga 10 i=1 (x ji x j )(x ki x k ) = 0 för alla 1 j < k 3, med x j = i x ji/10. För den fullständiga modellen med alla tre katalysatorer fick man följande variansanalystabell: Variationskälla Kvs Katalysator 1 4.1 Katalysator 2 6.2 Katalysator 3 2.1 Residual 7.7 Totalt 20.1 a) Genomför första steget i framåtinkludering (Forward Selection, FS), det vill säga undersök om någon förklarande variabel ska tas med. Signifikansnivån väljs till 5%. (Ledning: På grund av ortogonaliteten mellan de förklarande variablerna fås kvadratsumman för regressionsdelen av en delmodells variansanalystabell genom att addera kvadratsummorna för de katalysatorer som ingår, medan resterande kvadratsummor från den fullständiga modellen tillhör variationskällan residual för delmodellen.) (5 p) b) Stannar FS-schemat efter a)? Motivera ditt svar. (5 p) Uppgift 3 I ett visst land vaccineras alla barn under sitt första levnadsår mot en allvarlig sjukdom. Hälften av dem får Vaccin 1, medan den andra hälften får Vaccin 2. De båda vaccinerna ger likvärdigt skydd mot sjukdomen, men man misstänker att de kan ge olika biverkningar i form av feber de närmsta dygnen efter vaccineringen. Ett läkemedelsbolag har nyligen utvecklat ett tredje

Linjära statistiska modeller, 22 februari 2017 3 vaccin (med samma sjukdomsskydd) som man hävdar ger lägre feber än de två andra vaccinerna. Smittskyddsinstitutet i landet genomför en mindre pilotstudie för att jämföra biverkningarna av de tre vaccinerna. Den består av 18 olika barn som slumpmässigt delas in i tre lika stora grupper, där barnen i varje grupp ges samma vaccin. Men registrerar sedan den maximala febern Y ij för barn j = 1,..., 6 som erhöll Vaccin i = 1, 2, 3. Resultatet framgår av följande tabell, där medelvärdet Ȳi. och stickprovsstandardavvikelsen s i anges för respekive vaccin: Vaccin Ȳ i. s i 1 38.1 0.25 2 38.4 0.31 3 37.8 0.19 a) Anta att försöket beskrivs av en ensidig typ I variansanalysmodell, med µ i = E(Y ij ). Testa på nivån 5% nollhypotesen µ 1 = µ 2 = µ 3. (4 p) b) Smittskyddsforskarna överväger att ersätta de två vaccinerna som för närvarande används med Vaccin 3. Beräkna en punktskattning ˆ av den förväntade minskningen = (µ 1 + µ 2 )/2 µ 3 av feber i hela populationen om ett sådant vaccinbyte görs. (2 p) c) Beräkna Var( ˆ ) uttryckt i feltermsvariansen σ 2, och ange därefter ett 95% konfidensintervall för. (Ledning: Använd en skattning av σ 2 för att beräkna medelfelet för ˆ.) (4 p) Uppgift 4 I en kurs i försöksplanering ingick en laboration där eleverna poppade popcorn i en microvågsugn. Man skulle undersöka hur andelen poppade popcorn påverkades av tre faktorer; tid som poppningen pågick (T ), effekten i microvågsugnen (E) och mängden popcorn (M). Man genomförde ett 2 3 - försök utan replikat, där alla tre faktorerna varierades på en låg (-) och en hög (+) nivå. Vidare antog man en additiv modell Y ijk = µ + T i + Ē j + M k + ε ijk, i, j, k {, +}, där µ är genomsnittsnivån för hela försöket och T, Ē, M anger inflytandet hos de tre faktorerna. Feltermerna ε ijk (0, σ 2 ) antogs oberoende. Resultatet från de 8 försökspunktera i, j, k framgår av följande tabell: i, j, k Y ijk i, j, k Y ijk -,-,- 0.69 -,-,+ 0.61 +,-,- 0.74 +,-,+ 0.68 -,+,- 0.77 -,+,+ 0.72 +,+,- 0.79 +,+,+ 0.75

Linjära statistiska modeller, 22 februari 2017 4 a) Beräkna minsta kvadrat-skattningarna ˆT, Ê och ˆM av de tre faktorernas inflytande. (3 p) b) Motivera att de tre skattningarna i a) är väntevärdesriktiga, normalfördelade och sinsemellan oberoende, med samma varians σ 2 /8. (3 p) c) Genomför ett F -test på nivån 5% för att avgöra om tidsfaktorn har en signifikant inverkan på andelen poppade popcorn. (Ledning: Du kan utnyttja att ijk (Y ijk Ȳ ) 2 = 0.0233, samt att Kvs(Faktor = θ) = 8ˆθ 2 för varje θ {T, E, M}, där ˆθ anger motsvarande skattning från a).) (4 p) Uppgift 5 Anta att vi har en multipel linjär regressionsmodell, där varje observation Y i = µ i + ε i, i = 1,...,, kan skrivas som en summa av ett väntevärde µ i och en felterm ε i (0, σ 2 ). a) Visa hur µ i beror linjärt av de m förklarande variablerna x 1i,... x mi för observation i genom att införa lämpliga regressionsparametrar. (2 p) b) Definera förklaringsgraden R 2 med hjälp av observationerna Y i och minsta kvadrat-skattningarna ˆµ i av alla µ i. (3 p) c) Korrelationskoefficienten mellan två vektorer a = (a 1,..., a ) T och b = (b 1,..., b ) T kan skrivas som Corr(a, b) = 1 1 i=1 (a i ā)(b i b) i=1 (a i ā) 2 1 i=1 (b i b), 2 där ā = i=1 a i / och b = i=1 b i /. Visa att R 2 = Corr(Y, ˆµ) 2, där Y = (Y 1,..., Y ) T och ˆµ = (ˆµ 1,..., ˆµ ) T. (Ledning: Du kan utnyttja att i=1 Y i / = i=1 ˆµ i / = Ȳ, samt att residualvektorn Y ˆµ är ortogonal mot den skattade väntevärdesvektorn ˆµ.) (5 p)

Linjära statistiska modeller, 22 februari 2017 5 f 1 = 1 2 3 4 5 6 7 8 9 10 f 2 = 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 2 18.5 19.0 19.2 19.2 19.3 19.3 19.4 19.4 19.4 19.4 3 10.1 9.6 9.3 9.1 9.0 8.9 8.9 8.8 8.8 8.8 4 7.7 6.9 6.6 6.4 6.3 6.2 6.1 6.0 6.0 6.0 5 6.6 5.8 5.4 5.2 5.1 5.0 4.9 4.8 4.8 4.7 6 6.0 5.1 4.8 4.5 4.4 4.3 4.2 4.1 4.1 4.1 7 5.6 4.7 4.3 4.1 4.0 3.9 3.8 3.7 3.7 3.6 8 5.3 4.5 4.1 3.8 3.7 3.6 3.5 3.4 3.4 3.3 9 5.1 4.3 3.9 3.6 3.5 3.4 3.3 3.2 3.2 3.1 10 5.0 4.1 3.7 3.5 3.3 3.2 3.1 3.1 3.0 3.0 11 4.8 4.0 3.6 3.4 3.2 3.1 3.0 2.9 2.9 2.9 12 4.7 3.9 3.5 3.3 3.1 3.0 2.9 2.8 2.8 2.8 13 4.7 3.8 3.4 3.2 3.0 2.9 2.8 2.8 2.7 2.7 14 4.6 3.7 3.3 3.1 3.0 2.8 2.8 2.7 2.6 2.6 15 4.5 3.7 3.3 3.1 2.9 2.8 2.7 2.6 2.6 2.5 16 4.5 3.6 3.2 3.0 2.9 2.7 2.7 2.6 2.5 2.5 17 4.5 3.6 3.2 3.0 2.8 2.7 2.6 2.5 2.5 2.4 18 4.4 3.6 3.2 2.9 2.8 2.7 2.6 2.5 2.5 2.4 19 4.4 3.5 3.1 2.9 2.7 2.6 2.5 2.5 2.4 2.4 20 4.4 3.5 3.1 2.9 2.7 2.6 2.5 2.4 2.4 2.3 21 4.3 3.5 3.1 2.8 2.7 2.6 2.5 2.4 2.4 2.3 22 4.3 3.4 3.0 2.8 2.7 2.5 2.5 2.4 2.3 2.3 23 4.3 3.4 3.0 2.8 2.6 2.5 2.4 2.4 2.3 2.3 24 4.3 3.4 3.0 2.8 2.6 2.5 2.4 2.4 2.3 2.3 25 4.2 3.4 3.0 2.8 2.6 2.5 2.4 2.3 2.3 2.2 26 4.2 3.4 3.0 2.7 2.6 2.5 2.4 2.3 2.3 2.2 27 4.2 3.4 3.0 2.7 2.6 2.5 2.4 2.3 2.3 2.2 28 4.2 3.3 2.9 2.7 2.6 2.4 2.4 2.3 2.2 2.2 29 4.2 3.3 2.9 2.7 2.5 2.4 2.3 2.3 2.2 2.2 30 4.2 3.3 2.9 2.7 2.5 2.4 2.3 2.3 2.2 2.2 Table 1: F-kvantiler F 0.05 (f 1, f 2 ) avrundade till en decimals noggrannhet