TENTAMEN I MATEMATISK STATISTIK

Relevanta dokument
Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Statistik för teknologer, 5 poäng Skrivtid:

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Examinationsuppgifter del 2

Tentamen i matematisk statistik

Tentamen i matematisk statistik

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Metod och teori. Statistik för naturvetare Umeå universitet

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Tentamen i matematisk statistik

Tentamen i matematisk statistik

Följande resultat erhålls (enhet: 1000psi):

Räkneövning 3 Variansanalys

7.5 Experiment with a single factor having more than two levels

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Skrivning i ekonometri torsdagen den 8 februari 2007

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

7.5 Experiment with a single factor having more than two levels

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

10.1 Enkel linjär regression

TENTAMEN I MATEMATISK STATISTIK

8.1 General factorial experiments

Exempel 1 på multipelregression

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Skrivning i ekonometri lördagen den 29 mars 2008

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Regressions- och Tidsserieanalys - F4

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

TENTAMEN I STATISTIK B,

Tentamen i matematisk statistik

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Exempel 1 på multipelregression

Tentamen i Matematisk statistik Kurskod S0001M

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Regressions- och Tidsserieanalys - F3

OBS! Skriv e-postadress på tentan om du vill ha resultatet innan jul. Tentamensgenomgång måndagen den 9/ kl i MC413.

Regressions- och Tidsserieanalys - F7

Tentamen i Matematisk statistik Kurskod S0001M

Skrivning i ekonometri lördagen den 15 januari 2005

Tentamen Tillämpad statistik A5 (15hp)

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamen i Matematisk statistik Kurskod S0001M

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

1. En kontinuerlig slumpvariabel X har följande täthetsfunktion (för någon konstant k). f.ö.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Regressions- och Tidsserieanalys - F3

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Läs noggrant informationen nedan innan du börjar skriva tentamen

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Tentamen i Matematisk statistik Kurskod S0001M

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

Skrivning i ekonometri lördagen den 25 augusti 2007

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Statistisk försöksplanering

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp)

Tentamen i Matematisk statistik Kurskod S0001M

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Tentamen för kursen. Linjära statistiska modeller. 17 februari

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Laboration 2 multipel linjär regression

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen Tillämpad statistik A5 (15hp)

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tentamen i Matematisk statistik Kurskod S0001M

Regressions- och Tidsserieanalys - F3

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamen i Matematisk statistik Kurskod S0001M

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

OBS! Vi har nya rutiner.

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Tentamen i Matematisk statistik Kurskod S0001M

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Föreläsning 4. Kap 5,1-5,3

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Tentamen i Matematisk statistik Kurskod S0001M

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Transkript:

UMEÅ UNIVERSITET Institutionen för matematisk statistik Regressions- och variansanalys, 5 poäng MSTA35 Leif Nilsson TENTAMEN 2003-01-10 TENTAMEN I MATEMATISK STATISTIK Regressions- och variansanalys, 5 poäng Tillåtna hjälpmedel: Tabellsamling och egen miniräknare. Studenterna för behålla tentamensuppgifterna. Skrivtid: 09.00-15.00, Östra paviljongen sal 3 Betygsgränser: Godkänd vid 12p, Väl godkänd vid 18p (max 24p) Telefon till lärare vid frågor: 090-786 5380 (Leif) 1. Antag att vi vill studera förhållandet mellan vikt, längd och ålder hos barn med en viss typ av sjukdom (nutritional deficiency). Vikt, längd och ålder mättes hos 12 stycken barn med sjukdomen nutritional deficiency och följande resultat erhölls: vikt Längd Ålder 64 57 8 71 59 10 53 49 6 67 62 11 55 51 8 58 50 7 77 55 10 57 48 9 56 42 10 51 42 6 76 61 12 68 57 9 En regressionsmodell med de förklarande variablerna längd, ålder och ålder 2 ansattes och följande resultat erhölls.

Regression Analysis The regression equation is vikt = 3,4 + 0,724 längd + 2,78 ålder - 0,042 ålder^2 Predictor Coef StDev T P Constant 3,44 33,61 0,10 0,921 längd 0,7237? 2,61 0,031 ålder 2,777 7,427 0,37 0,718 ålder^2-0,0417 0,4224-0,10 0,924 S = 4,940 R-Sq = 78,0% R-Sq(adj) = 69,8% Analysis of Variance Regression 3 693,06 231,02 9,47 0,005 Residual Error 8 195,19 24,40 Total 11 888,25 Source DF Seq SS längd 1 588,92 ålder 1 103,90 ålder^2 1 0,24 a) Redogör för de modellantaganden som krävs för att kunna skatta och "testa" parametrar. b) Antag att modellantagandena är uppfyllda och bestäm ett 95%-igt konfidensintervall för parametern framför längden. c) Testa hypotesen att parametrarna framför ålder och ålder 2 båda är noll (simultant). Till ert förfogande har ni även regressionsanpassningen nedan där enbart längd är förklarande variabel: Regression Analysis The regression equation vikt = 6,2 + 1,07 längd is Predictor Coef StDev T P Constant 6,19 12,85 0,48 0,640 längd 1,0722 0,2417 4,44 0,001 S = 5,471 R-Sq =? % Analysis of Variance Regression 1 588,92 588,92 19,67 0,001 Residual Error 10 299,33 29,93 Total 11 888,25 d) Visa, för den enkla regressionsmodellen, att den totala kvadratsumman kan delas upp i två kvadratsummor (residualkvadratsumma och regressionskvadratsumma). e) Redogör i ord för begreppet förklaringsgrad samt bestäm den för den enkla regressionsanpassningen ovan.

f) Antag att variablerna vikt och längd kan ses som en bivariat normalfördelad variabel. Bestäm korrelationskoefficienten mellan vikt och längd samt testa om korrelationen är noll. g) För den enkla regressionsanpassningen ovan, beräkna residualer och anpassade värden samt "plotta" dem mot varandra. Finns det något i den bilden som tyder på att modellen är dålig (motivera)? h) Redogör för begreppen "outliers" och inflytelserika punkter. i) Ett 95%-igt prediktionsintervall för vikten hos ett barn som har sjukdomen och är 55 cm lång blir (52,42, 77,91) om man använder den enkla linjära regressionsanpassningen ovan. Bestäm ett 95%-igt konfidensintervall för den genomsnittliga vikten hos barn som har sjukdomen och är 55 cm långa. 2. Man har gjort en undersökning av hur 3 olika laboratorium lyckas mäta halten av en natriumförening (lasalocid sodium) i en viss mängd hönsfoder. Man skickade ut en mängd hönsfoder till de 3 olika laboratorierna vardera innehållande 85 mg/kg natriumämne. Man bad sedan laboratorierna att vardera göra 5 bestämningar på halten natriumämne. Man vill sedan jämföra resultaten från de olika laboratorierna. Resultatet visas nedan. Lab A 82,3 84,1 85,8 86,8 83,3 Lab B 87,5 89,1 86,3 89,6 88,7 Lab C 82,2 88,4 83,1 85,1 84,8 One-way ANOVA: Natrium versus Lab Analysis of Variance for Natrium Lab 2 44,56 22,28 6,15 0,014 Error 12 43,46 3,62 Total 14 88,02 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ----------+---------+---------+------ A 5 84,458 1,848 (-------*------) B 5 88,247 1,325 (------*------) C 5 84,739 2,387 (------*------) ----------+---------+---------+------ Pooled StDev = 1,903 85,0 87,5 90,0 Tukey's pairwise comparisons Family error rate = 0,0500 Individual error rate = 0,0206 Critical value = 3,77 Intervals for (column level mean) - (row level mean) A B B -6,997-0,580 C -3,489 0,299 2,928 6,717

Normal Probability Plot Probability,999,99,95,80,50,20,05,01,001 Average: -0,0000000 StDev: 1,76187 N: 15-2,5 0,0 RESI2 2,5 Anderson-Darling Normality Test A-Squared: 0,164 P-Value: 0,927 Test for Equal Variances for Natrium 95% Confidence Intervals for Sigmas Factor Levels A Bartlett's Test Test Statistic: 1,190 P-Value : 0,552 B Levene's Test Test Statistic: 0,421 P-Value : 0,666 C 0 1 2 3 4 5 6 7 8 9 10 a) Redogör för de modellantaganden man gör vid ensidig variansanalys. b) Redogör för skillnaden mellan fixa och slumpmässiga effekter. Har vi fixa eller slumpmässiga effekter i denna analys (motivera)? c) Visa att medelkvadratsumman för den faktor man vill studera vid ensidig variansanalys (MSA) endast är en väntevärdesriktig skattning av mätfelets varians om nollhypotesen att alla faktornivåer har samma väntevärde är sann. d) Redogör för begreppet massignifikans.

e) Beräkna residualerna och anpassade värdena samt "plotta" dem mot varandra. Finns det något i den bilden som tyder på att modellen är dålig? f) Vilka slutsatser kan man utifrån Minitab-utskrifterna ovan dra angående de olika laboratorierna? Vilket/vilka laboratorium skulle du rekommendera att man anlitar i framtiden? Ge utförlig motivering. g) Genomför motsvarande test (som vid ensidig variansanalys) med ett parameterfritt test. Vilka modellantaganden, görs samt hur er hypoteserna ut? (3p) h) Vid flersidig variansanalys är man ofta intresserad av att utröna om det finns samspel mellan faktorer. Redogör för begreppet samspel samt vad krävs för att man skall kunna testa om samspel föreligger.