En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Relevanta dokument
Metod och teori. Statistik för naturvetare Umeå universitet

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

7.5 Experiment with a single factor having more than two levels

Följande resultat erhålls (enhet: 1000psi):

7.5 Experiment with a single factor having more than two levels

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i matematisk statistik

Examinationsuppgifter del 2

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

8.1 General factorial experiments

TENTAMEN I MATEMATISK STATISTIK

Statistik för teknologer, 5 poäng Skrivtid:

Tentamen i matematisk statistik

Räkneövning 3 Variansanalys

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Tentamen i matematisk statistik

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

10.1 Enkel linjär regression

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Regressions- och Tidsserieanalys - F3

Tentamen i Matematisk statistik Kurskod S0001M

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Regressions- och Tidsserieanalys - F3

Tentamen i matematisk statistik

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Tentamen i matematisk statistik

Regressions- och Tidsserieanalys - F3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Skrivning i ekonometri torsdagen den 8 februari 2007

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Regressions- och Tidsserieanalys - F4

Tentamen Tillämpad statistik A5 (15hp)

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Regressions- och Tidsserieanalys - F7

Experiment med två faktorer. Treatment Population. Balanced och ortogonal design. Graph of means. Table of means

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Matematisk statistik Kurskod S0001M

Skrivning i ekonometri lördagen den 29 mars 2008

ANOVA Mellangruppsdesign

Tentamen i Matematisk statistik Kurskod S0001M

Statistik B Regressions- och tidsserieanalys Föreläsning 1

3.1 Beskrivande statistik

Statistisk försöksplanering

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

tentaplugg.nu av studenter för studenter

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Tentamen Tillämpad statistik A5 (15hp)

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Statistisk försöksplanering

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning G60 Statistiska metoder

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Tentamen i Matematisk statistik Kurskod S0001M

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Tentamen i Matematisk statistik Kurskod S0001M

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Exempel 1 på multipelregression

Tentamen i Matematisk statistik Kurskod S0001M

OBS! Skriv e-postadress på tentan om du vill ha resultatet innan jul. Tentamensgenomgång måndagen den 9/ kl i MC413.

Tentamen i Matematisk statistik Kurskod S0001M

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 08 June 2015, 14:00-18:00. English Version

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Hypotestestning och repetition

Medicinsk statistik II

1. En kontinuerlig slumpvariabel X har följande täthetsfunktion (för någon konstant k). f.ö.

Tentamen i Matematisk statistik Kurskod S0001M

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

F13 Regression och problemlösning

TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )

Transkript:

1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt finns mellan frukostflingor på tre olika hyllsektioner. 2 Metod och teori 2.1 Kroppstemperatur och hjärtfrekvens Vi har observerat 130 datapar. Låt x i beteckna kroppstemperatur i Fahrenheit för observation i. Korresponderande hjärtfrekvens y i antas vara en observation av Y i, där där Y i = µ i + ε i, i = 1,..., 130, µ i = α + βx i, i = 1,..., 130, och ε i, i = 1,..., 130 är oberoende slumpvariabler som är N (0, σ 2 ). En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 2.2 Frukostflingor H 0α : α = 0 H 0β : β = 0 H 1α : α 0 H 1β : β 0 Hyllsektionerna som undersöktes var vid golvet (1), i mitten (2; ögonhöjd för skolbarn) och lite högre upp (3). Vi antar att observationer från hyllsektion i är stickprov från slumpvariablerna X i, i = 1, 2, 3, som beskriver sockerhalten i flingor på hyllsektion i. Vi antar att Detta kan uttryckas som X i N (µ i, σ 2 ), i = 1, 2, 3 X i = µ i + ε i där µ i är medelvärdet för hyllsektion i och ε i är oberoende och N (0, σ 2 ). Värdeplottar och lådagram gjordes, och envägs-anova utfördes med 5% signifikansnivå, med Tukeys konfidensintervall, och med följande hypoteser: H 0 : µ 1 = µ 2 = µ 3 H 1 : Minst två µ i är olika 2

3 Resultat 3.1 Kroppstemperatur och hjärtfrekvens En scatterplot erhölls, se Figur 1. Testet av α gav ett P-värde på 0, 042 och testet av β gav ett P-värde på 0, 004. Variansanalys gav ett P-värde på 0, 004. Förklaringsgraden R Sq är 6, 4%. Se bilaga 5.1 för utförligare data. Figur 1: Scatterplot över hjärtfrekvens mot kroppstemperatur Residualerna ε i antogs vara normalfördelade. Fyra residualplottar gjordes för att verifiera detta, se Figur 2. Utifrån dessa kan slutsatsen dras att de är normalfördelade och rätt så slumpmässigt utspridda. Figur 2: Fyra plottar över residualerna 3

En sannolikhetsplot över residualerna gjordes också, se Figur 3. Följande hypoteser användes för att verifiera normalfördelning: H 0 : Datan kommer från en normalfördelning. H 1 : Datan kommer inte från en normalfördelning. Då P-värdet är 0,697 kan H 0 inte förkastas, och datan kan antas komma från en normalfördelning. Figur 3: Sannolikhetsplot över residualerna 4

3.2 Frukostflingor Värdeplottar och lådagram erhölls, se Figur 4 respektive 5. ANOVA gav ett P-värde på 0,002, vilket är lägre än signifikansnivån 5%. Från Tukeys konfi- Figur 4: Värdeplot Figur 5: Lådagram densintervall fås att sektion 1 subtraherad från sektion 2 inte inkluderar 0, sektion 1 subtraherad från sektion 3 inkluderar 0, och sektion 2 subtraherad från 3 inte inkluderar 0. Sektion 1 och 3 hamnade i samma grupp, och sektion 2 hamnade i en annan grupp. Se bilaga 5.2 för utförligare information. 5

Residualerna ε i antogs vara normalfördelade. Fyra residualplottar gjordes för att verifiera detta, se Figur 6. Utifrån dessa kan slutsatsen dras att de är normalfördelade och rätt så slumpmässigt utspridda. Figur 6: Fyra plottar över residualerna En sannolikhetsplot över residualerna gjordes också, se Figur 7. Följande hypoteser användes för att verifiera normalfördelning: H 0 : Datan kommer från en normalfördelning. H 1 : Datan kommer inte från en normalfördelning. Då P-värdet är 0,446 kan H 0 inte förkastas, och datan kan antas komma från en normalfördelning. Figur 7: Sannolikhetsplot över residualerna 6

För att testa om residualernas varians är lika i de tre grupperna utfördes Bartletts test, med följande hypoteser: H 0 : Varianserna korresponderande till varje grupp är lika. H 1 : Varianserna korresponderande till varje grupp är ej lika. Från Figur 8 nedan fås att P-värdet är 0,744, vilket är högre än signifikansnivån 5%. Alltså kan H 0 inte förkastas. Figur 8: Bartletts test 7

4 Slutsatser och diskussion 4.1 Kroppstemperatur och hjärtfrekvens De tre P-värderna gör att följande slutsatser kan dras, med 5% signifikansnivå: (i) Båda nollhypoteserna kan förkastas, och både α och β är därför signifikant skilda från 0. (ii) Ett statistiskt signifikant samband mellan kroppstemperatur och hjärtfrekvens finns. 4.2 Frukostflingor Ett mätvärde var negativt, och då sockerhalt enbart kan vara positiv togs denna observation bort ur analysen. Utifrån P-värdet kan H 0 förkastas och slutsatsen dras att det finns signifikant skillnad mellan hyllsektionerna. Utifrån Tukeys konfidensintervall kan slutsatsen dras att det finns en signifikant skillnad mellan sektion 1 och 2, samt mellan sektion 2 och 3, men inte mellan sektion 1 och 3. 8

5 Bilagor - output från Minitab 5.1 Regression Analysis: Hjartfrekvens versus Kroppstemperatur The regression equation is Hjartfrekvens = - 166 + 2,44 Kroppstemperatur Predictor Coef SE Coef T P Constant -166,28 80,91-2,06 0,042 Kroppstemperatur 2,4432 0,8235 2,97 0,004 S = 6,85774 R-Sq = 6,4% R-Sq(adj) = 5,7% Analysis of Variance Source DF SS MS F P Regression 1 413,95 413,95 8,80 0,004 Residual Error 128 6019,66 47,03 Total 129 6433,61 5.2 One-way ANOVA: Socker versus Hyllsektion Source DF SS MS F P Hyllsektion 2 220,2 110,1 6,60 0,002 Error 73 1217,7 16,7 Total 75 1437,9 S = 4,084 R-Sq = 15,32% R-Sq(adj) = 13,00% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -------+---------+---------+---------+-- 1 19 5,105 4,483 (------*-------) 2 21 9,619 4,129 (------*-------) 3 36 6,528 3,836 (----*-----) -------+---------+---------+---------+-- 5,0 7,5 10,0 12,5 Pooled StDev = 4,084 Grouping Information Using Tukey Method Hyllsektion N Mean Grouping 2 21 9,619 A 3 36 6,528 B 9

1 19 5,105 B Means that do not share a letter are significantly different. Tukey 95% Simultaneous Confidence Intervals All Pairwise Comparisons among Levels of Hyllsektion Individual confidence level = 98,06% Hyllsektion = 1 subtracted from: Hyllsektion Lower Center Upper ------+---------+---------+---------+--- 2 1,423 4,514 7,604 (--------*--------) 3-1,345 1,423 4,191 (-------*-------) ------+---------+---------+---------+--- -3,5 0,0 3,5 7,0 Hyllsektion = 2 subtracted from: Hyllsektion Lower Center Upper ------+---------+---------+---------+--- 3-5,772-3,091-0,411 (------*-------) ------+---------+---------+---------+--- -3,5 0,0 3,5 7,0 10