Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Relevanta dokument
Laboration 4 R-versionen

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Laboration 4 Regressionsanalys

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet. Laboration 4. Regressionsanalys

10.1 Enkel linjär regression

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

1 Förberedelseuppgifter

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

F13 Regression och problemlösning

Laboration 5 Regressionsanalys

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Föreläsning 12: Linjär regression

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen

LABORATION 3 - Regressionsanalys

Matematisk statistik för D, I, Π och Fysiker

Grundläggande matematisk statistik

Metod och teori. Statistik för naturvetare Umeå universitet

Laboration 2: Styrkefunktion samt Regression

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

Föreläsning 12: Regression

förstå modellen enkel linjär regression och de antaganden man gör i den Laborationen är dessutom en direkt förberedelse inför Miniprojekt II.

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Regressions- och Tidsserieanalys - F1

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Matematisk statistik, Föreläsning 5

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Regressions- och Tidsserieanalys - F1

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

TVM-Matematik Adam Jonsson

LABORATION 3 - Regressionsanalys

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Datorövning 1 Enkel linjär regressionsanalys

Examinationsuppgifter del 2

Matematisk statistik för B, K, N, BME och Kemister

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

oberoende av varandra så observationerna är

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Obligatorisk uppgift, del 1

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Tentamen i Matematisk statistik Kurskod S0001M

TENTAMEN I MATEMATISK STATISTIK

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Föreläsning G60 Statistiska metoder

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Del 2 tillsammans med förberedelsefrågor - tid för inlämning och återlämning meddelas senare.

Tentamen i Matematisk statistik Kurskod S0001M

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Laboration 4: Lineär regression

Statistik 1 för biologer, logopeder och psykologer

tentaplugg.nu av studenter för studenter

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Regressions- och Tidsserieanalys - F4

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

InStat Exempel 4 Korrelation och Regression

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Lektionsanteckningar 11-12: Normalfördelningen

Tentamen i Matematisk statistik Kurskod S0001M

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Jan Hagberg, Bo Rydén, Christian Tallberg, Jan Wretman

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg/Jep Agrell. Laboration 2. Statistiska test

TENTAMEN I MATEMATISK STATISTIK

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

Läs noggrant informationen nedan innan du börjar skriva tentamen

Instruktioner till arbetet med miniprojekt II

Medicinsk statistik II

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet. Laboration 3. Variansanalys

LABORATION 1. Syfte: Syftet med laborationen är att

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller

Linjär regressionsanalys. Wieland Wermke

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Tentamen i Matematisk statistik Kurskod S0001M

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

träna på att använda olika grafiska metoder för att undersöka vilka fördelningar ett datamaterial kan komma från

Tentamen i Matematisk statistik Kurskod S0001M

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Datorövning 5 Exponentiella modeller och elasticitetssamband

Laboration 4: Hypotesprövning och styrkefunktion

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Transkript:

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25, 8.15 10.00

Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner som finns i SPSS vad det gäller korrelations- och regressionsanalys. När ni arbetat er igenom laborationshandledningen fortsätter ni med projektet. 2 Introduktion - Regressionsanalys i SPSS Genom hela introduktionen ställs frågor i anslutning till analyserna. Kortfattade svar finns i slutet på introduktionen. Vi skall börja med att göra en regressionsanalys på följande datamaterial: Datamaterial: För 6 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Längd (cm) Ålder (år) 15 1 30 2 35 3 50 4 55 5 60 6 Kan vi påvisa något samband (linjärt) mellan längd och ålder? 1. Inläsning av data. Börja med att mata in data till SPSS. Lägg in värdena i två kolumner: Längd och Ålder. Datamaterialet skall alltså innehålla 2 kolumner med 6 värden i varje kolumn. a) Beskrivning av data. Börja nu med en grafisk beskrivning av sambandet genom att använda Graphs>Legacy Dialogs>Scatter>Simple>Define. Lägg in Längd på Y Axis och Ålder på X Axis. b) Korrelationer. Vi börjar med att beskriva sambandet mellan variablerna med hjälp av korrelationskoefficienten. Beräkna korrelationskoefficienten (Pearson) som du hittar under Analyze>Correlate>Bivariate. Tyder resultaten på att det finns något samband mellan Längd och Ålder? c) Enkel linjär regression. Vi skall nu undersöka hur sambandet mellan variablerna ser ut genom att anpassa en rät linje till data. Ge Analyze>Regression>Linear och lägg in Längd som Dependent och Ålder som Independent. Kryssa också i att ni vill ha konfidensintervall för de skattade parametrarna under Statistics. Gör analysen. Identifiera följande mått i utskriften: r korrelationskoefficienten, r 2 förklaringsgraden, s residualspridningen, de skattade koefficienterna med standardfel, t-test och konfidensintervall. För att få den skattade regressionslinjen utritad dubbelklicka på figuren ni skapade i 1 a). Använd sedan Fit line under fliken Elements. d) Prognoser och konfidensintervall. Om man vill använda sin regressionsmodell för att göra prognoser så kan detta enkelt göras som en del av analysen. Gå då in under Analyze>Regression>Linear följt av Save. Vill man ha prognoser markerar man här Predicted Values Unstandardized. Gör detta. Markera även Mean och Individual under

3 Prediction Intervals. Passa även på att spara residualerna (Unstandardized) (de behövs i nästa deluppgift). Gör analysen. Titta sedan i datamaterialet. Det bör finnas sex nya kolumner. pre_1 res_1 lmci_1 umci_1 lici_1 uici_1 - Prognoser - Residualer - Undre gräns för ett KI för medelvärdet på Y givet olika X - Övre gräns för ett KI för medelvärdet på Y givet olika X - Undre gräns för ett PI * för ett enskilt Y givet olika värden på X - Övre gräns för ett PI * för ett enskilt Y givet olika värden på X * PrognosIntervall Alla värden och KI är räknade för de värden på X som finns i datamaterialet. Vill man ha prognoser/intervall för ett annat värde på X så lägger man till detta värde i X-kolumnen på en ensam rad sist i datamaterialet och gör om analysen. Detta värde kommer inte med i analysen (det finns ju inget Y-värde), men man får prognoser/intervall i alla fall. Ta nu bort de sex nya kolumnerna och lägg till värdet 7 på rad 7 i X-kolumnen (Ålder). Gör sedan om analysen. Vad blir prognosen för längden för en sju år gammal torsk? Vad blir prognosintervallet? (det går bara att göra en i taget). För att få intervallen utritade i figur dubbelklicka på figuren ni skapade i 1 a). Använd sedan Fit line at total under fliken Elements och kryssa i mean och individual (det går bara att göra en i taget). e) Kontroll av förutsättningar. Vi skall nu kontrollera två av de antagande som finns i analysen. För det första antagandet om normalfördelning och för det andra antagandet om lika varianser. Undersök nu om residualerna är normalfördelade genom att göra en Q-Q-plot. Antagandet om lika varianser (konstant spridning kring linjen) kan vi undersöka genom att plotta residualerna mot Ålder. Datamaterial: Bradfordmetoden. I laborationen ''Proteinbestämning enligt Bradfordmetoden'' i kursen cellbiologi undersöktes absorbansen hos prov med olika spädningar av Bovint Serum Albumin (BSA)-standard. Prov med 0-10 μg protein spädes till 100 μl med vatten och två prover förberedes per koncentration. Data för en laborationsgrupp finns i filen LABBDATA.SAV som du hittar på kursens hemsida www.maths.lth.se/matstat/kurser/masb11/vtm3/material. Modell: Enligt Lambert-Beers lag gäller att absorbansen (A) kan beskrivas som en linjär funktion av koncentrationen (c): A=k c där konstanten k beror på ämnets molära absorptionskoefficient vid en viss våglängd samt kyvettens längd. Vid mätningar får man naturligtvis räkna med en viss slumpmässig variation, en rimlig modell är att absorbansen vid mätning nr i, A i, beskrivs linjärt av koncentrationen c i plus ett slumpmässigt fel: A i = β 0 + β 1 c i + e i

4 där e i är oberoende och normalfördelad slumpfel med väntevärde 0 och standardavvikelse σ. Här motsvaras konstanten β 1 av den tidigare k medan β 0 är absorbansen i den lösning som BSA:n är löst. 2. a) Undersök på labbdata om den linjära regressionsmodellen ovan är rimlig att anpassa. b) Hur mycket ökar absorbansen då man ökar koncentrationen en enhet? Ange ett 95 % konfidensintervall för denna storhet. c) Vad är genomsnittlig absorbans för prov med koncentration 50 (mg/l). Ange ett 95 % konfidensintervall för denna storhet. d) Vi har ett prov med koncentration 50 (mg/l). Ange ett 95 % prediktionsintervall för absorbansen i just detta prov. e) Huvudsyftet med mätningarna var att erhålla en standardkurva för hur absorbansen påverkas av koncentrationen. Anta att vi på ett prov med okänd koncentration c 0 uppmätte absorbansen 0.43. Ange en skattning av c 0 - detta anges inte på något smidigt sätt i SPSS utan måste räknas fram. (Ta fram fler decimaler på skattningen av β 1 genom att dubbelklicka på resultattabellen, högerklicka på skattningen och gå in under Cell properties.) f) Man skulle också vilja ha ett intervall som uppskattar inom vilka gränser c 0 kan ligga ett sådant intervall kallas kalibreringsintervall. Tyvärr kan man inte få det direkt i SPSS. Däremot kan man få en uppfattning om hur brett intervallet är eftersom kalibreringsintervallet är omvändningen till prediktionsintervallet. Rita ut prediktionsintervallets gränser m.h.a. Graphs>Interactive>Scatterplot. Sätt absorbans på y-axeln och koncentration på x-axeln, markera under fliken Fit att ni vill ha prediction lines (både mean och individual). Gå in i figuren på absorbansen 0.43 (0.43 på y-axeln) och titta på prediktionsintervallets bredd på x- axeln för detta y-värde. Genom att avläsa (svårt i figuren) motsvarande koncentrationer har ni fått det sökta kalibreringsintervallet. Svar: 1. b) Ja! r p = 0,982 => p=0,000 Det finns ett samband c) r = 0,982 / r 2 = 0,964 / s = 3,651 / β 0 =9,333 (3,399) / β 1 =9,000 (0,873) t=10,311 => p=0,000 d) Prognos vid åldern 7 år = 72,33 / PI 58,5-86,2 e) NF: Nej! p=0,990 / Konstant varians: Ej helt lätt att bedöma (få värden) 2. b) 0.0008 intervall: 0,00063-0,0011 c) KI 0,425 0,441 d) PI 0,407 0,459 e) c 0 skattas till 47 mg/l f) Intervallet skattas till 15-78 Sammanfattning SPSS Graphs>Legacy Dialogs>Scatter Analyze>Correlate>Bivariate Spridningdiagram Korrelationer

Analyze>Regression>Linear Linjär regression 5