En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Relevanta dokument
Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1

Lösningar till SPSS-övning: Analytisk statistik

Tentamen Tillämpad statistik A5 (15hp)

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Samhällsvetenskaplig metod, 7,5 hp

Medicinsk statistik II

Medicinsk statistik II

Uppgift 1. Deskripitiv statistik. Lön

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Uppgift 1. Produktmomentkorrelationskoefficienten

Forsknings- och undersökningsmetodik Skrivtid: 4h

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

10.1 Enkel linjär regression

Metod och teori. Statistik för naturvetare Umeå universitet

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Statistik 1 för biologer, logopeder och psykologer

Multipel regression och Partiella korrelationer

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Skrivning i ekonometri torsdagen den 8 februari 2007

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Tentamen i matematisk statistik

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

7.5 Experiment with a single factor having more than two levels

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

2.1 Minitab-introduktion

Grundläggande matematisk statistik

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

TENTAMEN I MATEMATISK STATISTIK

Föreläsning 12: Linjär regression

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Multipel Regressionsmodellen

Laboration 4 R-versionen

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Statistik och epidemiologi T5

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Lösningar med kommentarer till övningsuppgifterna i min bok Grundläggande statistiska metoder för analys av kvantitativa data

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Tentamen består av 9 frågor, totalt 34 poäng. Det krävs minst 17 poäng för att få godkänt och minst 26 poäng för att få väl godkänt.

Tentamen i Statistik, STA A11/STA A14 (8 poäng) 25 augusti 2004, klockan

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Höftledsdysplasi hos dansk-svensk gårdshund

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

OBS! Vi har nya rutiner.

Skrivning i ekonometri lördagen den 25 augusti 2007

MVE051/MSG Föreläsning 14

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

InStat Exempel 4 Korrelation och Regression

Datorövning 1 Enkel linjär regressionsanalys

oberoende av varandra så observationerna är

Skrivning i ekonometri lördagen den 29 mars 2008

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik för STS vt 2014

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Regressions- och Tidsserieanalys - F1

Laboration 4 Regressionsanalys

Examinationsuppgifter del 2

Regressions- och Tidsserieanalys - F1

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Mata in data i Excel och bearbeta i SPSS

Överlevnadsanalys. 732G34 Statistisk analys av komplexa data

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Lägre andel behöriga på skolor med stora utmaningar

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

Matematisk statistik för D, I, Π och Fysiker

Tentamen MVE301 Sannolikhet, statistik och risk

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Tentamen MVE301 Sannolikhet, statistik och risk

ANOVA Mellangruppsdesign

Kan föräldrastöd förbättra föräldrars hälsa, kompetens och barns beteende?

Tentamen MVE302 Sannolikhet och statistik

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

FACIT!!! (bara facit,

8.1 General factorial experiments

7.5 Experiment with a single factor having more than two levels

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

Tentamen i matematisk statistik

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Bilaga 1: Informationsbrev Informationsbrev gällande enkät undersökning

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

SOPA62 - Kunskapsproduktion i socialt arbete

Föreläsning G60 Statistiska metoder

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Transkript:

En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar på ett linjärt sätt Y när X ökar? X Staffan Nilsson, Chalmers 1

Anpassa en linje till data Y Y i εi ε i kallas residual Minimera ε i 2 Y i = β 0 + β 1 X i + ε i X i X Hypotesprövning Är lutningen 0? H 0 :β 1 =0 vs H 1 : β 1 0, baseras på t-fördelning. Sällan meningsfullt: Är skärningen 0? H 0 :β 0 =0 vs H 1 : β 0 0, baseras på t-fördelning. Blodtryck vs BMI SYSTB P 2 6 0,0 0 O b ser ve d L ine a r 2 4 0,0 0 2 2 0,0 0 2 0 0,0 0 1 8 0,0 0 1 6 0,0 0 1 4 0,0 0 1 2 0,0 0 1 5,0 0 2 0,0 0 2 5,0 0 3 0,0 0 3 5,0 0 4 0,00 4 5,0 0 B M I I experimentella studier ställer man ibland in X-variabeln, men vid observationsstudier är båda slumpmässiga. Staffan Nilsson, Chalmers 2

SBP vs BMI or BMI vs SBP a Unstandardized Standardized 95% Confidence Interval for B B Std. Error Beta t Sig. Lower Bound Upper Bound 1 (Constant) 144,610 15,638 9,247,000 113,379 175,840 BMI 1,352,576,280 2,349,022,202 2,501 a. Dependent Variable: SYSTBP 1 (Constant) SYSTBP a. Dependent Variable: BMI Unstandardized a Standardized 95% Confidence Interval for B t Sig. Lower Bound Upper Bound B Std. Error Beta 16,362 4,486 3,647,001 7,403 25,321,058,025,280 2,349,022,009,107 Inte samma linje Skattade linjer: SBP= 144.61 + 1.352 BMI BMI= -107 + 0.74 SBP BMI= 16.362 + 0.058 SBP Val av riktning är ofta naturligt, men inte alltid. Förklaringsgrad R 2 1 Summary Adjusted Std. Error of R R Square R Square the Estimate,280 a,078,064 20,20462 a. Predictors: (Constant), BMI Descriptive Statistics Mean Std. Deviation N SYSTBP 180,8806 20,88462 67 BMI 26,8308 4,32133 67 1 (Constant) BMI Unstandardized a. Dependent Variable: SYSTBP a Standardized B Std. Error Beta t Sig. 144,610 15,638 9,247,000 1,352,576,280 2,349,022 Den del av y-variansen som förklaras av modellen, dvs av att x varierar. Staffan Nilsson, Chalmers 3

SYSTBP SYSTBP Konfidensintervall Confidence interval for mean 250,00 225,00 200,00 175,00 SYSTBP = 144,61 + 1,35 * BMI R-Square = 0,08 Linear Regression with 95,00% Mean Prediction Interval 150,00 20,00 30,00 40,00 BMI Prediktionsintervall Prediction interval for individuals 250,00 200,00 Linear Regression with 95,00% Individual Prediction Interval SYSTBP = 144,61 + 1,35 * BMI R-Square = 0,08 150,00 20,00 30,00 40,00 BMI Extrapolation? weight(kg) Observed Linear 120,00 Vad blir det förväntade värdet av en 50cm pojke? 100,00 80,00 60,00 40,00 a 160,0 170,0 180,0 190,0 200,0 210,0 length(cm) Unstandardized Standardized B Std. Error Beta t Sig. 1 (Constant) -63,772 8,853-7,204,000 length(cm),759,049,431 15,557,000 a. Dependent Variable: weight(kg) Staffan Nilsson, Chalmers 4

Andra linjära modeller Y=β 0 + β 1 X 2 + brus Y=β 0 + β 1 log(x) + brus etc Kan alla analyseras på samma sätt. Enda förutsättningen är att antagnadet om normalfördelat brus håller. Motivet till att detta ändå kallas en linjär modell är att den är linjär m a p parametrarna (β 0,β 1 ). Du behöver bara skapa nya variabler. Korrelation (Pearson) Korrelation är ett mått på styrkan av det linjär sambandet mellan två variabler, ju närmre linjen desto större korrelation. Betecknas r och är ett skalat mått -1 r 1-1 perfekt linje with negativ lutning 1 perfekt linje med positiv lutning 0 betyder inget linjärt samband r=0.30 Staffan Nilsson, Chalmers 5

r=0.51 r=0.69 r=0.92 Staffan Nilsson, Chalmers 6

Hypotesprövning av r H 0 :r=0 vs H 1 r 0, baseras på t-fördelning. Easy to find empirical p-value with permutation. Ett alternativt icke-parametriskt test är Spearmans rangkorrelation där koefficienten betcknas r s, principen är att rangordna varje variabel och beräkna vanlig r på rangerna. SBP vs BMI Samma p-värde, Stdβ = r R 2 = r 2 Correlations BMI SYSTBP BMI Pearson Correlation 1,280* Sig. (2-tailed),022 N 67 67 SYSTBP Pearson Correlation,280* 1 Sig. (2-tailed),022 N 67 67 *. Correlation is significant at the 0.05 level (2-tailed). 1 (Constant) BMI Unstandardized a. Dependent Variable: SYSTBP a Standardized 95% Confidence Interval for B t Sig. Lower Bound Upper Bound B Std. Error Beta 144,610 15,638 9,247,000 113,379 175,840 1,352,576,280 2,349,022,202 2,501 Deterministic, but not correlated cosinus(x) -1.0-0.5 0.0 0.5 1.0 r=0.05 p=0.59 0 1 2 3 4 5 6 x Staffan Nilsson, Chalmers 7

y y För tolkning måste {(X i,y i ) } vara ett stickprov. Study 1 random sample r=0.63 En valid skattning av korrelation i populationen 3 2 1 0 1 2 3 3 2 1 0 1 2 3 Estimate Std.Error t value Pr(> t ) (Intercept) 1.0187 0.4558 2.235 0.0559 x1 1.3478 0.5785 2.330 0.0482 * x Selektivt urval Study 2 selective sample r=0.92 Korrelationen meningslös, Regression OK 3 2 1 0 1 2 3 3 2 1 0 1 2 3 x Estimate Std.Error t value Pr(> t ) (Intercept) 0.1841 0.3128 0.589 0.572294 x 1.0747 0.1655 6.494 0.000189 *** Ingen korrelation? r = -0.045 p = 0.7 Staffan Nilsson, Chalmers 8

b Blandpopulation! R= -0.66 P< 0.001 R= -0.74 P< 0.001 Storks and babies (klassiskt) Kontinuerliga data -2-1 0 1 2 3-2 -1 0 1 2 3 r=0.23, P=0.001 a Staffan Nilsson, Chalmers 9

b Dikotomisera -2-1 0 1 2 3-2 -1 0 1 2 3 a Kategorisk analys låg hög låg 27 25 hög 17 31 χ 2 =2.13, P=0.14 Sense moral: Utnyttja variationen i data. Staffan Nilsson, Chalmers 10