STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA
|
|
- Kurt Berglund
- för 7 år sedan
- Visningar:
Transkript
1 STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Mattias Villani Statistik Institutionen för Datavetenskap Linköpings Universitet MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 1 / 44
2 MOMENTETS INNEHÅLL Introduktion till longitudinella data Modeller för väntevärdesprofiler Modeller för kovariansmatriser Modeller med fixed och random effects R-paket för analys av longitudinella data MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 2 / 44
3 TVÄRSNITTSDATA (CROSS-SECTIONAL DATA) En mätning per individ/subjekt (blodtryck för individ i) Mätningen kan vara fler-dimensionell (blodtryck och kroppstemperatur för individ i) De olika mätvariablerna (blocktryck och temp) kan vara beroende/korrelerade Ingen tidsdimension Kan jämföra olika delpopulationer som råkar ha skilda åldrar, men ingen info om hur en given individ utvecklas över tiden Mellan-individ effekter, men inga inom-individ effekter Oparat t-test Vanlig modell: regression MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 3 / 44
4 EXEMPEL LUNGFUNKTION MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 4 / 44
5 TIDSSERIEDATA En mätvariabel som observeras över tid Oftast många mätningar över tiden (lång tidsserie med > 100 observationer) Beroende mellan mätningar vid olika tidpunkter Starkast beroende mellan närliggande tidpunkter Mätvariabeln kan vara fler-dimensionell Vanlig modell: ARIMA eller state-space modeller MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 5 / 44
6 EXEMPEL LUNGFUNKTION MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 6 / 44
7 LONGITUDINELLA DATA Samma individer observeras vid flera olika tidpunkter Ger information om en individs förändring över tiden Tänk parat t-test Kombo av tvärsnitts- och tidsseriedata Ofta få mätningar per individ (5-20 st) Longitudinella data är i princip korta tidsserier, men har egna modeller och metoder Mätningar mellan olika individer antas ofta vara oberoende Mätningarna för en individ tenderar att vara beroende Autokorrelation MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 7 / 44
8 EXEMPEL LUNGFUNKTION MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 8 / 44
9 VARFÖR ÄR DEN LONGITUDINELLA ASPEKTEN VIKTIG? MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 9 / 44
10 VARFÖR ÄR DEN LONGITUDINELLA ASPEKTEN VIKTIG? MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 10 / 44
11 VARFÖR ÄR DEN LONGITUDINELLA ASPEKTEN VIKTIG? MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 11 / 44
12 LONGITUDINELLA DATA, FORTS Egenskaper för autokorrelation i longitudinella data: Positiv Minskar med tidsavståndet mellan två observationer Korrelation mellan mycket långa tidsavstånd är ofta skild från noll Korrelation mellan mycket korta tidsavstånd är sällan nära ett Vanligt med missing data: Saknade mättillfällen Drop-outs Överlevare Besläktade datatyper: hierarkiska data (skolor med skolklasser med elever) spatiala (rumsliga) data (huspriser i olika städer, miljödata) tempo-spatiala data (månatliga mätningar av huspriser i olika städer) MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 12 / 44
13 HUR MAN ORGANISERAR LONGITUDINELLA DATA fev <- readtable("/data/lungfunctiongrowthdat", header = TRUE) fev[1:18, ] ID Height Age InitialHeight InitialAge LogFEV MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 13 / 44
14 BLYMÄNGDER HOS SMÅ BARN - KONTROLLGRUPP MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 14 / 44
15 BLYMÄNGDER HOS SMÅ BARN - BEHANDLINGSGRUPP MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 15 / 44
16 LONGITUDINELLA DATA ÄR MULTIVARIATA DATA Y i = n i 1 Y i1 Y i2 Y ini, i = 1, 2,, N Kan modelleras med multivariate normalfördelning, och multivariat regression Blymängder, kontrollgrupp: Corr(Y ) = MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 16 / 44
17 LONGITUDINELLA DATA ÄR MULTIVARIATA DATA MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 17 / 44
18 PROBLEM MED DIREKT MULTIVARIAT ANALYS Cov(Y ) innehåller T (T + 1)/2 fria parametrar, dvs många parametrar när T är stort Missing data och drop-outs Y 11 Y 1 = Y 12 Y 13 Y 14, Y 2 = Y 21 NA NA NA, Y 3 = Olika individer kan observeras vid olika tidpunkter Y 31 Y 32 NA Y 34 MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 18 / 44
19 Var( ˆθ) = σ2 1 + σ2 2 2ρ 12σ 1 σ 2 N MATTIASvilken VILLANI är (STATISTIK, liten vid LIU) stark positiv LONGITUDINELLA (auto)korrelation DATA 19 / 44 AUTOKORRELERADE MÄTNINGAR ÄR BRA Intresse: förändringen mellan två tidpunkter θ = µ 2 µ 1 Modell för tidpunkt 1 och 2 Notera: Y 1 N(µ 1, σ 2 1 ) Y 2 N(µ 2, σ 2 2 ) E (Y 2 Y 1 ) = µ 2 µ 1 Var(Y 2 Y 1 ) = σ σ 2 2 2ρ 12 σ 1 σ 2 Estimator av förändringen mellan tidpunkterna: Samplingvarians för ˆθ ˆθ = 1 N N i=1 (Y i2 Y i1 )
20 MODELL FÖR VÄNTEVÄRDESPROFILER Väntevärdesprofilen, mean response profile, över tiden för individ i: E (Y ij ) = β 0 + β 1 t ij + β 2 t 2 ij, i = 1,, N och j = 1,, n i Andra parametriska kurvor går också bra, t ex splines Vi kan även ha en annan förklarande variabel X 1 som är konstant över tiden (tidsinvariant): E (Y ij X i ) = β 0 + β 1 t ij + β 2 t 2 ij + β 3 X i,1 Och vi kan ha en förklarande variabel som varierar över tid (tidsvariant) E (Y ij X i ) = β 0 + β 1 t ij + β 2 t 2 ij + β 3 X i,1 + β 4 X ij,2 MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 20 / 44
21 HUR MAN ORGANISERAR LONGITUDINELLA DATA fev <- readtable("/data/lungfunctiongrowthdat", header = TRUE) fev[1:18, ] ID Height Age InitialHeight InitialAge LogFEV MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 21 / 44
22 MODELLER FÖR VÄNTEVÄRDESPROFILER, FORTS Vi kan skriva modellen in matrisform för Y i = (Y i1, Y i2,, Y in ) E (Y i X i ) = µ i = X i β Exempel: för modellen har vi E (y ij x) = β 0 + β 1 t + β 2 t 2 + β 3 x 1,i + β 4 x 2,ij 1 t i1 t 2 i1 x 1,i x 2,i1 1 t i2 ti2 2 x 1,i x 2,i1 X i = 1 t ini tin 2 i x 1,i x 2,ini Notera: multivariat regression (multivariat respons) = Multipel regression (en respons, flera förklarande variabler) MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 22 / 44
23 VÄNTEVÄRDESPROFILER MED TVÅ GRUPPER Kontrollgruppens väntevärdesprofil E (y ij x i ) = β 0 + β 1 t + β 2 t 2 Behandlingsgruppens väntevärdesprofil: E (y ij x i ) = (β 0 + β 3 ) + (β 1 + β 4 ) t + (β 2 + β 5 ) t 2 Testa om behandlingen har någon som helst effekt: H 0 : β 3 = β 4 = β 5 = 0 Vanligt F-test MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 23 / 44
24 VÄNTEVÄRDESPROFILER MED TVÅ GRUPPER, FORTS Datamatris Första personen kontroll, andra personen behandlad X i = 1 t 11 t t 12 t t 1n1 t 2 i1n t 21 t t 21 t t 22 t t 22 t t 2n2 t 2 2n 2 1 t 2n2 t 2 2n 2 MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 24 / 44
25 VÄNTEVÄRDESPROFILER MED TVÅ GRUPPER, FORTS R sätter upp X i åt oss utifrån följande datamatris 1 Y 11 t 11 T 1 Y 12 t 12 T 1 Y 1n1 t 1n1 T Data = 2 Y 21 t 21 C 2 Y 22 t 22 C 2 Y 2n2 t 2n2 C där den första kolumnen indikerar individ och sista kolumnen är en faktor-variabel som indikerar behandling (T) eller kontroll (C) MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 25 / 44
26 ESTIMATION Modell Y i = X i n i 1 β n i pp 1 + ɛ i n i 1 iid där ɛ i N(0, Ri ) Antag att R i är kända Generalized Least Squares (GLS) ˆβ = [ N X i=1 i Ri 1 X i ] 1 N (X i Ri 1 y i ) i=1 Notera: att n i kan variera över individerna X i R 1 i X i är alltid en p p matris ocjh X i R 1 i y i är en p dimensional vektor När R i är okänd kan den ersättas med en skattning Fortfarande konsistent skattning av β Vi kan faktiskt sätta R i = σ 2 I och ändå få konsistenta skattningar Men standardfelen för ˆβ blir inte rätt Sandwich MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 26 / 44
27 FUNKTIONEN GLS I R-PAKETET NLME - ALLMÄN # Fitting quadratic mean response profiles with GLS model using different # covariance structures Child lead data - GLS library(nlme) # Reading data from file leaddata <- readtable("/data/leaddatapp") # General symmetric covariance structure modelsym <- gls(lead ~ 1 + time * group + I(time^2) * group, data = leaddata, correlation = corsymm(form = ~1 id)) summary(modelsym) Generalized least squares fit by REML Model: lead ~ 1 + time * group + I(time^2) * group Data: leaddata AIC BIC loglik Correlation Structure: General Formula: ~1 id Parameter estimate(s): Correlation: Coefficients: Value StdError t-value p-value (Intercept) time groupp MATTIAS I(time^2) VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 27 / 44
28 FUNKTIONEN GLS I R-PAKETET NLME - EQUI # Fitting quadratic mean response profiles with GLS model using different # covariance structures Child lead data - GLS library(nlme) # Reading data from file leaddata <- readtable("/data/leaddatapp") # General symmetric covariance structure modelsym <- gls(lead ~ 1 + time * group + I(time^2) * group, data = leaddata, correlation = corcompsymm(form = ~1 id)) summary(modelsym) Generalized least squares fit by REML Model: lead ~ 1 + time * group + I(time^2) * group Data: leaddata AIC BIC loglik Correlation Structure: Compound symmetry Formula: ~1 id Parameter estimate(s): Rho Coefficients: Value StdError t-value p-value (Intercept) time groupp I(time^2) time:groupp groupp:i(time^2) MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 28 / 44
29 FUNKTIONEN GLS I R-PAKETET NLME - AR1 # Fitting quadratic mean response profiles with GLS model using different # covariance structures Child lead data - GLS library(nlme) # Reading data from file leaddata <- readtable("/data/leaddatapp") # General symmetric covariance structure modelsym <- gls(lead ~ 1 + time * group + I(time^2) * group, data = leaddata, correlation = corar1(form = ~1 id)) summary(modelsym) Generalized least squares fit by REML Model: lead ~ 1 + time * group + I(time^2) * group Data: leaddata AIC BIC loglik Correlation Structure: AR(1) Formula: ~1 id Parameter estimate(s): Phi Coefficients: Value StdError t-value p-value (Intercept) time groupp I(time^2) time:groupp groupp:i(time^2) MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 29 / 44
30 BLYMÄNGDER - FITTED VALUES FRÅN GLS EQUICORR MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 30 / 44
31 BLYMÄNGDER HOS SMÅ BARN - KONTROLLGRUPP MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 31 / 44
32 BLYMÄNGDER HOS SMÅ BARN - BEHANDLINGSGRUPP MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 32 / 44
33 MODELLER FÖR KOVARIANSMATRISEN R i = σ 2 i I n Oberoende observationer med olika varians för varje individ Specialfall: σ i = σ 2 för alla i Equikorrelationsmodell R = σ1 2 ρσ 1 σ 2 ρσ 1 σ n ρσ 1 σ 2 σ2 2 ρσ 2 σ n ρσ 1 σ n ρσ 2 σ n σn 2 med korrelationsmatris P = 1 ρ ρ ρ 1 ρ ρ ρ 1 MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 33 / 44
34 MODELLER FÖR KOVARIANSMATRISEN, FORTS Autoregressiv struktur P = 1 ρ 1 ρ n 1 ρ 1 1 ρ n 2 ρ n 1 ρ n 2 1 där autokorrelationen avtar med tidsavståndet, t ex Corr(Y i1, Y i4 ) = ρ 3 Autoregressiv struktur för data med olika tid mellan observationstillfällen: Corr(Y ij, Y ik ) = ρ t ij t ik MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 34 / 44
35 VARIOGRAM Variogram beskriver det temporala beroendet för en stokastisk process med oregelbundna observationstider γ(u) = 1 2 E {[Y (t) Y (t u)] 2}, u 0 Om processen är stationär gäller följande relation mellan variogram och autokorrelationsfunktion γ(u) = σ 2 [1 ρ(u)], där σ 2 är variansen för Y (t) Sample variogram anpassar en mjuk kurva genom punkterna v ijk = 1 2 (e ij e ik ) där e ij är residualen vid tidpunkt t ij och u ijk = t ij t ik Funktionen Variogram i R-paketet nlme beräknar variogrammet på gls-objekt och lme-objekt MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 35 / 44
36 FIXED EFFECTS OCH RANDOM EFFECTS Den vanliga linjära modellen (Fixed effects) Random intercept model: Y ij = β 0 + β 1 X ij + ɛ ij Y ij = (β 0 + b i ) + β 1 X ij + ɛ ij där b i N(0, σb 2 ) är den individ-specifika delen av interceptet Slumpmässigt Marginell väntevärdesprofil Betingad väntevärdesprofil E (Y ij X ij ) = β 0 + β 1 X ij E (Y ij X ij, b i ) = (β 0 + b i ) + β 1 X ij MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 36 / 44
37 KOVARIANSSTRUKTUR FRÅN RANDOM INTERCEPT Kovariansen för en random intercept modell är σb 2 σb 2 σb 2 σb 2 σb 2 σb 2 Cov(Y i ) = σb 2 σb 2 σb 2 + R i Om R i = σ 2 I n ger detta en ekvi-korrelationsmatris med korrelationskoefficienten ρ = σ2 b σ 2 +σ 2 b Ett slumpmässigt intercept ger varje individ dess eget intercept innebär: observationerna är oberoende kring den betingade väntevärdesprofilen (β 0 + b i ) + β 1 X ij observationerna för en individ är beroende kring det marginella väntevärdet β 0 + β 1 X ij Autokorrelation genom random intercept MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 37 / 44
38 FIXED EFFECTS OCH RANDOM EFFECTS Random slope Y ij = (β 0 + b 0i ) + (β 1 + b 1i )X ij + ɛ ij där (b 0i, b 1i ) N 2 (0, D) är den individ-specifika delen Slumpmässigt General Linear Mixed Model (GLMM) Y i = X i β + Z i b i + ɛ i b i iid Nq (0, D) ε i iid Np (0, R i ) MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 38 / 44
39 VÄNTEVÄRDE OCH COVARIANS - GLMM Marginell väntevärdesprofil Betingad väntevärdesprofil Kovariansmatris E (Y i X ij ) = X i β E (Y i X i, b i ) = X i β + Z i b i Σ 1 = Cov(Y i ) = Z i GZ i + R i Notera 1: Cov(Y i ) visar tydligt att variationen i data kan delas upp i mellan-individsvariation (Z i GZ i ) och inom-individsvariation (R i ) Notera 2: varianser och kovarianser för Y i kan nu bero på förklarande variabler (Z i ) Linjär tidstrend i Z i ger kvadratisk tidstrend i variansen Notera 3: variablerna i Z i bör även ingå i X i Notera 4: R i kan parametriseras som tidigare, t ex via equi-korrelationmatris eller autoregressive struktur MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 39 / 44
40 KRYMPNING - LÅNA STYRKA GLMM modellen: Y i = X i β + Z i b i + ɛ i Responsprofilen för den ite individen är Ŷ i = W i (X i ˆβ) + (I W i ) Y i där ˆβ är GLS skattning på populationsnivå och viktmatrisen W i är Intuition: W i = ˆR i (Z i ĜZ i + ˆR i ) 1 p p Ŷ i = Vikt Populationsprofil + (1-Vikt) Observerad profil Variation inom individ Vikt = Variation mellan individer + Variation inom individ Individer med svaga observationer (stort R i ) lånar styrka från populationen MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 40 / 44
41 MODELLVAL Hur väljer man bland modeller? vilken modell för vänteväntevärdesprofilen? vilken struktur på kovariansmatrisen? Fixed eller random effects? Vilka förklarande variabler? etc etc Strategi: välj den modell som minimerar ett informationskriterium AIC: 2 MaxLogLik + 2 (#antal parametrar i modellen) BIC 2 MaxLogLik + ln N (#antal parametrar i modellen) där MaxLogLik är log-likelihoodfunktionens maximum (ln L( ˆθ)) MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 41 / 44
42 LONGITUDINELL ANALYS I R Flera paket att välja på, framförallt: nlme och lme4 nlme kan skatta linear mixed models med normalfördelade störningar (ɛ) och normalfördelade random effects (b i ) Många options, t ex olika strukturer på R i = Cov(ɛ ij ) och D = Cov(b i ) T o m heteroscedastiska modeller för variansen är möjliga lme4 liknar nlme, men har inte lika många kovarianstrukturer att välja på Men lme4 kan skatta linear mixed models för data där responsen t ex är räknedata eller binär lme4 kan alltså skatta en logistisk regression med fixed och random effects SAS har PROC MIXED Se Lindas föreläsningar om hierarkiska data MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 42 / 44
43 EXEMPEL - LONGITUDINELL ANALYS MED NLME # installpackages('nlme') # install package uncomment if not installed library(nlme) # load package fev <- readtable("/data/lungfunctiongrowthdat", header = TRUE) modelrandomslopear1 <- lme(fixed = LogFEV1 ~ 1 + Age + log(height) + InitialAge + log(initialheight), random = ~1 + Age ID, data = fev, correlation = corar1()) summary(modelrandomslopear1) Linear mixed-effects model fit by REML Data: fev AIC BIC loglik Random effects: Formula: ~1 + Age ID Structure: General positive-definite, Log-Cholesky parametrization StdDev Corr (Intercept) (Intr) Age Residual Correlation Structure: AR(1) Formula: ~1 ID Parameter estimate(s): Phi Fixed effects: LogFEV1 ~ 1 + Age + log(height) + InitialAge + log(initialheight) Value StdError DF t-value p-value (Intercept) Age log(height) InitialAge log(initialheight) MATTIAS Correlation: VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 43 / 44
44 BLYMÄNGD - RANDOM INTERCEPT MODELL # installpackages('nlme') # install package uncomment if not installed library(nlme) # load package leaddata <- readtable("/data/leaddatapp") # Fitting a random intercept model modelrandomintercept <- lme(fixed = lead ~ 1 + time * group + I(time^2) * group, random = ~1 id, data = leaddata, correlation = NULL) modelrandomintercept$coef$fixed (Intercept) time groupp I(time^2) time:groupp groupp:i(time^2) var(modelrandomintercept$coef$random[[1]]) (Intercept) (Intercept) 1997 MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 44 / 44
TVÄRSNITTSDATA (CROSS-SECTIONAL DATA)
STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Mattias Villani Statistik Institutionen för Datavetenskap Linköpings Universitet MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 1 / 44 TVÄRSNITTSDATA
STATISTISK ANALYS AV KOMPLEXA DATA
STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 9 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 1 / 43 Longitudinella data
STATISTISK ANALYS AV KOMPLEXA DATA
STATISTISK ANALYS AV KOMPLEXA DATA HIERARKISKA DATA Linda Wänström Linköpings universitet 25 November Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 1 / 53 Regressionsmodell för icke-hierarkiska
STATISTISK ANALYS AV KOMPLEXA DATA
STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 1 / 56 Longitudinella data Tvärsnittsdata Flera
STATISTISK ANALYS AV KOMPLEXA DATA
STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 12 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 December 1 / 12 Explorativ Faktoranalys
Stokastiska processer med diskret tid
Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna
Finansiell statistik. Multipel regression. 4 maj 2011
Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi
Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012
Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig
Bayesiansk statistik, 732g43, 7.5 hp
Bayesiansk statistik, 732g43, 7.5 hp Moment 2 - Linjär regressionsanalys Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA, LiU) Bayesiansk statistik 1 / 29 Översikt moment 2: linjär
TRE TYPER AV SPATIALA DATA
STATISTISK ANALYS AV KOMPLEXA DATA SPATIALA DATA Mattias Villani Statistik Institutionen för Datavetenskap Linköpings Universitet MATTIAS VILLANI (STATISTIK, LIU) SPATIALA DATA 1 / 21 TRE TYPER AV SPATIALA
Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
STATISTISK ANALYS AV KOMPLEXA DATA
STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 1 / 66 Longitudinella data Tvärsnittsdata Flera
STATISTISK ANALYS AV KOMPLEXA DATA
STATISTISK ANALYS AV KOMPLEXA DATA HIERARKISKA DATA Linda Wänström Linköpings universitet 14-15 November Wänström (Linköpings universitet) HIERARKISKA DATA 14-15 November 1 / 59 Hierarkiska data Hierarkiska
Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå
Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; () Mixed effect models; (3)
STATISTISK ANALYS AV KOMPLEXA DATA SPATIALA DATA
STATISTISK ANALYS AV KOMPLEXA DATA SPATIALA DATA Mattias Villani Statistik Institutionen för Datavetenskap Linköpings Universitet MATTIAS VILLANI (STATISTIK, LIU) SPATIALA DATA 1 / 28 MOMENTETS INNEHÅLL
Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå
Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; (2) Mixed effect models; (3)
Stokastiska processer med diskret tid
Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna
732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris
4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler
Föreläsning 2 4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler Stokastiskavariabler Stokastisk variabel (eng: random variable) En variabel vars värde
En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.
En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
Härledning av Black-Littermans formel mha allmänna linjära modellen
Härledning av Black-Littermans formel mha allmänna linjära modellen Ett sätt att få fram Black-Littermans formel är att formulera problemet att hitta lämpliga justerade avkastningar som ett skattningsproblem
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology September 21, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två
2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer
Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna
Formler och tabeller till kursen MSG830
Formler och tabeller till kursen MSG830 Deskriptiva mått För ett datamängd x 1,, x n denieras medelvärde standardavvikelse standardfelet (SEM) Sannolikheter x = 1 n n i=1 = x 1 + + x n n s = 1 n (x i x)
Tentamen för kursen. Linjära statistiska modeller. 22 augusti
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus
Föreläsning 12: Linjär regression
Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera
Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar
Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Stas Volkov Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 1/20 Översikt Exempel Repetition Exempel Matematisk statistik
TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65
Formel- och tabellsamling i matematisk statistik Martin Singull Innehåll 4.1 Multipel regression.............................. 15 1 Sannolikhetslära 7 1.1 Några diskreta fördelningar.........................
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology April 27, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två numeriska
732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29
732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann
MVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
Stokastiska vektorer
TNG006 F2 9-05-206 Stokastiska vektorer 2 Kovarians och korrelation Definition 2 Antag att de sv X och Y har väntevärde och standardavvikelse µ X och σ X resp µ Y och σ Y Då kallas för kovariansen mellan
3 Maximum Likelihoodestimering
Lund Universitet med Lund Tekniska Högskola Finansiell Statistik Matematikcentrum, Matematisk Statistik VT 2006 Parameterestimation och linjär tidsserieanalys Denna laborationen ger en introduktion till
Regressions- och Tidsserieanalys - F7
Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys
Föreläsning 11: Mer om jämförelser och inferens
Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer
TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder
TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder Martin Singull Matematisk statistik Matematiska institutionen Innehåll Fö2 Punktskattningar Egenskaper Väntevärdesriktig Effektiv Konsistent
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-05-31 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-06-01 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version
Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 5 June 217, 14:-18: Examiner: Zhenxia Liu (Tel: 7 89528). Please answer in ENGLISH if you can. a. You are allowed to use a calculator, the formula and
Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8
1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,
7.5 Experiment with a single factor having more than two levels
7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan
Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012
Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov
Föreläsning 13: Multipel Regression
Föreläsning 13: Multipel Regression Matematisk statistik Chalmers University of Technology Oktober 9, 2017 Enkel linjär regression Vi har gjort mätningar av en responsvariabel Y för fixerade värden på
STATISTISK ANALYS AV KOMPLEXA DATA SPATIALA DATA
STATISTISK ANALYS AV KOMPLEXA DATA SPATIALA DATA Mattias Villani Statistik Institutionen för Datavetenskap Linköpings Universitet MATTIAS VILLANI (STATISTIK, LIU) SPATIALA DATA 1 / 36 MOMENTETS INNEHÅLL
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-10-12 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.
S0005M. Stokastiska variabler. Notes. Notes. Notes. Stokastisk variabel (slumpvariabel) (eng: random variable) Mykola Shykula
Mykola Shykula LTU Mykola Shykula (LTU) 1 / 18 Föreläsning 2 4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler Mykola Shykula (LTU) 2 / 18 Stokastiska
1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell
Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning
Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar
Föreläsning 6 (kap 6.1, 6.3, 7.1-7.3): Punktskattningar Marina Axelson-Fisk 4 maj, 2016 Stickprov (sample) Idag: Stickprovsmedelvärde och varians Statistika (statistic) Punktskattning (point estimation)
Kossor, tallsteklar och sockerärter Statistik vid Sveriges Lantbruksuniversitet
Kossor, tallsteklar och sockerärter Statistik vid Sveriges Lantbruksuniversitet Mikael Andersson Franko Universitetslektor i matematisk statistik Enheten för tillämpad statistik och matematik SLU i hela
Stokastiska vektorer och multivariat normalfördelning
Stokastiska vektorer och multivariat normalfördelning Johan Thim johanthim@liuse 3 november 08 Repetition Definition Låt X och Y vara stokastiska variabler med EX µ X, V X σx, EY µ Y samt V Y σy Kovariansen
Statistisk analys av komplexa data
Statistisk analys av komplexa data Trunkerade data och Tobitregression Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 10, 2015 Bertil Wegmann (statistik, LiU) Trunkerade data
S0005M, Föreläsning 2
S0005M, Föreläsning 2 Mykola Shykula LTU Mykola Shykula (LTU) S0005M, Föreläsning 2 1 / 18 Föreläsning 2 4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler
F13 Regression och problemlösning
1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell
Grundläggande matematisk statistik
Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x
Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA
Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA Statistiska tester bygger alltid på vissa antaganden. Är feltermen homoskedastisk? Är den normalfördelad? Dessa antaganden är faktiskt aldrig uppfyllda i praktiken,
oberoende av varandra så observationerna är
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 1, 1-5-7 REGRESSION (repetition) Vi har mätningarna ( 1, 1 ),..., ( n, n
För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE31 Sannolikhet, statistik och risk 218-5-31 kl. 8:3-13:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.
Något om val mellan olika metoder
Något om val mellan olika metoder Givet är en observerad tidsserie: y 1 y 2 y n Säsonger? Ja Nej Trend? Tidsserieregression Nej ARMA-modeller Enkel exponentiell utjämning Tidsserieregression ARIMA-modeller
Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar
Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar Anna Lindgren (Stanislav Volkov) 31 oktober + 1 november 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 1/18 Matematisk
Matematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret
Tentamen för kursen. Linjära statistiska modeller. 22 februari
STOCKHOLMS UIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 februari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida
Skrivning i ekonometri lördagen den 25 augusti 2007
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA10:3 Skrivning i ekonometri lördagen den 5 augusti 007 1. Vi vill undersöka hur variationen i ölförsäljningen i ett bryggeri i en stad i USA
10.1 Enkel linjär regression
Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot
Föreläsning 7: Stokastiska vektorer
Föreläsning 7: Stokastiska vektorer Johan Thim johanthim@liuse oktober 8 Repetition Definition Låt X och Y vara stokastiska variabler med EX = µ X, V X = σx, EY = µ Y samt V Y = σy Kovariansen CX, Y definieras
Regressions- och Tidsserieanalys - F1
Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp
Matematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 11 & 12 Johan Lindström 5 & 14 oktober 2015 Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 1/27 Johan Lindström - johanl@maths.lth.se
Matematisk statistik för D, I, Π och Fysiker
Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar
Regressions- och Tidsserieanalys - F1
Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,
Regressions- och Tidsserieanalys - F4
Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1
732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20
732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE30 Sannolikhet, statistik och risk 207-08-5 kl. 8:30-3:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 03-7725325 Hjälpmedel: Valfri miniräknare.
Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
Tidsserier och Prognoser
Tidsserier och Prognoser Mattias Villani Sveriges Riksbank och Stockholms Universitet Stockholm, Oktober 2008 Mattias Villani () Tidsserier och Prognoser Stockholm, Oktober 2008 1 / 16 Översikt Tidsserier,
Tentamen för kursen. Linjära statistiska modeller. 27 oktober
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 27 oktober 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida
Föreläsning 7. Statistikens grunder.
Föreläsning 7. Statistikens grunder. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper.ryden@math.uu.se 1MS008, 1MS777 vt 2016 Föreläsningens innehåll Översikt, dagens föreläsning: Inledande
Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik för STS vt 2014
Föreläsning 11. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper@math.uu.se Tillämpad statistik för STS vt 2014 Old Faithful Old Faithful Eruption times 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0
Vi har en ursprungspopulation/-fördelning med medelvärde µ.
P-värde P=probability Sannolikhetsvärde som är resultat av en statistisk test. Anger sannolikheten för att göra den observation vi har gjort eller ett sämre / mer extremt utfall om H 0 är sann. Vi har
Enkel och multipel linjär regression
TNG006 F3 25-05-206 Enkel och multipel linjär regression 3.. Enkel linjär regression I det här avsnittet kommer vi att anpassa en rät linje till mätdata. Betrakta följande värden från ett försök x 4.0
1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att
FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD 208-08-26 Sannolikhetsteori Följande gäller för sannolikheter: 0 P(A P(Ω = P(A
Korrelation och autokorrelation
Korrelation och autokorrelation Låt oss begrunda uttrycket r = i=1 (x i x) (y i y) n i=1 (x i x) 2 n. i=1 (y i y) 2 De kvadratsummor kring de aritmetiska medelvärdena som står i nämnaren är alltid positiva.
Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.
PANELDATA Poolade data över tiden och över tvärsnittet Alternativ 1: Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. Oberoende stickprov dragna från stora populationer vid olika tidpunkter.
Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.
Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, HT2013 2014-02-07 Skrivtid: 13.00-18.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller
SF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 6 13 november 2017 1 / 29 Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer
TRE TYPER AV SPATIALA DATA
STATISTISK ANALYS AV KOMPLEXA DATA SPATIALA DATA Mattias Villani Statistik Institutionen för Datavetenskap Linköpings Universitet MATTIAS VILLANI (STATISTIK, LIU) SPATIALA DATA 1 / 28 TRE TYPER AV SPATIALA
Metod och teori. Statistik för naturvetare Umeå universitet
Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån
Statistiska metoder för säkerhetsanalys
F10: Intensiteter och Poissonmodeller Frågeställningar Konstant V.v.=Var Cyklister Poissonmodeller för frekvensdata Vi gör oberoende observationer av de (absoluta) frekvenserna n 1, n 2,..., n k från den
F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
Tentamen MVE302 Sannolikhet och statistik
Tentamen MVE302 Sannolikhet och statistik 2019-06-05 kl. 8:30-12:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Oskar Allerbo, telefon: 031-7725325 Hjälpmedel: Valfri miniräknare.
Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar
ICKE-LINJÄRA MODELLER Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Y i = 1 + 2 X 2i + u i Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar cov(x i,u i )
Matematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 11 & 12 Johan Lindström 2 & 9 oktober 217 Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 1/32 Repetition Multipel linjär regression
Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper
Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att
Statistiska Institutionen Gebrenegus Ghilagaber (docent)
Statistiska Institutionen Gebrenegus Ghilagaber (docent) Lösningsförslag till skriftlig tentamen i FINANSIELL STATISTIK, grundnivå, 7,5 hp, VT09. Onsdagen 3 juni 2009-1 Sannolkhetslära Mobiltelefoner tillverkas
GMM och Estimationsfunktioner
Lunds Universitet med Lund Tekniska Högskola Finansiell Statistik Matematikcentrum, Matematisk Statistik VT 2006 GMM och Estimationsfunktioner I laborationen möter du två besläktade metoder för att estimera
Matematisk statistik KTH. Formelsamling i matematisk statistik
Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska
Tentamen för kursen. Linjära statistiska modeller. 13 januari
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 13 januari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida
Tentamen MVE302 Sannolikhet och statistik
Tentamen MVE32 Sannolikhet och statistik 219-6-5 kl. 8:3-12:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Oskar Allerbo, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.