STATISTISK ANALYS AV KOMPLEXA DATA

Relevanta dokument
STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA

Multivariata metoder

STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA

Regressions- och Tidsserieanalys - F7

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Regressions- och Tidsserieanalys - F3

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F4

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Finansiell statistik. Multipel regression. 4 maj 2011

Regressions- och Tidsserieanalys - F3

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Regressions- och Tidsserieanalys - F1

Paneldata och instrumentvariabler/2sls

Multivariata metoder

Regressions- och Tidsserieanalys - F1

TVÄRSNITTSDATA (CROSS-SECTIONAL DATA)

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Skrivning i ekonometri lördagen den 25 augusti 2007

Multilevel Modeling med SPSS Kimmo Sorjonen ( )

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Data på individ/hushålls/företags/organisationsnivå. Idag större datamänger än tidigare

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA

Skrivning i ekonometri lördagen den 29 mars 2008

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Tentamen MVE301 Sannolikhet, statistik och risk

Multipel Regressionsmodellen

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Kossor, tallsteklar och sockerärter Statistik vid Sveriges Lantbruksuniversitet

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Tentamen MVE301 Sannolikhet, statistik och risk

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

Lösningar till SPSS-övning: Analytisk statistik

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Samband mellan elevers motivationer och åskådarbeteenden vid mobbningssituationer. - En jämförelse av resultat från multilevel- och faktoranalyser

Modeller för fler än två valmöjligheter. Förekommer både som logit- och som probitmodeller.

Tentamen i Tillämpad statistisk analys, GN, 7.5 hp 23 maj 2013 kl. 9 14

FACIT!!! (bara facit,

Premiepensionens delningstal och dess känslighet för ändrad livslängd och ränteantagande

Skrivning i ekonometri torsdagen den 8 februari 2007

Innehåll. Data. Skillnad SEM & Regression. Exogena & Endogena variabler. Latenta & Manifesta variabler

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Tentamen MVE301 Sannolikhet, statistik och risk

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

English Version. Number of sold cakes Number of days

Bayesiansk statistik, 732g43, 7.5 hp

Structural Equation Modeling (SEM) Ingenting är omöjligt

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

MVE051/MSG Föreläsning 14

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Bakgrundsvariablers påverkan på enkätsvaren i en telefonintervju

Ht Patientupplevd vårdkvalité utifrån. olika bakgrunder. Författare: Åsa Hjort Hedenberg

Konjunkturförändringar i åländsk ekonomi

Standard Normal Quantiles. Vilken av följande slutsatser kan man dra från qq-plotten?

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

OBS! Vi har nya rutiner.

10.1 Enkel linjär regression

Stokastiska vektorer och multivariat normalfördelning

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Structural Equation Modeling med Amos Kimmo Sorjonen ( )

Tentamen MVE301 Sannolikhet, statistik och risk

oberoende av varandra så observationerna är

Vad man bör tänka på innan man börjar analysera sina data SLU

Föreläsning 7: Punktskattningar

Statistiska metoder för säkerhetsanalys

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Analys av en longitudinell studie för att undersöka eekten av korttidsutsättning för ygljud på blodtryck och hjärtfrekvens

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

F11. Kvantitativa prognostekniker

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

Regressions- och Tidsserieanalys - F8

Bygga linjära modeller! Didrik Vanhoenacker 2007

TENTAMEN I STATISTIK B,

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Regressions- och Tidsserieanalys - F5

Fotboll. Slump eller systematik???

OBS! Vi har nya rutiner.

Transkript:

STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 9 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 1 / 43

Longitudinella data Tvärsnittsdata Flera enheter undersöks under samma tidpunkt Enheterna antas vara oberoende av varandra Tidsseriedata En enhet undersöks under många tidpunkter Observationer vid närliggande tidpunkter antas ej vara oberoende av varandra Longitudinella data / Paneldata Flera enheter undersöks under flera tidpunkter Enheterna antas vara oberoende av varandra Observationer vid närliggande tidpunkter antas ej vara oberoende av varandra Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 2 / 43

Longitudinella data - exempel National Longitudinal Survey of Youth (NLSY79) Ett slumpmässigt urval av män och kvinnor mellan 14 och 19 år samlades in 1979 i USA. De har sedan undersökts varje/varannat år sedan dess. Även kvinnornas barn har undersökts varannat år sedan 1986. Exempel på variabler som har samlats in hos barnen: IQ-tester, kriminella beteenden, familjebakgrund, utbildningsnivå... Individual Development and Adaptation (IDA) Alla som gick i trean i Örebro år 1969. De har senare följts upp i sexan och nian samt i vuxen ålder. Exempel på variabler som har samlats in: Betyg, IQ, familjebakgrund, utbildningsnivå, inkomst... Longitudinal Individual Database (LINDA) Longitudinellt register hos SCB - ett stort urval av individer i Sverige (från 1969) Exempel på variabler som har samlats in: Inkomst, yrke, pendling, antal personer i hushållet... Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 3 / 43

Notation Antag att vi har ett urval av individer - för varje individ har vi gjort upprepade mätningar på en respons. För den j:te individen kan vi skriva responsvektorn y j1 Y j = y j2..., j = 1, 2,..., n y jkj där n är antalet individer och k j är antalet upprepade mätningar för individ j. Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 4 / 43

Har vi även observerat oberoende variabler kan vi skriva Ind(j) Mätning(i) Tid(t ij ) y ij x ij1 x ij2... x ijp 1 1 t 11 y 11 x 111 x 112... x 11p 1 2 t 12 y 12 x 121 x 122... x 12p........................ 1 k 1 t 1k1 y 1k1 x 1k1 1 x 1k1 2... x 1k1 p........................ j 1 t j1 y j1 x j11 x j12... x j1p j 2 t j2 y j2 x j21 x j22... x j2p........................ j k j t jkj y jkj x jkj 1 x jkj 2... x jkj p........................ n 1 t n1 y n1 x n11 x n12... x n1p n 2 t n2 y n2 x n21 x n22... x n2p........................ n k n t nkn y nkn x nkn 1 x nkn 2... x nkn 1 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 5 / 43

Metoder för att analysera longitudinella data - ej bra enligt mig t-test för korrelerade data Endast för två tidpunkter Change scores Endast för två tidpunkter ANOVA/ANCOVA Endast för kontinuerlig respons (som antas normalfördelad) Fungerar bäst för balanserade data MANOVA/MANCOVA En multivariat generalisering av MANOVA där vi har en vektor av responsvariabler Endast för kontinuerliga respons (multivariat NF) Balanserade data Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 6 / 43

Metoder för att analysera longitudinella data - bra enligt mig Multilevel-modell (General Linear Mixed Model) Fungerar bra även om individerna är mätta vid olika tidpunkter / olika antal tidpunkter Kan ha mer än två nivåer Latent Growth Curve Model En faktoranalys-approach Svårt om olika tidpunkter / antal tidpunkter Fungerar bra om responsvariabeln är latent Kan utvidgas till mer komplicerade faktorstrukturer Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 7 / 43

Multilevel-modell Racdom coeffi cent-modell med tid som oberoende variabel y ij = β 0j + β 1j t ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j ɛ ij N ( 0, σ 2 ) e [ u0j u 1j ] N ([ 0 0 ] [ σ 2, u0 σ u01 σ u10 σ 2 u1 ]) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 8 / 43

Autokorrelation Observationer som ligger nära varandra i tid är ofta ej oberoende (per individ) Jmfr tidsserieanalys Antagandet ɛ ij N ( 0, σ 2 e ) är därför ofta inte uppfyllt vid upprepade mätningar Vi kan anta olika kovariansstrukturer för feltermerna ɛ ij N (0, R) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 9 / 43

Exempel på vanliga strukturer för kovariansmatrisen Compound symmetry R = AR(1) (fungerar ej om olika tidsintervall) Unstructured R = σ 2 e R= σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e 1 ρ ρ 2 ρ 3 ρ 1 ρ ρ 2 ρ 2 ρ 1 ρ ρ 3 ρ 2 ρ 1 σ 2 1 σ 12 σ 13 σ 14 σ 21 σ 2 2 σ 23 σ 24 σ 31 σ 32 σ 2 3 σ 34 σ 41 σ 42 σ 43 σ 2 4 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 10 / 43

Jämförelse av kovariansstrukturer Modeller med så små värden på 2LL samt få skattade parametrar är ofta att föredra. Ett jämförelsemått som tar hänsyn till antal skattade parametrar i kovariansmatrisen (q) är AIC. Den modell med lägst AIC föredras. AIC = 2LL + 2q Om skattningsmetoden är REML så kan jämförelsemått baserade på -2LL endans användas då man jämför modeller med olika slumpmässiga parametrar. Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 11 / 43

Multilevel regressionsmodell med tidspolynom Ju fler upprepade mätningar, desto större tidspolynom kan modelleras y ij = β 0j + β 1j t ij + +β 2j t 2 ij +... + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j β 2j = β 2 + u 2j... ɛ ij N (0, R) u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ u2 σ 2 u1 σ u21 σ u12 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 12 / 43

Multilevel regressionsmodell med oberoende variabler Precis som vid "vanliga" mulitlevelmodeller kan oberoende variabler läggas till på respektive nivå y ij = β 0j + β 1j t ij + β 2j t 2 ij + β 3 x ij1 + ɛ ij β 0j = β 0 + β 4 x j2 + u 0j β 1j = β 1 + β 5 x j2 + u 1j β 2j = β 2 + β 6 x j2 + u 2j ɛ ij N (0, R) u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ u2 σ 2 u1 σ u21 σ u12 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 13 / 43

Exempel: Barn från NLSY79 (de första observationerna) Kolumnerna ger: observation, individ, familj, etnicitet, kön, födelseår, födelseordning, mors ålder vid första födsel, Piat Math, Piat Math åldersstandardiserat, ålder (månader) Obs id idmom race sex birthyear birthorder agemom m mz a 1 201 2 3 2 1993 1 34 10 90 63 2 201 2 3 2 1993 1 34 24 100 87 3 201 2 3 2 1993 1 34 38 95 111 4 201 2 3 2 1993 1 34 55 111 136 5 202 2 3 2 1994 2 35 13 103 66 6 202 2 3 2 1994 2 35 27 102 91 7 202 2 3 2 1994 2 35 47 110 115 8 301 3 3 2 1981 1 19 27 107 85 9 301 3 3 2 1981 1 19 49 104 134 10 301 3 3 2 1981 1 19 57 102 159 Linda Wänström 11 302 (Linköpings 3 universitet) 3 2 1983 LONGITUDINELLA DATA 2 22 38 100 1069 December 14 / 43

Multilevel regressionsmodell ("random coeffi cent"-modell) m ij = β 0j + β 1j a ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j ɛ ij N ( 0, σ 2 ) e [ u0j u 1j ] N ([ 0 0 ] [ σ 2, u0 σ u01 σ u10 σ 2 u1 ]) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 15 / 43

proc mixed data=four covtest; class id; model m=a /solution ddfm=bw; random intercept a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 16 / 43

Varning i log om G-matris Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 1 Intercept 201 1.0000 2 a 201 1.0000 Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id 0... UN(2,1) id 0.1084 0.01113 9.74 <.0001 UN(2,2) id 0.006052 0.000210 28.82 <.0001 Residual 46.6271 0.4176 111.65 <.0001 Fit Statistics 2 Res Log Likelihood 241632.7 AIC (smaller is better) 241638.7 AICC (smaller is better) 241638.7 BIC (smaller is better) 241660.1 Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq 2 13705.46 <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept 12.7128 0.1440 9203 88.28 <.0001 a 0.4353 0.001485 25E3 293.06 <.0001 Type 3 Tests of Fixed Effects Linda Wänström Effect Num DF Den DF F Value Pr > F (Linköpings universitet) LONGITUDINELLA DATA 9 December 17 / 43

Standardiserad ålder (a) proc mixed data=zfive covtest; class id; model m=a /solution ddfm=bw; random intercept a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 18 / 43

Fortfarande varning i log om G-matris Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 1 Intercept 201 1.0000 1.0000 2 a 201 1.0000 1.0000 Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id 57.4540 1.0835 53.03 <.0001 UN(2,1) id 20.3649 0.4535 44.90 <.0001 UN(2,2) id 4.1227 0.3008 13.70 <.0001 Residual 49.5519 0.5165 95.94 <.0001 Fit Statistics 2 Res Log Likelihood 241486.7 AIC (smaller is better) 241494.7 AICC (smaller is better) 241494.7 BIC (smaller is better) 241523.2 Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq 3 13844.47 <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept 38.1548 0.08981 9203 424.83 <.0001 a 14.7553 0.04715 25E3 312.95 <.0001 Type 3 Tests of Fixed Effects Effect Num DF Den DF F Value Pr > F a 1 25E3 97940.6 <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 19 / 43

Åldersstandardiserad Piat Math (mz) och standardiserad ålder (a) proc mixed data=zfive covtest; class id; model mz=a /solution ddfm=bw; random intercept a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 20 / 43

Ingen varning! Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 1 Intercept 201 1.0000 0.3351 2 a 201 0.3351 1.0000 Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id 127.18 2.2396 56.79 <.0001 UN(2,1) id 12.1196 0.7614 15.92 <.0001 UN(2,2) id 10.2877 0.5167 19.91 <.0001 Residual 69.1573 0.7332 94.33 <.0001 Fit Statistics 2 Res Log Likelihood 260404.0 AIC (smaller is better) 260412.0 AICC (smaller is better) 260412.0 BIC (smaller is better) 260440.5 Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq 3 15670.27 <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept 100.36 0.1287 9202 779.84 <.0001 a 0.2740 0.06259 25E3 4.38 <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 21 / 43

Multilevel regressionsmodell Lägg till ett tidspolynom mz ij = β 0j + β 1j a ij + β 2 a 2 ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j ɛ ij N ( 0, σ 2 ) e [ u0j u 1j ] N ([ 0 0 ] [ σ 2, u0 σ u01 σ u10 σ 2 u1 ]) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 22 / 43

proc mixed data=zfive covtest; class id; model mz=a a*a/solution ddfm=bw; random intercept a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 23 / 43

Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 1 Intercept 201 1.0000 0.3179 2 a 201 0.3179 1.0000 Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id 127.06 2.2337 56.88 <.0001 UN(2,1) id 11.3388 0.7563 14.99 <.0001 UN(2,2) id 10.0157 0.5085 19.69 <.0001 Residual 68.4808 0.7271 94.18 <.0001 Fit Statistics 2 Res Log Likelihood 260133.5 AIC (smaller is better) 260141.5 AICC (smaller is better) 260141.5 BIC (smaller is better) 260170.0 Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq 3 15725.64 <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept 101.19 0.1379 9202 734.00 <.0001 a 0.3043 0.06213 25E3 4.90 <.0001 a*a 0.8835 0.05309 25E3 16.64 <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 24 / 43

Multilevel regressionsmodell Även som slumpmässig effekt mz ij = β 0j + β 1j a ij + β 2j a 2 ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j β 2j = β 2 + u 2j ɛ ij N ( 0, σ 2 ) e u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ 2 u1 σ u12 σ u20 σ u21 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 25 / 43

proc mixed data=zfive covtest; class id; model mz=a a*a/solution ddfm=bw; random intercept a a*a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 26 / 43

Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 Col3 1 Intercept 201 1.0000 0.4775 0.4310 2 a 201 0.4775 1.0000 0.8463 3 a*a 201 0.4310 0.8463 1.0000 Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id 145.58 2.8025 51.95 <.0001 UN(2,1) id 19.1642 0.8695 22.04 <.0001 UN(2,2) id 11.0668 0.5091 21.74 <.0001 UN(3,1) id 12.4582 0.8777 14.19 <.0001 UN(3,2) id 6.7442 0.3149 21.42 <.0001 UN(3,3) id 5.7387 0.4182 13.72 <.0001 Residual 62.1849 0.7451 83.46 <.0001 Fit Statistics 2 Res Log Likelihood 259407.2 AIC (smaller is better) 259421.2 AICC (smaller is better) 259421.3 BIC (smaller is better) 259471.1 Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq 6 16451.86 <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept 101.20 0.1447 9202 699.18 <.0001 a 0.2238 0.06209 25E3 3.60 0.0003 a*a 0.9076 0.05748 25E3 15.79 <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 27 / 43

Multilevel regressionsmodell Lägg till en variabel som varierar mellan individer men ej över tid mz ij = β 0j + β 1j a ij + β 2j a 2 ij + ɛ ij β 0j = β 0 + β 2 agemom + u 0j β 1j = β 1 + β 3 agemom + u 1j β 2j = β 2 + β 4 agemom + u 2j ɛ ij N ( 0, σ 2 ) e u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ 2 u1 σ u12 σ u20 σ u21 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 28 / 43

proc mixed data=zfive covtest; class id; model mz=a a*a agemom a*agemom a*a*agemom/solution ddfm=bw; random intercept a a*a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 29 / 43

Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 Col3 1 Intercept 201 1.0000 0.4460 0.4108 2 a 201 0.4460 1.0000 0.8345 3 a*a 201 0.4108 0.8345 1.0000 Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id 132.08 2.6060 50.68 <.0001 UN(2,1) id 16.7024 0.8250 20.25 <.0001 UN(2,2) id 10.6165 0.4999 21.24 <.0001 UN(3,1) id 11.2844 0.8564 13.18 <.0001 UN(3,2) id 6.4993 0.3104 20.94 <.0001 UN(3,3) id 5.7142 0.4202 13.60 <.0001 Residual 62.1419 0.7445 83.47 <.0001 Fit Statistics 2 Res Log Likelihood 258676.5 AIC (smaller is better) 258690.5 AICC (smaller is better) 258690.5 BIC (smaller is better) 258740.4 Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq 6 15154.37 <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept 101.26 0.1396 9201 725.57 <.0001 a 0.2882 0.06223 25E3 4.63 <.0001 a*a 0.8617 0.05924 25E3 14.55 <.0001 agemom 3.5538 0.1350 9201 26.32 <.0001 a*agemom 0.6502 0.06471 25E3 10.05 <.0001 a*a*agemom 0.3284 0.05533 25E3 5.94 <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 30 / 43

Exempel forts. Undersök strukturen i R Struktur för R: compound symmetry mz ij = β 0 + β 1 a ij + ɛ ij ɛ ij N (0, R) där, för en individ med fyra tidpunkter, R = σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 31 / 43

proc mixed data=zfive covtest; class id wave; model mz=a /solution ddfm=bw; repeated wave/type=cs subject=id r; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 32 / 43

Estimated R Matrix for id 201 Row Col1 Col2 Col3 Col4 1 205.25 124.98 124.98 124.98 2 124.98 205.25 124.98 124.98 3 124.98 124.98 205.25 124.98 4 124.98 124.98 124.98 205.25 Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z CS id 124.98 2.2200 56.30 <.0001 Residual 80.2668 0.7218 111.21 <.0001 Fit Statistics 2 Res Log Likelihood 261232.7 AIC (smaller is better) 261236.7 AICC (smaller is better) 261236.7 BIC (smaller is better) 261251.0 Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq 1 14841.51 <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept 100.26 0.1281 9202 782.86 <.0001 a 0.2888 0.05345 25E3 5.40 <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 33 / 43

Kovariansstruktur för olika tidsintervall SP(POW) (Spatial Power Law) mz ij = β 0 + β 1 a ij + ɛ ij ɛ ij N (0, R) AR(1) går inte att använda vid olika tidsintervall. En generalisering av AR(1) för olika tidsintervall är SP(POW). Kovariansen mellan två mätningar vid tidpunkt T1 och T2 modelleras som: Cov [Y t1, Y t2 ] = σ 2 ρ t1 t2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 34 / 43

proc mixed data=zfive covtest; class id wave; model mz=a /solution ddfm=bw; repeated wave/type=sp(pow)(a) subject=id r; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 35 / 43

Estimated R Matrix for id 201 Row Col1 Col2 Col3 Col4 1 206.01 136.35 90.2442 58.7113 2 136.35 206.01 136.35 88.7056 3 90.2442 136.35 206.01 134.02 4 58.7113 88.7056 134.02 206.01 Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z SP(POW) id 0.5580 0.004752 117.44 <.0001 Residual 206.01 2.0968 98.25 <.0001 Fit Statistics 2 Res Log Likelihood 262431.8 AIC (smaller is better) 262435.8 AICC (smaller is better) 262435.8 BIC (smaller is better) 262450.1 Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq 1 13642.45 <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept 100.03 0.1192 9202 839.42 <.0001 a 0.06059 0.07801 25E3 0.78 0.4374 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 36 / 43

Kombinerad modell Kovariansstruktur i R:CS mz ij = β 0j + β 1j a ij + β 2j a 2 ij + ɛ ij β 0j = β 0 + β 2 agemom + u 0j β 1j = β 1 + β 3 agemom + u 1j β 2j = β 2 + β 4 agemom + u 2j ɛ ij N (0, R) u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ 2 u1 σ u12 σ u20 σ u21 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 37 / 43

proc mixed data=zfive covtest; class id wave; model mz=a a*a a*a*a/solution ddfm=bw; random intercept a a*a/ subject=id type=un gcorr; repeated wave/type=cs subject=id r; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 38 / 43

Estimated R Matrix for id 201 Row Col1 Col2 Col3 Col4 1 60.6033 1.5523 1.5523 1.5523 2 1.5523 60.6033 1.5523 1.5523 3 1.5523 1.5523 60.6033 1.5523 4 1.5523 1.5523 1.5523 60.6033 Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 Col3 1 Intercept 201 1.0000 0.4748 0.4304 2 a 201 0.4748 1.0000 0.8448 3 a*a 201 0.4304 0.8448 1.0000 Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id 147.26 2.8067 52.47 <.0001 UN(2,1) id 19.1713 0.8700 22.04 <.0001 UN(2,2) id 11.0713 0.5091 21.75 <.0001 UN(3,1) id 12.5621 0.8897 14.12 <.0001 UN(3,2) id 6.7601 0.3162 21.38 <.0001 UN(3,3) id 5.7843 0.4221 13.70 <.0001 CS id 1.5523 0.01862 83.38 <.0001 Residual 62.1556 0.7455 83.38 <.0001 Fit Statistics 2 Res Log Likelihood 259411.0 AIC (smaller is better) 259427.0 AICC (smaller is better) 259427.0 BIC (smaller is better) 259484.0 Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq 7 16440.20 <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 39 / 43

Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept 101.20 0.1451 9202 697.40 <.0001 a 0.2826 0.1029 25E3 2.75 0.0060 a*a 0.8959 0.05991 25E3 14.96 <.0001 a*a*a 0.03480 0.04824 25E3 0.72 0.4708 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 40 / 43

Multilevel regressionsmodell En till nivå: familj (idmom) mz ijh = β 0jh + β 1jh a ijh + ɛ ijh β 0jh = β 0h + u 0jh β 1jh = β 1h + u 1jh β 0h = β 0 + v 0h β 1h = β 1 + v 1h ɛ ijh N ( 0, σ 2 ) e [ ] ([ ] [ ]) u0jh 0 σ 2 N, u0 σ u01 u 1jh 0 σ u10 σ [ ] ([ ] [ 2 u1 ]) v0h 0 σ 2 N, v 0 σ v 01 v 1h 0 σ v 10 σ 2 v 1 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 41 / 43

proc mixed data=zfive covtest; class id idmom; model mz=a /solution ddfm=bw; random intercept a / subject=idmom type=un; random intercept a / subject=id(idmom) type=un; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 42 / 43

Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) idmom 74.0033 2.5413 29.12 <.0001 UN(2,1) idmom 6.7079 0.7394 9.07 <.0001 UN(2,2) idmom 3.4142 0.4092 8.34 <.0001 UN(1,1) id(idmom) 50.6594 1.4271 35.50 <.0001 UN(2,1) id(idmom) 5.1692 0.6276 8.24 <.0001 UN(2,2) id(idmom) 6.8282 0.5611 12.17 <.0001 Residual 69.3489 0.7345 94.42 <.0001 Fit Statistics 2 Res Log Likelihood 258430.0 AIC (smaller is better) 258444.0 AICC (smaller is better) 258444.0 BIC (smaller is better) 258488.1 Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq 6 17644.29 <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept 100.99 0.1682 4047 600.61 <.0001 a 0.3564 0.06791 3E4 5.25 <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 43 / 43