STATISTISK ANALYS AV KOMPLEXA DATA

Storlek: px
Starta visningen från sidan:

Download "STATISTISK ANALYS AV KOMPLEXA DATA"

Transkript

1 STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 1 / 56

2 Longitudinella data Tvärsnittsdata Flera enheter undersöks under samma tidpunkt Enheterna antas vara oberoende av varandra Tidsseriedata En enhet undersöks under många tidpunkter Observationer vid närliggande tidpunkter antas ej vara oberoende av varandra Longitudinella data / Paneldata Flera enheter undersöks under flera tidpunkter Enheterna antas vara oberoende av varandra Observationer vid närliggande tidpunkter antas ej vara oberoende av varandra Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 2 / 56

3 Longitudinella data - exempel National Longitudinal Survey of Youth (NLSY79) Ett slumpmässigt urval av män och kvinnor mellan 14 och 19 år samlades in 1979 i USA. De har sedan undersökts varje/varannat år sedan dess. Även kvinnornas barn har undersökts varannat år sedan Exempel på variabler som har samlats in hos barnen: IQ-tester, kriminella beteenden, familjebakgrund, utbildningsnivå... Individual Development and Adaptation (IDA) Alla som gick i trean i Örebro år De har senare följts upp i sexan och nian samt i vuxen ålder. Exempel på variabler som har samlats in: Betyg, IQ, familjebakgrund, utbildningsnivå, inkomst... Longitudinal Individual Database (LINDA) Longitudinellt register hos SCB - ett stort urval av individer i Sverige (från 1969) Exempel på variabler som har samlats in: Inkomst, yrke, pendling, antal personer i hushållet... Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 3 / 56

4 Notation Antag att vi har ett urval av individer - för varje individ har vi gjort upprepade mätningar på en respons. För den j:te individen kan vi skriva responsvektorn y j1 Y j = y j2..., j = 1, 2,..., n y jkj där n är antalet individer och k j är antalet upprepade mätningar för individ j. Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 4 / 56

5 Har vi även observerat oberoende variabler kan vi skriva Ind(j) Mätning(i) Tid(t ij ) y ij x ij1 x ij2... x ijp 1 1 t 11 y 11 x 111 x x 11p 1 2 t 12 y 12 x 121 x x 12p k 1 t 1k1 y 1k1 x 1k1 1 x 1k x 1k1 p j 1 t j1 y j1 x j11 x j12... x j1p j 2 t j2 y j2 x j21 x j22... x j2p j k j t jkj y jkj x jkj 1 x jkj 2... x jkj p n 1 t n1 y n1 x n11 x n12... x n1p n 2 t n2 y n2 x n21 x n22... x n2p n k n t nkn y nkn x nkn 1 x nkn 2... x nkn 1 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 5 / 56

6 Metoder för att analysera longitudinella data - ej bra enligt mig t-test för korrelerade data Endast för två tidpunkter Change scores Endast för två tidpunkter ANOVA/ANCOVA Endast för kontinuerlig respons (som antas normalfördelad) Fungerar bäst för balanserade data MANOVA/MANCOVA En multivariat generalisering av MANOVA där vi har en vektor av responsvariabler Endast för kontinuerliga respons (multivariat NF) Balanserade data Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 6 / 56

7 Metoder för att analysera longitudinella data - bra enligt mig Multilevel-modell (General Linear Mixed Model) Fungerar bra även om individerna är mätta vid olika tidpunkter / olika antal tidpunkter Kan ha mer än två nivåer Latent Growth Curve Model En faktoranalys-approach Svårt om olika tidpunkter / antal tidpunkter Fungerar bra om responsvariabeln är latent Kan utvidgas till mer komplicerade faktorstrukturer Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 7 / 56

8 Multilevel-modell Racdom coeffi cent-modell med tid som oberoende variabel y ij = β 0j + β 1j t ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j ɛ ij N ( 0, σ 2 ) e [ u0j u 1j ] N ([ 0 0 ] [ σ 2, u0 σ u01 σ u10 σ 2 u1 ]) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 8 / 56

9 Autokorrelation Observationer som ligger nära varandra i tid är ofta ej oberoende (per individ) Jmfr tidsserieanalys Antagandet ɛ ij N ( 0, σ 2 e ) är därför ofta inte uppfyllt vid upprepade mätningar Vi kan anta olika kovariansstrukturer för feltermerna ɛ ij N (0, R) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 / 56

10 Exempel på vanliga strukturer för kovariansmatrisen Compound symmetry R = AR(1) (fungerar ej om olika tidsintervall) Unstructured R = σ 2 e R= σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e 1 ρ ρ 2 ρ 3 ρ 1 ρ ρ 2 ρ 2 ρ 1 ρ ρ 3 ρ 2 ρ 1 σ 2 1 σ 12 σ 13 σ 14 σ 21 σ 2 2 σ 23 σ 24 σ 31 σ 32 σ 2 3 σ 34 σ 41 σ 42 σ 43 σ 2 4 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 10 / 56

11 Jämförelse av kovariansstrukturer Modeller med små värden på 2LL samt få skattade parametrar är ofta att föredra. Ett jämförelsemått som tar hänsyn till antal skattade parametrar i kovariansmatrisen (q) är AIC. Den modell med lägst AIC föredras. AIC = 2LL + 2q Om skattningsmetoden är REML så kan jämförelsemått baserade på -2LL endast användas då man jämför modeller med olika slumpmässiga parametrar. Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 11 / 56

12 Multilevel regressionsmodell med tidspolynom Ju fler upprepade mätningar, desto större tidspolynom kan modelleras y ij = β 0j + β 1j t ij + β 2j t 2 ij ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j β 2j = β 2 + u 2j... ɛ ij N (0, R) u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ u2 σ 2 u1 σ u21 σ u12 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 / 56

13 Multilevel regressionsmodell med oberoende variabler Precis som vid "vanliga" mulitlevelmodeller kan oberoende variabler läggas till på respektive nivå y ij = β 0j + β 1j t ij + β 2j t 2 ij + β 3 x ij1 + ɛ ij β 0j = β 0 + β 4 x j2 + u 0j β 1j = β 1 + β 5 x j2 + u 1j β 2j = β 2 + β 6 x j2 + u 2j ɛ ij N (0, R) u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ u2 σ 2 u1 σ u21 σ u12 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 13 / 56

14 Exempel: Barn från NLSY79 (de första observationerna) Kolumnerna ger: observation, individ, familj, etnicitet, kön, födelseår, födelseordning, mors ålder vid barnets födsel, Piat Math, Piat Math åldersstandardiserat, ålder (månader) Obs id idmom race sex birthyear birthorder agemom m mz a Linda Wänström (Linköpings 3 universitet) LONGITUDINELLA DATA / 56

15 Multilevel regressionsmodell ("random coeffi cent"-modell) m ij = β 0j + β 1j a ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j ɛ ij N ( 0, σ 2 ) e [ u0j u 1j ] N ([ 0 0 ] [ σ 2, u0 σ u01 σ u10 σ 2 u1 ]) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 15 / 56

16 proc mixed data=four covtest; class id; model m=a /solution ddfm=bw; random intercept a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 16 / 56

17 Varning i log om G-matris Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 1 Intercept a Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id 0... UN(2,1) id <.0001 UN(2,2) id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E <.0001 Type 3 Tests of Fixed Effects Linda Wänström (Linköpings Effect Num universitet) DF Den DF F Value LONGITUDINELLA Pr > F DATA 17 / 56

18 Standardiserad ålder (a) proc mixed data=zfive covtest; class id; model m=a /solution ddfm=bw; random intercept a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 18 / 56

19 Fortfarande varning i log om G-matris Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 1 Intercept a Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id <.0001 UN(2,1) id <.0001 UN(2,2) id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E <.0001 Type 3 Tests of Fixed Effects Effect Num DF Den DF F Value Pr > F a 1 25E <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 19 / 56

20 Åldersstandardiserad Piat Math (mz) och standardiserad ålder (a) proc mixed data=zfive covtest; class id; model mz=a /solution ddfm=bw; random intercept a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 20 / 56

21 Ingen varning! Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 1 Intercept a Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id <.0001 UN(2,1) id <.0001 UN(2,2) id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 21 / 56

22 Multilevel regressionsmodell Lägg till ett tidspolynom mz ij = β 0j + β 1j a ij + β 2 a 2 ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j ɛ ij N ( 0, σ 2 ) e [ u0j u 1j ] N ([ 0 0 ] [ σ 2, u0 σ u01 σ u10 σ 2 u1 ]) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 22 / 56

23 proc mixed data=zfive covtest; class id; model mz=a a*a/solution ddfm=bw; random intercept a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 23 / 56

24 Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 1 Intercept a Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id <.0001 UN(2,1) id <.0001 UN(2,2) id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E <.0001 a*a E <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 24 / 56

25 Multilevel regressionsmodell Även som slumpmässig effekt mz ij = β 0j + β 1j a ij + β 2j a 2 ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j β 2j = β 2 + u 2j ɛ ij N ( 0, σ 2 ) e u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ 2 u1 σ u12 σ u20 σ u21 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 25 / 56

26 proc mixed data=zfive covtest; class id; model mz=a a*a/solution ddfm=bw; random intercept a a*a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 26 / 56

27 Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 Col3 1 Intercept a a*a Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id <.0001 UN(2,1) id <.0001 UN(2,2) id <.0001 UN(3,1) id <.0001 UN(3,2) id <.0001 UN(3,3) id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E a*a E <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 27 / 56

28 Multilevel regressionsmodell Lägg till en variabel som varierar mellan individer men ej över tid mz ij = β 0j + β 1j a ij + β 2j a 2 ij + ɛ ij β 0j = β 0 + β 2 agemom + u 0j β 1j = β 1 + β 3 agemom + u 1j β 2j = β 2 + β 4 agemom + u 2j ɛ ij N ( 0, σ 2 ) e u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ 2 u1 σ u12 σ u20 σ u21 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 28 / 56

29 proc mixed data=zfive covtest; class id; model mz=a a*a agemom a*agemom a*a*agemom/solution ddfm=bw; random intercept a a*a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 29 / 56

30 Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 Col3 1 Intercept a a*a Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id <.0001 UN(2,1) id <.0001 UN(2,2) id <.0001 UN(3,1) id <.0001 UN(3,2) id <.0001 UN(3,3) id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E <.0001 a*a E <.0001 agemom <.0001 a*agemom E <.0001 a*a*agemom E <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 30 / 56

31 Exempel forts. Undersök strukturen i R Struktur för R: compound symmetry mz ij = β 0 + β 1 a ij + ɛ ij ɛ ij N (0, R) där, för en individ med fyra tidpunkter, R = σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 31 / 56

32 proc mixed data=zfive covtest; class id wave; model mz=a /solution ddfm=bw; repeated wave/type=cs subject=id r; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 32 / 56

33 Estimated R Matrix for id 201 Row Col1 Col2 Col3 Col Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z CS id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 33 / 56

34 Kovariansstruktur för olika tidsintervall SP(POW) (Spatial Power Law) mz ij = β 0 + β 1 a ij + ɛ ij ɛ ij N (0, R) AR(1) går inte att använda vid olika tidsintervall. En generalisering av AR(1) för olika tidsintervall är SP(POW). Kovariansen mellan två mätningar vid tidpunkt T1 och T2 modelleras som: Cov [Y t1, Y t2 ] = σ 2 ρ t1 t2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 34 / 56

35 proc mixed data=zfive covtest; class id wave; model mz=a /solution ddfm=bw; repeated wave/type=sp(pow)(a) subject=id r; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 35 / 56

36 Estimated R Matrix for id 201 Row Col1 Col2 Col3 Col Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z SP(POW) id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 36 / 56

37 Kombinerad modell Kovariansstruktur i R:CS mz ij = β 0j + β 1j a ij + β 2j a 2 ij + ɛ ij β 0j = β 0 + β 2 agemom + u 0j β 1j = β 1 + β 3 agemom + u 1j β 2j = β 2 + β 4 agemom + u 2j ɛ ij N (0, R) u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ 2 u1 σ u12 σ u20 σ u21 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 37 / 56

38 proc mixed data=zfive covtest; class id wave; model mz=a a*a agemom a*agemom a*a*agemom/solution ddfm=bw; random intercept a a*a/ subject=id type=un gcorr; repeated wave/type=cs subject=id r; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 38 / 56

39 Estimated R Matrix for id 201 Row Col1 Col2 Col3 Col Estimated G Correlation Matrix ID CODE OF CHILD Col1 Row Effect Col2 Col3 1 Intercept a a*a Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id <.0001 UN(2,1) id <.0001 UN(2,2) id <.0001 UN(3,1) id <.0001 UN(3,2) id <.0001 UN(3,3) id <.0001 CS id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (Smaller is Better) AICC (Smaller is Better) BIC (Smaller is Better) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 39 / 56

40 Latent growth curves (LGC) Explorativ Faktoranalys (repetition från Multivariata Metoder) Antagande: Korrelationer mellan ett antal observerade variabler uppstår pga bakomliggande, latenta faktorer Antal faktorer kan bestämmas från PC-analys Observerade variablers laddningar kan skattas med iterativ PC-analys Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 40 / 56

41 Konfirmativ Faktoranalys "Latent growth curve-modeller" (LGC) härstammar från konfirmativ faktoranalys En faktorstruktur antas och testas Antagande vid LGC-analys: Latenta faktorer (intercept, slope) påverkar värdena på responsvariabeln under de olika tidpunkterna. Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 41 / 56

42 Exempel: LGC-modell som antar linjär utveckling för fem tidpunkter 1 1 η η2 3 4 Y1 Y2 Y3 Y4 Y5 ε1 ε2 ε3 ε4 ε5 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 42 / 56

43 LGC-modell Om vi har p tidpunkter och m faktorer (intercept, lutning för tid, lutning för tid i kvadrat etc.) kan vi skriva modellen: y = τ + Λη + ε där y är en p 1 vektor av observationer, τ är en p 1 vektor av intercept (ofta fixerad till 0), η är en m 1 vektor av faktorer, Λ är en p m matris med laddningar (ofta fixerade för att definiera intercept och olika typer av lutningar), och ε är en p 1 vektor av unika faktorer som antas normalfördelade. Faktorerna kan uttryckas som avvikelser från faktormedelvärden: η = µ η + ζ där µ η är en m 1 vektor av medelvärden och ζ är en m 1 vektor av residualer. Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 43 / 56

44 LGC-modell Variansen för y kan uttryckas som Σ = ΛΨΛ + Θ ɛ där Σ är en p p kovariansmatris, Ψ är en m m kovariansmatris för faktorer, och Θ ɛ är en p p kovarianmatris för unika faktorer. Förväntade värdet för y kan uttryckas som µ y = τ + Λµ η Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 44 / 56

45 Exempel forts För exemplet ovan ser vektorerna och matriserna ut som följer: µ η = Λ = [ µη1 µ η , Ψ = ], Θ ɛ = [ ψ11 ψ 21 ψ 22 ] θ ɛ 0 θ ɛ 0 0 θ ɛ θ ɛ θ ɛ Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 45 / 56

46 Skattning av de okända parametrarna Okända parametrar i modellen är medelvärden, varianser och kovarianser för faktorer, och varianser för unika faktorer Samma skattningsmetoder som vid konfirmativ faktoranalys Elementen i observerad kovariansmatris (S) och medelvärden för alla p variabler uttrycks som funktioner av de okända parametrarna Skattningarna är de värden på parametrarna som reproducerar de observerade kovarianserna och varianserna (implicerad kovariansmatris Σ) och medelvärdena så bra som möjligt ML-skattningar: en funktion av avvikelser mellan observerade kovariansmatrisen (S) och medelvärden (y) samt implicerade kovariansmatrisen (Σ) och medelvärden (µ) minimeras F ML = Tr(SΣ 1 ) p + ln( Σ ) ln( S ) + (y µ) Σ 1 (y µ) Modellen måste vara "identifierad": antal kända bitar information (observerade varianser, kovarianser, medelvärden) måste vara minst lika många som antal okända parametrar Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 46 / 56

47 Anpassningsmått χ 2 = (N 1)F GFI (Goodness of Fit) Mått på hur hur stor andel varians i observerade kovariansmatrisen som förklaras av modellen Bra anpassing: GFI > 0.9 (gärna >0.95) RMSEA (Root Mean Squared Error of Approximation) Mått på skillnad mellan observerad och implicerad matris Bra anpassning: RMSEA <0.10 (gärna <0.05) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 47 / 56

48 Exempel data growth; input y1 y2 y3 y4 y5; datalines; ; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 48 / 56

49 SAS proc calis method=ml data=growth; lineqs y1 = 0. * Intercept + f_int + e1, y2 = 0. * Intercept + f_int + 1 * f_slp + e2, y3 = 0. * Intercept + f_int + 2 * f_slp + e3, y4 = 0. * Intercept + f_int + 3 * f_slp + e4, y5 = 0. * Intercept + f_int + 4 * f_slp + e5; std f_int f_slp, e1 e5 = 5 * evar; mean f_int f_slp; cov f_int f_slp; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 49 / 56

50 Manifest Latent Manifest Latent Error Variables in the Model y1 y2 y3 y4 y5 f_int f_slp e1 e2 e3 e4 e5 Number of Endogenous Variables = 5 Number of Exogenous Variables = 7 Variable Mean Std Dev y y y y y Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 50 / 56

51 Fit Summary Modeling Info Number of Observations 16 Number of Variables 5 Number of Moments 20 Number of Parameters 6 Number of Active Constraints 0 Baseline Model Function Value Baseline Model Chi Square Baseline Model Chi Square DF 10 Pr > Baseline Model Chi Square <.0001 Absolute Index Fit Function Chi Square Chi Square DF 14 Pr > Chi Square Z Test of Wilson & Hilferty Hoelter Critical N 12 Root Mean Square Residual (RMR) Standardized RMR (SRMR) Goodness of Fit Index (GFI) Parsimony Index Adjusted GFI (AGFI) Parsimonious GFI RMSEA Estimate RMSEA Lower 90% Confidence Limit RMSEA Upper 90% Confidence Limit Probability of Close Fit Akaike Information Criterion Bozdogan CAIC Schwarz Bayesian Criterion McDonald Centrality Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 51 / 56

52 Variable Type Estimates for Variances of Exogenous Variables Variable Parameter Estimate Standard Error t Value Latent f_int _Parm f_slp _Parm Error e1 evar e2 evar e3 evar e4 evar e5 evar Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 52 / 56

53 Covariances Among Exogenous Variables Var1 Var2 Parameter Estimate Standard Error t Value f_int f_slp _Parm Variable Type Mean Parameters Variable Parameter Estimate Standard Error t Value Latent f_int _Parm f_slp _Parm Squared Multiple Correlations Variable Error Variance Total Variance R Square y y y y y Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 53 / 56

54 Standardized Results for Covariances Among Exogenous Variables Var1 Var2 Parameter Estimate Standard Error t Value f_int f_slp _Parm Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 54 / 56

55 Multilevel-modeller eller LGC-modeller för longitudinella data? Om man har balanserade data (dvs alla individer är mätta vid alla tidpunkter) kan bägge metoderna användas Om man inte har balanserade data (eller bortfall) är det lättare med multilevel-modeller Oberoende variabler kan användas vid bägge metoder Kovariansstruktur för feltermer (unika faktorer) kan användas vid bägge metoder Om någon/några variabler är latent, och mätt med flera indikatorer (tex 3 IQ-test som antas mäta intelligens vid varje tidpunkt) kan man använda LGC Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 55 / 56

56 Multilevel-modeller eller LGC-modeller för longitudinella data? Om man har mer komplicerade modeller, så som att en variabel X 1 påverkar en variabel X 2 som i sin tur antas påverka interceptet och lutningen, kan man använda LGC Om man har mer komplicerade modeller, så som att en utvecklingskurva (intercept och lutning för exempelvis intelligensutveckling) antas påverka en annan utvecklingskurva (intercept och lutning för exempelvis betygsutveckling) kan man använda LGC Multilevel-modeller används oftare än LGC-modeller, men användningen av LGC-modeller ökar mer och mer! Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 56 / 56

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 9 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 1 / 43 Longitudinella data

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 1 / 66 Longitudinella data Tvärsnittsdata Flera

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 12 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 December 1 / 12 Explorativ Faktoranalys

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA HIERARKISKA DATA Linda Wänström Linköpings universitet 25 November Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 1 / 53 Regressionsmodell för icke-hierarkiska

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA HIERARKISKA DATA Linda Wänström Linköpings universitet 14-15 November Wänström (Linköpings universitet) HIERARKISKA DATA 14-15 November 1 / 59 Hierarkiska data Hierarkiska

Läs mer

Multivariata metoder

Multivariata metoder Multivariata metoder F5 Linda Wänström Linköpings universitet 1 oktober Wänström (Linköpings universitet) Multivariata metoder 1 oktober 1 / 18 Kanonisk korrelationsanalys Syfte: Undersöka om en grupp

Läs mer

Structural Equation Modeling (SEM) Ingenting är omöjligt

Structural Equation Modeling (SEM) Ingenting är omöjligt Structural Equation Modeling (SEM) Ingenting är omöjligt Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll Data Latenta och manifesta variabler Typ av modell (path, CFA, SEM) Specificera

Läs mer

Innehåll. Data. Skillnad SEM & Regression. Exogena & Endogena variabler. Latenta & Manifesta variabler

Innehåll. Data. Skillnad SEM & Regression. Exogena & Endogena variabler. Latenta & Manifesta variabler Innehåll Structural Equation Modeling (SEM) Ingenting är omöjligt Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Data Latenta och manifesta variabler Typ av modell (path, CFA, SEM) Specificera

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,

Läs mer

Multivariata metoder

Multivariata metoder Multivariata metoder F3 Linda Wänström Linköpings universitet 17 september Wänström (Linköpings universitet) Multivariata metoder 17 september 1 / 21 Principalkomponentanalys Syfte med principalkomponentanalys

Läs mer

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1. En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar

Läs mer

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; () Mixed effect models; (3)

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; (2) Mixed effect models; (3)

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA

STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Mattias Villani Statistik Institutionen för Datavetenskap Linköpings Universitet MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 1 / 44 MOMENTETS

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels 7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan och att en inblandning mellan 10% och 40% är bra. För att

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Mälardalens Högskola. Formelsamling. Statistik, grundkurs Mälardalens Högskola Formelsamling Statistik, grundkurs Höstterminen 2015 Deskriptiv statistik Populationens medelvärde (population mean): μ = X N Urvalets medelvärde (sample mean): X = X n Där N är storleken

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2018-05-31 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

Bayesiansk statistik, 732g43, 7.5 hp

Bayesiansk statistik, 732g43, 7.5 hp Bayesiansk statistik, 732g43, 7.5 hp Moment 2 - Linjär regressionsanalys Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA, LiU) Bayesiansk statistik 1 / 29 Översikt moment 2: linjär

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Tentamen för kursen. Linjära statistiska modeller. 13 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 13 januari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Skrivning i multivariata metoder lördagen den 30 augusti 2003

Skrivning i multivariata metoder lördagen den 30 augusti 2003 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA102:4 Skrivning i multivariata metoder lördagen den 30 augusti 2003 Förutom Körners tabell- och formelsamling och miniräknare är även läroboken:

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när

Läs mer

Skrivning i ekonometri lördagen den 25 augusti 2007

Skrivning i ekonometri lördagen den 25 augusti 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA10:3 Skrivning i ekonometri lördagen den 5 augusti 007 1. Vi vill undersöka hur variationen i ölförsäljningen i ett bryggeri i en stad i USA

Läs mer

En utvärdering av reliabilitet och mätinvarians hos ett självtest för spelberoende

En utvärdering av reliabilitet och mätinvarians hos ett självtest för spelberoende Linköpings universitet Institutionen för datavetenskap Kandidatuppsats i statistik, 15 hp Statistik och dataanalys Vårterminen 17 ISRN LIU-IDA/STAT-G--17/9--SE En utvärdering av reliabilitet och mätinvarians

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

Lösningar till SPSS-övning: Analytisk statistik

Lösningar till SPSS-övning: Analytisk statistik UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt

Läs mer

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera

Läs mer

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för: Datorövning 5 Statistisk teori med tillämpningar Hypotestest i SAS Syfte Lära sig beräkna konfidensintervall och utföra hypotestest för: 1. Populationsmedelvärdet, µ. 2. Skillnaden mellan två populationsmedelvärden,

Läs mer

Standard Normal Quantiles. Vilken av följande slutsatser kan man dra från qq-plotten?

Standard Normal Quantiles. Vilken av följande slutsatser kan man dra från qq-plotten? -2.5cm TENTAMEN: Statistisk modellering för I3, TMS160, lördagen den 11 december 2004 kl 8:30-11:30 på M. Jour: John Gustavsson, mob 0705-330375 Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2017-06-01 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

Structural Equation Modeling med Amos Kimmo Sorjonen (2012-01-24)

Structural Equation Modeling med Amos Kimmo Sorjonen (2012-01-24) 1 Structural Equation Modeling med Amos Kimmo Sorjonen (2012-01-24) 1. Variabler och tänkt modell Data simulerar de som använts i följande studie (se Appendix A): Hull, J. G., & Mendolia, M. (1991). Modeling

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Skrivning i ekonometri torsdagen den 8 februari 2007

Skrivning i ekonometri torsdagen den 8 februari 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)

Läs mer

Samband mellan elevers motivationer och åskådarbeteenden vid mobbningssituationer. - En jämförelse av resultat från multilevel- och faktoranalyser

Samband mellan elevers motivationer och åskådarbeteenden vid mobbningssituationer. - En jämförelse av resultat från multilevel- och faktoranalyser Linköpings universitet Institutionen för datavetenskap Kandidatuppsats, 5 hp Statistik Vårterminen 7 LIU-IDA/STAT-G--7/6--SE Samband mellan elevers motivationer och åskådarbeteenden vid mobbningssituationer.

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Multilevel Modeling med SPSS Kimmo Sorjonen ( )

Multilevel Modeling med SPSS Kimmo Sorjonen ( ) 1 Multilevel Modeling med SPSS Kimmo Sorjonen (2012-01-21) 1. Tvärsnittsdata, Två nivåer 1.i Variabler Data simulerar de som använts i följande studie (se Appendix A och Appendix B): Andersen, R., & van

Läs mer

Formler och tabeller till kursen MSG830

Formler och tabeller till kursen MSG830 Formler och tabeller till kursen MSG830 Deskriptiva mått För ett datamängd x 1,, x n denieras medelvärde standardavvikelse standardfelet (SEM) Sannolikheter x = 1 n n i=1 = x 1 + + x n n s = 1 n (x i x)

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4. Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student)

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod: Forskningsmetod 6,0 högskolepoäng Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod: 11OP90/TE01 samt 11PS30/TE01 Tentamen ges för: OPUS kull H12 termin 5 inriktning Psykologi samt fristående grundkurs

Läs mer

Skrivning i multivariata metoder lördagen den 27 augusti 2005

Skrivning i multivariata metoder lördagen den 27 augusti 2005 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA102:4 Skrivning i multivariata metoder lördagen den 27 augusti 2005 Förutom Körners tabell- och formelsamling och miniräknare är även läroboken:

Läs mer

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 5 June 217, 14:-18: Examiner: Zhenxia Liu (Tel: 7 89528). Please answer in ENGLISH if you can. a. You are allowed to use a calculator, the formula and

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

Statistik för teknologer, 5 poäng Skrivtid:

Statistik för teknologer, 5 poäng Skrivtid: UMEÅ UNIVERSITET Institutionen för matematisk statistik Statistik för teknologer, MSTA33, p Statistik för kemister, MSTA19, p TENTAMEN 2004-06-03 TENTAMEN I MATEMATISK STATISTIK Statistik för teknologer,

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2018-10-12 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

Examinationsuppgifter del 2

Examinationsuppgifter del 2 UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).

Läs mer

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1! LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal

Läs mer

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013 Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet November 6, 2013 Wänström (Linköpings universitet) F3 November 6, 2013 1 / 22 Interaktion

Läs mer

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012 Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig

Läs mer

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar ICKE-LINJÄRA MODELLER Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Y i = 1 + 2 X 2i + u i Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar cov(x i,u i )

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Tentamen för kursen. Linjära statistiska modeller. 17 februari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 17 februari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312,

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA Statistiska tester bygger alltid på vissa antaganden. Är feltermen homoskedastisk? Är den normalfördelad? Dessa antaganden är faktiskt aldrig uppfyllda i praktiken,

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

10.1 Enkel linjär regression

10.1 Enkel linjär regression Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot

Läs mer

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts. Syfte: Bestämma normal kroppstemperatur med tillgång till data från försök. Avgöra eventuell skillnad mellan män och kvinnor. Utforska ett eventuellt samband mellan kroppstemperatur och hjärtfrekvens.

Läs mer

FACIT!!! (bara facit,

FACIT!!! (bara facit, STOCKHOLMS UNIVERSITET Psykologiska institutionen Psykologi III, VT 2012. Fristående kurs FACIT!!! (bara facit, inga tolkningar) Skrivning i Psykologi III metod, fristående kurs: Metod och Statistik avsnitt

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE30 Sannolikhet, statistik och risk 207-08-5 kl. 8:30-3:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 03-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs TE/RC Datorövning 6 Syfte: 1. Lära sig utföra godness of fit-test 2. Lära sig utföra test av homogenitet 3. Lära sig utföra prövning av hypoteser

Läs mer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat

Läs mer

Föreläsning 12: Linjär regression

Föreläsning 12: Linjär regression Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret

Läs mer

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner. Försättsblad KOD: Kurskod: PC1546 Kursnamn: Forskningsmetodik och fördjupningsarbete Provmoment: Statistik, 5 hp Ansvarig lärare: Sara Landström & Pär Bjälkebring Tentamensdatum: 10/1-2015 Tillåtna hjälpmedel:

Läs mer

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14 STOCKHOLMS UNIVERSITET MT 5001 MATEMATISKA INSTITUTIONEN TENTAMEN Avd. Matematisk statistik 13 januari 2014 Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14 Examinator: Martin Sköld, tel.

Läs mer

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Paneldata och instrumentvariabler/2sls

Paneldata och instrumentvariabler/2sls Extra anteckningar om paneldata; Paneldata och instrumentvariabler/2sls Oavsett REM, FEM eller poolad OLS så görs antagandet att Corr(x,u) = 0, dvs att vi har svagt exogena regressorer. Om detta inte gäller

Läs mer

Skrivning i ekonometri lördagen den 29 mars 2008

Skrivning i ekonometri lördagen den 29 mars 2008 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan

Läs mer

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. PANELDATA Poolade data över tiden och över tvärsnittet Alternativ 1: Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. Oberoende stickprov dragna från stora populationer vid olika tidpunkter.

Läs mer

Statistiska metoder för säkerhetsanalys

Statistiska metoder för säkerhetsanalys F10: Intensiteter och Poissonmodeller Frågeställningar Konstant V.v.=Var Cyklister Poissonmodeller för frekvensdata Vi gör oberoende observationer av de (absoluta) frekvenserna n 1, n 2,..., n k från den

Läs mer

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology April 27, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två numeriska

Läs mer

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 11: Mer om jämförelser och inferens Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer

Läs mer

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 24 april, Ansvarig lärare: Bengt Jansson ( , mobil: )

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 24 april, Ansvarig lärare: Bengt Jansson ( , mobil: ) GÖTEBORGS UNIVERSITET Psykologiska institutionen TENTAMEN PC1307 PC1546 Statistik (5 hp) Lördag den 24 april, 2010 Tid: 14 30 18 30 Lokal: Viktoriagatan 30 Hjälpmedel: räknedosa Ansvarig lärare: Bengt

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Tentamen för kursen. Linjära statistiska modeller. 27 oktober STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 27 oktober 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Stokastiska vektorer och multivariat normalfördelning

Stokastiska vektorer och multivariat normalfördelning Stokastiska vektorer och multivariat normalfördelning Johan Thim johanthim@liuse 3 november 08 Repetition Definition Låt X och Y vara stokastiska variabler med EX µ X, V X σx, EY µ Y samt V Y σy Kovariansen

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

English Version. Number of sold cakes Number of days

English Version. Number of sold cakes Number of days Kurskod: TAMS24 (Statistisk teori / Provkod: TEN 206-0-04 (kl. 8-2 Examinator/Examiner: Xiangfeng Yang (Tel: 070 089666. Please answer in ENGLISH if you can. a. You are permitted to bring: a calculator;

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F3 1 / 21 Interaktion Ibland ser sambandet mellan en

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar

Läs mer

Premiepensionens delningstal och dess känslighet för ändrad livslängd och ränteantagande

Premiepensionens delningstal och dess känslighet för ändrad livslängd och ränteantagande 1 (5) PM Dok.bet. 2016-06-16 Analysavdelningen Tommy Lowen 010-454 20 50 Premiepensionens delningstal och dess känslighet för ändrad livslängd och ränteantagande Premiepensionens delningstal minskar med

Läs mer

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att

Läs mer

Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik KTH. Formelsamling i matematisk statistik Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska

Läs mer