STATISTISK ANALYS AV KOMPLEXA DATA
|
|
- Erik Dahlberg
- för 5 år sedan
- Visningar:
Transkript
1 STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 1 / 56
2 Longitudinella data Tvärsnittsdata Flera enheter undersöks under samma tidpunkt Enheterna antas vara oberoende av varandra Tidsseriedata En enhet undersöks under många tidpunkter Observationer vid närliggande tidpunkter antas ej vara oberoende av varandra Longitudinella data / Paneldata Flera enheter undersöks under flera tidpunkter Enheterna antas vara oberoende av varandra Observationer vid närliggande tidpunkter antas ej vara oberoende av varandra Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 2 / 56
3 Longitudinella data - exempel National Longitudinal Survey of Youth (NLSY79) Ett slumpmässigt urval av män och kvinnor mellan 14 och 19 år samlades in 1979 i USA. De har sedan undersökts varje/varannat år sedan dess. Även kvinnornas barn har undersökts varannat år sedan Exempel på variabler som har samlats in hos barnen: IQ-tester, kriminella beteenden, familjebakgrund, utbildningsnivå... Individual Development and Adaptation (IDA) Alla som gick i trean i Örebro år De har senare följts upp i sexan och nian samt i vuxen ålder. Exempel på variabler som har samlats in: Betyg, IQ, familjebakgrund, utbildningsnivå, inkomst... Longitudinal Individual Database (LINDA) Longitudinellt register hos SCB - ett stort urval av individer i Sverige (från 1969) Exempel på variabler som har samlats in: Inkomst, yrke, pendling, antal personer i hushållet... Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 3 / 56
4 Notation Antag att vi har ett urval av individer - för varje individ har vi gjort upprepade mätningar på en respons. För den j:te individen kan vi skriva responsvektorn y j1 Y j = y j2..., j = 1, 2,..., n y jkj där n är antalet individer och k j är antalet upprepade mätningar för individ j. Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 4 / 56
5 Har vi även observerat oberoende variabler kan vi skriva Ind(j) Mätning(i) Tid(t ij ) y ij x ij1 x ij2... x ijp 1 1 t 11 y 11 x 111 x x 11p 1 2 t 12 y 12 x 121 x x 12p k 1 t 1k1 y 1k1 x 1k1 1 x 1k x 1k1 p j 1 t j1 y j1 x j11 x j12... x j1p j 2 t j2 y j2 x j21 x j22... x j2p j k j t jkj y jkj x jkj 1 x jkj 2... x jkj p n 1 t n1 y n1 x n11 x n12... x n1p n 2 t n2 y n2 x n21 x n22... x n2p n k n t nkn y nkn x nkn 1 x nkn 2... x nkn 1 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 5 / 56
6 Metoder för att analysera longitudinella data - ej bra enligt mig t-test för korrelerade data Endast för två tidpunkter Change scores Endast för två tidpunkter ANOVA/ANCOVA Endast för kontinuerlig respons (som antas normalfördelad) Fungerar bäst för balanserade data MANOVA/MANCOVA En multivariat generalisering av MANOVA där vi har en vektor av responsvariabler Endast för kontinuerliga respons (multivariat NF) Balanserade data Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 6 / 56
7 Metoder för att analysera longitudinella data - bra enligt mig Multilevel-modell (General Linear Mixed Model) Fungerar bra även om individerna är mätta vid olika tidpunkter / olika antal tidpunkter Kan ha mer än två nivåer Latent Growth Curve Model En faktoranalys-approach Svårt om olika tidpunkter / antal tidpunkter Fungerar bra om responsvariabeln är latent Kan utvidgas till mer komplicerade faktorstrukturer Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 7 / 56
8 Multilevel-modell Racdom coeffi cent-modell med tid som oberoende variabel y ij = β 0j + β 1j t ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j ɛ ij N ( 0, σ 2 ) e [ u0j u 1j ] N ([ 0 0 ] [ σ 2, u0 σ u01 σ u10 σ 2 u1 ]) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 8 / 56
9 Autokorrelation Observationer som ligger nära varandra i tid är ofta ej oberoende (per individ) Jmfr tidsserieanalys Antagandet ɛ ij N ( 0, σ 2 e ) är därför ofta inte uppfyllt vid upprepade mätningar Vi kan anta olika kovariansstrukturer för feltermerna ɛ ij N (0, R) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 / 56
10 Exempel på vanliga strukturer för kovariansmatrisen Compound symmetry R = AR(1) (fungerar ej om olika tidsintervall) Unstructured R = σ 2 e R= σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e 1 ρ ρ 2 ρ 3 ρ 1 ρ ρ 2 ρ 2 ρ 1 ρ ρ 3 ρ 2 ρ 1 σ 2 1 σ 12 σ 13 σ 14 σ 21 σ 2 2 σ 23 σ 24 σ 31 σ 32 σ 2 3 σ 34 σ 41 σ 42 σ 43 σ 2 4 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 10 / 56
11 Jämförelse av kovariansstrukturer Modeller med små värden på 2LL samt få skattade parametrar är ofta att föredra. Ett jämförelsemått som tar hänsyn till antal skattade parametrar i kovariansmatrisen (q) är AIC. Den modell med lägst AIC föredras. AIC = 2LL + 2q Om skattningsmetoden är REML så kan jämförelsemått baserade på -2LL endast användas då man jämför modeller med olika slumpmässiga parametrar. Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 11 / 56
12 Multilevel regressionsmodell med tidspolynom Ju fler upprepade mätningar, desto större tidspolynom kan modelleras y ij = β 0j + β 1j t ij + β 2j t 2 ij ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j β 2j = β 2 + u 2j... ɛ ij N (0, R) u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ u2 σ 2 u1 σ u21 σ u12 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 / 56
13 Multilevel regressionsmodell med oberoende variabler Precis som vid "vanliga" mulitlevelmodeller kan oberoende variabler läggas till på respektive nivå y ij = β 0j + β 1j t ij + β 2j t 2 ij + β 3 x ij1 + ɛ ij β 0j = β 0 + β 4 x j2 + u 0j β 1j = β 1 + β 5 x j2 + u 1j β 2j = β 2 + β 6 x j2 + u 2j ɛ ij N (0, R) u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ u2 σ 2 u1 σ u21 σ u12 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 13 / 56
14 Exempel: Barn från NLSY79 (de första observationerna) Kolumnerna ger: observation, individ, familj, etnicitet, kön, födelseår, födelseordning, mors ålder vid barnets födsel, Piat Math, Piat Math åldersstandardiserat, ålder (månader) Obs id idmom race sex birthyear birthorder agemom m mz a Linda Wänström (Linköpings 3 universitet) LONGITUDINELLA DATA / 56
15 Multilevel regressionsmodell ("random coeffi cent"-modell) m ij = β 0j + β 1j a ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j ɛ ij N ( 0, σ 2 ) e [ u0j u 1j ] N ([ 0 0 ] [ σ 2, u0 σ u01 σ u10 σ 2 u1 ]) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 15 / 56
16 proc mixed data=four covtest; class id; model m=a /solution ddfm=bw; random intercept a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 16 / 56
17 Varning i log om G-matris Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 1 Intercept a Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id 0... UN(2,1) id <.0001 UN(2,2) id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E <.0001 Type 3 Tests of Fixed Effects Linda Wänström (Linköpings Effect Num universitet) DF Den DF F Value LONGITUDINELLA Pr > F DATA 17 / 56
18 Standardiserad ålder (a) proc mixed data=zfive covtest; class id; model m=a /solution ddfm=bw; random intercept a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 18 / 56
19 Fortfarande varning i log om G-matris Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 1 Intercept a Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id <.0001 UN(2,1) id <.0001 UN(2,2) id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E <.0001 Type 3 Tests of Fixed Effects Effect Num DF Den DF F Value Pr > F a 1 25E <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 19 / 56
20 Åldersstandardiserad Piat Math (mz) och standardiserad ålder (a) proc mixed data=zfive covtest; class id; model mz=a /solution ddfm=bw; random intercept a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 20 / 56
21 Ingen varning! Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 1 Intercept a Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id <.0001 UN(2,1) id <.0001 UN(2,2) id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 21 / 56
22 Multilevel regressionsmodell Lägg till ett tidspolynom mz ij = β 0j + β 1j a ij + β 2 a 2 ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j ɛ ij N ( 0, σ 2 ) e [ u0j u 1j ] N ([ 0 0 ] [ σ 2, u0 σ u01 σ u10 σ 2 u1 ]) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 22 / 56
23 proc mixed data=zfive covtest; class id; model mz=a a*a/solution ddfm=bw; random intercept a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 23 / 56
24 Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 1 Intercept a Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id <.0001 UN(2,1) id <.0001 UN(2,2) id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E <.0001 a*a E <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 24 / 56
25 Multilevel regressionsmodell Även som slumpmässig effekt mz ij = β 0j + β 1j a ij + β 2j a 2 ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j β 2j = β 2 + u 2j ɛ ij N ( 0, σ 2 ) e u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ 2 u1 σ u12 σ u20 σ u21 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 25 / 56
26 proc mixed data=zfive covtest; class id; model mz=a a*a/solution ddfm=bw; random intercept a a*a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 26 / 56
27 Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 Col3 1 Intercept a a*a Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id <.0001 UN(2,1) id <.0001 UN(2,2) id <.0001 UN(3,1) id <.0001 UN(3,2) id <.0001 UN(3,3) id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E a*a E <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 27 / 56
28 Multilevel regressionsmodell Lägg till en variabel som varierar mellan individer men ej över tid mz ij = β 0j + β 1j a ij + β 2j a 2 ij + ɛ ij β 0j = β 0 + β 2 agemom + u 0j β 1j = β 1 + β 3 agemom + u 1j β 2j = β 2 + β 4 agemom + u 2j ɛ ij N ( 0, σ 2 ) e u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ 2 u1 σ u12 σ u20 σ u21 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 28 / 56
29 proc mixed data=zfive covtest; class id; model mz=a a*a agemom a*agemom a*a*agemom/solution ddfm=bw; random intercept a a*a/ subject=id type=un gcorr; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 29 / 56
30 Estimated G Correlation Matrix Row Effect ID CODE OF CHILD Col1 Col2 Col3 1 Intercept a a*a Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id <.0001 UN(2,1) id <.0001 UN(2,2) id <.0001 UN(3,1) id <.0001 UN(3,2) id <.0001 UN(3,3) id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E <.0001 a*a E <.0001 agemom <.0001 a*agemom E <.0001 a*a*agemom E <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 30 / 56
31 Exempel forts. Undersök strukturen i R Struktur för R: compound symmetry mz ij = β 0 + β 1 a ij + ɛ ij ɛ ij N (0, R) där, för en individ med fyra tidpunkter, R = σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e σ 1 σ 1 σ 1 σ 1 σ 2 e Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 31 / 56
32 proc mixed data=zfive covtest; class id wave; model mz=a /solution ddfm=bw; repeated wave/type=cs subject=id r; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 32 / 56
33 Estimated R Matrix for id 201 Row Col1 Col2 Col3 Col Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z CS id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E <.0001 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 33 / 56
34 Kovariansstruktur för olika tidsintervall SP(POW) (Spatial Power Law) mz ij = β 0 + β 1 a ij + ɛ ij ɛ ij N (0, R) AR(1) går inte att använda vid olika tidsintervall. En generalisering av AR(1) för olika tidsintervall är SP(POW). Kovariansen mellan två mätningar vid tidpunkt T1 och T2 modelleras som: Cov [Y t1, Y t2 ] = σ 2 ρ t1 t2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 34 / 56
35 proc mixed data=zfive covtest; class id wave; model mz=a /solution ddfm=bw; repeated wave/type=sp(pow)(a) subject=id r; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 35 / 56
36 Estimated R Matrix for id 201 Row Col1 Col2 Col3 Col Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z SP(POW) id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 a E Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 36 / 56
37 Kombinerad modell Kovariansstruktur i R:CS mz ij = β 0j + β 1j a ij + β 2j a 2 ij + ɛ ij β 0j = β 0 + β 2 agemom + u 0j β 1j = β 1 + β 3 agemom + u 1j β 2j = β 2 + β 4 agemom + u 2j ɛ ij N (0, R) u 0j u 1j u 2j N 0 0 0, σ 2 u0 σ u01 σ u02 σ u10 σ 2 u1 σ u12 σ u20 σ u21 σ 2 u2 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 37 / 56
38 proc mixed data=zfive covtest; class id wave; model mz=a a*a agemom a*agemom a*a*agemom/solution ddfm=bw; random intercept a a*a/ subject=id type=un gcorr; repeated wave/type=cs subject=id r; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 38 / 56
39 Estimated R Matrix for id 201 Row Col1 Col2 Col3 Col Estimated G Correlation Matrix ID CODE OF CHILD Col1 Row Effect Col2 Col3 1 Intercept a a*a Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) id <.0001 UN(2,1) id <.0001 UN(2,2) id <.0001 UN(3,1) id <.0001 UN(3,2) id <.0001 UN(3,3) id <.0001 CS id <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (Smaller is Better) AICC (Smaller is Better) BIC (Smaller is Better) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 39 / 56
40 Latent growth curves (LGC) Explorativ Faktoranalys (repetition från Multivariata Metoder) Antagande: Korrelationer mellan ett antal observerade variabler uppstår pga bakomliggande, latenta faktorer Antal faktorer kan bestämmas från PC-analys Observerade variablers laddningar kan skattas med iterativ PC-analys Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 40 / 56
41 Konfirmativ Faktoranalys "Latent growth curve-modeller" (LGC) härstammar från konfirmativ faktoranalys En faktorstruktur antas och testas Antagande vid LGC-analys: Latenta faktorer (intercept, slope) påverkar värdena på responsvariabeln under de olika tidpunkterna. Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 41 / 56
42 Exempel: LGC-modell som antar linjär utveckling för fem tidpunkter 1 1 η η2 3 4 Y1 Y2 Y3 Y4 Y5 ε1 ε2 ε3 ε4 ε5 Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 42 / 56
43 LGC-modell Om vi har p tidpunkter och m faktorer (intercept, lutning för tid, lutning för tid i kvadrat etc.) kan vi skriva modellen: y = τ + Λη + ε där y är en p 1 vektor av observationer, τ är en p 1 vektor av intercept (ofta fixerad till 0), η är en m 1 vektor av faktorer, Λ är en p m matris med laddningar (ofta fixerade för att definiera intercept och olika typer av lutningar), och ε är en p 1 vektor av unika faktorer som antas normalfördelade. Faktorerna kan uttryckas som avvikelser från faktormedelvärden: η = µ η + ζ där µ η är en m 1 vektor av medelvärden och ζ är en m 1 vektor av residualer. Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 43 / 56
44 LGC-modell Variansen för y kan uttryckas som Σ = ΛΨΛ + Θ ɛ där Σ är en p p kovariansmatris, Ψ är en m m kovariansmatris för faktorer, och Θ ɛ är en p p kovarianmatris för unika faktorer. Förväntade värdet för y kan uttryckas som µ y = τ + Λµ η Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 44 / 56
45 Exempel forts För exemplet ovan ser vektorerna och matriserna ut som följer: µ η = Λ = [ µη1 µ η , Ψ = ], Θ ɛ = [ ψ11 ψ 21 ψ 22 ] θ ɛ 0 θ ɛ 0 0 θ ɛ θ ɛ θ ɛ Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 45 / 56
46 Skattning av de okända parametrarna Okända parametrar i modellen är medelvärden, varianser och kovarianser för faktorer, och varianser för unika faktorer Samma skattningsmetoder som vid konfirmativ faktoranalys Elementen i observerad kovariansmatris (S) och medelvärden för alla p variabler uttrycks som funktioner av de okända parametrarna Skattningarna är de värden på parametrarna som reproducerar de observerade kovarianserna och varianserna (implicerad kovariansmatris Σ) och medelvärdena så bra som möjligt ML-skattningar: en funktion av avvikelser mellan observerade kovariansmatrisen (S) och medelvärden (y) samt implicerade kovariansmatrisen (Σ) och medelvärden (µ) minimeras F ML = Tr(SΣ 1 ) p + ln( Σ ) ln( S ) + (y µ) Σ 1 (y µ) Modellen måste vara "identifierad": antal kända bitar information (observerade varianser, kovarianser, medelvärden) måste vara minst lika många som antal okända parametrar Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 46 / 56
47 Anpassningsmått χ 2 = (N 1)F GFI (Goodness of Fit) Mått på hur hur stor andel varians i observerade kovariansmatrisen som förklaras av modellen Bra anpassing: GFI > 0.9 (gärna >0.95) RMSEA (Root Mean Squared Error of Approximation) Mått på skillnad mellan observerad och implicerad matris Bra anpassning: RMSEA <0.10 (gärna <0.05) Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 47 / 56
48 Exempel data growth; input y1 y2 y3 y4 y5; datalines; ; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 48 / 56
49 SAS proc calis method=ml data=growth; lineqs y1 = 0. * Intercept + f_int + e1, y2 = 0. * Intercept + f_int + 1 * f_slp + e2, y3 = 0. * Intercept + f_int + 2 * f_slp + e3, y4 = 0. * Intercept + f_int + 3 * f_slp + e4, y5 = 0. * Intercept + f_int + 4 * f_slp + e5; std f_int f_slp, e1 e5 = 5 * evar; mean f_int f_slp; cov f_int f_slp; run; Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 49 / 56
50 Manifest Latent Manifest Latent Error Variables in the Model y1 y2 y3 y4 y5 f_int f_slp e1 e2 e3 e4 e5 Number of Endogenous Variables = 5 Number of Exogenous Variables = 7 Variable Mean Std Dev y y y y y Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 50 / 56
51 Fit Summary Modeling Info Number of Observations 16 Number of Variables 5 Number of Moments 20 Number of Parameters 6 Number of Active Constraints 0 Baseline Model Function Value Baseline Model Chi Square Baseline Model Chi Square DF 10 Pr > Baseline Model Chi Square <.0001 Absolute Index Fit Function Chi Square Chi Square DF 14 Pr > Chi Square Z Test of Wilson & Hilferty Hoelter Critical N 12 Root Mean Square Residual (RMR) Standardized RMR (SRMR) Goodness of Fit Index (GFI) Parsimony Index Adjusted GFI (AGFI) Parsimonious GFI RMSEA Estimate RMSEA Lower 90% Confidence Limit RMSEA Upper 90% Confidence Limit Probability of Close Fit Akaike Information Criterion Bozdogan CAIC Schwarz Bayesian Criterion McDonald Centrality Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 51 / 56
52 Variable Type Estimates for Variances of Exogenous Variables Variable Parameter Estimate Standard Error t Value Latent f_int _Parm f_slp _Parm Error e1 evar e2 evar e3 evar e4 evar e5 evar Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 52 / 56
53 Covariances Among Exogenous Variables Var1 Var2 Parameter Estimate Standard Error t Value f_int f_slp _Parm Variable Type Mean Parameters Variable Parameter Estimate Standard Error t Value Latent f_int _Parm f_slp _Parm Squared Multiple Correlations Variable Error Variance Total Variance R Square y y y y y Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 53 / 56
54 Standardized Results for Covariances Among Exogenous Variables Var1 Var2 Parameter Estimate Standard Error t Value f_int f_slp _Parm Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 54 / 56
55 Multilevel-modeller eller LGC-modeller för longitudinella data? Om man har balanserade data (dvs alla individer är mätta vid alla tidpunkter) kan bägge metoderna användas Om man inte har balanserade data (eller bortfall) är det lättare med multilevel-modeller Oberoende variabler kan användas vid bägge metoder Kovariansstruktur för feltermer (unika faktorer) kan användas vid bägge metoder Om någon/några variabler är latent, och mätt med flera indikatorer (tex 3 IQ-test som antas mäta intelligens vid varje tidpunkt) kan man använda LGC Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 55 / 56
56 Multilevel-modeller eller LGC-modeller för longitudinella data? Om man har mer komplicerade modeller, så som att en variabel X 1 påverkar en variabel X 2 som i sin tur antas påverka interceptet och lutningen, kan man använda LGC Om man har mer komplicerade modeller, så som att en utvecklingskurva (intercept och lutning för exempelvis intelligensutveckling) antas påverka en annan utvecklingskurva (intercept och lutning för exempelvis betygsutveckling) kan man använda LGC Multilevel-modeller används oftare än LGC-modeller, men användningen av LGC-modeller ökar mer och mer! Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 56 / 56
STATISTISK ANALYS AV KOMPLEXA DATA
STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 9 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 1 / 43 Longitudinella data
Läs merSTATISTISK ANALYS AV KOMPLEXA DATA
STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 1 / 66 Longitudinella data Tvärsnittsdata Flera
Läs merSTATISTISK ANALYS AV KOMPLEXA DATA
STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 12 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 December 1 / 12 Explorativ Faktoranalys
Läs merSTATISTISK ANALYS AV KOMPLEXA DATA
STATISTISK ANALYS AV KOMPLEXA DATA HIERARKISKA DATA Linda Wänström Linköpings universitet 25 November Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 1 / 53 Regressionsmodell för icke-hierarkiska
Läs merSTATISTISK ANALYS AV KOMPLEXA DATA
STATISTISK ANALYS AV KOMPLEXA DATA HIERARKISKA DATA Linda Wänström Linköpings universitet 14-15 November Wänström (Linköpings universitet) HIERARKISKA DATA 14-15 November 1 / 59 Hierarkiska data Hierarkiska
Läs merMultivariata metoder
Multivariata metoder F5 Linda Wänström Linköpings universitet 1 oktober Wänström (Linköpings universitet) Multivariata metoder 1 oktober 1 / 18 Kanonisk korrelationsanalys Syfte: Undersöka om en grupp
Läs merStructural Equation Modeling (SEM) Ingenting är omöjligt
Structural Equation Modeling (SEM) Ingenting är omöjligt Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll Data Latenta och manifesta variabler Typ av modell (path, CFA, SEM) Specificera
Läs merInnehåll. Data. Skillnad SEM & Regression. Exogena & Endogena variabler. Latenta & Manifesta variabler
Innehåll Structural Equation Modeling (SEM) Ingenting är omöjligt Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Data Latenta och manifesta variabler Typ av modell (path, CFA, SEM) Specificera
Läs mer1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell
Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning
Läs merInstuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8
1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,
Läs merMultivariata metoder
Multivariata metoder F3 Linda Wänström Linköpings universitet 17 september Wänström (Linköpings universitet) Multivariata metoder 17 september 1 / 21 Principalkomponentanalys Syfte med principalkomponentanalys
Läs merEn rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.
En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar
Läs merAnvändning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå
Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; () Mixed effect models; (3)
Läs merRegressions- och Tidsserieanalys - F7
Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys
Läs merAnvändning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå
Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; (2) Mixed effect models; (3)
Läs merSTATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA
STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Mattias Villani Statistik Institutionen för Datavetenskap Linköpings Universitet MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 1 / 44 MOMENTETS
Läs mer1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
Läs mer2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer
Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna
Läs mer7.5 Experiment with a single factor having more than two levels
7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan
Läs mer7.5 Experiment with a single factor having more than two levels
Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan och att en inblandning mellan 10% och 40% är bra. För att
Läs mer1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att
Läs mer732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris
Läs merFinansiell statistik. Multipel regression. 4 maj 2011
Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi
Läs merRegressions- och Tidsserieanalys - F4
Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1
Läs merRegressions- och Tidsserieanalys - F1
Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp
Läs merMälardalens Högskola. Formelsamling. Statistik, grundkurs
Mälardalens Högskola Formelsamling Statistik, grundkurs Höstterminen 2015 Deskriptiv statistik Populationens medelvärde (population mean): μ = X N Urvalets medelvärde (sample mean): X = X n Där N är storleken
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-05-31 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merBayesiansk statistik, 732g43, 7.5 hp
Bayesiansk statistik, 732g43, 7.5 hp Moment 2 - Linjär regressionsanalys Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA, LiU) Bayesiansk statistik 1 / 29 Översikt moment 2: linjär
Läs merRegressions- och Tidsserieanalys - F1
Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,
Läs merTentamen för kursen. Linjära statistiska modeller. 13 januari
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 13 januari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida
Läs merSkrivning i multivariata metoder lördagen den 30 augusti 2003
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA102:4 Skrivning i multivariata metoder lördagen den 30 augusti 2003 Förutom Körners tabell- och formelsamling och miniräknare är även läroboken:
Läs merMetod och teori. Statistik för naturvetare Umeå universitet
Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån
Läs merRegressions- och Tidsserieanalys - F3
Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när
Läs merSkrivning i ekonometri lördagen den 25 augusti 2007
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA10:3 Skrivning i ekonometri lördagen den 5 augusti 007 1. Vi vill undersöka hur variationen i ölförsäljningen i ett bryggeri i en stad i USA
Läs merEn utvärdering av reliabilitet och mätinvarians hos ett självtest för spelberoende
Linköpings universitet Institutionen för datavetenskap Kandidatuppsats i statistik, 15 hp Statistik och dataanalys Vårterminen 17 ISRN LIU-IDA/STAT-G--17/9--SE En utvärdering av reliabilitet och mätinvarians
Läs merFör logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Läs merLösningar till SPSS-övning: Analytisk statistik
UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt
Läs merUpprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland
Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera
Läs merDatorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:
Datorövning 5 Statistisk teori med tillämpningar Hypotestest i SAS Syfte Lära sig beräkna konfidensintervall och utföra hypotestest för: 1. Populationsmedelvärdet, µ. 2. Skillnaden mellan två populationsmedelvärden,
Läs merStandard Normal Quantiles. Vilken av följande slutsatser kan man dra från qq-plotten?
-2.5cm TENTAMEN: Statistisk modellering för I3, TMS160, lördagen den 11 december 2004 kl 8:30-11:30 på M. Jour: John Gustavsson, mob 0705-330375 Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-06-01 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merStructural Equation Modeling med Amos Kimmo Sorjonen (2012-01-24)
1 Structural Equation Modeling med Amos Kimmo Sorjonen (2012-01-24) 1. Variabler och tänkt modell Data simulerar de som använts i följande studie (se Appendix A): Hull, J. G., & Mendolia, M. (1991). Modeling
Läs merFöreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
Läs merSkrivning i ekonometri torsdagen den 8 februari 2007
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)
Läs merSamband mellan elevers motivationer och åskådarbeteenden vid mobbningssituationer. - En jämförelse av resultat från multilevel- och faktoranalyser
Linköpings universitet Institutionen för datavetenskap Kandidatuppsats, 5 hp Statistik Vårterminen 7 LIU-IDA/STAT-G--7/6--SE Samband mellan elevers motivationer och åskådarbeteenden vid mobbningssituationer.
Läs merGrundläggande matematisk statistik
Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x
Läs merMultipel Regressionsmodellen
Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b
Läs merMultilevel Modeling med SPSS Kimmo Sorjonen ( )
1 Multilevel Modeling med SPSS Kimmo Sorjonen (2012-01-21) 1. Tvärsnittsdata, Två nivåer 1.i Variabler Data simulerar de som använts i följande studie (se Appendix A och Appendix B): Andersen, R., & van
Läs merFormler och tabeller till kursen MSG830
Formler och tabeller till kursen MSG830 Deskriptiva mått För ett datamängd x 1,, x n denieras medelvärde standardavvikelse standardfelet (SEM) Sannolikheter x = 1 n n i=1 = x 1 + + x n n s = 1 n (x i x)
Läs merStatistik B Regressions- och tidsserieanalys Föreläsning 1
Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs
Läs merGrundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.
Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student)
Läs merFöreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3
Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest
Läs merProvmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:
Forskningsmetod 6,0 högskolepoäng Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod: 11OP90/TE01 samt 11PS30/TE01 Tentamen ges för: OPUS kull H12 termin 5 inriktning Psykologi samt fristående grundkurs
Läs merSkrivning i multivariata metoder lördagen den 27 augusti 2005
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA102:4 Skrivning i multivariata metoder lördagen den 27 augusti 2005 Förutom Körners tabell- och formelsamling och miniräknare är även läroboken:
Läs merKurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version
Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 5 June 217, 14:-18: Examiner: Zhenxia Liu (Tel: 7 89528). Please answer in ENGLISH if you can. a. You are allowed to use a calculator, the formula and
Läs merLÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29
UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN
Läs mer732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29
732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann
Läs merStatistik för teknologer, 5 poäng Skrivtid:
UMEÅ UNIVERSITET Institutionen för matematisk statistik Statistik för teknologer, MSTA33, p Statistik för kemister, MSTA19, p TENTAMEN 2004-06-03 TENTAMEN I MATEMATISK STATISTIK Statistik för teknologer,
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-10-12 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merExaminationsuppgifter del 2
UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).
Läs mera) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal
Läs merLogistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013
Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas
Läs merRegressions- och Tidsserieanalys - F3
Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet November 6, 2013 Wänström (Linköpings universitet) F3 November 6, 2013 1 / 22 Interaktion
Läs merStokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012
Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig
Läs merVid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar
ICKE-LINJÄRA MODELLER Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Y i = 1 + 2 X 2i + u i Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar cov(x i,u i )
Läs merTentamen för kursen. Linjära statistiska modeller. 17 februari
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 17 februari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312,
Läs merResidualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen
Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då
Läs merKapitel 22: KLUSTRADE SAMPEL OCH PANELDATA
Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA Statistiska tester bygger alltid på vissa antaganden. Är feltermen homoskedastisk? Är den normalfördelad? Dessa antaganden är faktiskt aldrig uppfyllda i praktiken,
Läs mer732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20
732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta
Läs mer10.1 Enkel linjär regression
Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot
Läs merKroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.
Syfte: Bestämma normal kroppstemperatur med tillgång till data från försök. Avgöra eventuell skillnad mellan män och kvinnor. Utforska ett eventuellt samband mellan kroppstemperatur och hjärtfrekvens.
Läs merFACIT!!! (bara facit,
STOCKHOLMS UNIVERSITET Psykologiska institutionen Psykologi III, VT 2012. Fristående kurs FACIT!!! (bara facit, inga tolkningar) Skrivning i Psykologi III metod, fristående kurs: Metod och Statistik avsnitt
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE30 Sannolikhet, statistik och risk 207-08-5 kl. 8:30-3:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 03-7725325 Hjälpmedel: Valfri miniräknare.
Läs merStatistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs
Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs TE/RC Datorövning 6 Syfte: 1. Lära sig utföra godness of fit-test 2. Lära sig utföra test av homogenitet 3. Lära sig utföra prövning av hypoteser
Läs merKorrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION
KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat
Läs merFöreläsning 12: Linjär regression
Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera
Läs merMatematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret
Läs merOBS! Vi har nya rutiner.
Försättsblad KOD: Kurskod: PC1546 Kursnamn: Forskningsmetodik och fördjupningsarbete Provmoment: Statistik, 5 hp Ansvarig lärare: Sara Landström & Pär Bjälkebring Tentamensdatum: 10/1-2015 Tillåtna hjälpmedel:
Läs merTentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14
STOCKHOLMS UNIVERSITET MT 5001 MATEMATISKA INSTITUTIONEN TENTAMEN Avd. Matematisk statistik 13 januari 2014 Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14 Examinator: Martin Sköld, tel.
Läs merSkriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012
Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller
Läs merPaneldata och instrumentvariabler/2sls
Extra anteckningar om paneldata; Paneldata och instrumentvariabler/2sls Oavsett REM, FEM eller poolad OLS så görs antagandet att Corr(x,u) = 0, dvs att vi har svagt exogena regressorer. Om detta inte gäller
Läs merSkrivning i ekonometri lördagen den 29 mars 2008
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan
Läs merPoolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.
PANELDATA Poolade data över tiden och över tvärsnittet Alternativ 1: Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. Oberoende stickprov dragna från stora populationer vid olika tidpunkter.
Läs merStatistiska metoder för säkerhetsanalys
F10: Intensiteter och Poissonmodeller Frågeställningar Konstant V.v.=Var Cyklister Poissonmodeller för frekvensdata Vi gör oberoende observationer av de (absoluta) frekvenserna n 1, n 2,..., n k från den
Läs merFöreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology April 27, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två numeriska
Läs merFöreläsning 11: Mer om jämförelser och inferens
Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer
Läs merTENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 24 april, Ansvarig lärare: Bengt Jansson ( , mobil: )
GÖTEBORGS UNIVERSITET Psykologiska institutionen TENTAMEN PC1307 PC1546 Statistik (5 hp) Lördag den 24 april, 2010 Tid: 14 30 18 30 Lokal: Viktoriagatan 30 Hjälpmedel: räknedosa Ansvarig lärare: Bengt
Läs merMVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
Läs merPrediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval
Läs merTentamen för kursen. Linjära statistiska modeller. 27 oktober
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 27 oktober 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida
Läs merStokastiska vektorer och multivariat normalfördelning
Stokastiska vektorer och multivariat normalfördelning Johan Thim johanthim@liuse 3 november 08 Repetition Definition Låt X och Y vara stokastiska variabler med EX µ X, V X σx, EY µ Y samt V Y σy Kovariansen
Läs merStokastiska processer med diskret tid
Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna
Läs merEnglish Version. Number of sold cakes Number of days
Kurskod: TAMS24 (Statistisk teori / Provkod: TEN 206-0-04 (kl. 8-2 Examinator/Examiner: Xiangfeng Yang (Tel: 070 089666. Please answer in ENGLISH if you can. a. You are permitted to bring: a calculator;
Läs merRättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:
Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig
Läs merRegressions- och Tidsserieanalys - F3
Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F3 1 / 21 Interaktion Ibland ser sambandet mellan en
Läs merMatematisk statistik för D, I, Π och Fysiker
Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar
Läs merPremiepensionens delningstal och dess känslighet för ändrad livslängd och ränteantagande
1 (5) PM Dok.bet. 2016-06-16 Analysavdelningen Tommy Lowen 010-454 20 50 Premiepensionens delningstal och dess känslighet för ändrad livslängd och ränteantagande Premiepensionens delningstal minskar med
Läs merEnvägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper
Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att
Läs merMatematisk statistik KTH. Formelsamling i matematisk statistik
Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska
Läs mer