STATISTISK ANALYS AV KOMPLEXA DATA

Storlek: px
Starta visningen från sidan:

Download "STATISTISK ANALYS AV KOMPLEXA DATA"

Transkript

1 STATISTISK ANALYS AV KOMPLEXA DATA HIERARKISKA DATA Linda Wänström Linköpings universitet November Wänström (Linköpings universitet) HIERARKISKA DATA November 1 / 59

2 Hierarkiska data Hierarkiska data, "Clustered" data, er-nivå data, grupperade data Enheter grupperade i olika nivåer Vi har ett urval av skolor - inom varje skola har vi ett urval av elever Nivå 1: elever Nivå 2: skolor Vi har ett urval av familjer - inom varje familj undersöker vi alla/några barn Nivå 1: barn Nivå 2: familjer Vi har ett urval av familjer - inom varje familj undersöker vi alla/några barn - för varje barn gör vi upprepade mätningar Nivå 1: mättidpunkter Nivå 2: barn Nivå 3: familjer Wänström (Linköpings universitet) HIERARKISKA DATA November 2 / 59

3 Exempel: Samband mellan medelbetyg och poäng på prov Inritad regressionslinje Score Grade 4 5 Wänström (Linköpings universitet) HIERARKISKA DATA November 3 / 59

4 Exempel: Samband mellan medelbetyg och poäng på prov Inritad regressionslinje för varje skola School Score Grade 4 5 Wänström (Linköpings universitet) HIERARKISKA DATA November 4 / 59

5 Varför ska vi ta hänsyn till den hierarkiska strukturen på data? Vi kan väl bara använda den lägsta nivån (tex elev) som enhet och använda vanliga analysmetoder? Eller - vi kan väl använda den högre nivån (tex klass / skola) som enhet och använda vanliga metoder? Individer (observationer) inom en grupp tenderar att vara lika varandra Familjer: syskon (samma föräldrar, samma miljöpåverkan) Skolor: klasser: elever (påverkar varandra, mer lika från början?) Ignorerar vi grupperingar kan vi missa viktiga gruppe ekter Ignorerar vi korrelationen mellan observationer inom grupper får vi missvisande skattningar på varianser Wänström (Linköpings universitet) HIERARKISKA DATA November 5 / 59

6 Exempel: Studie om läsinlärning i skolan (Bennet, 1976) Slutsats: Barn som lär sig läsa enligt den "traditionella tekniken" lär sig fortare än de som inte gör det Multipel regressionsmodell med elever som enheter (inga grupperingar) Statistisk signi kant skillnad Aitkin et el (1981) analyserade om datamaterialet och tog hänsyn till att eleverna var grupperade i klasser Inte längre statistiskt signi kant skillnad Wänström (Linköpings universitet) HIERARKISKA DATA November 6 / 59

7 Exempel: Mean PIAT Scores Data från Rodgers, J.L., Cleveland, H.H., van den Oord, E., & Rowe, D.C. (2000). Resolving the debate over birth order, family size and intelligence. American Psychologist, 55, Wänström (Linköpings universitet) HIERARKISKA DATA November 7 / 59

8 Mean Piat Score uppdelat på familjestorlek Wänström (Linköpings universitet) HIERARKISKA DATA November 8 / 59

9 Fixed e ects modeller De niera dummyvariabler för att skatta skillnader mellan skolor, klasser, familjer... Detta fungerar om vi har ett mindre antal skolor, klasser, familjer... och endast vill generalisera till dem Vill vi generalisera resultaten till ett större antal skolor, klasser, familjer - använd inte xed e ects modeller Fungerar inte heller bra om vi har få observationer (tex elever) i några av grupperna (tex klasser) Wänström (Linköpings universitet) HIERARKISKA DATA November 9 / 59

10 Multilevel regressionsmodell Multilevel model (Goldstein) Hierarchical linear model (Raudenbush & Bryk) Variance component model (Longford) Random coe cient model (De Leeuw & Kreft, Longford) Latent growth curve model (Tucker, Rao) Random e ects model, mixed e ects model etc... Wänström (Linköpings universitet) HIERARKISKA DATA November 10 / 59

11 Multilevel regressionsmodell ("random coe cent" modell) Y ij = β 0j + β 1j x ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j Y ij = β 0 + u 0j + β 1 x ij + u 1j x ij + ɛ ij Y ij = β 0 + β 1 x ij + (u 0j + u 1j x ij + ɛ ij ) Där ij står för, tex, den i:te eleven i den j:te klassen. ɛ ij N 0, σ 2 e u0j 0 N 0 u 1j σ 2, u0 σ u10 σ u01 σ 2 u1 Två xa (intercept och slope) och tre slumpmässiga parametrar (två varianser och en kovarians) att skatta Wänström (Linköpings universitet) HIERARKISKA DATA November 11 / 59

12 Enklaste fallet: Varianskomponentmodell y ij = β 0j + β 1 x ij + ɛ 0ij β 0j = β 0 + u 0j y ij = β 0 + u 0j + β 1 x ij + ɛ 0ij y ij = β 0 + β 1 x ij + (u 0j + ɛ 0ij ) ɛ ij N 0, σ 2 e u 0j N 0, σ 2 u0 Wänström (Linköpings universitet) HIERARKISKA DATA November 12 / 59

13 Varianskomponentmodell y ij = β 0 + β 1 x ij + (u 0j + ɛ 0ij ) ɛ ij N 0, σ 2 e u 0j N 0, σ 2 u0 var(y ij jβ 0, β 1, x ij ) = var(u 0j + ɛ ij ) = σ 2 u0 + σ2 e cov(y ij jβ 0, β 1, x ij ) = cov(u 0j + ɛ 1j, u 0j + ɛ 2j ) = σ 2 u0, för i = 1, 2 Wänström (Linköpings universitet) HIERARKISKA DATA November 13 / 59

14 Intraklass-korrelation Varianskomponentmodell ρ = σ2 u0 σ 2 u0 +σ2 e Andelen av den oförklarade variationen som är mellan grupper (klasser) Om den är större än noll bör vi inte använda vanliga metoder (som tex OLS) som inte tar hänsyn till varianser på era nivåer Wänström (Linköpings universitet) HIERARKISKA DATA November 14 / 59

15 Kovariansmatris Varianskomponentmodell Kovariansmatris för värdena för tre individer i en grupp och två individer i en annan grupp: 0 σ 2 A 0 u0 + σ2 e σ 2 u0 σ 2 1 u0, där A σ 0 B 2 u0 σ 2 u0 + σ2 e σ 2 A u0 och σ 2 u0 σ 2 u0 σ 2 u0 + σ2 e σ 2 B = u0 + σ 2 e σ 2 u0 σ 2 u0 σ 2 u0 + σ2 e Variansen i y-värden för en given individ är σ 2 u0 + σ2 e. Kovariansen mellan y värden för två individer i samma klass är σ 2 u0. Kovariansen mellan y värden för två individer i olika klasser är 0. Variansen inom en klass är σ 2 e. σ 2 Mer generellt: V = u0 J (3) + σ 2 ei (3) 0 0 σ 2 u0 J (2) + σ 2 ei (2) där I (n) är (n n) identitetsmatris, J (n) är (n n) matris med ettor. Wänström (Linköpings universitet) HIERARKISKA DATA November 15 / 59

16 Generell multilevel-modell Y = X β + Zu + e e N (0, Ω e ) u N (0, Ω u ) V (Y ) = Z Ω u Z T + Ω e där Ω u är kovariansmatrisen för de slumpmässiga e ekterna u och Ω e är kovariansmatrisen för e. 0 σ 2 u0 σ 2 u01... σ 2 1 u0k Exempel Ω u(kk) = B σ 2 u10 σ 2 u1... σ 2 u1k A, Ω e(nn) = σ 2 uk0 σ 2 uk1 σ 2 uk 0 σ 2 e σ 2 e σ 2 e 1 C A Wänström (Linköpings universitet) HIERARKISKA DATA November 16 / 59

17 Skattning av parametrar ( xa och slumpmässiga) Vid känd varians V är GLS-skattning av xa parametrar bβ = (X T V 1 X ) 1 X T V 1 Y V (bβ) = (X T V 1 X ) 1 Vanliga startvärden för xa parametrar: OLS Vektor med residualer skapas, och används för att uttryckas som funktion av varianser för slumptermerna och dessa skattas (krävs att dessa är normalfördelade) Skattad V används för att ta fram nya GLS-skattningar, och nya varianser för slumptermerna skattas osv till konvergens Om slumptermerna (residualerna) är normalfördelade är skattningarna ML-skattningar Skattningarna för varianserna för slumptermerna är inte VVR (tar inte hänsyn till samplingvariation av xa parametrar) En modi kation ger REML - VVR skattningar (används i SAS) Wänström (Linköpings universitet) HIERARKISKA DATA November 17 / 59

18 Hypotestest Test för xa parametrar "Vanliga" hypotestest / kon densintervall baserade på skattningarna och standradavvikleserna för skattningarna från IGLS (REML) Test för slumpmässiga parametrar (varianser och kovarianser) Z-test (vid stora stickprov) Bättre med Likelhood ratio test D 01 = 2 log e (λ 0 /λ 1 ) där λ 0, λ 1 är likelihood under noll respektive alternativhypotesen. D 01 är χ 2 fördelad q frihetsgrader, där q är skillnaden i antalet skattade parametrar under de två modellerna. Vid REML-skattning bör likelihood ratio-testet endast användas vid jämförande av modeller som skiljer sig åt endast genom slumpmässiga parametrar (ej xa). Wänström (Linköpings universitet) HIERARKISKA DATA November 18 / 59

19 Exempel (data från Hox (2010). Multilevel Analysis) 2000 elever från 100 olika klasser (skolor) Popularity (skala 0-10, elevnivå) Sex (elevnivå) Extraversion (kontinuerlig 0-10, elevnivå) Teacher experience (År, klassnivå) Wänström (Linköpings universitet) HIERARKISKA DATA November 19 / 59

20 Spridningsdiagram mellan popularity-scores och extraversion för eleverna i de två första klasserna Wänström (Linköpings universitet) HIERARKISKA DATA November 20 / 59

21 Uppdelat på de två klasserna Wänström (Linköpings universitet) HIERARKISKA DATA November 21 / 59

22 Varianskomponent-modell Basmodell popular ij = β 0j + ɛ ij, β 0j = β 0 + u 0j popular ij = β 0 + u 0j + ɛ ij ɛ 0ij N(0, σ 2 e) u 0j N(0, σ 2 u0 ) Wänström (Linköpings universitet) HIERARKISKA DATA November 22 / 59

23 Data Z p Z p p o Z p o C e o p e o p e c p x p t x Z p t x C l u c t t u e t Z t u e t t C O a p o r s e l a r s e l a r e s b s i n a e x a c a e x a c a x e s s l s v x p r h v x p r h v p x Wänström (Linköpings universitet) HIERARKISKA DATA November 23 / 59

24 Varianskomponent-modell SAS proc mixed data=popdata covtest; class class; model popular= /solution; random intercept / subject=class; run; Wänström (Linköpings universitet) HIERARKISKA DATA November 24 / 59

25 The Mixed Procedure Model Information Data Set Dependent Variable Covariance Structure Subject Effect Estimation Method Residual Variance Method Fixed Effects SE Method Degrees of Freedom Method WORK.POPDATA popular Variance Components class REML Profile Model Based Containment Class Level Information Class Levels Values class Dimensions Covariance Parameters 2 Columns in X 1 Columns in Z Per Subject 1 Subjects 100 Max Obs Per Subject 26 Number of Observations Number of Observations Read 2000 Number of Observations Used 2000 Number of Observations Not Used 0 Iteration History Iteration Evaluations 2 Res Log Like Criterion Convergence criteria met. Wänström (Linköpings universitet) HIERARKISKA DATA November 25 / 59

26 Covariance Parameter Estimates Standard Z Cov Parm Subject Estimate Error Value Pr > Z UN(1,1) class <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Standard Effect Estimate Error DF t Value Pr > t Intercept <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA November 26 / 59

27 Resultat: skattning och test cβ 0 = ( ), p <.0001 cσ 2 e = ( ), p <.0001 cσ 2 u0 = (0.1086), p <.0001 Intraklass-korrelation: bρ = = Wänström (Linköpings universitet) HIERARKISKA DATA November 27 / 59

28 Varianskomponent-modell med kön (sex) på individnivå - x e ekt Vi lägger till kön (sex) som x e ekt popularity ij = β 0j + β 1 sex ij + ɛ ij β 0j = β 0 + u 0j popularity ij = β 0 + u 0j + β 1 sex ij + ɛ ij ɛ 0ij N(0, σ 2 e) u 0j N(0, σ 2 u0 ) Wänström (Linköpings universitet) HIERARKISKA DATA November 28 / 59

29 Varianskomponent-modell med kön (sex) på individnivå - x e ekt SAS proc mixed data=popdata covtest; class class; model popular = Csex / solution; random intercept / subject=class; run; Wänström (Linköpings universitet) HIERARKISKA DATA November 29 / 59

30 Covariance Parameter Estimates Standard Z Cov Parm Subject Estimate Error Value Pr > Z UN(1,1) class <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Standard Effect Estimate Error DF t Value Pr > t Intercept <.0001 Csex <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA November 30 / 59

31 Resultat: skattning och test cβ 0 = ( ), p <.0001 cβ 1 = ( ), p <.0001 cσ 2 e = ( ), p <.0001 cσ 2 u0 = ( ), p <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA November 31 / 59

32 Multilevel-modell med kön (sex) på individnivå - slumpmässig e ekt Vi lägger till kön (sex) också som slumpmässig e ekt popularity ij = β 0j + β 1j sex ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j popularity ij = β 0 + u 0j + β 1 sex ij + u 1j sex ij + ɛ ij ɛ ij N 0, σ 2 e u0j 0 N 0 u 1j σ 2, u0 σ u10 σ u01 σ 2 u1 Wänström (Linköpings universitet) HIERARKISKA DATA November 32 / 59

33 Multilevel-modell med kön (sex) på individnivå - slumpmässig e ekt SAS proc mixed data=popdata covtest; class class; model popular = Csex / solution; random intercept Csex/ subject=class type=un; run; Wänström (Linköpings universitet) HIERARKISKA DATA November 33 / 59

34 Covariance Parameter Estimates Standard Cov Parm Subject Estimate Error Value Pr Z Z UN(1,1) class <.0001 UN(2,1) class UN(2,2) class Covariance Parameter Estimates Standard Cov Parm Subject Estimate Error Value Pr Z Z Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Standard Effect Estimate Error DF t Value Pr > t Intercept <.0001 Csex <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA November 34 / 59

35 Resultat: skattning och test cβ 0 = ( ), p <.0001 cβ 1 = ( ), p <.0001 cσ 2 e = ( ), p <.0001 cσ 2 u0 = ( ), p <.0001 cσ 2 u1 = ( ), p =.0621 dσ u01 = ( ), p =.2194 D 01 = = 5 q = 2 Wänström (Linköpings universitet) HIERARKISKA DATA November 35 / 59

36 Varianskomponent-modell med kön (individnivå) och teacher experience (klassnivå) - xa e ekter Vi har kvar kön som x och lägger till teacher experience ( x) popularity ij = β 0j + β 1 sex ij + ɛ ij β 0j = β 0 + β 2 tex j + u 0j popularity ij = β 0 + β 1 sex ij + β 2 tex j + u 0j + ɛ 0ij ɛ 0ij N(0, σ 2 e) u 0j N(0, σ 2 u0 ) Wänström (Linköpings universitet) HIERARKISKA DATA November 36 / 59

37 Varianskomponent-modell med kön (individnivå) och teacher experience (klassnivå) - xa e ekter SAS proc mixed data=popdata covtest; class class; model popular = Csex Ctexp/ solution; random intercept / subject=class type=un; run; Wänström (Linköpings universitet) HIERARKISKA DATA November 37 / 59

38 Covariance Parameter Estimates Standard Z Cov Parm Subject Estimate Error Value Pr > Z UN(1,1) class <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Standard Effect Estimate Error DF t Value Pr > t Intercept <.0001 Csex <.0001 Ctexp <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA November 38 / 59

39 Resultat: skattning och test av parametrar cβ 0 = ( ), p <.0001 cβ 1 = ( ), p <.0001 cβ 2 = ( ), p <.0001 cσ 2 e = ( ), p <.0001 cσ 2 u0 = ( ), p <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA November 39 / 59

40 Varianskomponent-modell med kön (individnivå), teacher experience (klassnivå) och extraversion (individnivå) - xa e ekter popularity ij = β 0j + β 1 sex ij + +β 3 extra ij + ɛ ij β 0j = β 0 + β 2 tex j + u 0j popularity ij = β 0 + β 1 sex ij + β 2 tex j + β 3 extra ij + u 0j + ɛ ij ɛ ij N(0, σ 2 e) u 0j N(0, σ 2 u0 ) Wänström (Linköpings universitet) HIERARKISKA DATA November 40 / 59

41 Varianskomponent-modell med kön (individnivå), teacher experience (klassnivå) och extraversion (individnivå) - xa e ekter SAS proc mixed data=popdata covtest; class class; model popular = Csex Ctexp Cextrav/ solution; random intercept / subject=class type=un; run; Wänström (Linköpings universitet) HIERARKISKA DATA November 41 / 59

42 Covariance Parameter Estimates Standard Z Cov Parm Subject Estimate Error Value Pr > Z UN(1,1) class <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Standard Effect Estimate Error DF t Value Pr > t Intercept <.0001 Csex <.0001 Ctexp <.0001 Cextrav <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA November 42 / 59

43 Resultat: skattning och test av parametrar cβ 0 = ( ), p <.0001 cβ 1 = ( ), p <.0001 cβ 2 = ( ), p <.0001 cβ 3 = ( ), p <.0001 cσ 2 e = ( ), p <.0001 cσ 2 u0 = ( ), p <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA November 43 / 59

44 Multilevel-modell med kön, teacher experience och extraversion (random) Vi lägger till en random e ekt av extraversion popularity ij = β 0j + β 1 sex ij + β 3j extra ij + ɛ ij β 0j = β 0 + β 2 tex j + u 0j β 3j = β 3 + u 3j popularity ij = β 0 + β 2 tex j + u 0j + β 1 sex ij + β 3 extra ij + u 3j extra ij + ɛ ij ɛ ij N 0, σ 2 e u0j 0 N 0 u 3j σ 2, u0 σ u30 σ u03 σ 2 u3 Wänström (Linköpings universitet) HIERARKISKA DATA November 44 / 59

45 Multilevel-modell med kön, teacher experience och extraversion (slumpmässig) SAS proc mixed data=popdata covtest; class class; model popular = Csex Ctexp Cextrav/ solution; random intercept Cextrav / subject=class type=un; run; Wänström (Linköpings universitet) HIERARKISKA DATA November 45 / 59

46 Covariance Parameter Estimates Standard Z Cov Parm Subject Estimate Error Value Pr Z UN(1,1) class <.0001 UN(2,1) class UN(2,2) class <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Standard Effect Estimate Error DF t Value Pr > t Intercept <.0001 Csex <.0001 Ctexp <.0001 Cextrav <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA November 46 / 59

47 Resultat: skattning och test av parametrar cβ 0 = ( ), p <.0001 cβ 1 = ( ), p <.0001 cβ 2 = ( ), p <.0001 cβ 3 = ( ), p <.0001 cσ 2 e = ( ), p <.0001 cσ 2 u0 = ( ), p <.0001 cσ 2 u3 = ( ), p <.0001 dσ u03 = ( ), p =.6879 D 01 = = 50.2 q = 2 Wänström (Linköpings universitet) HIERARKISKA DATA November 47 / 59

48 Multilevel-modell med kön, teacher experience och extraversion (random) och interaktion popularity ij = β 0j + β 1 sex ij + β 3j extra ij + ɛ ij β 0j = β 0 + β 2 tex j + u 0j β 3j = β 3 + +β 4 tex j + u 3j popularity ij = β 0 + β 1 sex ij + β 2 tex j + β 3 extra ij + β 4 tex j extra ij + u 0j + u 3j extra ij + +ɛ ij ɛ ij N 0, σ 2 e u0j 0 N u 3j 0, σ 2 u0 σ u03 σ u30 σ 2 u3 Wänström (Linköpings universitet) HIERARKISKA DATA November 48 / 59

49 Multilevel-modell med kön, teacher experience och extraversion (slumpmässig) och interaktion SAS proc mixed data=popdata covtest; class class; model popular = Csex Ctexp Cextrav Ctexp*Cextrav/ solution; random intercept Cextrav / subject=class type=un; run; Wänström (Linköpings universitet) HIERARKISKA DATA November 49 / 59

50 Covariance Parameter Estimates Standard Z Cov Parm Subject Estimate Error Value Pr Z UN(1,1) class <.0001 UN(2,1) class UN(2,2) class Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Standard Effect Estimate Error DF t Value Pr > t Intercept <.0001 Csex <.0001 Ctexp <.0001 Cextrav <.0001 Ctexp*Cextrav <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA November 50 / 59

51 Resultat: skattning och test av parametrar cβ 0 = ( ), p <.0001 cβ 1 = ( ), p <.0001 cβ 2 = ( ), p <.0001 cβ 3 = ( ), p <.0001 cβ 3 = ( ), p <.0001 cσ 2 e = ( ), p <.0001 cσ 2 u0 = ( ), p <.0001 cσ 2 u3 = ( ), p =.1101 dσ u03 = ( ), p =.6531 Wänström (Linköpings universitet) HIERARKISKA DATA November 51 / 59

52 Fler än två nivåer: föregående modeller kan enkelt utvecklas till er nivåer Y ijh = β 0jh + β 1jh x ijh + ɛ ijh β 0jh = β 0h + u 0jh β 1jh = β 1h + u 1jh β 0h = β 0 + v 0h β 1h = β 1 + v 1h ijh är tex i:te eleven i j:te klassen i h:te skolan Y ijh = β 0 + β 1 x ijh + v 0h + v 1h x ijh + u 0jh + u 1jh x ijh + ɛ ijh ɛ ijh N 0, σ 2 e u0jh 0 N u 1jh 0 v0jh 0 N 0 v 1jh σ 2, u0 σ u01 σ u10 σ 2 u1 σ 2 v 0 σ v 01, σ v 10 σ 2 v 1 Wänström (Linköpings universitet) HIERARKISKA DATA November 52 / 59

53 Exempel på SAS-kod 3 nivåer, varianskomponentmodell proc mixed data=popdata2 covtest; class class area; model popular = / solution; random intercept / subject=area; random intercept / subject=class(area); run; Wänström (Linköpings universitet) HIERARKISKA DATA November 53 / 59

54 Exempel: Påverkar syskonstorlek IQ? 3-level-modell (lite andra beteckningar) Piat tij = β 0ij + β 1ij Age tij + β 2 Age 2 tij + β 3 Birth tij + β 4 Father tij + ɛ tij β 0ij = γ 00j + γ 01 Cohort ij + γ 02 Old ij + γ 03 Young ij + r 0ij β 1ij = γ 10j + γ 11 Old ij + γ 12 Young ij + r 1ij γ 00j = π π 001 M.Age j + π 002 M.IQ j + π 003 Race(1) j + π 004 Race(2) j + u 00j γ 10j = π π 101 M.Age j + π 102 M.IQ j + π 103 Race(1) j + π 104 Race(2) j + u 10j tij är t:te tidpunkten för i:te barnet i j:te familjen PIAT = Peabody Individual Achievement Test, M = PIAT math, RR = PIAT reading recognition, RC = PIAT reading comprehension, CONS=constant, OLD = number of siblings at birth, YOUNG = number of additional siblings at age 5, BIRTH = number of children born since age 5, M.AGE = maternal age at birth of first child, M.IQ = maternal IQ, RACE(1) = mother Hispanic (1) or not (0), RACE (2) = mother Black (1) or not (0), FATHER = father present in household. Wänström (Linköpings universitet) HIERARKISKA DATA November 54 / 59

55 Exempel: Påverkar syskonstorlek IQ? Antaganden ɛ tij N 0, σ 2 e r0ij 0 N r 1ij 0 u00j 0 N 0 u 10j σ 2, r 0 σ r 01 σ r 10 σ 2 r 1 σ 2 u0, σ u10 σ u01 σ 2 u1 Wänström (Linköpings universitet) HIERARKISKA DATA November 55 / 59

56 Resultat Table 10. Model IV: Sibship size regression slopes from longitudinal multilevel regression models controlling for AGE, AGE 2, COHORT, and family variables by PIAT score. Effects M RR RC N family =3616 N child =7787 N family =3612 N child =7776 N family = 3604 N child =7747 CONS (0.20)*** (0.25)*** (0.21)*** AGE 0.50 (0.003)*** 0.54 (0.004)*** 0.47 (0.003)*** AGE ( )*** ( )*** ( )*** COHORT 0.11 (0.02)*** 0.13 (0.03)*** 0.06 (0.02)** Sibship size OLD 0.57 (0.11)*** 1.05 (0.13)*** 1.24 (0.11)*** YOUNG 0.56 (0.11)*** 0.36 (0.14)** 0.49 (0.12)*** BIRTH 0.32 (0.12)** 0.16 (0.14) 0.23 (0.13) Wänström (Linköpings universitet) HIERARKISKA DATA November 56 / 59

57 Resultat forts. Family variables M.AGE 0.13 (0.03)*** 0.10 (0.04)** 0.05 (0.03) M.IQ 0.11 (0.004)*** 0.12 (0.005)*** 0.11 (0.004)*** RACE(1) 1.08 (0.25)*** 0.65 (0.32)* 0.12 (0.26) RACE(2) 1.84 (0.23)*** 0.19 (0.30) 0.48 (0.24)* FATHER 0.14 (0.14) 0.60 (0.14)*** 0.54 (0.14)*** Interactions OLD.AGE (0.002) (0.002)* 0.01 (0.002)*** YOUNG.AGE (0.002) (0.003) (0.002) M.AGE.AGE (0.0004)*** (0.0005)** (0.0004) M.IQ.AGE ( )*** ( )*** ( )*** RACE(1).AGE (0.004) 0.02 (0.006)*** (0.005) RACE(2).AGE 0.02 (0.004)*** 0.04 (0.005)*** 0.05 (0.004)*** Wänström (Linköpings universitet) HIERARKISKA DATA November 57 / 59

58 Resultat forts. Residuals 2 σ (0.60)*** (0.73)*** (0.62)*** r 0 σ 0.11 h 0.37 h 0.13 h r 0 r 1 2 σ (0.0002)*** (0.0003)*** (0.0003)*** r 1 2 σ (0.68)*** (1.10)*** (0.72)*** u 0 σ 0.13 (0.008)*** 0.28 (0.01)*** 0.17 (0.009)*** u 0 u 1 2 σ (0.0002)*** (0.0003)*** (0.0002)*** u (0.40)*** (0.39)*** σ (0.46)*** ε 2lnL Note. ***p<.001, ** p<.01, * p<.05 Wänström (Linköpings universitet) HIERARKISKA DATA November 58 / 59

59 Några Datorprogram HLM MLWin SAS R M-plus Wänström (Linköpings universitet) HIERARKISKA DATA November 59 / 59

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA HIERARKISKA DATA Linda Wänström Linköpings universitet 25 November Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 1 / 53 Regressionsmodell för icke-hierarkiska

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 9 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 1 / 43 Longitudinella data

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 1 / 56 Longitudinella data Tvärsnittsdata Flera

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 1 / 66 Longitudinella data Tvärsnittsdata Flera

Läs mer

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; (2) Mixed effect models; (3)

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; () Mixed effect models; (3)

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

Multivariata metoder

Multivariata metoder Multivariata metoder F5 Linda Wänström Linköpings universitet 1 oktober Wänström (Linköpings universitet) Multivariata metoder 1 oktober 1 / 18 Kanonisk korrelationsanalys Syfte: Undersöka om en grupp

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 12 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 December 1 / 12 Explorativ Faktoranalys

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström October 31, 2010 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels 7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: Betygsgränser: 732G21 Sambandsmodeller 2009-01-14,

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1. En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar

Läs mer

Lösningar till SPSS-övning: Analytisk statistik

Lösningar till SPSS-övning: Analytisk statistik UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström April 8, 2011 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,

Läs mer

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

Statistiska Institutionen Gebrenegus Ghilagaber (docent) Statistiska Institutionen Gebrenegus Ghilagaber (docent) Lösningsförslag till skriftlig tentamen i FINANSIELL STATISTIK, grundnivå, 7,5 hp, VT09. Onsdagen 3 juni 2009-1 Sannolkhetslära Mobiltelefoner tillverkas

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Multivariata metoder

Multivariata metoder Multivariata metoder F3 Linda Wänström Linköpings universitet 17 september Wänström (Linköpings universitet) Multivariata metoder 17 september 1 / 21 Principalkomponentanalys Syfte med principalkomponentanalys

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan och att en inblandning mellan 10% och 40% är bra. För att

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F3 1 / 21 Interaktion Ibland ser sambandet mellan en

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Mälardalens Högskola. Formelsamling. Statistik, grundkurs Mälardalens Högskola Formelsamling Statistik, grundkurs Höstterminen 2015 Deskriptiv statistik Populationens medelvärde (population mean): μ = X N Urvalets medelvärde (sample mean): X = X n Där N är storleken

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet November 6, 2013 Wänström (Linköpings universitet) F3 November 6, 2013 1 / 22 Interaktion

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65 Formel- och tabellsamling i matematisk statistik Martin Singull Innehåll 4.1 Multipel regression.............................. 15 1 Sannolikhetslära 7 1.1 Några diskreta fördelningar.........................

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2018-05-31 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA Statistiska tester bygger alltid på vissa antaganden. Är feltermen homoskedastisk? Är den normalfördelad? Dessa antaganden är faktiskt aldrig uppfyllda i praktiken,

Läs mer

Kurskod: TAMS24 / Provkod: TEN (8:00-12:00) English Version

Kurskod: TAMS24 / Provkod: TEN (8:00-12:00) English Version Kurskod: TAMS24 / Provkod: TEN 25-8-7 (8: - 2:) Examinator/Examiner: Xiangfeng Yang (Tel: 7 2234765). Please answer in ENGLISH if you can. a. You are permitted to bring: a calculator; formel -och tabellsamling

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för: Datorövning 5 Statistisk teori med tillämpningar Hypotestest i SAS Syfte Lära sig beräkna konfidensintervall och utföra hypotestest för: 1. Populationsmedelvärdet, µ. 2. Skillnaden mellan två populationsmedelvärden,

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Tentamen för kursen. Linjära statistiska modeller. 13 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 13 januari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA

STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Mattias Villani Statistik Institutionen för Datavetenskap Linköpings Universitet MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 1 / 44 MOMENTETS

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4. Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student)

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2018-10-12 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan

Läs mer

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera

Läs mer

TENTAMEN I MATEMATISK STATISTIK

TENTAMEN I MATEMATISK STATISTIK UMEÅ UNIVERSITET Institutionen för matematisk statistik Regressions- och variansanalys, 5 poäng MSTA35 Leif Nilsson TENTAMEN 2003-01-10 TENTAMEN I MATEMATISK STATISTIK Regressions- och variansanalys, 5

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. PANELDATA Poolade data över tiden och över tvärsnittet Alternativ 1: Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. Oberoende stickprov dragna från stora populationer vid olika tidpunkter.

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2017-06-01 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE30 Sannolikhet, statistik och risk 207-08-5 kl. 8:30-3:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 03-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14 STOCKHOLMS UNIVERSITET MT 5001 MATEMATISKA INSTITUTIONEN TENTAMEN Avd. Matematisk statistik 13 januari 2014 Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14 Examinator: Martin Sköld, tel.

Läs mer

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum Examiner Linus Carlsson 016-01-07 3 hours In English Exam (TEN) Probability theory and statistical inference MAA137 Aids: Collection of Formulas, Concepts and Tables Pocket calculator This exam consists

Läs mer

Samband mellan elevers motivationer och åskådarbeteenden vid mobbningssituationer. - En jämförelse av resultat från multilevel- och faktoranalyser

Samband mellan elevers motivationer och åskådarbeteenden vid mobbningssituationer. - En jämförelse av resultat från multilevel- och faktoranalyser Linköpings universitet Institutionen för datavetenskap Kandidatuppsats, 5 hp Statistik Vårterminen 7 LIU-IDA/STAT-G--7/6--SE Samband mellan elevers motivationer och åskådarbeteenden vid mobbningssituationer.

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Tentamen för kursen. Linjära statistiska modeller. 17 februari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 17 februari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312,

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Uppsala universitet Statistiska institutionen A5 2014-08-26 Tentamen Tillämpad statistik A5 (15hp) 2014-08-26 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

Formler och tabeller till kursen MSG830

Formler och tabeller till kursen MSG830 Formler och tabeller till kursen MSG830 Deskriptiva mått För ett datamängd x 1,, x n denieras medelvärde standardavvikelse standardfelet (SEM) Sannolikheter x = 1 n n i=1 = x 1 + + x n n s = 1 n (x i x)

Läs mer

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 3 Bertil Wegmann IDA, Linköpings universitet November 4, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 4, 2015 1 / 22 Kap. 4.8, interaktionsvariabler Ibland

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 5 June 217, 14:-18: Examiner: Zhenxia Liu (Tel: 7 89528). Please answer in ENGLISH if you can. a. You are allowed to use a calculator, the formula and

Läs mer

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner. Försättsblad KOD: Kurskod: PC1546 Kursnamn: Forskningsmetodik och fördjupningsarbete Provmoment: Statistik, 5 hp Ansvarig lärare: Sara Landström & Pär Bjälkebring Tentamensdatum: 10/1-2015 Tillåtna hjälpmedel:

Läs mer

Multilevel Modeling med SPSS Kimmo Sorjonen ( )

Multilevel Modeling med SPSS Kimmo Sorjonen ( ) 1 Multilevel Modeling med SPSS Kimmo Sorjonen (2012-01-21) 1. Tvärsnittsdata, Två nivåer 1.i Variabler Data simulerar de som använts i följande studie (se Appendix A och Appendix B): Andersen, R., & van

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE30 Sannolikhet, statistik och risk 207-06-0 kl. 8:30-3:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 03-7725348 Hjälpmedel: Valfri miniräknare.

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Tentamen för kursen. Linjära statistiska modeller. 27 oktober STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 27 oktober 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Examinationsuppgifter del 2

Examinationsuppgifter del 2 UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 11 Johan Lindström 13 november 2018 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 1/25 Repetition Stickprov & Skattning Maximum likelihood

Läs mer

Ht Patientupplevd vårdkvalité utifrån. olika bakgrunder. Författare: Åsa Hjort Hedenberg

Ht Patientupplevd vårdkvalité utifrån. olika bakgrunder. Författare: Åsa Hjort Hedenberg Patientupplevd vårdkvalité utifrån olika bakgrunder Författare: Åsa Hjort Hedenberg Ht 2013 Det är vår egen upplevelse av vår hälsa och vår ålder som har störst betydelse för vad vi tycker om vårdkvalitén.

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Tentamen Tillämpad statistik A5 (15hp) 2016-02-13 Statistiska institutionen, Uppsala universitet Upplysningar 1. Tillåtna hjälpmedel: Miniräknare, A4/A8 Tabell- och formelsamling (alternativ Statistik

Läs mer

Bayesiansk statistik, 732g43, 7.5 hp

Bayesiansk statistik, 732g43, 7.5 hp Bayesiansk statistik, 732g43, 7.5 hp Moment 2 - Linjär regressionsanalys Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA, LiU) Bayesiansk statistik 1 / 29 Översikt moment 2: linjär

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig

Läs mer

Sannolikhetsteori. Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik,

Sannolikhetsteori. Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik, Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik, 5p. Tid: Torsdagen den 22 december, 2006 kl 14.00-18.00 i M-huset. Examinator: Olle Nerman, tel 7723565. Jour: Alexandra

Läs mer

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.

Läs mer

English Version. Number of sold cakes Number of days

English Version. Number of sold cakes Number of days Kurskod: TAMS24 (Statistisk teori / Provkod: TEN 206-0-04 (kl. 8-2 Examinator/Examiner: Xiangfeng Yang (Tel: 070 089666. Please answer in ENGLISH if you can. a. You are permitted to bring: a calculator;

Läs mer

Tentamen MVE302 Sannolikhet och statistik

Tentamen MVE302 Sannolikhet och statistik Tentamen MVE302 Sannolikhet och statistik 2019-06-05 kl. 8:30-12:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Oskar Allerbo, telefon: 031-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

10.1 Enkel linjär regression

10.1 Enkel linjär regression Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot

Läs mer

Skrivning i ekonometri lördagen den 29 mars 2008

Skrivning i ekonometri lördagen den 29 mars 2008 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan

Läs mer

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod: Forskningsmetod 6,0 högskolepoäng Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod: 11OP90/TE01 samt 11PS30/TE01 Tentamen ges för: OPUS kull H12 termin 5 inriktning Psykologi samt fristående grundkurs

Läs mer

Föreläsning 12: Linjär regression

Föreläsning 12: Linjär regression Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera

Läs mer

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Vi har en ursprungspopulation/-fördelning med medelvärde µ. P-värde P=probability Sannolikhetsvärde som är resultat av en statistisk test. Anger sannolikheten för att göra den observation vi har gjort eller ett sämre / mer extremt utfall om H 0 är sann. Vi har

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE31 Sannolikhet, statistik och risk 218-5-31 kl. 8:3-13:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar ICKE-LINJÄRA MODELLER Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Y i = 1 + 2 X 2i + u i Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar cov(x i,u i )

Läs mer

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs TE/RC Datorövning 6 Syfte: 1. Lära sig utföra godness of fit-test 2. Lära sig utföra test av homogenitet 3. Lära sig utföra prövning av hypoteser

Läs mer

FACIT!!! (bara facit,

FACIT!!! (bara facit, STOCKHOLMS UNIVERSITET Psykologiska institutionen Psykologi III, VT 2012. Fristående kurs FACIT!!! (bara facit, inga tolkningar) Skrivning i Psykologi III metod, fristående kurs: Metod och Statistik avsnitt

Läs mer

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner. Försättsblad KOD: Kurskod: PC1307/PC1546 Kursnamn: Kurs 7: Samhällsvetenskaplig forskningsmetodik/ Forskningsmetodik och fördjupningsarbete Provmoment: Statistik, 5 hp Ansvarig lärare: Sara Landström Tentamensdatum:

Läs mer

Skrivning i ekonometri lördagen den 25 augusti 2007

Skrivning i ekonometri lördagen den 25 augusti 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA10:3 Skrivning i ekonometri lördagen den 5 augusti 007 1. Vi vill undersöka hur variationen i ölförsäljningen i ett bryggeri i en stad i USA

Läs mer

TAMS79 / TAMS65 - vt TAMS79 / TAMS65 - vt Formel- och tabellsamling i matematisk statistik. TAMS79 / TAMS65 - vt 2013.

TAMS79 / TAMS65 - vt TAMS79 / TAMS65 - vt Formel- och tabellsamling i matematisk statistik. TAMS79 / TAMS65 - vt 2013. Formel- och tabellsamling i matematisk statistik c Martin Singull 2 Innehåll 3.3 Tukey s metod för parvisa jämförelser.................... 14 1 Sannolikhetslära 5 1.1 Några diskreta fördelningar.........................

Läs mer

Bayesiansk statistik, 732g43, 7.5 hp

Bayesiansk statistik, 732g43, 7.5 hp Bayesiansk statistik, 732g43, 7.5 hp Moment 4 - Logistisk regression, Binomialregression, Poissonregression, Multilevelmodeller Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA,

Läs mer