STATISTISK ANALYS AV KOMPLEXA DATA

Storlek: px
Starta visningen från sidan:

Download "STATISTISK ANALYS AV KOMPLEXA DATA"

Transkript

1 STATISTISK ANALYS AV KOMPLEXA DATA HIERARKISKA DATA Linda Wänström Linköpings universitet 25 November Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 1 / 53

2 Regressionsmodell för icke-hierarkiska data (repetition) Antag att vi observerar n oberoende värden y 1,..., y n och vill förklara dem med n värden på p förklarande variabler x 11,...x 1p, x 21,..., x 2p, x n1,..., x np. Standardregressionsmodellen är, för individ i, y i = β 0 + β 1 x i β p x ip + ɛ i där ɛ i N(0, σ 2 ɛ). I matrisform kan modellen skrivas som där e N(0, σ 2 ɛi). Y = Xβ + e Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 2 / 53

3 Hierarkiska data Hierarkiska data, "Clustered" data, fler-nivå data, grupperade data Enheter grupperade i olika nivåer Vi har ett urval av skolor - inom varje skola har vi ett antal klasser - inom varje klass har vi ett urval av elever Nivå 1: elever Nivå 2: klasser Nivå 3: skolor Vi har ett urval av familjer - inom varje familj undersöker vi alla/några barn Nivå 1: barn Nivå 2: familjer Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 3 / 53

4 Exempel: Samband mellan medelbetyg och poäng på prov Inritad regressionslinje Score Grade 4 5 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 4 / 53

5 Exempel: Samband mellan medelbetyg och poäng på prov Inritad regressionslinje för varje skola School Score Grade 4 5 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 5 / 53

6 Varför ska vi ta hänsyn till den hierarkiska strukturen på data? Vi kan väl bara använda den lägsta nivån (tex elev) som enhet och använda vanliga analysmetoder? Eller - vi kan väl använda den högre nivån (tex klass / skola) som enhet och använda vanliga metoder? Individer (observationer) inom en grupp tenderar att vara lika varandra Familjer: syskon (samma föräldrar, samma miljöpåverkan) Skolor: klasser: elever (påverkar varandra, mer lika från början?) Ignorerar vi grupperingar kan vi missa viktiga gruppeffekter Ignorerar vi korrelationen mellan observationer inom grupper får vi missvisande skattningar på varianser Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 6 / 53

7 Exempel: Studie om läsinlärning i skolan (Bennet, 1976) Slutsats: Barn som lär sig läsa enligt den "traditionella tekniken" lär sig fortare än de som inte gör det Multipel regressionsmodell med elever som enheter (inga grupperingar) Statistisk signifikant skillnad Aitkin et el (1981) analyserade om datamaterialet och tog hänsyn till att eleverna var grupperade i klasser Inte längre statistiskt signifikant skillnad Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 7 / 53

8 Exempel: Mean PIAT Scores Data från Rodgers, J.L., Cleveland, H.H., van den Oord, E., & Rowe, D.C. (2000). Resolving the debate over birth order, family size and intelligence. American Psychologist, 55, Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 8 / 53

9 Mean Piat Score uppdelat på familjestorlek Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 9 / 53

10 Fixed effects modeller Definiera dummyvariabler för att skatta skillnader mellan skolor, klasser, familjer... Detta fungerar om vi har ett mindre antal skolor, klasser, familjer... och endast vill generalisera till dem Vill vi generalisera resultaten till ett större antal skolor, klasser, familjer - använd inte fixed effects modeller Fungerar inte heller bra om vi har få observationer (tex elever) i några av grupperna (tex klasser) Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 10 / 53

11 General linear mixed model Multilevel model (Goldstein) Hierarchical linear model (Raudenbush & Bryk) Variance component model (Longford) Random coeffi cient model (De Leeuw & Kreft, Longford) Random effects model, mixed effects model etc... Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 11 / 53

12 Notation Antag att vi har ett urval av klasser - inom varje klass har vi ett urval av elever där vi har observerat en respons. För den j:te klassen kan vi skriva responsvektorn y j1 Y j = y j2..., j = 1, 2,..., n y jkj där n är antalet klasser och k j är antalet elever i klass j. Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 12 / 53

13 Har vi även observerat oberoende variabler kan vi skriva Klass(j) Elev(i) y ij x ij1 x ij2... x ijp 1 1 y 11 x 111 x x 11p 1 2 y 21 x 211 x x 21p k 1 y k1 1 x k1 11 x k x k1 1p j 1 y 1j x 1j1 x 1j2... x 1jp j 2 y 2j x 2j1 x 2j2... x 2jp j k j y kj j x kj j1 x kj j2... x kj jp n 1 y 1n x 1n1 x 1n2... x 1np n 2 y 2n x 2n1 x 2n2... x 2np n k n y kn n x kn n1 x kn n2... x kn np Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 13 / 53

14 General linear mixed model (GLMM) Y = Xβ + Zu + e e N (0, R) u N (0, G) Cov [u, e] = 0 Modellens parametrar består av fixa effekter i vektorn β och alla okända parametrar i matriserna G och R. De slumpmässiga effekterna u och e är inte parametrar utan består av slumpmässiga variabler. Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 14 / 53

15 General linear mixed model Betingade fördelningen Y u och marginalfödelningen för Y är Y u N (Xβ + Zu, R) Y N (Xβ, V) V = Var [Y] = ZGZ + R Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 15 / 53

16 Skattning av parametrar 2LL för GLMM är 2l(θ, β; y) = log V + (y Xβ) V 1 (y Xβ) + c ML-skattningen av fix effekt-parametrarna är ( θ) 1 β = (X V( θ) 1 X) 1 X V y Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 16 / 53

17 Skattning av parametrar Vid känd varians V är GLS-skattning av fixa parametrar β = (X T V 1 X) 1 X T V 1 y V( β) = (X T V 1 X) 1 Vanliga startvärden för fixa parametrar: OLS Vektor med residualer skapas, och används för att uttryckas som funktion av varianser för slumptermerna och dessa skattas (krävs att dessa är normalfördelade) Skattad V används för att ta fram nya GLS-skattningar, och nya varianser för slumptermerna skattas osv till konvergens Om slumptermerna (residualerna) är normalfördelade är skattningarna ML-skattningar Skattningarna för varianserna för slumptermerna är inte VVR (tar inte hänsyn till samplingvariation av fixa parametrar) En modifikation ger REML - VVR skattningar (används i SAS) Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 17 / 53

18 Multilevelmodell - enklaste fallet: Varianskomponentmodell y ij = β 0j + ɛ ij β 0j = β 0 + u 0j y ij = β 0 + u 0j + ɛ ij y ij = (β 0 ) + (u 0j + ɛ ij ) ɛ ij N ( 0, σ 2 ) e u 0j N ( 0, σ 2 ) u0 En fix (intercept) och två slumpmässiga parametrar (två varianser) att skatta Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 18 / 53

19 Multilevelmodell: Varianskomponentmodell y ij = β 0 + (u 0j + ɛ ij ) ɛ ij N ( 0, σ 2 ) e u 0j N ( 0, σ 2 ) u0 var(y ij ) = var(u 0j + ɛ ij ) = σ 2 u0 + σ2 e cov(y 1j, y 2j ) = cov(u 0j + ɛ 1j, u 0j + ɛ 2j ) = σ 2 u0 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 19 / 53

20 Intraklass-korrelation Varianskomponentmodell ρ = σ2 u0 σ 2 u0 +σ2 e Andelen av variationen som är mellan grupper (klasser) Om den är större än noll bör vi inte använda vanliga metoder (som tex OLS) som inte tar hänsyn till varianser på flera nivåer Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 20 / 53

21 Multilevelmodell: "random coeffi cent"-modell y ij = β 0j + β 1j x ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j y ij = β 0 + u 0j + β 1 x ij + u 1j x ij + ɛ ij y ij = (β 0 + β 1 x ij ) + (u 0j + u 1j x ij + ɛ ij ) ɛ ij N ( 0, σ 2 ) [ ] e([ u0j 0 N 0 u 1j ] [ σ 2, u0 σ u01 σ u10 σ 2 u1 Två fixa (intercept och slope) och fyra slumpmässiga parametrar (tre varianser och en kovarians) att skatta ]) Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 21 / 53

22 Hypotestest Test för fixa parametrar "Vanliga" hypotestest / konfidensintervall baserade på skattningarna och standradavvikleserna för skattningarna från IGLS (REML) Test för slumpmässiga parametrar (varianser och kovarianser) Z-test (vid stora stickprov) Bättre med Likelhood ratio test D 01 = 2LL(λ 0 /λ 1 ) där λ 0, λ 1 är likelihood under noll respektive alternativhypotesen. D 01 är χ 2 fördelad med q frihetsgrader, där q är skillnaden i antalet skattade parametrar under de två modellerna. Vid REML-skattning bör likelihood ratio-testet endast användas vid jämförande av modeller som skiljer sig åt endast genom slumpmässiga parametrar (ej fixa). Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 22 / 53

23 Exempel (data från Hox (2010). Multilevel Analysis) 2000 elever från 100 olika klasser (skolor) Popularity (skala 0-10, elevnivå) Sex (elevnivå) Extraversion (skala 0-10, elevnivå) Teacher experience (År, klassnivå) Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 23 / 53

24 Spridningsdiagram mellan popularity-scores och extraversion för eleverna i de två första klasserna Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 24 / 53

25 Uppdelat på de två klasserna Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 25 / 53

26 Varianskomponent-modell Basmodell popular ij = β 0j + ɛ ij, β 0j = β 0 + u 0j popular ij = β 0 + u 0j + ɛ ij ɛ 0ij N(0, σ 2 e) u 0j N(0, σ 2 u0 ) Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 26 / 53

27 Data Z p Z p p o Z p o C e o p e o p e c p x p t x Z p t x C l u c t t u e t Z t u e t t C O a p o r s e l a r s e l a r e s b s i n a e x a c a e x a c a x e s s l s v x p r h v x p r h v p x Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 27 / 53

28 Varianskomponent-modell SAS proc mixed data=popdata covtest; class class; model popular= /solution; random intercept / subject=class; run; Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 28 / 53

29 The Mixed Procedure Model Information Data Set Dependent Variable Covariance Structure Subject Effect Estimation Method Residual Variance Method Fixed Effects SE Method Degrees of Freedom Method WORK.POPDATA popular Variance Components class REML Profile Model Based Containment Class Level Information Class Levels Values class Dimensions Covariance Parameters 2 Columns in X 1 Columns in Z Per Subject 1 Subjects 100 Max Obs Per Subject 26 Number of Observations Number of Observations Read 2000 Number of Observations Used 2000 Number of Observations Not Used 0 Iteration History Iteration Evaluations 2 Res Log Like Criterion Convergence criteria met. Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 29 / 53

30 Covariance Parameter Estimates Standard Z Cov Parm Subject Estimate Error Value Pr > Z UN(1,1) class <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Standard Effect Estimate Error DF t Value Pr > t Intercept <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 30 / 53

31 Resultat: skattning och test β 0 = ( ), p <.0001 σ 2 e = ( ), p <.0001 σ 2 u0 = (0.1086), p <.0001 Intraklass-korrelation: ρ = = Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 31 / 53

32 Varianskomponent-modell med kön (sex) på individnivå - fix effekt Vi lägger till kön (sex) som fix effekt popularity ij = β 0j + β 1 sex ij + ɛ ij β 0j = β 0 + u 0j popularity ij = β 0 + u 0j + β 1 sex ij + ɛ ij ɛ 0ij N(0, σ 2 e) u 0j N(0, σ 2 u0 ) Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 32 / 53

33 Varianskomponent-modell med kön (sex) på individnivå - fix effekt SAS proc mixed data=popdata covtest; class class; model popular = Csex / solution; random intercept / subject=class; run; Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 33 / 53

34 Covariance Parameter Estimates Standard Z Cov Parm Subject Estimate Error Value Pr > Z UN(1,1) class <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Standard Effect Estimate Error DF t Value Pr > t Intercept <.0001 Csex <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 34 / 53

35 Resultat: skattning och test β 0 = ( ), p <.0001 β 1 = ( ), p <.0001 σ 2 e = ( ), p <.0001 σ 2 u0 = ( ), p <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 35 / 53

36 Multilevel-modell med kön (sex) på individnivå - fix och slumpmässig effekt Vi lägger till kön (sex) också som slumpmässig effekt popularity ij = β 0j + β 1j sex ij + ɛ ij β 0j = β 0 + u 0j β 1j = β 1 + u 1j popularity ij = β 0 + u 0j + β 1 sex ij + u 1j sex ij + ɛ ij ɛ ij N ( 0, σ 2 ) [ ] e([ u0j 0 N 0 u 1j ] [ σ 2, u0 σ u01 σ u10 σ 2 u1 ]) Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 36 / 53

37 Multilevel-modell med kön (sex) på individnivå - fix och slumpmässig effekt SAS proc mixed data=popdata covtest; class class; model popular = Csex / solution; random intercept Csex/ subject=class type=un; run; Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 37 / 53

38 Covariance Parameter Estimates Standard Cov Parm Subject Estimate Error Value Pr Z Z UN(1,1) class <.0001 UN(2,1) class UN(2,2) class Covariance Parameter Estimates Standard Cov Parm Subject Estimate Error Value Pr Z Z Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Standard Effect Estimate Error DF t Value Pr > t Intercept <.0001 Csex <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 38 / 53

39 Resultat: skattning och test β 0 = ( ), p <.0001 β 1 = ( ), p <.0001 σ 2 e = ( ), p <.0001 σ 2 u0 = ( ), p <.0001 σ 2 u1 = ( ), p =.0621 σ u01 = ( ), p =.2194 D 01 = = 5 q = 2 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 39 / 53

40 Varianskomponent-modell med individnivåvariabler - fixa effekter Vi lägger till extraversion som fix effekt popularity ij = β 0j + β 1 sex ij + β 2 extra ij + ɛ ij β 0j = β 0 + u 0j popularity ij = β 0 + u 0j + β 1 sex ij + β 2 extra ij + ɛ ij ɛ 0ij N(0, σ 2 e) u 0j N(0, σ 2 u0 ) Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 40 / 53

41 Varianskomponent-modell med individnivåvariabler - fixa effekter SAS proc mixed data=popdata covtest; class class; model popular = Csex Cextrav / solution; random intercept / subject=class; run; Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 41 / 53

42 Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr > Z UN(1,1) class <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 Csex <.0001 Cextrav <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 42 / 53

43 Resultat: skattning och test β 0 = ( ), p <.0001 β 1 = ( ), p <.0001 β 2 = ( ), p <.0001 σ 2 e = ( ), p <.0001 σ 2 u0 = ( ), p <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 43 / 53

44 Multilevel-modell med individnivåvariabler: kön (fix) och extraversion (fix och slumpmässig) Vi lägger till extraversion också som slumpmässig effekt popularity ij = β 0j + β 1 sex ij + β 2j extra ij + ɛ ij β 0j = β 0 + u 0j β 2j = β 2 + u 2j popularity ij = β 0 + u 0j + β 1 sex ij + β 2 extra ij + u 2j extra ij + ɛ ij ɛ ij N ( 0, σ 2 ) [ ] e([ u0j 0 N 0 u 2j ] [ σ 2, u0 σ u02 σ u20 σ 2 u2 ]) Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 44 / 53

45 Multilevel-modell med individnivåvariabler: kön (fix) och extraversion (fix och slumpmässig) SAS proc mixed data=popdata covtest; class class; model popular = Csex Cextrav / solution; random intercept Cextrav/ subject=class type=un; run; Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 45 / 53

46 Covariance Parameter Estimates Cov Parm Subject Estimate Standard Error Z Value Pr Z UN(1,1) class <.0001 UN(2,1) class <.0001 UN(2,2) class <.0001 Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Effect Estimate Standard Error DF t Value Pr > t Intercept <.0001 Csex <.0001 Cextrav <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 46 / 53

47 Resultat: skattning och test β 0 = ( ), p <.0001 β 1 = ( ), p <.0001 β 2 = ( ), p <.0001 σ 2 e = ( ), p <.0001 σ 2 u0 = (0.1020), p <.0001 σ 2 u2 = ( ), p <.0001 σ u02 = ( ), p <.0001 D 01 = = 75.2 q = 2 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 47 / 53

48 Multilevel-modell med individnivåvariabler kön (fix), extraversion (fix, random) och teacher experience (klassnivå) Vi lägger till teacher experience på klassnivå popularity ij = β 0j + β 1 sex ij + β 2j extra ij + ɛ ij β 0j = β 0 + β 3 tex j + u 0j β 2j = β 2 + β 4 tex j + u 2j popularity ij = β 0 + β 3 tex j + u 0j + β 1 sex ij + β 2 extra ij + β 4 tex j extra ij + u 2j extra ij + ɛ ij ɛ ij N ( 0, σ 2 ) [ ] e([ u0j 0 N 0 u 2j ] [ σ 2, u0 σ u02 σ u20 σ 2 u2 ]) Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 48 / 53

49 Multilevel-modell med individnivåvariabler kön (fix), extraversion (fix, random) och teacher experience (klassnivå) SAS proc mixed data=popdata covtest; class class; model popular = Csex Ctexp Cextrav Ctexp*Cextrav/ solution; random intercept Cextrav / subject=class type=un; run; Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 49 / 53

50 Covariance Parameter Estimates Standard Z Cov Parm Subject Estimate Error Value Pr Z UN(1,1) class <.0001 UN(2,1) class UN(2,2) class Residual <.0001 Fit Statistics 2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Null Model Likelihood Ratio Test DF Chi Square Pr > ChiSq <.0001 Solution for Fixed Effects Standard Effect Estimate Error DF t Value Pr > t Intercept <.0001 Csex <.0001 Ctexp <.0001 Cextrav <.0001 Ctexp*Cextrav <.0001 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 50 / 53

51 Resultat: skattning och test av parametrar β 0 = ( ), p <.0001 β 1 = ( ), p <.0001 β 2 = ( ), p <.0001 β 3 = ( ), p <.0001 β 4 = ( ), p <.0001 σ 2 e = ( ), p <.0001 σ 2 u0 = ( ), p <.0001 σ 2 u2 = ( ), p =.1101 σ u02 = ( ), p =.6531 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 51 / 53

52 Fler än två nivåer: föregående modeller kan enkelt utvecklas till fler nivåer Y ijh = β 0jh + β 1jh x ijh + ɛ ijh β 0jh = β 0h + u 0jh β 1jh = β 1h + u 1jh β 0h = β 0 + v 0h β 1h = β 1 + v 1h ijh är tex i:te eleven i j:te klassen i h:te området. y ijh = β 0 + β 1 x ijh + v 0h + v 1h x ijh + u 0jh + u 1jh x ijh + ɛ ijh ɛ ijh N ( 0, σ 2 ) [ ] e([ ] [ ]) u0jh 0 σ 2 N, u0 σ u01 u 1jh 0 σ u10 σ [ ] ([ ] [ 2 u1 ]) v0h 0 σ 2 N, v 0 σ v 01 v 1h 0 σ v 10 σ 2 v 1 Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 52 / 53

53 Exempel på SAS-kod 3 nivåer, varianskomponentmodell proc mixed data=popdata2 covtest; class class area; model popular = / solution; random intercept / subject=area; random intercept / subject=class(area); run; Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 53 / 53

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA HIERARKISKA DATA Linda Wänström Linköpings universitet 14-15 November Wänström (Linköpings universitet) HIERARKISKA DATA 14-15 November 1 / 59 Hierarkiska data Hierarkiska

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 9 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 1 / 43 Longitudinella data

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 1 / 56 Longitudinella data Tvärsnittsdata Flera

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 1 / 66 Longitudinella data Tvärsnittsdata Flera

Läs mer

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; () Mixed effect models; (3)

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 12 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 December 1 / 12 Explorativ Faktoranalys

Läs mer

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; (2) Mixed effect models; (3)

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels 7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2018-05-31 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

Multivariata metoder

Multivariata metoder Multivariata metoder F5 Linda Wänström Linköpings universitet 1 oktober Wänström (Linköpings universitet) Multivariata metoder 1 oktober 1 / 18 Kanonisk korrelationsanalys Syfte: Undersöka om en grupp

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2017-06-01 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: Betygsgränser: 732G21 Sambandsmodeller 2009-01-14,

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE30 Sannolikhet, statistik och risk 207-08-5 kl. 8:30-3:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 03-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2018-10-12 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 11: Mer om jämförelser och inferens Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1. En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström October 31, 2010 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan och att en inblandning mellan 10% och 40% är bra. För att

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE30 Sannolikhet, statistik och risk 207-06-0 kl. 8:30-3:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 03-7725348 Hjälpmedel: Valfri miniräknare.

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för: Datorövning 5 Statistisk teori med tillämpningar Hypotestest i SAS Syfte Lära sig beräkna konfidensintervall och utföra hypotestest för: 1. Populationsmedelvärdet, µ. 2. Skillnaden mellan två populationsmedelvärden,

Läs mer

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. PANELDATA Poolade data över tiden och över tvärsnittet Alternativ 1: Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. Oberoende stickprov dragna från stora populationer vid olika tidpunkter.

Läs mer

Tentamen MVE302 Sannolikhet och statistik

Tentamen MVE302 Sannolikhet och statistik Tentamen MVE302 Sannolikhet och statistik 2019-06-05 kl. 8:30-12:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Oskar Allerbo, telefon: 031-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65 Formel- och tabellsamling i matematisk statistik Martin Singull Innehåll 4.1 Multipel regression.............................. 15 1 Sannolikhetslära 7 1.1 Några diskreta fördelningar.........................

Läs mer

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4. Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student)

Läs mer

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Vi har en ursprungspopulation/-fördelning med medelvärde µ. P-värde P=probability Sannolikhetsvärde som är resultat av en statistisk test. Anger sannolikheten för att göra den observation vi har gjort eller ett sämre / mer extremt utfall om H 0 är sann. Vi har

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA Statistiska tester bygger alltid på vissa antaganden. Är feltermen homoskedastisk? Är den normalfördelad? Dessa antaganden är faktiskt aldrig uppfyllda i praktiken,

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE31 Sannolikhet, statistik och risk 218-5-31 kl. 8:3-13:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet November 6, 2013 Wänström (Linköpings universitet) F3 November 6, 2013 1 / 22 Interaktion

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

Bayesiansk statistik, 732g43, 7.5 hp

Bayesiansk statistik, 732g43, 7.5 hp Bayesiansk statistik, 732g43, 7.5 hp Moment 2 - Linjär regressionsanalys Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA, LiU) Bayesiansk statistik 1 / 29 Översikt moment 2: linjär

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE31 Sannolikhet, statistik och risk 218-1-12 kl. 8:3-13:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström April 8, 2011 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Mälardalens Högskola. Formelsamling. Statistik, grundkurs Mälardalens Högskola Formelsamling Statistik, grundkurs Höstterminen 2015 Deskriptiv statistik Populationens medelvärde (population mean): μ = X N Urvalets medelvärde (sample mean): X = X n Där N är storleken

Läs mer

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F3 1 / 21 Interaktion Ibland ser sambandet mellan en

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14 STOCKHOLMS UNIVERSITET MT 5001 MATEMATISKA INSTITUTIONEN TENTAMEN Avd. Matematisk statistik 13 januari 2014 Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14 Examinator: Martin Sköld, tel.

Läs mer

Kurskod: TAMS24 / Provkod: TEN (8:00-12:00) English Version

Kurskod: TAMS24 / Provkod: TEN (8:00-12:00) English Version Kurskod: TAMS24 / Provkod: TEN 25-8-7 (8: - 2:) Examinator/Examiner: Xiangfeng Yang (Tel: 7 2234765). Please answer in ENGLISH if you can. a. You are permitted to bring: a calculator; formel -och tabellsamling

Läs mer

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 5 June 217, 14:-18: Examiner: Zhenxia Liu (Tel: 7 89528). Please answer in ENGLISH if you can. a. You are allowed to use a calculator, the formula and

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 11 Johan Lindström 13 november 2018 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 1/25 Repetition Stickprov & Skattning Maximum likelihood

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

FÖRELÄSNING 8:

FÖRELÄSNING 8: FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data

Läs mer

Tentamen MVE300 Sannolikhet, statistik och risk

Tentamen MVE300 Sannolikhet, statistik och risk Tentamen MVE300 Sannolikhet, statistik och risk 205-08-8 kl. 8.30-3.30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Johan Jonasson, telefon: 0706-985223 03-7723546 Hjälpmedel:

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Tentamen för kursen. Linjära statistiska modeller. 17 februari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 17 februari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312,

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera

Läs mer

TENTAMEN I MATEMATISK STATISTIK

TENTAMEN I MATEMATISK STATISTIK UMEÅ UNIVERSITET Institutionen för matematisk statistik Regressions- och variansanalys, 5 poäng MSTA35 Leif Nilsson TENTAMEN 2003-01-10 TENTAMEN I MATEMATISK STATISTIK Regressions- och variansanalys, 5

Läs mer

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Stas Volkov Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 1/20 Översikt Exempel Repetition Exempel Matematisk statistik

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA

STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Mattias Villani Statistik Institutionen för Datavetenskap Linköpings Universitet MATTIAS VILLANI (STATISTIK, LIU) LONGITUDINELLA DATA 1 / 44 MOMENTETS

Läs mer

Matematiska Institutionen Silvelyn Zwanzig 13 mar, 2006

Matematiska Institutionen Silvelyn Zwanzig 13 mar, 2006 UPPSALA UNIVERSITET Sannolikhetslära och Statistik Matematiska Institutionen F Silvelyn Zwanzig 3 mar, 006 Tillåtna hjälpmedel: Miniräknare, Formel- och Tabellsamling med egna handskrivna tillägg Skrivtid:5-0.

Läs mer

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner. Försättsblad KOD: Kurskod: PC1546 Kursnamn: Forskningsmetodik och fördjupningsarbete Provmoment: Statistik, 5 hp Ansvarig lärare: Sara Landström & Pär Bjälkebring Tentamensdatum: 10/1-2015 Tillåtna hjälpmedel:

Läs mer

Multilevel Modeling med SPSS Kimmo Sorjonen ( )

Multilevel Modeling med SPSS Kimmo Sorjonen ( ) 1 Multilevel Modeling med SPSS Kimmo Sorjonen (2012-01-21) 1. Tvärsnittsdata, Två nivåer 1.i Variabler Data simulerar de som använts i följande studie (se Appendix A och Appendix B): Andersen, R., & van

Läs mer

Tentamen MVE302 Sannolikhet och statistik

Tentamen MVE302 Sannolikhet och statistik Tentamen MVE32 Sannolikhet och statistik 219-6-5 kl. 8:3-12:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Oskar Allerbo, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Uppsala universitet Statistiska institutionen A5 2014-08-26 Tentamen Tillämpad statistik A5 (15hp) 2014-08-26 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling

Läs mer

Lösningar till SPSS-övning: Analytisk statistik

Lösningar till SPSS-övning: Analytisk statistik UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt

Läs mer

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

Statistiska Institutionen Gebrenegus Ghilagaber (docent) Statistiska Institutionen Gebrenegus Ghilagaber (docent) Lösningsförslag till skriftlig tentamen i FINANSIELL STATISTIK, grundnivå, 7,5 hp, VT09. Onsdagen 3 juni 2009-1 Sannolkhetslära Mobiltelefoner tillverkas

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig

Läs mer

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod: Forskningsmetod 6,0 högskolepoäng Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod: 11OP90/TE01 samt 11PS30/TE01 Tentamen ges för: OPUS kull H12 termin 5 inriktning Psykologi samt fristående grundkurs

Läs mer

Sannolikhetsteori. Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik,

Sannolikhetsteori. Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik, Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik, 5p. Tid: Torsdagen den 22 december, 2006 kl 14.00-18.00 i M-huset. Examinator: Olle Nerman, tel 7723565. Jour: Alexandra

Läs mer

Samband mellan elevers motivationer och åskådarbeteenden vid mobbningssituationer. - En jämförelse av resultat från multilevel- och faktoranalyser

Samband mellan elevers motivationer och åskådarbeteenden vid mobbningssituationer. - En jämförelse av resultat från multilevel- och faktoranalyser Linköpings universitet Institutionen för datavetenskap Kandidatuppsats, 5 hp Statistik Vårterminen 7 LIU-IDA/STAT-G--7/6--SE Samband mellan elevers motivationer och åskådarbeteenden vid mobbningssituationer.

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

Uppgift 1. Produktmomentkorrelationskoefficienten

Uppgift 1. Produktmomentkorrelationskoefficienten Uppgift 1 Produktmomentkorrelationskoefficienten Både Vikt och Längd är variabler på kvotskalan och således kvantitativa variabler. Det innebär att vi inte har så stor nytta av korstabeller om vi vill

Läs mer

3 Maximum Likelihoodestimering

3 Maximum Likelihoodestimering Lund Universitet med Lund Tekniska Högskola Finansiell Statistik Matematikcentrum, Matematisk Statistik VT 2006 Parameterestimation och linjär tidsserieanalys Denna laborationen ger en introduktion till

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Multivariata metoder

Multivariata metoder Multivariata metoder F3 Linda Wänström Linköpings universitet 17 september Wänström (Linköpings universitet) Multivariata metoder 17 september 1 / 21 Principalkomponentanalys Syfte med principalkomponentanalys

Läs mer

ANOVA Mellangruppsdesign

ANOVA Mellangruppsdesign ANOVA Mellangruppsdesign Envägs variansanlays, mellangruppsdesign Variabler En oberoende variabel ( envägs ): Nominalskala eller ordinalskala. Delar in det man undersöker (personerna?) i grupper/kategorier,

Läs mer

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar ICKE-LINJÄRA MODELLER Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Y i = 1 + 2 X 2i + u i Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar cov(x i,u i )

Läs mer

2. Finns samband mellan individbundna faktorer och kontextuella faktorer och skolresultat?

2. Finns samband mellan individbundna faktorer och kontextuella faktorer och skolresultat? 1 Teknisk bilaga till rapport 2018:10 Det är i det lokala man finner komplexiteten - Betydelsen av migrationsbakgrund och socioekonomiska faktorer för skolmisslyckanden 1 Bakgrund Denna rapport är en teknisk

Läs mer

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner. Försättsblad KOD: Kurskod: PC1307/PC1546 Kursnamn: Kurs 7: Samhällsvetenskaplig forskningsmetodik/ Forskningsmetodik och fördjupningsarbete Provmoment: Statistik, 5 hp Ansvarig lärare: Sara Landström Tentamensdatum:

Läs mer

Föreläsning 12: Linjär regression

Föreläsning 12: Linjär regression Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera

Läs mer

Introduktion till statistik för statsvetare

Introduktion till statistik för statsvetare "Det finns inget så praktiskt som en bra teori" November 2011 Bakgrund Introduktion till test Introduktion Formulera lämplig hypotes Bestäm en testvariabel Bestäm en beslutsregel Fatta ett beslut När det

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar

Läs mer

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs TE/RC Datorövning 6 Syfte: 1. Lära sig utföra godness of fit-test 2. Lära sig utföra test av homogenitet 3. Lära sig utföra prövning av hypoteser

Läs mer

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall Anna Lindgren 7+8 november 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 1/19 Stickprov & Skattning Ett

Läs mer

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet Datorövning 3 Statistikens Grunder 2 Syfte 1. Lära sig utföra hypotestest för populationsproportionen 2. Lära sig utföra test för populationsmedelvärdet 3. Lära sig utföra test för skillnaden mellan två

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 22 augusti STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer