UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt vid graviditetens början mellan de kvinnorna var helt fria från ryggbesvär eller hade lindriga besvär och de som hade bekymmersamma eller allvarliga besvär? Vad är nollhypotesen respektive alternativ hypotesen här? Hur tolkar du resultatet av testet? Nollhypotes: Det finns ingen skillnad i medelvikt vid graviditetens början mellan de med lindriga besvär och de med svårare besvär. Alternativ hypotes: Det finns skillnad i medelvikt vid graviditetens början mellan de med lindriga besvär och de med svårare besvär. Group Statistics start of pregnancy (kg) Back pain severity >= 2 < 2 Std. Error N Mean Std. Deviation Mean 87 60,3552,00429,7978 93 58,970 9,27095,9635 Independent Samples Test start of pregnancy (kg) assumed not assumed Levene's Test for Equality of Variances F Sig. t df Sig. (2-tailed) t-test for Equality of Means Mean Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper,385,24,95 78,362,3842,5324 -,6098 4,37039,90 68,626,364,3842,5287 -,6207 4,38858 Tolkning av resultatet: Eftersom p-värdet är så stort, 0.362, (större än 0.05) så kan vi inte förkasta nollhypotesen (på 5%-nivån). Tillsvidare accepterar vi nollhypotesen om att det inte finns någon skillnad.
Uppgift 2 Testa om det är någon skillnad i medelvikt vid graviditetens slut mellan de kvinnorna var helt fria från ryggbesvär eller hade lindriga besvär och de som hade bekymmersamma eller allvarliga besvär? Vad är nollhypotesen respektive alternativ hypotesen här? Hur tolkar du resultatet av testet? Nollhypotes: Det finns ingen skillnad i medelvikt vid graviditetens slut mellan de med lindriga besvär och de med svårare besvär. Alternativ hypotes: Det finns skillnad i medelvikt vid graviditetens slut mellan de med lindriga besvär och de med svårare besvär. Group Statistics end of pregnancy (kg) Back pain severity >= 2 < 2 Std. Error N Mean Std. Deviation Mean 87 72,747,49059,2392 93 69,2785 0,73287,295 end of pregnancy (kg) assumed not assumed Levene's Test for Equality of Variances F Sig. Independent Samples Test t df Sig. (2-tailed) t-test for Equality of Means Mean Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper,659,48,748 78,082 2,8962,65642 -,37253 6,6496,744 74,84,083 2,8962,66020 -,3804 6,7284 Tolkning av resultatet: Eftersom p-värdet är större än 0.05 så kan vi inte förkasta nollhypotesen (på 5%-nivån). Tillsvidare accepterar vi nollhypotesen om att det inte finns någon skillnad. Väljer vi signifikansnivån 0% så kan vi dock förkasta nollhypotsen. Alltså det finns en signifikant skillnad (på 0%-nivån) mellan grupperna avseende slutvikt.
Chi-2-test Uppgift 3 Koda om NOCHLDR i följande grupper Inga barn, Ett barn och Mer än ett barn. Koda om BPSEV i följande grupper Ingen eller lindrig smärta och Bekymmersam eller allvarlig smärta. Namnge variablerna och variabelvärdena. Gör en korstabell med de nya omkodade variablerna. Testa om smärtnivån är beroende av antal barn från tidigare graviditeter. Vad är nollhypotesen respektive alternativ hypotesen här? Hur tolkar du resultatet av testet? Nollhypotes: Grad av ryggbesvär är oberoende av antalet barn sedan tidigare. Alternativ hypotes: Grad av ryggbesvär är beroende av antalet barn sedan tidigare. Case Processing Summary Back pain severity * Number of children Cases Valid Missing Total N Percent N Percent N Percent 80 00,0% 0,0% 80 00,0% Back pain severity * Number of children Crosstabulation Count Back pain severity Total no or "troubleless" pain pain Number of children more than no child one child one child Total 64 9 0 93 37 33 7 87 0 52 27 80 Chi-Square Tests Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases Asymp. Sig. Value df (2-sided) 2,66 a 2,002 2,758 2,002 0,45,00 80 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 3,05. Tolkning av resultatet: Eftersom p-värdet är mindre än 0.05 så förkastas nollhypotesen (på 5%-nivån). Grad av ryggbesvär är beroende av antalet barn sedan tidigare.
Uppgift 4 Klassindela kvinnornas ålder samt gör en korstabell med smärtnivåer. Testa om smärtnivån är beroende av kvinnans ålder. Vad är nollhypotesen här? Hur tolkar du resultatet av testet? Nollhypotes: Grad av ryggbesvär är oberoende av kvinnans ålder. Alternativ hypotes: Grad av ryggbesvär är beroende av kvinnans ålder. Case Processing Summary Back pain severity * AGEGROUP Cases Valid Missing Total N Percent N Percent N Percent 80 00,0% 0,0% 80 00,0% Back pain severity * AGEGROUP Crosstabulation Count Back pain severity Total no or "troubleless" pain pain AGEGROUP younger than older than 25 years 26-30 3-35 35 years Total 56 22 9 6 93 37 3 3 6 87 93 53 22 2 80 Chi-Square Tests Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases Asymp. Sig. Value df (2-sided) 5,944 a 3,4 5,976 3,3 3,034,082 80 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 5,80. Tolkning av resultatet: Eftersom p-värdet är större än 0.05 så kan vi inte förkasta nollhypotesen (på 5%-nivån).
Regressionsanalys Uppgift 5 Skapa en ny variabel som bygger på kvinnornas viktökning. Vilken är den minsta respektive största viktökningen. Gör en regressionsmodell där du försöker förklara de varierande viktökningarna med de andra variablerna, t ex patientens ålder, patientens längd, patientens vikt vid graviditetens början, barnets vikt, antal barn från tidigare graviditeter eller vad du tycker skulle vara relevant. Summary Adjusted Std. Error of R R Square R Square the Estimate,38 a,45,25 5,009 a. Predictors: (Constant), Number of children, Weight of patient at start of pregnancy (kg), Weight of baby (kg), Age Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig. 772,077 4 93,09 7,48,000 a 4553,368 75 26,09 5325,446 79 a. Predictors: (Constant), Number of children, start of pregnancy (kg), Weight of baby (kg), Age b. Dependent Variable: Weight gain under pregnancy (kg) (Constant) Weight of baby (kg) start of pregnancy (kg) Age Number of children a Unstandardized a. Dependent Variable: Weight gain under pregnancy (kg) Standardized B Std. Error Beta t Sig. 5,262 3,249,620,07 3,48,60,366 5,58,000-6,49E-02,038 -,2 -,707,090 3,805E-03,078,004,049,96 -,983,585 -,33 -,679,095 Hur tolkar du de skattade koefficienterna? Koefficienten för vikten på babyn = 3.4. Tolkning: Om barnets vikt ökar med ett kilo ökar mammans viktökning i genomsnitt med 3. kg (jmf med mammor med en baby som är ett kilo lättare) om allt annat (ålder, vikt vid graviditetens början, antalet barn sedan tidigare) är lika.
Koefficienten för startvikten = -0.0649. Tolkning: Om mammans vikt från graviditetens början ökar med ett kilo minskar mammans viktökning med 0.06 kg i genomsnitt (jmf med mammor vars startvikt var ett kilo lättare) om allt annat (ålder, babyns vikt, antalet barn sedan tidigare) är lika. Osv Testa om kofficienterna är skild från noll, dvs om variabeln i fråga förklarar något av variationen i viktökningarna. Kan du ta bort någon variabel från din modell? Hur blir skattningarna nu? En koefficient är signifikant skild från noll: Barnets vikt förklarar (i alla fall en del av) variationen i viktökning mellan kvinnorna. Tar vi bort variabler ändras skattningarna av koefficienterna? Jmf nedan. Om vi inte tar hänsyn till ålder etc som tidigare så ökar viktökningen i genomsnitt 2,9 kg per kilo som babyns vikt ökar, enligt modellen. (Constant) Weight of baby (kg) a Unstandardized a. Dependent Variable: Weight gain under pregnancy (kg) Standardized B Std. Error Beta t Sig.,683,990,846,399 2,908,607,338 4,792,000 Varför bör man inte göra en regressions analys med t ex smärtnivåer som responsvariabel (yvariabel)? Eftersom smärtnivåer är mätt på ordinalskala kan man inte använda dessa som responsvariabel i en regression. Responsvariabeln måste vara mätt på kvot- eller intervallskala.