Lösningar till SPSS-övning: Analytisk statistik



Relevanta dokument
Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Uppgift 1. Produktmomentkorrelationskoefficienten

Forsknings- och undersökningsmetodik Skrivtid: 4h

Samhällsvetenskaplig metod, 7,5 hp

Uppgift 1. Deskripitiv statistik. Lön

Tentamen består av 9 frågor, totalt 34 poäng. Det krävs minst 17 poäng för att få godkänt och minst 26 poäng för att få väl godkänt.

OBS! Vi har nya rutiner.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1

Lösningar med kommentarer till övningsuppgifterna i min bok Grundläggande statistiska metoder för analys av kvantitativa data

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

OBS! Vi har nya rutiner.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Tentan består av 10 frågor, totalt 30 poäng. Det krävs 20 poäng för att få godkänt på tentan, varav 50 % inom respektive moment.

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

SOPA62 - Kunskapsproduktion i socialt arbete

Multipel regression och Partiella korrelationer

Medicinsk statistik II

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

Multipel Regressionsmodellen

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

HÖGSKOLAN I BORÅS. FORSKNINGSMETODER I OFFENTLIG FÖRVALTNING 15 Högskolepoäng

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Metod och teori. Statistik för naturvetare Umeå universitet

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

7.5 Experiment with a single factor having more than two levels

Överlevnadsanalys. 732G34 Statistisk analys av komplexa data

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Tentan består av 15 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 33 poäng för att få välgodkänt.

OBS! Vi har nya rutiner.

Variansanalys med SPSS Kimmo Sorjonen ( )

SOPA62 - Kunskapsproduktion i socialt arbete

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

Skrivning i ekonometri torsdagen den 8 februari 2007

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Statistik och epidemiologi T5

Psykologiska institutionen tillämpar anonymitet i samband med tentor i skrivsal, som går till så här:

Bakgrund. Christina. C Fåhraeus Barnläkare 2011

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

KA RKUNSKAP. Vad vet samhällsvetarna om sin kår? Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc STAA31 HT14

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Skrivning i ekonometri lördagen den 29 mars 2008

OBS! Vi har nya rutiner.

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

Regressions- och Tidsserieanalys - F4

Daftar Populasi dan Sampel Penelitian

Följande resultat erhålls (enhet: 1000psi):

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

8.1 General factorial experiments

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

ANOVA Mellangruppsdesign

OBS! Vi har nya rutiner.

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Tentamen Tillämpad statistik A5 (15hp)

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

TENTAMEN I MATEMATISK STATISTIK

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Linjär regressionsanalys. Wieland Wermke

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

OBS! Vi har nya rutiner.

FACIT!!! (bara facit,

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Kan föräldrastöd förbättra föräldrars hälsa, kompetens och barns beteende?

För Godkänt krävs minst 70% av maxpoängen i kvalitativ metodik och minst 70% av maxpoängen i kvantitativ metodik.

Statistik för teknologer, 5 poäng Skrivtid:

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

Statistik Lars Valter

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Lägre andel behöriga på skolor med stora utmaningar

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

Medicinsk statistik II

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Datorlaboration 2 Konfidensintervall & hypotesprövning

Tentamen i matematisk statistik

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

7.5 Experiment with a single factor having more than two levels

Transkript:

UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt vid graviditetens början mellan de kvinnorna var helt fria från ryggbesvär eller hade lindriga besvär och de som hade bekymmersamma eller allvarliga besvär? Vad är nollhypotesen respektive alternativ hypotesen här? Hur tolkar du resultatet av testet? Nollhypotes: Det finns ingen skillnad i medelvikt vid graviditetens början mellan de med lindriga besvär och de med svårare besvär. Alternativ hypotes: Det finns skillnad i medelvikt vid graviditetens början mellan de med lindriga besvär och de med svårare besvär. Group Statistics start of pregnancy (kg) Back pain severity >= 2 < 2 Std. Error N Mean Std. Deviation Mean 87 60,3552,00429,7978 93 58,970 9,27095,9635 Independent Samples Test start of pregnancy (kg) assumed not assumed Levene's Test for Equality of Variances F Sig. t df Sig. (2-tailed) t-test for Equality of Means Mean Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper,385,24,95 78,362,3842,5324 -,6098 4,37039,90 68,626,364,3842,5287 -,6207 4,38858 Tolkning av resultatet: Eftersom p-värdet är så stort, 0.362, (större än 0.05) så kan vi inte förkasta nollhypotesen (på 5%-nivån). Tillsvidare accepterar vi nollhypotesen om att det inte finns någon skillnad.

Uppgift 2 Testa om det är någon skillnad i medelvikt vid graviditetens slut mellan de kvinnorna var helt fria från ryggbesvär eller hade lindriga besvär och de som hade bekymmersamma eller allvarliga besvär? Vad är nollhypotesen respektive alternativ hypotesen här? Hur tolkar du resultatet av testet? Nollhypotes: Det finns ingen skillnad i medelvikt vid graviditetens slut mellan de med lindriga besvär och de med svårare besvär. Alternativ hypotes: Det finns skillnad i medelvikt vid graviditetens slut mellan de med lindriga besvär och de med svårare besvär. Group Statistics end of pregnancy (kg) Back pain severity >= 2 < 2 Std. Error N Mean Std. Deviation Mean 87 72,747,49059,2392 93 69,2785 0,73287,295 end of pregnancy (kg) assumed not assumed Levene's Test for Equality of Variances F Sig. Independent Samples Test t df Sig. (2-tailed) t-test for Equality of Means Mean Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper,659,48,748 78,082 2,8962,65642 -,37253 6,6496,744 74,84,083 2,8962,66020 -,3804 6,7284 Tolkning av resultatet: Eftersom p-värdet är större än 0.05 så kan vi inte förkasta nollhypotesen (på 5%-nivån). Tillsvidare accepterar vi nollhypotesen om att det inte finns någon skillnad. Väljer vi signifikansnivån 0% så kan vi dock förkasta nollhypotsen. Alltså det finns en signifikant skillnad (på 0%-nivån) mellan grupperna avseende slutvikt.

Chi-2-test Uppgift 3 Koda om NOCHLDR i följande grupper Inga barn, Ett barn och Mer än ett barn. Koda om BPSEV i följande grupper Ingen eller lindrig smärta och Bekymmersam eller allvarlig smärta. Namnge variablerna och variabelvärdena. Gör en korstabell med de nya omkodade variablerna. Testa om smärtnivån är beroende av antal barn från tidigare graviditeter. Vad är nollhypotesen respektive alternativ hypotesen här? Hur tolkar du resultatet av testet? Nollhypotes: Grad av ryggbesvär är oberoende av antalet barn sedan tidigare. Alternativ hypotes: Grad av ryggbesvär är beroende av antalet barn sedan tidigare. Case Processing Summary Back pain severity * Number of children Cases Valid Missing Total N Percent N Percent N Percent 80 00,0% 0,0% 80 00,0% Back pain severity * Number of children Crosstabulation Count Back pain severity Total no or "troubleless" pain pain Number of children more than no child one child one child Total 64 9 0 93 37 33 7 87 0 52 27 80 Chi-Square Tests Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases Asymp. Sig. Value df (2-sided) 2,66 a 2,002 2,758 2,002 0,45,00 80 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 3,05. Tolkning av resultatet: Eftersom p-värdet är mindre än 0.05 så förkastas nollhypotesen (på 5%-nivån). Grad av ryggbesvär är beroende av antalet barn sedan tidigare.

Uppgift 4 Klassindela kvinnornas ålder samt gör en korstabell med smärtnivåer. Testa om smärtnivån är beroende av kvinnans ålder. Vad är nollhypotesen här? Hur tolkar du resultatet av testet? Nollhypotes: Grad av ryggbesvär är oberoende av kvinnans ålder. Alternativ hypotes: Grad av ryggbesvär är beroende av kvinnans ålder. Case Processing Summary Back pain severity * AGEGROUP Cases Valid Missing Total N Percent N Percent N Percent 80 00,0% 0,0% 80 00,0% Back pain severity * AGEGROUP Crosstabulation Count Back pain severity Total no or "troubleless" pain pain AGEGROUP younger than older than 25 years 26-30 3-35 35 years Total 56 22 9 6 93 37 3 3 6 87 93 53 22 2 80 Chi-Square Tests Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases Asymp. Sig. Value df (2-sided) 5,944 a 3,4 5,976 3,3 3,034,082 80 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 5,80. Tolkning av resultatet: Eftersom p-värdet är större än 0.05 så kan vi inte förkasta nollhypotesen (på 5%-nivån).

Regressionsanalys Uppgift 5 Skapa en ny variabel som bygger på kvinnornas viktökning. Vilken är den minsta respektive största viktökningen. Gör en regressionsmodell där du försöker förklara de varierande viktökningarna med de andra variablerna, t ex patientens ålder, patientens längd, patientens vikt vid graviditetens början, barnets vikt, antal barn från tidigare graviditeter eller vad du tycker skulle vara relevant. Summary Adjusted Std. Error of R R Square R Square the Estimate,38 a,45,25 5,009 a. Predictors: (Constant), Number of children, Weight of patient at start of pregnancy (kg), Weight of baby (kg), Age Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig. 772,077 4 93,09 7,48,000 a 4553,368 75 26,09 5325,446 79 a. Predictors: (Constant), Number of children, start of pregnancy (kg), Weight of baby (kg), Age b. Dependent Variable: Weight gain under pregnancy (kg) (Constant) Weight of baby (kg) start of pregnancy (kg) Age Number of children a Unstandardized a. Dependent Variable: Weight gain under pregnancy (kg) Standardized B Std. Error Beta t Sig. 5,262 3,249,620,07 3,48,60,366 5,58,000-6,49E-02,038 -,2 -,707,090 3,805E-03,078,004,049,96 -,983,585 -,33 -,679,095 Hur tolkar du de skattade koefficienterna? Koefficienten för vikten på babyn = 3.4. Tolkning: Om barnets vikt ökar med ett kilo ökar mammans viktökning i genomsnitt med 3. kg (jmf med mammor med en baby som är ett kilo lättare) om allt annat (ålder, vikt vid graviditetens början, antalet barn sedan tidigare) är lika.

Koefficienten för startvikten = -0.0649. Tolkning: Om mammans vikt från graviditetens början ökar med ett kilo minskar mammans viktökning med 0.06 kg i genomsnitt (jmf med mammor vars startvikt var ett kilo lättare) om allt annat (ålder, babyns vikt, antalet barn sedan tidigare) är lika. Osv Testa om kofficienterna är skild från noll, dvs om variabeln i fråga förklarar något av variationen i viktökningarna. Kan du ta bort någon variabel från din modell? Hur blir skattningarna nu? En koefficient är signifikant skild från noll: Barnets vikt förklarar (i alla fall en del av) variationen i viktökning mellan kvinnorna. Tar vi bort variabler ändras skattningarna av koefficienterna? Jmf nedan. Om vi inte tar hänsyn till ålder etc som tidigare så ökar viktökningen i genomsnitt 2,9 kg per kilo som babyns vikt ökar, enligt modellen. (Constant) Weight of baby (kg) a Unstandardized a. Dependent Variable: Weight gain under pregnancy (kg) Standardized B Std. Error Beta t Sig.,683,990,846,399 2,908,607,338 4,792,000 Varför bör man inte göra en regressions analys med t ex smärtnivåer som responsvariabel (yvariabel)? Eftersom smärtnivåer är mätt på ordinalskala kan man inte använda dessa som responsvariabel i en regression. Responsvariabeln måste vara mätt på kvot- eller intervallskala.