Lösningar med kommentarer till övningsuppgifterna i min bok Grundläggande statistiska metoder för analys av kvantitativa data

Relevanta dokument
Lösningar till SPSS-övning: Analytisk statistik

Uppgift 1. Produktmomentkorrelationskoefficienten

Samhällsvetenskaplig metod, 7,5 hp

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Tentamen består av 9 frågor, totalt 34 poäng. Det krävs minst 17 poäng för att få godkänt och minst 26 poäng för att få väl godkänt.

ANOVA Mellangruppsdesign

Forsknings- och undersökningsmetodik Skrivtid: 4h

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 24 april, Ansvarig lärare: Bengt Jansson ( , mobil: )

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Tentan består av 10 frågor, totalt 30 poäng. Det krävs 20 poäng för att få godkänt på tentan, varav 50 % inom respektive moment.

OBS! Vi har nya rutiner.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Uppgift 1. Deskripitiv statistik. Lön

7.5 Experiment with a single factor having more than two levels

SOPA62 - Kunskapsproduktion i socialt arbete

OBS! Vi har nya rutiner.

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

Medicinsk statistik II

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

FACIT!!! (bara facit,

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

OBS! Vi har nya rutiner.

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

Tentamensresultat anslås (anslagstavla och kursportal) senast 3 veckor efter tentamen.

8.1 General factorial experiments

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Multipel regression och Partiella korrelationer

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

HÖGSKOLAN I BORÅS. FORSKNINGSMETODER I OFFENTLIG FÖRVALTNING 15 Högskolepoäng

Skrivning i ekonometri torsdagen den 8 februari 2007

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

OBS! Vi har nya rutiner.

Psykologiska institutionen tillämpar anonymitet i samband med tentor i skrivsal, som går till så här:

Tentamen i matematisk statistik

OBS! Vi har nya rutiner.

Metod och teori. Statistik för naturvetare Umeå universitet

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Tentan består av 15 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 33 poäng för att få välgodkänt.

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

2.1 Minitab-introduktion

Disraeli, England, 1860 talet: Det finns tre grader av osanning. Går ej att mäta hela populationen. Deskriptiv statistik

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Skrivning i ekonometri lördagen den 29 mars 2008

Statistiska analyser C2 Bivariat analys. Wieland Wermke

Hypotestestning och repetition

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Regressions- och Tidsserieanalys - F4

Följande resultat erhålls (enhet: 1000psi):

Tentamen i matematisk statistik

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

SOPA62 - Kunskapsproduktion i socialt arbete

Mata in data i Excel och bearbeta i SPSS

Variansanalys med SPSS Kimmo Sorjonen ( )

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

7.3.3 Nonparametric Mann-Whitney test

Räkneövning 3 Variansanalys

Tentamen i matematisk statistik

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

TENTAMEN PC1307 PC1546. Statistik (5 hp) Onsdag den 20 oktober, Ansvarig lärare: Bengt Jansson ( , mobil: )

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet. Laboration 3. Variansanalys

Överlevnadsanalys. 732G34 Statistisk analys av komplexa data

En kort instruktion för arbete i SPSS

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner.

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Statistik för teknologer, 5 poäng Skrivtid:

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

TENTAMEN SAMHÄLLSVETENSKAPLIG FORSKNINGSMETODIK Kurs 7 PC1307 Forskningsmetodik och statistik 10 hp. Fredag den 24 april, 2009

Skrivning i ekonometri lördagen den 25 augusti 2007

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Transkript:

Lösningar med kommentarer till övningsuppgifterna i min bok Grundläggande statistiska metoder för analys av kvantitativa data Uppgift a Eftersom betygsdata är approximativt normalfördelade väljer man lämpligen medelvärde och standardavvikelse. Lämpligt är att ge frekvenstabellen. Frequencies Statistics N Valid Missing Median Std. Dev iation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis 54 0 3,00 3,00,022 -,052,05 -,545,20 Valid 2 3 4 5 Cumulativ e Frequency Percent Valid Percent Percent 39 7,2 7,2 7,2 3 24,2 24,2 3,4 96 36,2 36,2 67,7 4 26, 26, 93,7 34 6,3 6,3 00,0 54 00,0 00,0

Uppgift b Alternativ Explore KÖN Pojkar Flickor Case Processing Summary Cases Valid Missing N Percent N Percent N Percent 253 00,0% 0,0% 253 00,0% 288 00,0% 0,0% 288 00,0% Descriptives KÖN Pojkar 95% Confidence Interv al for Lower Bound Upper Bound Statistic Std. Error 2,53,06 2,4 2,65 Flickor 5% Trimmed Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis 95% Confidence Interv al for Lower Bound Upper Bound 2,5 3,00,932,966 5 4,277,53 -,23,305 3,4,052 3,3 3,5 5% Trimmed Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis 3,4 3,00,786,887 5 4 -,77,44 -,406,286

5 457 4 3 2 28 Pojkar KÖN Flickor Uppgift b Alternativ 2 Crosstabs Case Processing Summary BETYG PÅ UPPSATSEN * KÖN Cases Valid Missing N Percent N Percent N Percent 54 00,0% 0,0% 54 00,0% * KÖN Crosstabulation Count BETYG PÅ UPPSATSEN 2 3 4 5 KÖN Pojkar Flickor 36 3 39 89 42 3 92 04 96 29 2 4 7 27 34 253 288 54

Uppgift 2 250 200 Frequency 50 00 50 0 2 3 4 5 = 3 Std. Dev. =,022 N = 54 Uppgift 3 Frequencies Statistics ATTITYDER TILL SKRIVNING N Valid Missing Median Std. Dev iation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis 536 5 3,43 3,00,972 -,399,06,60,2

Valid Missing My cket tråkigt Tråkigt Varken - eller Roligt My cket roligt Sy stem ATTITYDER TILL SKRIVNING Cumulativ e Frequency Percent Valid Percent Percent 25 4,6 4,7 4,7 42 7,8 7,8 2,5 26 39,9 40,3 52,8 83 33,8 34, 86,9 70 2,9 3, 00,0 536 99, 00,0 5,9 54 00,0 Histogram 250 200 Frequency 50 00 50 0 0 2 3 4 5 6 ATTITYDER TILL SKRIVNING = 3,43 Std. Dev. = 0,972 N = 536 Uppgift 4 Eftersom de båda variablerna är rangordnade så är Spearman s rangkorrelation nog den lämpligaste. Om man betraktar variablerna som approx. normalfördelade (scale i SPSS) kan man ange Pearson Corr. De båda beräkningarna ger mycket lika värden. Correlations

ANTAL TIMMARS TV-TITTANDE SKOLDAGAR Correlations Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N **. Correlation is signif icant at the 0.0 lev el (2-tailed). ANTAL TIMMARS TV-TITTANDE BETYG PÅ SKOLDAGAR UPPSATSEN -,224**,000 537 537 -,224**,000 537 54 Correlations Spearman's rho ANTAL TIMMARS TV-TITTANDE SKOLDAGAR Correlation Coef ficient Sig. (2-tailed) N Correlation Coef ficient Sig. (2-tailed) **. Correlation is significant at the 0.0 lev el (2-tailed). N ANTAL TIMMARS TV-TITTANDE BETYG PÅ SKOLDAGAR UPPSATSEN,000 -,24**.,000 537 537 -,24**,000,000. 537 54 Uppgift 5 Nonparametric Correlations Correlations Spearman's rho TID FÖR LÄXOR ANTAL TIMMAR FÖR SKRIVUPPGIFTER Correlation Coef ficient Sig. (2-tailed) N Correlation Coef ficient Sig. (2-tailed) N Correlation Coef ficient Sig. (2-tailed) N BETYG PÅ TID FÖR ANTAL TIMMAR FÖR SKRIVUPPGIF SJÄLVSKAT TNING AV SKRIVFÖR UPPSATSEN LÄXOR TER MÅGAN,000,220**,4*,367**.,000,0,000 54 536 502 527,220**,000,447**,23**,000.,000,000 536 536 500 522,4*,447**,000,059,0,000.,95 502 500 502 49 SJÄLVSKATTNING AV SKRIVFÖRMÅGAN **. Correlation is signif icant at the 0.0 level (2-tailed). *. Correlation is signif icant at the 0.05 level (2-tailed). Correlation Coef ficient Sig. (2-tailed) N,367**,23**,059,000,000,000,95. 527 522 49 527

Sambandet mellan de båda läxvariablerna är naturligt nog ganska högt. Likaså är sambandet mellan självskattningen av skrivförmågan måttligt, möjligen hade man förväntat sig ett något högre samband. Tid för läxor och skrivuppgifter är ganska lågt korrelsera med betyg på uppsatsen. Uppgift 6 Crosstabs Case Processing Summary NÖJESSKRIVNING * KÖN Cases Valid Missing N Percent N Percent N Percent 502 92,8% 39 7,2% 54 00,0% NÖJESSKRIVNING * KÖN Crosstabulation NÖJESSKRIVNING Nej Ja Count % within NÖJESSKRIVNING % within KÖN Count % within NÖJESSKRIVNING % within KÖN Count % within NÖJESSKRIVNING % within KÖN KÖN Pojkar Flickor 74 60 34 55,2% 44,8% 00,0% 33,6% 2,3% 26,7% 46 222 368 39,7% 60,3% 00,0% 66,4% 78,7% 73,3% 220 282 502 43,8% 56,2% 00,0% 00,0% 00,0% 00,0% Uppgift 7 Crosstabs NÖJESSKRIVNING * KÖN Crosstabulation Count NÖJESSKRIVNING Nej Ja KÖN Pojkar Flickor 74 60 34 46 222 368 220 282 502

Chi-Square Tests Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (-sided) Pearson Chi-Square 9,648(b),002 Continuity Correction(a) 9,027,003 Likelihood Ratio 9,598,002 Fisher's Exact Test,002,00 Linear-by-Linear Association 9,629,002 N of Valid Cases 502 a Computed only for a 2x2 table b 0 cells (,0%) have expected count less than 5. The minimum expected count is 58,73. Symmetric Measures Nominal by Nominal N of Valid Cases Phi Cramer's V a. Not assuming the null hy pothesis. Value Approx. Sig.,39,002,39,002 502 b. Using the asy mptotic standard error assuming the null hy pothesis. Visserligen är sambandet signifikant (p<0,0) men sambandet är lågt (0,4). Anledningen till signifikansen trots att sambandet är lågt är p.g.a. det stora antalet observationer (220 + 282) Uppgift 8 a) Oberoende: kön, antal timmar per vecka till skriftliga hemuppgifter och attityder till skrivning. Den beroende variabeln är den som ska prediceras, dvs. betyg på uppsatsen. b) Ja, signifikant. c) Kön ger bäst prediktion, därefter attityder. Antal timmar per vecka till skriftliga hemuppgifter bidrar ej signifikant till prediktionen. d) Den multipla korrelationen är ca 0,50 och således kan ca 25% av variansen i betyg prediceras. Regression

Model Variables Entered/Removed b Variables Entered ATTITYDE R TILL SKRIVNIN G, ANTAL TIMMAR FÖR SKRIVUPP GIFTER, KÖN a Variables Remov ed a. All requested v ariables entered. Method. Enter b. Dependent Variable: Model Summary Adjusted R Std. Error of Model R R Square Square the Estimate,508(a),259,254,87 a Predictors: (Constant), ATTITYDER TILL SKRIVNING, ANTAL TIMMAR FÖR SKRIVUPPGIFTER, KÖN ANOVA(b) Model Sum of Squares df Square F Sig. Regression 30,820 3 43,607 57,538,000(a) Residual 375,48 495,758 505,968 498 a Predictors: (Constant), ATTITYDER TILL SKRIVNING, ANTAL TIMMAR FÖR SKRIVUPPGIFTER, KÖN b Dependent Variable: Coefficients(a) Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. (Constant),023,65 6,220,000 KÖN,666,089,330 7,494,000 ANTAL TIM- MAR FÖR SKRIVUPP-,032,053,024,600,548 GIFTER ATTITYDER TILL SKRIV- NING,268,047,255 5,759,000 a Dependent Variable:

Uppgift 9 a) Det finns ingen skillnad mellan pojkar och flickor vad gäller medelvärdet för uppsatsbetyg (μ p - μ f = 0) b) Kön är oberoende variabel och den är en kategorivariabel. Uppsatsbetyg betraktar jag som en approximativt normalfördelad variabel (scale) och den är beroende. c) T-test för två oberoende grupper och variansanalys. Om man anser betyg vara en ordinalskalerad variabel kan t.ex. Mann-Whitney användas (som ger en z-transformation eftersom grupperna är stora). d) Nollhypotesen måste förkastas. Det finns en högst signifikant skillnad mellan medelvärdena (p<0,00). Skillnaden är dessutom stor (eta-kvadrat = 8%). e) Som framgår av beräkningarna är t2 = F. T-Test Group Statistics BETYG PÅ UPPSATSEN KÖN N Std. Deviation Std. Error Pojkar 253 2,53,966,06 Flickor 288 3,4,887,052 Equal variances assumed Equal variances not assumed Levene's Test f or Equality of Variances F Independent Samples Test Sig. t df t-test for Equality of s Sig. (2-tailed) Dif f er ence 95% Std. Error Dif f er Confidence Interv al of the Dif f erence ence Lower Upper,680,96-0,999 539,000 -,876,080 -,033 -,720-0,938 55,333,000 -,876,080 -,033 -,79

s Case Processing Summary Cases Included Excluded N Percent N Percent N Percent BETYG PÅ UPPSAT- SEN * KÖN 54 00,0% 0,0% 54 00,0% Report KÖN N Std. Deviation Pojkar 2,53 253,966 Flickor 3,4 288,887 3,00 54,022 ANOVA Table BETYG PÅ UPPSATSEN * KÖN Between Groups Within Groups (Combined) Sum of Squares df Square F Sig. 03,383 03,383 20,975,000 460,67 539,855 564,000 540 Measures of Association Eta Eta Squared BETYG PÅ UPPSAT- SEN * KÖN,428,83 Uppgift 0 a) Ja, sambandet mellan kön och dagboksskrivande är högst signifikant (p<0,00). b) Nollhypotes: Det finns inget samband mellan kön och dagboksskrivande. Mothypotes: Det finns ett samband mellan kön och dagboksskrivande. c) Båda variablerna är kategorivariabler (nominalskala). d) Se nedan! e) Cramérs index. (sambandet mellan variablerna är 0,55)

Crosstabs Case Processing Summary Cases Valid Missing N Percent N Percent N Percent KÖN * DAGBOK 502 92,8% 39 7,2% 54 00,0% KÖN * DAGBOK Crosstabulation KÖN Pojkar Flickor Count % within KÖN % within DAGBOK Count % within KÖN % within DAGBOK Count % within KÖN % within DAGBOK DAGBOK Nej Ja 99 2 220 90,5% 9,5% 00,0% 66,3% 0,4% 43,8% 0 8 282 35,8% 64,2% 00,0% 33,7% 89,6% 56,2% 300 202 502 59,8% 40,2% 00,0% 00,0% 00,0% 00,0% Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Chi-Square Tests Asy mp. Sig. Value df (2-sided) 53,429 b,000 5,65,000 70,49,000 53,23,000 502 a. Computed only f or a 2x2 table Exact Sig. (2-sided) Exact Sig. (-sided),000,000 b. 0 cells (,0%) hav e expected count less than 5. The minimum expected count is 88,53. Symmetric Measures Nominal by Nominal N of Valid Cases Phi Cramer's V a. Not assuming the null hy pothesis. Value Approx. Sig.,553,000,553,000 502 b. Using the asy mptotic standard error assuming the null hy pothesis.

Uppgift a) Det finns ingen skillnad i medelvärdena mellan de fyra grupperna (kategorierna) i uppsatsbetyg. b) Grupperna är oberoende och kategorivariabler och den beroende variabeln (om vi accepterar tidigare resonemang) en scale-variabel. c) Enligt b ovan använder man lämpligen One-way-Anova. Man kan också parvisa jämförelse enligt någon av föreslagna metoder. d) Eta-kvadrat är väl ett bra mått. Oneway ANOVA Sum of Squares df Square F Sig. Between Groups 72,823 3 24,274 26,66,000 Within Groups 476,75 523,90 548,998 526 Eta-kvadrat = 72,823/548,998 = 0,3 Post Hoc Tests Dependent Variable: Schef fe (I) SJÄLVSKATTNING AV SKRIVFÖRMÅGAN Inte alls bra Ganska dålig Ganska bra Bra (J) SJÄLVSKATTNING AV SKRIVFÖRMÅGAN Ganska dålig Ganska bra Bra Inte alls bra Ganska bra Bra Inte alls bra Ganska dålig Bra Inte alls bra Ganska dålig Ganska bra Multiple Comparisons Dif f erence *. The mean diff erence is signif icant at the.05 level. 95% Confidence Interv al Lower Upper (I-J) Std. Error Sig. Bound Bound -,399,66,23 -,86,07 -,956*,56,000 -,39 -,52 -,342*,95,000 -,89 -,79,399,66,23 -,07,86 -,557*,097,000 -,83 -,28 -,942*,52,000 -,37 -,52,956*,56,000,52,39,557*,097,000,28,83 -,385,42,06 -,78,0,342*,95,000,79,89,942*,52,000,52,37,385,42,06 -,0,78

Schef fe a,b SJÄLVSKATTNING AV SKRIVFÖRMÅGAN Inte alls bra Ganska dålig Ganska bra Bra Sig. Subset for alpha =.05 N 2 43 2,23 44 2,63 286 3,9 54 3,57,083,02 s for groups in homogeneous subsets are display ed. a. Uses Harmonic Sample Size = 76,606. b. The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed. Skillnaden mellan Inte alls bra och Ganska dålig är ej signifikant, ej heller skillnaden mellan Ganska bra och Bra. Dock finns det en signifikant skillnad mellan grupperna (Inte alls bra och Ganska dålig) i jämförelse med grupperna (Ganska bra och Bra). Uppgift 2 Sambandsvärdet blir mycket lika. Eta-kvadrat är också ett korrelationsmått, om än mellan en kategorivariabel och en scale-variabel. En rangkorrelation, som väl är mer korrekt, ger sambandet 0,367. Uppgift 3 Om man betraktar attityder till skrivning som en scale-variabel så blir resultatet följande: s Case Processing Summary ATTITYDER TILL SKRIVNING * KÖN Cases Included Excluded N Percent N Percent N Percent 536 99,% 5,9% 54 00,0% Report ATTITYDER TILL SKRIVNING KÖN Pojkar Flickor N Std. Dev iation 2,97 25,883 3,84 285,862 3,43 536,972

ANOVA Table ATTITYDER TILL SKRIVNING * KÖN Between Groups Within Groups (Combined) Sum of Squares df Square F Sig. 99,392 99,392 30,7,000 406,054 534,760 505,446 535 Measures of Association Eta Eta Squared ATTITYDER TILL SKRIVNING * KÖN,443,97 Om man anser att attityder är en ordinalskalerad variabel så blir resultatet följande: NPar Tests Mann-Whitney Test Ranks ATTITYD TILL PROVUPPSATSEN KÖN Pojkar Flickor N Rank Sum of Ranks 32 9,08 578,50 55 65,22 25609,50 287 Mann-Whitney U Wilcoxon W Z Test Statistics a Asy mp. Sig. (2-tailed) a. Grouping Variable: KÖN ATTITYD TILL PROVUPPSA TSEN 6940,500 578,500-4,846,000 Slutsatsen blir densamma, dvs. att det finns en högst signifikant skillnad mellan pojkar och flickor. ANOVA ger eta-kvadrat = 20%, dvs. stor skillnad.

Uppgift 4 Det finns 5 grupper (v) och grupp är den oberoende variabeln. De jämförs på den beroende variabeln. Här betraktas betyg som scale-variabel. Oneway ANOVA Sum of Squares df Square F Sig. Between Groups 32,22 4 8,053 8,02,000 Within Groups 527,78 53,994 559,993 535 Post Hoc Tests Multiple Comparisons Dependent Variable: Schef fe (I) TID FÖR LÄXOR Ingen tid alls Ca /2 tim Ca tim Ca /2 tim Ca 2 tim eller mer (J) TID FÖR LÄXOR Ca /2 tim Ca tim Ca /2 tim Ca 2 tim eller mer Ingen tid alls Ca tim Ca /2 tim Ca 2 tim eller mer Ingen tid alls Ca /2 tim Ca /2 tim Ca 2 tim eller mer Ingen tid alls Ca /2 tim Ca tim Ca 2 tim eller mer Ingen tid alls Ca /2 tim Ca tim Ca /2 tim *. The mean diff erence is signif icant at the.05 lev el. Dif f erence 95% Confidence Interv al (I-J) Std. Error Sig. Lower Bound Upper Bound -,285,80,642 -,84,27 -,630*,76,03 -,7 -,09 -,833*,90,00 -,42 -,25 -,696*,99,07 -,3 -,08,285,80,642 -,27,84 -,345*,0,046 -,69,00 -,548*,3,002 -,95 -,4 -,4,45,092 -,86,04,630*,76,03,09,7,345*,0,046,00,69 -,203,26,624 -,59,9 -,066,40,994 -,50,37,833*,90,00,25,42,548*,3,002,4,95,203,26,624 -,9,59,38,57,943 -,35,62,696*,99,07,08,3,4,45,092 -,04,86,066,40,994 -,37,50 -,38,57,943 -,62,35

Homogeneous Subsets Scheffe Subset for alpha =.05 TID FÖR LÄXOR N 2 3 Ingen tid alls 39 2,46 Ca /2 tim 46 2,75 2,75 Ca tim 86 3,09 3,09 Ca 2 tim eller mer 70 3,6 3,6 Ca /2 tim 95 3,29 Sig.,56,5,798 s for groups in homogeneous subsets are displayed. a Uses Harmonic Sample Size = 79,772. b The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed. Det finns en signifikant skillnad mellan de fem grupperna (p<0,00). Av kontrastanalyserna framgår skillnaderna mellan de olika grupperna. De som lägger ner mer tid på läxläsning är bättre. Högst medelvärde har gruppen ca,5 timmar. Om man i ställer betraktar betyg som en ordinalskala ska Kruskal-Wallis användas: NPar Tests Kruskal-Wallis Test Ranks BETYG PÅ UPPSAT- SEN TID FÖR LÄXOR N Rank Ingen tid alls 39 89,95 Ca /2 tim 46 232,7 Ca tim 86 282,05 Ca /2 tim 95 3,2 Ca 2 tim eller mer 70 293,05 536 Test Statistics(a,b) BETYG PÅ UPPSATSEN Chi-Square 30,663 df 4 Asymp. Sig.,000 a Kruskal Wallis Test b Grouping Variable: TID FÖR LÄXOR Här framkommer självfallet också en signifikant skillnad mellan grupperna.

Uppgift 5 Här ska två oberoende variabler prövas i en och samma analys, dvs. skillnaden mellan kön och skillnaden mellan de fem läxläsningsgrupperna. I och med vi har två oberoende variabler, en s.k. 2x5 faktoriell design kan vi också studera en ev. samspelseffekt. Univariate Analysis of Variance Between-Subjects Factors KÖN TID FÖR LÄXOR 2 2 3 4 Value Label N Pojkar 25 Flickor 285 Ingen tid alls 39 Ca /2 tim 46 Ca tim 86 Ca /2 tim 95 5 Ca 2 tim eller mer 70 Descriptive Statistics Dependent Variable: KÖN Pojkar Flickor TID FÖR LÄXOR Ingen tid alls Ca /2 tim Ca tim Ca /2 tim Ca 2 tim eller mer Ingen tid alls Ca /2 tim Ca tim Ca /2 tim Ca 2 tim eller mer Ingen tid alls Ca /2 tim Ca tim Ca /2 tim Ca 2 tim eller mer Std. Dev iation N 2,3,859 32 2,33,923 84 2,72,978 8 2,63,060 35 2,84,958 9 2,53,968 25 3,4,069 7 3,3,759 62 3,38,892 05 3,68,9 60 3,27,940 5 3,40,889 285 2,46,942 39 2,75,98 46 3,09,985 86 3,29,090 95 3,6,958 70 3,00,023 536

Dependent Variable: Source Corrected Model Intercept v v v * v Error Corrected Tests of Between-Subjects Effects Type III Sum Partial Eta of Squares df Square F Sig. Squared 7,347 a 9 3,039 5,494,000,20 2569,296 2569,296 3053,22,000,853 45,88 45,88 54,446,000,094 9,027 4 2,257 2,682,03,020 5,20 4,302,548,87,02 442,645 526,842 5372,000 536 559,993 535 a. R Squared =,20 (Adjusted R Squared =,96) Det finns en högst signifikant skillnad mellan kön (p<0,00) och en signifikant skillnad mellan läxläsningsgrupper (p<0,05). Däremot finns ingen signifikant samspelseffekt (p>0,05). Skillnaden mellan kön är påtaglig, däremot är den liten mellan läxläsningsgrupper. Uppgift 6 Om vi betraktar betyg som scale-variabel kan man använda envägs variansanalys med kontrastanalys. Oneway ANOVA Sum of Squares df Square F Sig. Between Groups 44,945 2 22,472 23,394,000 Within Groups 5,048 532,96 555,993 534

Post Hoc Tests Dependent Variable: Schef fe Multiple Comparisons (I) TVSUM,00 2,00 3,00 (J) TVSUM 2,00 3,00,00 3,00,00 2,00 Diff erence 95% Confidence Interv al (I-J) Std. Error Sig. Lower Bound Upper Bound,497*,02,000,25,75 *. The mean diff erence is signif icant at the.05 level.,864*,56,000,48,25 -,497*,02,000 -,75 -,25,367,72,03 -,05,79 -,864*,56,000 -,25 -,48 -,367,72,03 -,79,05 Homogeneous Subsets Schef fe a,b TVSUM 3,00 2,00,00 Sig. Subset f or alpha =.05 N 2 3 44 2,32 24 2,69 367 3,8,000,000,000 s for groups in homogeneous subsets are display ed. a. Uses Harmonic Sample Size = 89,508. b. The group sizes are unequal. The harmonic mean of the group sizes is used. Ty pe I error levels are not guaranteed. Skillnaden mellan de tre TV-grupperna är signifikant (p<0,00) och ganska stor (etakvadrat 8%). Det finns parvis signifikanta skillnader mellan de tre grupperna. Uppgift 7 Nedan presenteras endast den roterade matrisen enligt principalkomponentmetoden med varimaxrotering.

Rotated Component Matrix a BETYG PÅ UPPSATSEN BETYG, STIL OCH SPRÅK BETYG, INNEHÅLL BETYG, DISPOSITION ATTITYD TILL PROVUPPSATSEN ANTAL ÅR FORTSATT UTBILDNING Component 2 3 4 5 6 7,923,94,89,889,56,302,339,48,393 PLANERAR TILLSAMMANS FAMILJEANGELÄGEN HETER DISKUTERAR TV- OCH RADIOPROGRAM ARBETE OCH SKOLA DISKUTERAR ALLMäNNA TING DISKUTERAR LITTERATUR ANTAL TIMMARS TV-TITTANDE FRIDAGAR ANTAL TIMMARS TV-TITTANDE SKOLDAGAR FADERNS UTBILDNING MODERNS UTBILDNING DAGBOK BREVVÄN ATTITYDER TILL SKRIVNING TID FÖR LÄXOR ANTAL TIMMAR FÖR SKRIVUPPGIFTER NÖJESSKRIVNING SJÄLVSKATTNING AV SKRIVFÖRMÅGAN ANTAL TIMMAR FÖR LÄSUPPGIFTER,827,788,753,635,349 -,37,634,533,479 -,76 -,754,736,709 Extraction Method: Principal Component Analy sis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation conv erged in 8 iterations.,853,698,309,520,50,840,665,32,833,324,65,778

a) Ja, de sex frågorna om hur ofta barn och vuxna gör saker tillsammans (v4-v9) verkar hänga samman och kan benämnas hemkultur. b) Det verkar inte finnas några bra attitydfrågor som hänger samman. c) Nej, de olika aspekterna av uppsatsskrivning verkar hänga mycket nära samman. Uppgift 8 Här får man undersöka mätsäkerheten i de tre skalorna, dvs. reliabiliteten och då lämpligen med Cronbach s alpha, eftersom uppgifterna i skalan ska vara homogena. Reliability Cases Case Processing Summary Valid Excluded a a. Listwise deletion based on all v ariables in the procedure. N % 487 90,0 54 0,0 54 00,0 Reliability Statistics Cronbach's Alpha N of Items,794 6 Item- Statistics ARBETE OCH SKOLA FAMILJEANGELÄGENH ETER PLANERAR TILLSAMMANS DISKUTERAR ALLMäNNA TING DISKUTERAR LITTERATUR DISKUTERAR TV- OCH RADIOPROGRAM Scale Corrected Cronbach's Scale if Variance if Item- Alpha if Item Item Deleted Item Deleted Correlation Deleted 2,98 20,38,573,756 3,47 9,270,642,739 4,06 2,023,55,762 4,59 9,988,553,762 5,4 22,806,492,776 4,24 2,04,482,779

Reliabiliteten är hög med tanke på vad man försöker mäta och det lönar sig inte ur reliabilitetssynpunkt att ta bort någon fråga. De två TV-frågorna kan också bilda en summavariabel med ganska hög reliabilitet (0,72). De tre frågorna -3 har visserligen något gemensamt men bildar ingen mätsäker skala. Uppgift 9 Till uppgift 3 finns en alternativ lösning med icke-parametrisk metod. Om betyg betraktas som ordinalskalerad måste Kruskal-Wallis användas. NPar Tests Kruskal-Wallis Test Ranks TVSUM,00 2,00 3,00 N Rank 367 295,20 24 222,72 44 68,72 535 Test Statistics a,b BETYG PÅ UPPSATSEN Chi-Square 43,670 df 2 Asy mp. Sig.,000 a. Kruskal Wallis Test b. Grouping Variable: TVSUM Självfallet får man även med denna icke-parametrisk metod en signifikant skillnad mellan grupperna. Uppgift 20 Här måste man bygga upp två olika filer för uppgift a respektive b. I uppgift a består datafilen av två kolumner med resultatet i grupp i den ena och grupp 2 i den andra (i rätt ordning eftersom de är matchade, dvs. beroende observationer). I uppgift b finns också två kolumner men nu finns grupp i den ena (dvs. 5 ettor och 5 tvåor ) och i den andra finns resultatet för de 30 observationerna.

a) T-Test Pair grupp grupp2 Paired Samples Statistics Std. Error N Std. Dev iation 6,2000 5 2,36643,60 6,8000 5 2,8085,72506 Paired Samples Correlations Pair grupp & grupp2 N Correlation Sig. 5,985,000 Paired Samples Test Pair grupp - grupp2 Std. Dev iation Paired Diff erences 95% Confidence Std. Error Interv al of the Dif f erence Lower Upper -,60000,63246,6330 -,95024 -,24976-3,674 4,003 t df Sig. (2-tailed) Det finns en signifikant skillnad mellan de två (matchade) grupperna (p<0,0) b) T-Test Group Statistics resultat grupp 2 Std. Error N Std. Dev iation 5 6,20 2,366,6 5 6,80 2,808,725

Independent Samples Test Lev ene's Test f or Equality of Variances t-test for Equality of s resultat Equal variances assumed Equal variances not assumed F Sig. t df Sig. (2-tailed) Diff er ence Std. Error Diff er 95% Confidence Interv al of the Diff erence ence Lower Upper,289,595 -,633 28,532 -,600,948-2,542,342 -,633 27,2,532 -,600,948-2,545,345 Om grupperna är oberoende framkommer ingen signifikant skillnad (p>0,05). I grupperna finns alltför få observationer för att det ska bli någon signifikant skillnad. Om man betraktar den beroende variabeln som ordinalskalerad så kan Wilcoxon sign rank test användas i uppgift a och Mann-Whitney-testet användas i uppgift b. Utfallet blir som tidigare; en signifikant skillnad om grupperna är matchade (högre precision genom matchning då en större del av variansen kan kontrolleras) och ingen signifikant skillnad om de är oberoende. Uppgift 2 Man ska skriva in data i en ny fil son innehåller de två variablerna grupp och resultat. En analys med Oneway ANOVA (alternativt med s med Options: Anova table and eta) ger ett p-värde = 0,465, dvs. nollhypotesen kan inte förkastas. Dock blir eta-kvadrat hela 0,40, viket indikerar en mycket stor skillnad mellan grupperna. Skälet till detta motsägande resultat är att grupperna är alltför små för att kunna ge någon signifikant skillnad. Oneway Descriptives Resultat 95% Confidence Interval for N Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum 2 2,00,44,000-0,7 4,7 3 2 2 3,00,44,000-9,7 5,7 2 4 3 2 4,00,44,000-8,7 6,7 3 5 6 3,00,44,577,52 4,48 5

Resultat ANOVA Sum of Squares df Square F Sig. Between Groups 4,000 2 2,000,000,465 Within Groups 6,000 3 2,000 0,000 5 Post Hoc Tests Dependent Variable: Resultat Scheffe Multiple Comparisons 95% Confidence Interval (I) Grupp (J) Grupp Difference (I-J) Std. Error Sig. Lower Bound Upper Bound 2 -,000,44,794-7,8 5,8 3-2,000,44,465-8,8 4,8 2,000,44,794-5,8 7,8 3 -,000,44,794-7,8 5,8 3 2,000,44,465-4,8 8,8 2,000,44,794-5,8 7,8 Homogeneous Subsets Resultat Scheffe Subset for alpha =.05 Grupp N 2 2,00 2 2 3,00 3 2 4,00 Sig.,465 s for groups in homogeneous subsets are displayed. a Uses Harmonic Sample Size = 2,000.