En kort instruktion för arbete i SPSS

Relevanta dokument
Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Mata in data i Excel och bearbeta i SPSS

En kort instruktion för arbete i R Commander

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Richard Öhrvall, 1

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Intro till SPSS Kimmo Sorjonen (0811)

Idiotens guide till. Håkan Lyckeborgs SPSS-föreläsning 4/ Av: Markus Ederwall, 21488

Marknadsinformationsmetodik Inlämningsuppgift

Icke parametriska metoder för variabler mätta på nominal- eller ordinalskala

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg/Jep Agrell. Laboration 2. Statistiska test

Fråga nr a b c d 2 D

Att välja statistisk metod

Lösningar till SPSS-övning: Analytisk statistik

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Marknadsinformationsmetodik Inlämningsuppgift

Uppgift 1. Produktmomentkorrelationskoefficienten

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

DATORÖVNING 3: MER OM STATISTISK INFERENS.

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

Repetitionsföreläsning

OBS! Vi har nya rutiner.

SPSS En guidad tur. Vad ska jag göra idag? Följ instruktioner som följer, om du behöver hjälp det är bara att fråga en lärare!

Introduktion till SPSS

Repetitionsföreläsning

Introduktion och laboration : Minitab

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Datainmatning TÄNKTA BETECKNINGAR. Variabelnamn/kolumnbeteckning, Dummyvärden, som matas in beroende på aktuellt svarsalternativ

Uppgift 1. Deskripitiv statistik. Lön

Kort manual till SPSS 10.0 för Mac/PC

import totalt, mkr index 85,23 100,00 107,36 103,76

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet. SPSS (PASW) 18 for Windows - a guided tour

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Laboration 2. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att utföra multipel regressionsanalys MÄLARDALENS HÖGSKOLA

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

7.3.3 Nonparametric Mann-Whitney test

Medicinsk statistik II

Multipel Regressionsmodellen

Forsknings- och undersökningsmetodik Skrivtid: 4h

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel vers. 2010

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Följande resultat erhålls (enhet: 1000psi):

Datorövning 1 Enkel linjär regressionsanalys

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet. Laboration 3. Variansanalys

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Gamla tentor (forts) ( x. x ) ) 2 x1

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Variansanalys med SPSS Kimmo Sorjonen ( )

Samhällsvetenskaplig metod, 7,5 hp

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Introduktion till PAST

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c)

Medicinsk statistik II

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

7.5 Experiment with a single factor having more than two levels

DATORÖVNING 2: STATISTISK INFERENS.

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 1

Hypotestestning och repetition

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Laboration 2 multipel linjär regression

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

F3 Introduktion Stickprov

Parade och oparade test

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET. BESKRIVANDE STATISTIK. SANNOLIKHETSLÄRA.

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Laboration 3 Inferens fo r andelar och korstabeller

Introduktion till PSPP

FACIT (korrekta svar i röd fetstil)

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Introduktion till. Minitab version 14

Datoro vning 1-2 Statistisk analys av kodade svar

Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet Per-Erik Isberg. SPSS for Windows 12 - a guided tour

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

InStat Exempel 4 Korrelation och Regression

Laborationer i statistik för A:1, Lab 1

Obligatorisk uppgift, del 1

Transkript:

En kort instruktion för arbete i SPSS Anpassad till kursen Statistik och kvantitativa undersökningar HT14 Lars Bohlin 1

Innehåll Att lägga in data i SPSS... 3 Att skapa nya variabler... 4 Koda en ny variabel utifrån värdena på en gammal variabel... 4 Koda om en existerande variabel... 5 Beräkna en ny variabel... 5 Deskriptiv statistik... 6 Beräkning av deskriptiva parametrar, kvantitativa variabler:... 6 Beräkning av deskriptiva parametrar, kvalitativa variabler:... 7 Diagram, kvalitativa variabler... 8 Cirkeldiagram:... 9 Stapeldiagram... 10 Grupperade stapeldiagram... 10 Stacked stapeldiagram... 10 Diagram, kvantitativa variabler... 11 Histogram... 11 Frekvens Polygon... 12 Box plot... 13 Hypotesprövning... 16 Hypotestestning av variabler mätta på kvotskala... 16 Hypotestest av medelvärde... 16 Hypotestest av medelvärde i två oberoende urval... 16 ANOVA test.... 18 Hypotestest av medelvärde i två beroende urval... 20 Hypotestester av variabler mätta på ordinalskala... 21 Två oberoende urval: Wilcoxons rangsummetest... 21 Flera oberoende urval: Kruska Wallis test... 22 Beroende urval: Teckentest och Wilcoxons teckenrangtest... 23 Hypotestestning av variabler mätta på nominalskala... 24 Hypotestest av andelar... 24 Test av samband mellan variabler... 25 Korstabellsanalys - test av samband mellan variabler mätta på nominalskala... 25 Korrelation... 27 Regressionsanalys... 28 2

Att lägga in data i SPSS Om du har data i en excellfil som du ska lägga in i SPSS gör du på följande sätt. Välj type in data när du öppnar SPSS (alterntivt om du redan har öppnat SPSS: Under menyn File i SPSS klicka på New och välj Data ) Markera datamaterialet i excellfilen och klicka på kopiera I det tomma datafönstret i SPSS klicka på Data View Markera översta cellen i översta kolumnen och klicka på Paste Klicka på variable view I kolumnen Name kan du ändra namnen på dina variabler, här får du dock bara använda 8 tecken. Vill du göra ett tydligare längre namn anger du det i kolumnen Label. Om du har en variabel där du kodat olika svarsalternativ med siffror kan du ange vilket svarsalternativ de olika siffrorna står för i kolumnen Values. Markera cellen i kolumnen values för den variabel där du vill förtydliga de olika utfallen. Klicka på den lilla rutan med tre prickar, du ska då få upp följande dialogruta: I rutan value skriver du in ett av utfallen I rutan Label vad det utfallet motsvarar Klicka på add Upprepa för alla utfall på variabeln. Klicka OK Du måste också tala om för SPSS vilken skala de olika variablerna är mätta på, det gör du i kolumnen Measure 3

Att skapa nya variabler Koda en ny variabel utifrån värdena på en gammal variabel Antag att vi har en variabel som kan anta värdena 1, 2, 3 eller 4. Du vill nu dela in ditt material i tre grupper. En grupp som innehåller de observationer som har värdet 1 på den ursprungliga variabel, en grupp för värdet 2 och en grupp för värdena 3 eller 4. Då behöver du skapa en variabel som kan anta tre utfall. Gör så här Klicka på: Transform/Recode into Different Variables I rutan Input Variable->Output variable placerad du den gamla variabeln I rutan name skriver du namnet på den nya variabeln Klicka på: Change Klicka på: Old and new Values Under old value skriv in ett värde från den gamla variabeln Under New Value skriv in det värde som den nya variabeln ska ha för detta värde på den gamla. Klicka på: Add Det ska nu ha dykt upp en rad i rutan Old->New Upprepa detta för alla värden på den gamla variabeln. Klicka sedan i System missing under såväl old value som new value klicka på add Klicka på: continue Klicka på: OK 4

Koda om en existerande variabel Använd: Transform/Recode into Same Variables Tillvägagångsättet är i princip detsamma som när vi skapa de en ny variabel Beräkna en ny variabel Gör så här Klicka på: Transform/Compute Variable I rutan Target variable skriver du namnet på den nya variabeln I rutan numeric expression skriver du hur den ska beräknas (I exemplet nedan beräknas en ny variabel som öppettiden i minuter. Jag skrev in 60 * och drog variabeln hrsopen från variabellistan.) Klicka på: OK 5

Deskriptiv statistik Beräkning av deskriptiva parametrar, kvantitativa variabler: 1. I menyn analyze välj Descreptive statistics / descriptives 2. Dra variabeln/variablerna du vill utföra beräkningarna på till fältet variabels 3. Klicka options och välj vilka mått du vill beräkna 4. Klicka continue i Descriptives options fönstret 5. Klicka OK I Descriptives fönstret 6. Resultatet visas i outputfönstret: 7. 6

Beräkning av deskriptiva parametrar, kvalitativa variabler: 1. I menyn analyze välj Descreptive statistics / frequencies 2. Dra variabeln/variablerna du vill utföra beräkningarna på till fältet variabels. (Om du vill anpassa hur frekvenstabellerna visas kan du göra det under Format.) 3. Klicka ok 7

Diagram, kvalitativa variabler Ett alternativ är att använda: 1. analyze / Descreptive statistics / frequencies och klicka på charts, bocka för det diagram du vill visa. 2. Klicka på continue 3. Klicka på OK 4. Diagrammet visas i outputfönstret. 8

Ett annat alternativ är att använda legacy dialog: Cirkeldiagram: 1. I menyn graphs klicka legacy dialog och välj diagramtyp pie 2. I den första diaglogrutan välj Summaries for groups of cases 3. Ni får nu upp en dialogruta där ni har alla variablerna till vänster. Till höger finns en ruta där det står Define slices by: Ni ska nu dra variabeln ni vill illustrera från variabellistan till rutan Define slices by 4. Klicka på OK Diagrammet öppnas i Output fönstret. Om ni dubbelklickar på det öppnas ett fönster som kallas chart editor I chart editorn har du flera alternativ för att modifiera diagrammet. Prova exempelvis den knapp jag markerat med en röd pil i bilden ovan (show data labels). Med den kan ni föra in frekvenserna i figuren. 9

Stapeldiagram 1. I menyn graphs klicka legacy dialog och välj diagramtyp Bar 2. I den första diaglogrutan välj simple 3. Ni ska nu dra variabeln chain från variabellistan till rutan Category axes 4. Klicka på OK Grupperade stapeldiagram 1. I menyn graphs klicka legacy dialog och välj diagramtyp Bar 2. I den första diaglogrutan välj clustered 3. Ni ska nu dra variabeln chain från variabellistan till rutan Category axes och variabeln compown till define clusters by 4. Klicka på OK Stacked stapeldiagram 1. I menyn graphs klicka legacy dialog och välj diagramtyp Bar 2. I den första diaglogrutan välj stacked 3. Ni ska nu dra variabeln chain från variabellistan till rutan Category axes och variabeln compown till define stacks by 4. Klicka på OK 10

Diagram, kvantitativa variabler Histogram 1. I menyn graphs klicka chart builder. 2. (Om ni får upp en dialogruta som frågar om set measurements levels klicka bara OK) 3. I Chart builder välj histogram nere till vänster. 4. I mittersta nedre fältet välj simple histogram (Den första ikonen) 5. Ni ska nu dra variabeln som du vill illustrera från variabellistan till rutan X-axis 6. Chart buildern ska nu se ut som nedan: 7. I dialogfönstrer Element properties klicka Set parameters 8. Under Bin Sices välj custom. Välj Number of Intervals och specifiera hur många klasser ni vill ha. (Prova gärna några olika alternativ för att jämföra.)klicka på continue. 9. Klicka Apply i Element Properties 10. Klicka OK i Chart buildern. 11

Diagrammet öppnas i Output fönstret. Vill du ha en titel på ditt diagram? Du kan lägga till det under Titles/Footnotes i chart buildern Frekvens Polygon Gör på samma sätt som för histogram men välj frequency polygon i mittre nedre fältet. (SPSS klassifierar frekvens polygon som en typ av histogram). 12

Box plot 1. I menyn graphs klicka chart builder. 2. I chart builderna välj boxplot nere till vänster och simple boxplot den första iconen nere i mitten. 3. Dra variabeln ni vill illustrera från variabellistan till fältet Y-axis. 4. Klicka OK 5. Diagrammet visas i outputfönstret: Under Basic element kan ni experimentera med att klicka på transpose. 13

SPSS anger extremvärden med ringar, bredvid ringen anges observationens löpnummer. Om du hellre vill att ett variabelvärde för extremvärdesobservationen visas kan du använda funktionen Point ID label 1. Under Groups/point id välj Point ID label och dra variabeln som du vill använda som namn på extremvärdena till fältet Point Label Variable Nu visas kedjetillhörigheten vid extremvärdena: 14

Om du vill dela in ditt datamaterial i olika grupper och göra en boxplot för varje grupp ska du dra den kategorivariabel som du vill använda för gruppindelningen till x-axis Med ovanstående inställning fås diagrammet nedan: 15

Hypotesprövning Hypotestestning av variabler mätta på kvotskala Hypotestest av medelvärde Antag att du vill testa nollhypotesen att medelvärdet av en variabel är lika med ett specifikt värde mot alternativhypotesen att medelvärdet avviker från det värdet. Gör så här Klicka på: Analyze/Compare Means/One Sample T-test I Test variable(s) placerar du den variabel vars medelvärde du vill göra hypotestesten på. I Test Value anger du medelvärdet enligt nollhypotesen Klicka på: OK Output I outputfönstret ska det nu ha kommit upp två tabeller: One-sample statistics anger variabelns medelvärde, standardavvikelse samt urvalsmedelvärdenas standardavvikelse (Std Error Mean) One-sample test anger teststatistikans värde (t), antalet frihetsgrader (df), p-värde(sig. (2- tailed), avvikelsen mellan variabelns medelvärde och nollhypotesens värde (Mean difference) samt ett konfidensintervall för den avvikelsen. Om du vill ändra konfidensgrad för det konfidensintervallet kan du göra det under options. Om du bara vill beräkna ett konfidensintervall för en variabel kan du också använda det här kommandot. Genom att ange 0 som hypotetiskt värde så kommer medelavvikelsen från noll att vara lika med variabelns medelvärde och konfidensintervallet kommer att avse variabelns värde. Hypotestest av medelvärde i två oberoende urval Gör så här Klicka på: Analyze/Compare Means/Independent-Samples T-test Drag de variabler som ni vill göra hypotestester på till Test variable(s). Drag den variabel ni vill använda för gruppindelningen till Grouping Variable: Klicka på: Define Groups Skriv variabelvärdet för den ena gruppen i fältet Group 1 Skriv variabelvärdet för den andra gruppen i fältet Group 2 Klicka på: continue 16

Klicka på: OK Output I outputfönstret ska det nu ha kommit upp två tabeller: Group Statistics I denna tabell finns en rad för varje grupp. I N kolumnen visas antal observationer i varje grupp, I Mean deras medelvärde för den variabel vi testar och i Std deras standardavvikelse. Kolumnen Std. Error mean ger oss urvalsmedelvärdets standardavvikelse. (Denna ska enligt centrala gränsvärdessatsen vara lika med standardavvikelsen dividerad med roten ur n, testa gärna om det stämmer) Independent Samples Test Här finns två rader, den översta raden beräknar teststatistikan utifrån ett antagande om att de båda populationerna har samma varians. De första två kolumnerna anger F statistikan och pvärdet från en hypotestest om över om varianserna är lika. Om p värdet här är signifikant kan vi bevisa att varianserna skiljer sig åt och bör använda siffrorna från andra raden. Om p värdet inte är signifikans vet vi inte om varianserna är lika eller ej. (Om vi inte har någon särskild anledning at tro att de är lika bör vi kanske använda siffrorna från andra raden även i det fallet?) Resten av kolumnerna anger utfallet för hypotestesten om medelvärdet. T kolumnen anger värdet på vår teststatistika, df dess frihetsgrader, Sig. (2 tailed) ger oss p värdet för ett dubbelsidigt test. Om detta är lägre än den signifikansnivå vi valt kan vi alltså förkasta nollhypotesen om att medelvärdena är lika och dra slutsatsen att de skiljer sig åt. Mean difference ger oss avvikelsen mellan medelvärdena i de 2 urvalen. Std Error Difference ger oss standardavvikelsen för denna avvikelse om vi gör en stor mängd urval av denna storlek från dessa populationer. Slutligen får vi ett konfidensintervall för avvikelsen mellan medelvärdena. 17

ANOVA test. I ett ANOVA test jämförs medelvärden från olika populationer. ANOVA testen används om vi delar in vårt dataset i olika delpopulationer och vill testa om de delpopulationerna har samma medelvärde. Nollhypotesen i ett ANOVA test är att alla populationer har samma medelvärde. Alternativhypotesen blir således att minst en population har ett avvikande medelvärde. Vi delar in datasetet med hjälp av en kvalitativ variabel. Exempel: Vi kanske har ett dataset över alla kommuner. Om vi i datasetet har en kvalitativ variabel som anger i vilket län kommunen ligger kan den variabeln användas för att dela in datasettet i flera underpopulationer, en population för varje län. Gör så här Klicka på: Analyze/Compare Means/ Means I dependent list placerar du de variabler vars medelvärden du vill beräkna och jämföra. I independent list placerar du den variabel du vill använda för att dela in materialet i delpopulationer. 18

Klicka på: options I cell statistics ska du ha med Mean, number of cases och standard deviation Kryssa för: Anova table and Eta under statistics for first layer Klicka på: continue Klicka på: OK Output I outputfönstret ska det nu ha kommit upp tre tabeller: Case Processing Summury: Här anges om några observationer har strukits pga data missing Report: Här anges medelvärde antal observationer och standardavvikelse i varje delpopulaiton: ANOVA: Denna tabell anger resultaten i Hypotestesten. I F kolumnen anges värdet på teststatistikan. Denna kan jämföras med ett kritiskt värde från tabellen Critical Values of the F Distribution. Men enklare är att titta i kolumnen sig. Där vi hittar testets p-värde. Om detta är lägre än den signifikansnivå vi valt kan vi förkasta nollhypotesen. Det innebär alltså att minst en av populationerna har ett avvikande medelvärde. Om vi kan förskasta nollhypotesen kan det vara en god ide att beräkna konfidensintervall för medelvärdet i varje population. All information du behöver för det finns i tabellen Report. Genom att se vilka konfidens intervall som överlappar varandra och vilka som ej gör det kan du se vilken vilka delpopulationer som har avvikande medelvärde. 19

Hypotestest av medelvärde i två beroende urval Gör så här Klicka på: Analyze/Compare Means/Paired-Samples T-test Drag de variabler som ni vill göra hypotestester på till Paired Variables. Klicka på: OK Output I outputfönstret ska det nu ha kommit upp tre tabeller: Paired Samples Statistics Ger oss medelvärde, urvalsstorlek, standardavvikelse och urvalsmedelvärdenas standardavvikelser Paired Samples Correlations Ger oss Pearsons korrelationskoefficient mellan de två variabler vi testar. Paired Samples Test Kolumnen Mean ger oss genomsnittliga avvikelsen mellan de båda variablerna, Std. Deviation standardavvikelsne på denna avvikelse. Std.Error Mean ger oss som vanligt urvalsmedelvärdenas standardavvikelse, nästa två kolumner ger oss en konfidensintervall över genomsnittliga avvikelsen, t kolumnen ger oss teststatistikans värde df dess frihetsgrader och Sig (2-tailed) ger oss p-värdet. Om p värdet är signifikant kan vi dra slutsatsen att variablerna skiljer sig åt i hela populationen. 20

Hypotestester av variabler mätta på ordinalskala Två oberoende urval: Wilcoxons rangsummetest Wilcoxons rangsummetest används för att visa om en grupp har högre värden på en variabel än en annan grupp när variabeln är mätt på ordinalskala. Testet kallas också för Mann- Witney U Gör så här Klicka på: Analyze / nonparametric test / legacy dialogs / 2 independent samples Drag de variabler som ni vill göra hypotestester på till Test variable list. Drag den variabel ni vill använda för gruppindelningen till Grouping Variable: Klicka på: Define Groups Skriv variabelvärdet för den ena gruppen i fältet Group 1 Skriv variabelvärdet för den andra gruppen i fältet Group 2 Klicka på: continue Klicka på: OK Output I outputfönstret ska det nu ha kommit upp två tabeller: Ranks I denna tabell finns en rad för varje grupp samt en totalrad. I N kolumnen visas antal respondenter i varje grupp, i mean Rank deras genomsnittliga rangtal och i SUM of Ranks deras rangsumma. Den grupp som har högst genomsnittliga rangtal har alltså de högsta värdena på testvariabeln i detta urval. Test statstics De två första raderna här anger delar i beräkningen av teststatistikan. Rad tre visar den normalfördelade teststatistikan och rad 4 dess p-värde. Om p-värdet är lägre än signifikansnivån kan den skillnad vi visat i urvalet anses gälla i hela populationen. 21

Flera oberoende urval: Kruska Wallis test Gör så här Klicka på: Analyze / nonparametric test / legacy dialogs / K independent samples Drag de variabler som ni vill göra hypotestester på till Test variable list. Drag den variabel ni vill använda för gruppindelningen till Grouping Variable: Klicka på: Define Range Skriv högsta och lägsta värde på er gruppindelningsvariabel. (De olika utfallen på denna variabel måste således vara siffror, om ni har bokstavskombinationer måste ni koda en ny variabel, med hjälp av kommandot Recode into Different Variables. Se avsnittet om Koda en ny variabel utifrån värdena på en gammal variabel. Klicka på: continue Bocka för: Kruska Wallis H Klicka på: OK Output I outputfönstret ska det nu ha kommit upp två tabeller: Ranks I denna tabell finns en rad för varje grupp samt en totalrad. I N kolumnen visas antal respondenter i varje grupp och i mean Rank deras genomsnittliga rangtal. Den grupp som har högst genomsnittliga rangtal har alltså de högsta värdena på testvariabeln i detta urval. Test statstics Den första raden här anger den Chi2 fördelade test statistikan och rad två dess frihetsgrader. Rad tre visar dess p-värde. Om p-värdet är lägre än signifikansnivån har vi visat att minst en av grupperna avviker från de övriga även i hela populationen. 22

Beroende urval: Teckentest och Wilcoxons teckenrangtest Gör så här Klicka på: Analyze / nonparametric test / legacy dialogs / 2 related samples Ange de två variabler du vill jämföra i Test Pairs Kryssa för: Wilcoxon och/eller Sign Klicka på: OK Output I outputfönstret visas under Wilcoxon Signed Rank Test två tabeller: I tabellen Ranks anger N kolumnen antalet observationer som har högst värde för ena eller andra variabeln, antalet observationer som har samma värde för båda variablerna samt totala antalet observationer. Kolumnen Mean Rank anger genomsnittliga rank talet och Sum of Ranks rangsumman. Test statistics tabellen anger z värdet samt p-värdet för dubbelsidig test. I outputfönstret visas under Sign Test två tabeller: Frequencies anger antal observationer som har högst värde för ena eller andra variabeln, antalet observationer. Test statistics tabellen anger z värdet samt p-värdet för dubbelsidig test. 23

Hypotestestning av variabler mätta på nominalskala Hypotestest av andelar Antag att du vill testa nollhypotesen att andelen som har ett visst värde på en kvalitativ variabel är lika med den hypotetiska andelen mot alternativhypotesen att andelen avviker från den hypotetiska andelen. Skapa först en dummyvariabel som antar värdet 1 för de individer som har det specifika värdet och 0 för övriga. Gör så här Klicka på: Analyze / Non-parametric tests / leacy dialog / Binomial I Test Variable list placerar du den dummyvariabel du skapat. I Test proportion anger du andelen enligt nollhypotesen Klicka på: OK Output I outputfönstret ska det nu ha kommit en tabell som heter Binomial test: Kolumnen Category anger värdena på dummyvariabeln Kolumnen N anger frekvenserna Kolumnen Observed prop anger andelarna, dvs de relativa ferkvenserna Kolumnen Test proportion anger andelen enligt nollhypotesen Kolumnen Exact Sig. Anger p värdet (om hypotesen är en andel om 0,5 görs en dubbelsidig test, vid andra hypoteser anges p värdet från en enkelsidig test). 24

Test av samband mellan variabler Korstabellsanalys - test av samband mellan variabler mätta på nominalskala I en korstabellsanalys är nollhypotesen att variablerna är oberoende. Om vi kan förkasta nollhypotesen har vi därmed bevisat att det finns ett beroende mellan variablerna. Gör så här Klicka på: Analyze/Descriptive statistics/crosstabs I Rows placerar du den variabel som du vill ha i raderna på korstabellen I Colums placerar du den variabel som du vill ha i kolumnerna på korstabellen Klicka på: statistics Bocka för Chi square Klicka på: continue 25

Klicka på: cells Bocka för Observed och Expected Klicka på: continue Klicka på: OK Output I outputfönstret ska det nu ha kommit upp tre tabeller: I case processing summary anges hur många observationer som har giltiga värden för de variabler vi undersöker, hur många som saknar värde samt totala antalet. Nästa tabell är själva korstabellen. Här bör du kontrollera att antalet celler som har en förväntad frekvens som är mindre än 5 inte överstiger 20 % av totala antalet celler. Chi Square tests tabellen anger om vi kan förkasta nollhypotesen eller ej. Om du vill ha de relativa frekvenserna i korstabellen ska du bocka för en eller flera av rutorna i Percentages i dialogfönstret cells 26

Korrelation För variabler mätta på ordinalskala eller kvotskala kan man beräkna korrelationen mellan två variabler som ett mått på deras beroende. För ordinalskala används Spearmans korrelationskoefficient och för kvotskala används Pearsons korrelationskoefficient. Gör så här Klicka på: Analyze / Correlate / Bivariate Ni ska nu ha fått upp en dialogruta som ser ut på följande sätt: Drag de variabler ni vill undersöka till rutan Variables. Bocka för rutorna Two tailed och Flag significant correlations Bocka för Pearson (om alla era variabler är mätta på kvotskala) eller Spearman (om någon av dem är mätt på ordinalskala.) Klicka på: OK Output I outputfönstret ska det nu ha kommit upp en korrelationsmatris: I varje cell av matrisen anger den översta siffran korrelationskoefficienten Den andra siffran anger p värdet, om detta är lägre än er signifikansnivå är korrelationskoefficienten signifikant skild från noll. Den tredje siffran visar antalet observationer med giltiga värden för båda variablerna. 27

Regressionsanalys I en OLS regression ska den beroende variabeln vara mätt på intervall eller kvotskala. Som oberoende variabler kan man använda variabler mätta på intervall eller kvotskala. Variabler mätta på ordinal eller nominalskala kan enbart användas om de görs om till dummyvariabler. Gör så här Klicka på: Analyze/Regression /Linier Dra den beroende variabeln till fältet Dependent och de oberoende variablerna till fältet Independent Klicka på: OK Output I outputfönstret ska det nu ha kommit upp fyra tabeller: Variables Enetered/Removed anger vilka variabler som används i regressionen I Model Summary angers förklaringsgraden i kolumnen R square. Kolumnen R ger roten ur förklaringsgraden. (Om du enbart har en oberoende variabel är detta lika med Pearsons korrelationskoeficient mellan den beroende och den oberoende variabeln) Kolumnen Adjusted R Square ger den justerade förklaringsgraden. Kolumnen Std. Error of the estimate ger residualspridningen (roten ur residualvariansen). 28

I ANOVA tabellen anger kvadratsummorna i kolumnen Sum of Squares. På översta raden anges SSR den variation i den beroende variabel som förklaras av regressionsmodellen. På andra raden anges SSE residualernas kvadratssumma, eller den oförklarade variationen. (Det är SSE som minimeras när datorn beräknar en OLS regression). På tredje raden anges SST, den totala variationen i den beroende variabeln. I kolumnen df anges frihetsgrader. På översta raden anges antalet oberoende variabler. På andra raden anges regressionskoefficienternas t-kvoters frihetsgrader, dvs urvalstorleken minus 1 minus antalet oberoende variabler. På tredje raden anges antalet frihetsgrader vid beräknandet av den beroende variabelns varians dvs urvalsstorleken minus 1. I de två sista kolumnerna F och Sig. visas resultaten från en F-test som är en test på hela modellen. Siffran i Sig. kolumnen är F-testets p-värde. Om detta är större än den valda signifikansnivån har modellen inget förklaringsvärde. I tabellen Coefficients anges regressionskoefficienterna. Kolumnen B ger deras värde, och kolumnen Std.error deras standardavvikelse. Kolumnen t ger koefficienternas t-kvoter och Sig. deras p-värden. Om p-värdet är större än den valda signifikansnivån kan vi inte avslå nollhypotesen att koefficienten är lika med 0. Vi säger då att koefficienten inte är signifikant. Det innebär att vi inte kan bevisa att den påverkar den beroende variabeln. Det är därför endas om p-värdet är lägre än signifikansnivån som vi tolkar en regressionskoefficient. Fler resultat: Det finns möjlighet att ta fram ytterligare resultat från regressionsmodellen. Om ni klickar på Statistics kan ni exempelvis välja till att få konfidensintervall på regressionskoefficienterna eller en kovariansmatris för de oberoende variablerna (om ni väljer att kryssa i kovariansmatrisen får ni dels kovarianserna dels korrelationskoefficienterna mellan varje par av oberoende variabler.) Om ni klickar på plots kan ni exempelvis få ett histogram över residualerna. Andra valmöjligheter: Om ni klickar på Save har ni bl a möjlighet att spara residualerna från regressionsmodellen till ert dataset. Om ni klickar på options kan ni bl a välja att köra en modell utan intercept. 29