1 Intro till SPSS Kimmo Sorjonen (0811) 1. Att mata in data i SPSS 1. Klicka på ikonen för SPSS. 2. Välj alternativet Type in data och klicka på OK. 3. Databladet har två flikar: Data view och Variable view (se längst ner till vänster). I data view matar man in data och utför sina analyser. I variable view definierar man sina variabler. Vi börjar med att gå in i variable view (klicka på fliken). 1.1 Variable view Huvudregeln är att varje variabel blir en rad. I de olika kolumnerna anger vi variabelns egenskaper. Från vänster till höger är kolumnerna: Name: Här anger man variabelns namn. Vissa tecken, t ex blanksteg, accepteras inte. Om programmet protesterar ändra på namnet. Type: Om man klickar i cellen i den här kolumnen så kommer det upp en liten fyrkant längst ut till höger i cellen. Om man klickar på den här fyrkanten så ser man vilka alternativ det finns att välja mellan. Det absolut vanligaste alternativet är numeric (som också är förvalt) som kan användas för de flesta kvantitativa variabler och även för kategorivariabler. String används om man vill ha en textvariabel, men sådana variabler kan inte användas i statistiska analyser. Width: Cellvidd (8 är förvalt). Om man vill ändra på cellvidden klickar man i cellen och sedan på pilarna, antingen uppåt eller neråt, som kommer upp längst till höger i cellen. Decimals: Antalet decimaler. 2 är förvalt men kan ändras. Label: Här kan man mer utförligt beskriva vad variabeln handlar om. Values: För kategorivariabler ges de olika kategorierna en siffra. Klicka i cellen och sedan på den lilla fyrkanten. I den nya rutan skriver man in en siffra på raden value, t ex 1. På raden value label skriver man in kategorin, t ex man. Sedan klickar man på Add och upprepar proceduren för nästa kategori, t ex 2 och kvinna. Avsluta alltid med att klicka på Add och sedan på OK. Missing: Här kan man skriva in vilket värde som står för saknad data (missing values). Columns: Align: Var ska värdena stå i cellen; höger, vänster eller centrerat. Measure: Här kan man ange vilken skalnivå variabeln är på. Scale står för intervalleller kvotdata. 1.2 Data view Här matar man in sina mätvärden. Huvudregeln är att varje undersökningsobjekt, inom psykologin oftast människor, blir en rad. Man kan förflytta sig mellan cellerna både med piltangenterna, tabulatorn eller genom att klicka med musen. Man kan använda både de
2 vanliga nummertangenterna och det lilla nummertangentbordet längst ut till höger på tangentbordet. När man matar in kategorivärden så skall man inte försöka skriva in dessa med bokstäver. Istället skriver man in den siffra som motsvarar den aktuella kategorin (t ex 1 för man och 2 för kvinna). Om knappen Value label (näst längst ut till höger i ikonmenyn) är intryckt så visas kategorinamnet, annars visas kategorivärdet. 2. Skapa nya variabler Ibland vill man skapa nya variabler som baseras på redan inmatade variabler. Detta kan man göra genom Compute-functionen (Transform Compute). I miniräknar en som man får upp skriver man namnet på den nya variabeln i rutan Target Variable. I rutan Numeric Expression definierar man hur värdena i den nya variabeln skall räknas fram. Beräkningen utförs när man klickar på OK. Den nya variabeln hamnar längst ut till höger i databladet. 2.1 Spegelvändning Om man vill spegelvända en variabel, t ex en som heter f28.tomt, så att höga värden blir låga och tvärtom, så kan man göra på följande sätt. Skriv namnet på den nya variabeln, t ex rev.f28.tomt, i rutan Target Variable. Om den ursprungliga variabeln (f28.tomt) är på en skala från 1 till 7 så skriver man 8- f28.tomt i rutan Numeric Expression. På så sätt kommer alla som hade värdet 1 i f28.tomt få värdet 7 i rev.f28.tomt, eftersom 8-1 = 7. Alla som hade värdet 2 i f28.tomt får värdet 6 i rev.f28.tomt, o.s.v. Om värdet på den ursprungliga variabeln är på en skala från 1 till 5 så skall man i rutan Numeric Expression skriva 6-f28.tomt istället. 2.2 Medelvärden (att skapa index) Om man vill att en ny variabel skall vara lika med medelvärdet för ett antal andra variabler (t ex f27.nöjd, f29.fantastiskt, f31.energi, rev.f28.tomt och rev.f30.uttråkad) så skriver man mean(f27.nöjd, f29.fantastiskt,f31.energi, rev.f28.tomt,rev.f30) i rutan Numeric Expression (dock helt utan mellanslag). Klicka på OK. Denna funktion kan användas för att skapa en index-variabel där varje respondent får ett värde som är lika
3 med medelvärdet för hur respondenten svarat på de i indexet ingående frågorna. Man bör ge den nya index-variabeln ett namn som reflekterar vad den mäter, i det aktuella fallet mäter frågorna hur pass nöjd man är med livet så den nya index-variabeln döps till life.sat. 3. Deskriptiv statistik 3.1 Medelvärden m.m. För att få fram deskriptiv statistik går vi in under: Analyze Descriptive statistics Descriptives. Alla våra inmatade variabler står i rutan till vänster. Markera, genom att klicka med musen, de variabler som du vill ha fram värden för. Klicka på pilen mitt i fönstret, så att variablerna hamnar i rutan under Variable(s). Om vi klickar på OK får vi fram medelvärden, standardavvikelser, min- och maxvärden samt antalet observationer. Om man vill ha andra deskriptiva mått så finns dessa kanske under Options. Markera de mått du vill få fram, klicka på Continue och sedan på OK. Nedan ges ett exempel på utskrift: OBS: Man förflyttar sig mellan databladet och resultatsidan (output) genom att välja alternativ under Windows i menyn alternativt genom att klicka på databladet eller på output i menyn längs ner på skärmen. 3.2 Frekvenser Om man vill ha fram frekvenser av observationer går man istället in under Analyze Descriptive statistics Frequencies. Proceduren är sedan den samma man markerar de variabler man är intresserad av och förflyttar dem till rutan under Variable(s) och klickar sedan på OK. 3.3 Korrelation För att beräkna korrelationen mellan två variabler går vi in under Analyze Correlate Bivariate. Markera de variabler du är intresserad av (man kan ta fler än två) och flytta dem till rutan under Variables. Klicka på OK och du kan få en utskrift som t ex ser ut så här:
4 I tabellen ser vi att variablerna korrelerar med +1.0 med sig själva så är det alltid. Korrelationen mellan variablerna f23.studier (hur mycket man pluggar) och life.sat (hur pass nöjd man är med livet) ges två gånger och den är lika med 0.26. 3.4 Uppdelat på grupper Om man vill ha deskriptiv statistik uppdelat på olika grupper (t ex kvinnor och män) så kan man gå in under Analyze Compare Means Means. Man flyttar den/de variabel/variabler man är intresserad av (t ex f21.te och f22.kaffe) in i rutan under Dependent List. Kategorivariabeln flyttas till rutan Independent List. Om man klickar på OK får man fram medelvärdet, standardavvikelsen och antalet observationer på f21.te och f22.kaffe för kvinnor och för män separat. Vill man ha någon ytterligare deskriptiv statistik så kan man klicka på Options och sedan välja i listan. I utskriften nedan har jag valt till medelfel (Std. Error of Mean). 3.5 Diagram Ofta vill man presentera data med hjälp av diagram. Själv brukar jag oftast göra mina diagram i Excel (kanske mest av gammal vana). Ovan till höger syns ett Exceldiagram baserat på en del av värdena i tabellen ovan till vänster. Man kan dock skapa diagram även i SPSS, under rubriken Graphs i menyn (här är det nog enklast att gå in under rubriken Legacy Dialogs ). Till höger syns ett punktdiagram (scatterplot) över sambandet mellan hur mycket man pluggar och hur pass nöjd man är med livet. Gillande 7 6 5 4 3 2 1 Te Kvinnor Män Dryck Kaffe Figur 11.1: Genomsnittligt gillande (+ medelfel) av te och kaffe, separat för kvinnliga och manliga respondenter.
5 4. Data-funktioner Under rubriken Data i menyn finns några funktioner som kan vara bra att känna till. 4.1 Sort Cases Här kan man sortera respondenterna i ordning utifrån värdet på valfri variabel. Man kör in den variabel utifrån vilken man vill sortera i rutan. Om Ascending är valt som Sort Order så sorteras respondenterna i stigande ordning medan Descending sorterar i en minskande ordning. Den här funktionen är användbar t.ex. om man vill plocka ut de högsta/lägsta värdena för presentation i en tabell. 4.2 Split File Om man vill utföra sina analyser separat för olika grupper så kan man dela upp filen. Om man t.ex. vill utföra analyser separat för kvinnor och män så väljer man alternativet Organize output by groups och så kör man in variabeln kön i rutan Groups Based on klicka på OK. Alla analyser utförs nu separat för kvinnor och män. Vill man stänga av denna funktion går man tillbaka till Split File, klickar bort kön från Groups based on -rutan och väljer alternativet Analyze all cases, do not create groups klicka på OK. 4.3 Select Cases Ibland vill man kanske göra sina analyser på endast en del av respondenterna. Då kan man gå in på Select Cases, välja alternativet If condition is satisfied och klicka på If. I listan till vänster väljer man, genom att dubbelklicka, den variabel som man välja utifrån. Om man t.ex. klickar på kön och sedan skriver till så att det står kön = 1 i rutan till höger (se bilden till höger) och sedan klickar på Continue och OK så kommer alla analyser att utföras endast på personer med kön = 1. Om man klickar på längd och fyller i så att det står längd > 180 så kommer alla analyser att utföras endast på de respondenter som är längre än 180 cm, o.s.v. Vill man åter utföra analyserna på alla respondenter så går man in på Select Cases och väljer alternativet All cases klicka på OK.