Idiotens guide till Håkan Lyckeborgs SPSS-föreläsning 4/12 2008 Av: Markus Ederwall, 21488
1. Starta SPSS! 2. Hitta din datamängd på Kurs 601\downloads\datamängd A på studentwebben 3. När du hittat datamängden (vars filnamn är ditt inskrivningsnummer) sparar du den på ett ställe där du snabbt kan hitta den (exempelvis under mina dokument eller på skrivbordet) 4. När du sparat filen ska du öppna den med SPSS: Via menyn till File/Open/Data, så kommer rutan för att öppna datafiler upp.
5. Börja med att först definiera vilka filtyper (files of type) som ska visas, markera sedan Excel, som jag har gjort på bilden och leta reda på din datamängd. Tryck på open så öppnas den (förhoppningsvis)
6. Förhoppningsvis ser det nu ut ungefär så här på din skärm: 7. Kommentarer till datamängden så här långt: 9999,0000 i värde betyder att respondenten inte svarat detta år. Kön 1 betyder kvinna, 2 betyder man.
8. För att göra en liten analys på rådata -mängden, utan att göra några som helst korrigeringar eller justeringar, tryck på Analyze->Descriptive Statistics->Descriptives, så kommer det upp en ruta där du får välja vilken av variablerna du vill analysera. Markera önskad variabel (Varde08 i detta fall), tryck på knappen som är markerad med en ful pil och en 2:a i bilden ovan och tryck sedan på OK. 9. Då kommer du att få upp en ruta som ser ut något i stil med nedan. Märk väl att siffrorna är personliga för just din datamängd. Descriptive Statistics N Minimum Maximum Mean Std. Deviation Varde08 300 40,1533 9999,0000 238,968476 1,2728624E3 Valid N (listwise) 300 10. Här kan du nu se att medelvärdet (mean) ligger utanför index (som ju är 0-100). Detta beror på att de som angivit 9999,0000 (dvs inget svar) som värde har räknats med (vilket man ser under maximum ). Detta måste åtgärdas, så vi får gå tillbaka till förra sidan, den som är nedan alltså. I fortsättningen kallar jag denna för data view (mestadels för att den heter det i programmet )
11. Längst ner till höger i data view går det att trycka på variable view, och man får då fram denna ruta (som är lite beskuren). Titta längst nere i högra hörnet så ser du var du trycker för att komma tillbaka till data view. Men nu ska vi ändra vilka värden som ska klassas som inget svar eller missing på engelska. Tryck i rutan där det står none för att få upp menyn. 12. Denna meny ser ut som nedan och du ska alltså fylla i vilka värden som är att betrakta som inget svar, i detta fall 9999,0000. Tryck sedan på OK och ändra även för de andra datamängderna där inte alla har svarat. Då ska det vara klart.
13. Det är väldigt mycket hoppande mellan data view och variable view, så testa lite och gör dig bekväm med dessa båda visningslägen. 14. Nu kan du om du vill testa och se vad du får för svar på Analyze-> Descriptive Statistics -> Descriptives. Förhoppningsvis (om du gjort rätt) är nu maximum och mean (medelvärde) båda mellan 0 och 100, ungefär som nedan. Notera att kolumnen N har ändrats, detta beror på att de som inte angivit något svar inte räknas denna gång, och populationen har således minskat. Descriptive Statistics N Minimum Maximum Mean Std. Deviation Varde08 295 40,1533 100,0000 73,544213 15,3846405 Valid N (listwise) 295 15. Nu ska vi testa att dela upp svarsgruppen baserat på vilket kön de har. Som jag tidigare nämnt motsvarar 1 kvinna och 2 man (inte för att det spelar någon roll just nu). Tryck på Data i menyn och sedan Split File. Kryssa i boxen Compare Groups i den ruta som kommer upp. Välj sedan kön i listan och tryck på pilen för att flytta kön till rutan Groups Based On: Sedan ska det vara klart, tryck på OK. Om du har gjort rätt är nu alla data i data view sorterade i ordning enligt kolumnen kön med alla 1:or för sig och 2:or efter dem. 16. Nu ska vi titta på om det är någon skillnad mellan hur könen har svarat i denna undersökning. Klicka återigen på Analyze-> Descriptive Statistics -> Descriptives. Kolla att du undersöker rätt variabel och klicka bara på OK. Förhoppningsvis har du nu fått upp en ruta i din output view som ser ut ungefär som såhär:
Descriptive Statistics Kon N Minimum Maximum Mean Std. Deviation 1 Varde08 136 40,5083 100,0000 76,504484 16,9747813 Valid N (listwise) 136 2 Varde08 159 40,1533 100,0000 71,012157 13,4247788 Valid N (listwise) 159 17. Nu är det dock inte så himla kul att kalla kvinnor för 1 och män för 2, så vi ska ta och definiera våra variabler. För att göra detta går vi till variable view. Väl där letar vi upp kolumnen som heter values och raden som heter kön (eller kon ). Tryck i den blå rutan så kommer det upp en liten knapp som i sin tur leder till rutan nedan. Där skriver du helt enkelt in vilka värden (value) som motsvarar vilken etikett (label). Till exempel motsvarar en 1:a en kvinna i denna mängd, och alltså skriver du Value: 1 och Label: Kvinna. Tryck sedan på Add och du kommer att se att 1 = kvinna läggs till i listan, precis som bilden nedan. Sedan gör du samma sak för 2:an. Tryck sedan på OK när du tycker att du är klar. 18. För att se om detta har fallit väl ut är det nu lämpligt att köra den klassiska Analyze-> Descriptive Statistics -> Descriptives och se. Det ser visserligen väldigt konstigt ut med kvinna och man, eftersom det här är fråga om plural, men man fattar i alla fall. Din tabell kan se ut exempelvis som nedan.
Descriptive Statistics Kon N Minimum Maximum Mean Std. Deviation Kvinna Varde08 136 40,5083 100,0000 76,504484 16,9747813 Valid N (listwise) 136 Man Varde08 159 40,1533 100,0000 71,012157 13,4247788 Valid N (listwise) 159 19. Nu har vi kollat att vi kan dela upp data efter kön, så det är dags att vi går tillbaka till hela datamängden. För att göra det gör man precis som när man delade upp efter kön, fast tvärtom. Tryck på Data i menyn och sedan Split File. Kryssa nu i boxen Analyza all cases, do not create groups i den ruta som kommer upp. Tryck sedan OK. Nu är det hela datamängden som avses igen. 20. Nu ska vi göra ett litet lådagram, och det gör man enklast genom att trycka på Graphs i menyn, välj Legacy Dialogs och sedan Boxplot i menyn. Om du väljer att göra detta från data view, variable view eller output view spelar absolut ingen roll, som jag hoppas illustrera med bilden nedan. Det är precis samma menyer överallt, och det är samma datamängd som avses. 21. När du klickat på Boxplot kommer det upp en ruta som ser ut som nedan. Välj Simple och kryssa i boxen Summaries of separate variables och tryck sedan Define.
22. Du kommer nu att få upp ytterligare en så kallad dialogruta där du ska välja vilken variabel lådagrammet avser. Se till att varde08 hamnar i rutan som heter Boxes Represent och tryck sedan OK så ska du få upp ett lådagram. 23. Nu är det på fel håll, i alla fall jämfört vad vi är vana vid, det ser ut ungefär som det lådagram som finns här nedan. För att åtgärda detta ska du dubbelklicka i diagrammet och du får då upp något som kallas Chart Editor.
24. I denna Chart Editor finns det en lång rad olika knappar precis under menyraden. Leta reda på den knapp som är markerad i figuren nedan och tryck på den så kommer du att se att ditt lådagram vänder på sig. Stäng sedan ner din Chart Editor och se, så är lådagrammet på rätt håll, se nedan. 25. När du nu har lärt dig ett lådagram är det dags att gå över till histogrammet. I menyn trycker du på Graphs -> Legacy Dialogs -> Histogram. Du får upp en ruta där du ska definiera vad diagrammet ska redovisa. Se till att det i rutan Variable:, som är markerad i bilden, står den variabel som du vill undersöka, i detta fall Varde08. Tryck sedan på OK, och du kommer få upp ett fint histogram, som kanske liknar det som finns på nästa sida.
26. Nu har vi tagit fram två olika diagram, och det är dags att ta fram lite siffror för vår datamängd. Dessa får vi tag på genom att klicka Analyze-> Descriptive Statistics -> Frequencies. Markera till att börja med den variabel du vill undersöka och flytta den till den högra kolumnen. Tryck sedan på knappen Statistics högst upp till höger. Då får du upp en ny dialogruta med massor av boxar att kryssa. Se dock till att du först kryssar ur rutan längst ner till vänster på den här bilden, den som heter Display Frequency Tables. Denna ruta gör ingen glad i det här sammanhanget. Sedan är det bara att kryssa i de rutor du känner för (eller de som du vill ha data på) i dialogrutan till höger. Tryck sedan Continue för att komma tillbaka till den vänstra bilden, där du sedan trycker OK.
27. Har du gjort rätt har du nu fått upp en ruta som liknar den som finns här. Där finns det en massa intressanta siffror som jag inte tänker gå in närmare på nu, jag hoppas att du redan vet vad de betyder, annars är det dags att sluta med det här dokumentet och börja läsa Newbold. Statistics Varde08 N Valid 295,000000 Missing 5,000000 Mean 73,544213 Median 74,099000 Std. Deviation 15,384640 Variance 236,687163 Minimum 40,153300 Maximum 100,000000 Percentiles 25 62,862600 50 74,099000 75 85,068500 28. Nu ska vi ta ett litet hopp och definiera en ny variabel, nämligen ålder. Något vilseledande har alla respondenter angett födelseår, men det är troligen mer intressant att veta hur gamla de är. För att slippa räkna detta i varje enskilt fall ska vi alltså ta fram en variabel för detta. Denna kommer att heta nummer 5 och återfinnas i den femte kolumnen i data view. För att skapa en variabel, tryck på Transform -> Compute Variable i menyn. Du får då fram en dialogruta för att definiera din nya variabel. Eftersom födelseåret är angivet utan prefixet 1900 vill vi räkna ut 108-födelseåret, (dvs 2008- (1900+angivet födelseår). Se bilden nedan för att fylla i Target Variable och Numeric Expression på korrekt sätt. I Numeric Expression ska du först skriva in 108 och sedan välja variabeln fodelsear, så ska det bli rätt. Jag hoppas att du lärt dig hur du ska hantera variabler för att få in dem i rätt rutor vid det här laget. Markera i listan till vänster och tryck på pilen för att få in variabeln i funktionen. Tryck sedan på OK. Om du gör allt rätt kommer du att få en 5:e kolumn i data view som heter ålder och som anger respondenternas ålder med 2 decimaler(som givetvis är 0:or, eftersom ingen angett ett halvt födelseår). Det är nästa steg att ta bort dessa två decimaler.
29. För att ta bort decimalerna går vi igen till variable view och titta i kolumnen som heter Decimals. På 5:e raden återfinns variabeln ålder och där markerar du den ruta som det för tillfället står 2 i. Du får då upp en pil uppåt och en pil nedåt. Tryck på nedåtpilen tills det står 0 istället för 2 i rutan. Bra jobbat, nu är det 0 decimaler. 30. Nu när det är klart ska vi definiera etiketter labels för våra variabler. I bilden ovan ser man även kolumnen för detta under variable view. Man klickar helt enkelt i den ruta som man vill ändra label för och fyller i denna. Detta gör man för att lättare se vilken variabel som motsvarar vad. När du har definierat variablerna på ett vettigt sätt, t.ex. Nöjdhetsindex för elbolagens prisvärdhet 2007 för variabeln varde07 är det dags att gå vidare. 31. Nästa steg är att återigen ta fram lite siffror för vår datamängd. Tryck på Analyze-> Descriptive Statistics -> Frequencies, och du får upp dialogrutan igen. Välj vilka variabler du vill undersöka och flytta dessa till högra kolumnen i vänstra rutan (du fattar, det börjar bli lite krångligt med höger ruta
och sådär). Tryck sedan på Statistics och välj vilka data du vill ha om variablerna. Kom ihåg att kryssa ur Display Frequency Tables längst ner till vänster i vänstra rutan. Tryck OK. 32. Nu kommer du förhoppningsvis få upp en liknande tabell som innan, men med den skillnaden att namnet på tabellen (står högst upp) är den label som du gav variabeln nyss. Nu är det inte mycket kvar att göra 33. Nu ska vi skapa en scatter plot för våra data. Klicka på Graphs -> Legacy Dialogs -> Scatter/Dot. Du får då upp en dialogruta där du får välja vilken sorts diagram du vill ha. Välj Simple Scatter som är markerad i bilden nedan. Tryck på Define för att komma vidare. 34. Här ska du välja vad axlarna representerar. Nedan har jag valt att sätta värde08 på y-axeln och värde07 på x-axeln. Detta spelar ingen större roll, bara man vet vad man gör. Sedan väljer jag Set Markers By till kön för att man ska kunna se skillnad på hur personer av de olika könen har svarat. Denna dialogruta kan då se ut som nedan.
35. Har du nu gjort allt rätt och bra ska du få fram en Scatter Plot som ser någotsånär ut som nedan.
36. Det sista som återstår nu är att ta fram en tendens-linje. Detta gör du genom att dubbelklicka i grafen och därmed få fram Chart Editor. Väl där letar du reda på knappen som heter Add Fit Line at Total och klickar på den. Då får du fram ytterligare en dialogruta, men allt är redan förinställt bra, så du stänger bara ner den. Förhoppningsvis har du nu en rät linje genom din plot. Bra jobbat! 37. Grattis, du har nu genomgått Håkan Lyckeborgs introduktionsföreläsning för SPSS version 16. Bra jobbat! Jag hoppas att du har lärt dig ungefär hur programmet fungerar och hur du kan använda det. Jag har lärt mig massor av att skriva den här guiden i alla fall.