UMEÅ UNIVERSITET Statistiska institutionen 2005-11-21 SPSS-övning: Introduktion & deskriptiv statistik Del 1: Lära er att lägga in datamaterial i SPSS. Koda variabler på ett lämpligt sätt och sätta etiketter på er kodning för att få "fina" tabeller etc. Del 2: Bekanta er med statistikprogrammet SPSS och en del av dess funktioner som är speciellt lämpliga för deskription av variabler mätta på i första hand nominal- och ordinalskala (Med tanke på de flesta frågor som ställs i enkäter etc), t ex frekvens- och korstabeller. Grafiska alternativ som stapeldiagram, histogram och låddiagram kommer också att presenteras. Del 3: En genomgång hur producerat material kan redigeras och kopieras till ett ordbehandlingsprogram. Del 4: Övningar på egen hand. Tips! Spss innehåller en riktigt bra tutorial (Help/Tutorial) som kan ge svar på många frågor, den är mycket utförligare än hjälp funktionen men innehåller inte allt som hjälpen gör. Det finns även en statistik wizard (Help/Statistics Coach) som frågar vad man vill göra och tar en stegvis genom processen. Är man inte riktigt säker på vad man gjort går det att högerklicka på grafer och tabeller i output fönstret och välj Results Coach för att få en snabb förklaring av vad diagrammet eller tabellen egentligen visar. Pröva gärna dessa hjälpmedel! I övrigt gäller det att pröva sig fram! Fråga mig och varandra!
DEL 1 1) Inled med att öppna Utforskaren. Skapa en ny egen mapp i katalogen D:\Student (Arkiv / Skapa / Mapp). I denna mapp sparar ni sedan ert datamaterial och resultat. Vi lektionen slut kopieras sedan hela mappen till er diskett. 2) Öppna SPSS. Som ni ser öppnas ett fönster automatiskt när ni öppnar SPSS. Detta fönster kallas Data Editor och innehåller ert datamaterial (är den plats där vi lägger in datamaterialet). 1 Vid öppnandet av SPSS kommer det allra först också fram ett diaglogfönster som frågar: What would you like to do? Detta kan vi strunta i. (Det är en snabbare väg t ex till ett befintligt datamaterial eller det senaste datamaterialet som använts etc.) Vi klickar alltså på knappen Cancel. I Dataeditorn finns det två blad. Vi kan växla mellan dem genom att klicka på flikarna Data View ochvariable View längst ned. Vi börjar med att titta på bladet Data View som består av en massa rutor. En rad (vågrät) motsvarar värdena för en individ (d v s en persons svar på en enkät) och en kolumn (lodrät) motsvarar värden på en variabel (d v s svaren på en enkätfråga för alla personer). Övning: Nedan följer ett antal enkätfrågor (4 bakgrundsfrågor) och hur 10 personer svarat på respektive fråga. Er uppgift blir att läsa in detta datamaterial. Det betyder att ni ska gå i genom steg 1) - 3) nedan på lämpligt sätt. Det innebär bl a att ni måste hitta lämpliga variabelnamn och sätta etiketter om detta krävs. 1) För att kunna skriva in dessa värden måste vi först aktivera rutorna i bladet Data View genom att gå till bladet Variable View. Under Name skriver ni in det önskade variabelnamnet, t ex Utb för utbildning. Notera att ni endast får skriva in åtta tecken och inte å, ä och ö. I grafer och tabeller är det vanligt med mer fullständiga namn. Detta kan fås genom att skriva t ex Utbildning i rutan under Label. Detta namn kommer att användas senare i grafer och tabeller. När vi har en variabel på nominal-/ordinalskala bör vi även definiera variabelvärdena ( sätta etiketter ), som i fallet med Utbildning. Klicka på rutan under Value, klicka på den lilla grå fyrkanten och ett nytt fönster kommer 1 Till skillnad från t.ex. Excel och Word m.m. går det bara att ha ett fönster med data öppet i taget. Det finns heller ingen möjlighet till två datafönster genom att öppna SPSS ytterligare en gång. Allt som händer är att man kommer tillbaka till det först öppnade exemplaret.
fram. I rutan Value skriver vi ett värde som motsvaras av värdena på Utbildning, t ex 1 och i rutan Value Label skriver vi den kodning som motsvarar ett, t ex 2- årigt gymnasium. Tryck därefter på Add. Upprepa sedan proceduren för de återstående variabelvärdena för Utbildning. Tryck sedan på OK. Återgå till bladet Data View och börja skriva in siffrorna. Kom ihåg varje kolumn motsvarar en variable och varje rad en individ. Svar Fråga Kön Svarsalternativ Man Kvinna Man, Man, Man, Kvinna, Kvinna, Man, Kvinna, Man, Kvinna, Man Ålder Svar 32, 40, 30, 25, 26, 35, 35, 36, 24, 25 Svar Svar Vilken utbildning har Du? Ange högst helt genomförda utbildningen. år Grundskola eller liknande Gymnasium Universitet/Högskola Gymn., Grund., Univ., Gymn., Gymn., Gymn., Univ., Univ., Gymn., Gymn. Vilka personer ingår i Ditt hushåll? (Flera altenativ kan anges.) Jag bor ensam Jag bor tillsammans med: make/maka eller motsvarande barn föräldrar syskon annan Ensam, Med maka och barn, Med maka, Ensam, Med annan, Med barn, Ensam, Med maka, Med syskon, Med föräldrar och syskon 2) På motsvarande sett namnger vi återstående variabler och definierar variabelvärden om lämpligt (tänk på skalan) och skriver in de siffrorna. Tips: Välj menyalternativet View/Value Labels eller klicka på snabbkomandot Value Label (knapp med något som ser ut som en adresslapp) för att kolla upp era etiketter. 3) Spara datamaterialet i er mapp under lämpligt namn. (File / Save As ).
DEL 2 Nedan följer korta beskrivningar av en del funktioner för deskription. Jag föreslår att ni prövar dessa med datamaterialet ni just lagt in. Tänk på skalnivån hos era variabler. Frekvenstabeller Välj menyalternativet Analyze/Descriptive Statistics/Frequencies. Alla variabler återfinns i en ruta till vänster. Markera variabeln ni vill göra en frekvenstabell över. Flytta sen denna till den översta högra rutan genom att klicka på knappen med pilen. När ni trycker på OK får ni en frekvenstabell med absoluta frekvenser (d v s antal), relativa frekvenser (d v s procent) och kumulativ procent. Korstabeller En frekvenstabell med flera variabler får ni genom att välja menyalternativet Analyze/Descriptive statistics/crostabs. Välj rad- och kolumnvariabel. Markera respektive variabler och klicka på motsvarande knapp med pil. Om procent önskas klicka på Cells och välj på Rows, Columns och/eller Total. Klicka på Continue. Klicka på OK. Pröva de olika alternativen och försök tolka vad de olika procenttalen egentligen innebär. Tips. Den variabel som har flest variabelvärden rekommenderas att välja som radvariabel. Tabellen blir lättare att läsa då. Å andra sidan brukar det rekommenderas att förklaringsvariabeln, dvs x-variabeln (om det finns någon sådan) används som kolumnvariabel. Ibland krockar dessa rekommendationer Grafiska alternativ Det finns olika diagramtyper och dessa hittar ni om ni väljer Graphs. Om ni t ex väljer Graphs/Bar får ni ett stapeldiagram. Välj Simple och Summary for groups of cases i fönstret som kommer upp, tryck därefter på Define. Markera önskad variabel och för över den till rutan Category Axis. Observera att ni kan välja vad staplarna ska representera t ex antal eller procent (pricka för önskat alternativ längst upp). Tryck därefter på OK. Övriga diagram fås på analogt sätt. Exempel: Graph/Pie ger ett cirkeldiagram. Graph/Histogram ger ett histogram. Graph/Boxplot ger ett låddiagram.
Centralmått och spridningsmått Det finns åtminstone två vägar att gå. Antingen väljer ni Analyze/Descriptive Statistics/Descriptives och för över önskade variabler klickar på knappen Options och kryssar för önskade mått. Continue och OK. Annars väljer ni Analyze/Descriptive Statistics/Frequencies och väljer variabler och kryssar för önskade mått under Statistics. Kom ihåg att tänka på skalnivån hos era variabler. Continue och OK. Datatransformation och datamodifiering Om ni har stor spridning på era variabelvärden (ex längd, ålder) är det lämpligt att klassindela materialet. Välj Transform/Recode/Into different variables. På detta sätt skapar ni en ny kolumn (variabel). Markera och för över den variabel som skall omarbetas, t ex alder till aldergr. Skriv in namnet på den nya variabeln, t ex aldergr, i rutan Output variable och sedan på Change. Klicka på Old and New Values. Här skall förändringarna anges. Inom avdelningen Old Value skall de gamla värdena anges (antingen var för sig i rutan Value eller med hjälp av Range-alternativen). För varje gammalt värde skall motsvarande värde på den nya variabeln anges i rutan Value under avdelningen New Value. Tryck på Add efter varje nytt värde. Continue och OK. När en ny variabel skapats bör man även sätta lämpliga etiketter (se ovan). Övning: Klassindela variabeln Ålder i tre klasser. Övning: Gör om variabeln Familjesituation till en variabel med endast två värden : Sammanboende resp. Bor ensam. Selektion av vissa grupper I vissa fall vill vi endast titta på en delmängd av individer, t ex individer med högskoleutbildning, och göra tabeller och beräkningar endast för dem. Detta kan vi göra genom att lägga ett filter över de andra individerna. Välj Data/Select Cases. Pricka för If condition is satisfied och klicka på If. Markera och för över aktuell variabel, tex Utbildning. Skriv in villkoret, t ex =3. Klicka på Continue och OK. Kom ihåg att ta bort filtret efter ni gjort önskade diagram etc. Detta görs på samma sätt som när vi la på filtret men nu väljer vi All cases istället för If condition is satisfied. Övning: Gör en frekvenstabell över könsfördelningen för personer med högst gymansieutbildning.
DEL 3 Redigera diagram och tabeller Dubbelklicka på ett diagram. Då får ni upp en sk Chart editor. Ni kan nu ändra rubriker, ändra färg och mönster på staplarna, lägga till förklaringar mm. Dubbelklicka på en tabell, högerklicka sedan på den, på i menyn som kommer upp finns TableLooks, där finns flera stilar som gör att tabellerna ser betydligt snyggare ut än SPSS standardtabeller. Prova att göra några olika tabeller och stilar. Infoga material i Word Det är enkelt att infoga alla diagram och figurer från SPSS till Word. Det är bara att klicka på den figur i Output-fönstret man önskar att föra över till Word och trycka Ctrl C (eller menyvägen: markera Edit/Copy) för att sedan gå till Word och trycka Ctrl V (Redigera/Klistra in). Tabeller kan däremot vara besvärligt. Det enklaste sättet är att man redigerar dem i SPSS och därefter markerar dem, trycker Ctrl K (eller menyvägen: Edit/Copy Objects) och går till Word och klickar på trycka Ctrl V (Redigera/Klistra in).
DEL 4 (Övning på egen hand) Ni ska nu öva på egen hand med en datafil som heter ryggont.sav. Filen hittar ni på kurshemsidan. När du klickar på länken med samma namn får du frågan var du vill ladda ned filen. Välj din mapp under D:\ Student. Öppna sedan filen från SPSS, File/Open/Data osv. Datafilen innehåller uppgifter om kvinnor som fött barn. Varje kvinna fick ett frågeformulär med frågor. Här är några av de undersökta variablerna. ID Identiteten på kvinnorna BPSEV Grad av ryggbesvär 0 Ingen smärta 1 Inget värt att bekymmra sig om 2 Bekymmersam men inte allvarlig 3 Allvarlig MONPREG Månad då graviditetssmärta startade AGE Ålder HEIGHT Patientens längd WEIGHT1 Patientens vikt vid graviditetens början WEIGHT2 Patientens vikt vid graviditetens slut BABYWGHT Barnets vikt NOCHLDR Antal barn från tidigare graviditeter Skaffa dig först en överblick över materialet. Uppgift 1 Hur många av kvinnorna var helt fria från ryggbesvär? Uppgift 2 Beräkna kvinnornas medelålder samt standardavvikelsen. Hur gammal var den äldsta respektive den yngsta kvinnan? Uppgift 3 Beräkna medianen samt kvartilerna på barnens vikt. Vilken var den lägsta vikten i fjärde kvartilen? Uppgift 4 Koda om NOCHLDR i följande grupper Inga barn, Ett barn och Mer än ett barn. Namnge variabel och variabelvärden. Studera denna nya variabel med hjälp av en frekvenstabell.
Uppgift 5 Gör en korstabell med den nya omkodade variabeln från övning 4 och smärtvariabeln BPSEV. Presentera korstabellen i procent. Välj lämplig procentpresentation. Uppgift 6 Skapa en ny variabel som bygger på kvinnornas viktökning. Vilken är den minsta respektive största viktökningen. Beräkna medeltalet för viktökningen TIPS: För att lösa den här uppgiften måste du först räkna ut hur stor viktökningen har varit för varje kvinna. Transform/Compute. Ange det nya variabelnamnet i rutan Target Variable och utför beräkningen, WEIGHT2-WEIGHT1, i rutan Numerical Expression och sedan OK. Uppgift 7 Visa viktökningen i ett histogram. Uppgift 8 Gör en boxplot för att visa viktökningen kopplat till smärtnivåerna. Uppgift 9 Klassindela kvinnornas ålder samt gör en korstabell med smärtnivåer. Uppgift 10 Gör ett valfritt diagram och redigera det.