KOMPENDIUM, IBM SPSS VERSION 23

Relevanta dokument
Intro till SPSS Kimmo Sorjonen (0811)

Idiotens guide till. Håkan Lyckeborgs SPSS-föreläsning 4/ Av: Markus Ederwall, 21488

Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet. SPSS (PASW) 18 for Windows - a guided tour

Mata in data i Excel och bearbeta i SPSS

Marknadsinformationsmetodik Inlämningsuppgift

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel vers. 2010

SPSS En guidad tur. Vad ska jag göra idag? Följ instruktioner som följer, om du behöver hjälp det är bara att fråga en lärare!

Richard Öhrvall, 1

Datainmatning TÄNKTA BETECKNINGAR. Variabelnamn/kolumnbeteckning, Dummyvärden, som matas in beroende på aktuellt svarsalternativ

Kort manual till SPSS 10.0 för Mac/PC

Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet Per-Erik Isberg. SPSS for Windows 12 - a guided tour

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel

Marknadsinformationsmetodik Inlämningsuppgift

DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET. BESKRIVANDE STATISTIK. SANNOLIKHETSLÄRA.

Ett litet kompendium om Excel 2003 som statistiskt verktyg

Handledning för konstruktion av tabeller och diagram med Excel

*****************************************************************************

Histogram, pivottabeller och tabell med beskrivande statistik i Excel

Gran Canaria - Arbetsbeskrivning knapplänkar (Mediator 8)

Grundkurs 1 IKT Filhantering

Kom igång. Readyonet Lathund för enkelt admin. Logga in Skriv in adressen till din webbsida följt av /login. Exempel:

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Data Editor, datainmatning och dataredigering

Grunderna i SPSS Martin Gellerstedt 0. INTRODUKTION KOM IGÅNG MED INMATNING, KODNING OCH DATATRIXANDE... 3

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Datorövning 1 Statistik med Excel (Office 2010, svenska)

Steg för Steg Att använda Statistics explorer med data från SKLs databas

Hämtning av sekundärdata och introduktion till Excel

Universitetskanslersämbetets Högskoleutforskare. En introduktion till analysvyn exemplet måluppfyllelse

Inledning till OpenOffice Calculator Datorlära 2 FK2005

Datorövning 2 Statistik med Excel (Office 2007, svenska)

3. Hämta och infoga bilder

Datorövning 1 Calc i OpenOffice 1

Allt du behöver för crowdsourcing

Guide till att använda Audacity för uttalsövningar

Datorövning 1 Statistik med Excel (Office 2007, svenska)

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

Målet för D1 är att studenterna ska kunna följande: Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Introduktion till frågespråket SQL (v0.91)

Skapa enkäter i EvaSys

Manual

Labb LABB 1. Databassagan och en rundtur i databasers märkliga värld. Plushögskolan Frågeutveckling inom MSSQL - SU14

STOCKHOLMS UNIVERSITET. Handbok 2. Funktionaliteter moveon 4

På följande sidor återfinns en kort dokumentation som beskriver några användbara programfunktioner.

Visualisering med Rhino/Vray/Photoshop av modell som skapats i Revit. AADA15 Revit Workshop 2017 LTH Ludvig Hofsten

Grunderna i SPSS Martin Gellerstedt 0. INTRODUKTION KOM IGÅNG MED INMATNING, KODNING OCH DATATRIXANDE... 3

DATORÖVNING 2: STATISTISK INFERENS.

5HVLVWHQVWDEHOO 'DWD3DUWQHU. Er partner inom data

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

6 PIVOTTABELLER SKAPA PIVOTTABELL. Skapa pivottabell

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

INNEHÅLL DEL 2 FORMATERA KALKYL DEL 1 SKAPA KALKYL

1. DEFINIERADE TABELLER. 1.1 Definiera en Excel-tabell

Laborationer i statistik för A:1, Lab 1

Workshop IBA internet based assessment

Lathund Hemsida för Astma- och Allergiförbundets föreningar

INSTÄLLNINGAR FÖR IRONCADS 2D-RITNING

Importera och använda en textdatabas i Excel

Användarhantering Windows 7 I denna laboration kommer vi att skapa nya användare och grupper och titta på hur man hantera dessa.

Kapitel 15: Data/Matrix Editor

Manual till funktionen Rapport/Export (beta) i Compos - Föräldrastöd February 2, 2016

Kopplingar via datalänk från Winbas till Excel samt Pivottabell 1 (13)

Handledningsmaterial Visio 2010

Datorövning 1 Statistik med Excel (Office 2007, svenska)

ANVÄNDARGUIDE. ViTex

Syfte Syftet med den här laborationen är att du ska lära dig använda några grundfunktioner i Microsoft Excel.

Tidtagning med Eresults Lite programmet

6. Nu skall vi ställa in vad som skall hända när man klickar på knappen samt att markören skall ändra sig till en hand när markören är på knappen.

Guide till EndNote X9

Paneler - VCPXX.2. Programmeringsmanual för VCP-paneler. Revision 2

Manual för Typo3 version 4.2

DATORÖVNING 5: SANNOLIKHETSFÖRDELNINGAR FÖR

Öppna EndNote varje gång när du vill samla referenser till ditt bibliotek.

Välj bort om du vill. 96 Internet och e-post. 2. Mail-programmet finns i datorn. 1. Skriv mail i sökrutan. Windows Live Mail i Aktivitetsfältet.

Installation av datafil för lokal lagring av e-post i Microsoft Outlook 2016

Excel-guide. Introduktion

TUTORIAL 3: ATT STARTA ETT NYTT PROJEKT, IMPORTERA ELLER DIGITALISERA MATERIAL, SAMT SORTERA DET.

Laboration 1 Introduktion till Visual Basic 6.0

SCB Räkenskapssammandrag

FolkhälsoAtlas Labmiljö - en handledning

Sophia Prosell DREAM WEAVER SKAPA OCH PUBLICERA EFFEKTIVA WEBBSIDOR

Juni 2003 PlanCon Viewer Handledning PlanCon PROJEKT

1.Lär känna MS SQL Observera. Tips. Förberedelse

Programmets startmeny ser ut så här. För att få fram menyerna Avsluta, Inställningar och Användare måste du föra markören upp till det blåa fältet.

Introduktion till SPSS

Manual. Anpassad för CMS Made Simple version 1.9.x (uppdaterad ) Birger Eriksson webblots.se

Se till att posten är i Ändringsläge. Gå till rullgardinsmenyn under Föremål och välj Lägg in bild.

Din guide till. Digitala assistenten

Introduktion till Winbas. excel till Winbas

samma sätt. Spara varje uppgift som separat Excelfil. För att starta Excel med Resampling-pluginet, välj Resampling Stats for Excel i Start-menyn.

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Manual. Verktyg för skolanalys. Astrakan. Motion Chart på enkelt sätt. Artisan Global Media

EXCEL 2010 FÖRDJUPNING

Grundläggande statistik kurs 1

Grundkurs 2 IKT. Dan Haldin Ålands lyceum

Användarhandledning Rapportgenerator Version: 1.1

Introduktion till. Minitab version 14

Steg 1 Minnen, mappar, filer Windows 7

Komma igång med 3L Pro Komma igång med 3L. Copyright VITEC FASTIGHETSSYSTEM AB

Transkript:

KOMPENDIUM, IBM SPSS VERSION 23 Erling Englund Statistiker Forskning och Utveckling Landstinget Västernorrland erling.englund[at]lvn.se 2016-10-25

2

1. INTRODUKTION... 4 1.1 DATA I KOMPENDIUM... 4 2. ÖVERSIKT AV SPSS... 5 2.1 S T A R T A S P S S... 5 2.2 DATAFÖNSTER/ DATA VIEW... 6 2.2.1 Ikoner i meny... 6 2.2.2 Innehåll i meny... 8 2.3 VARIABELFÖNSTER/ VARIABLE VIEW... 9 2.4 OUTPUTFILEN/ SPSS VIEWER... 10 3. P R E C I S E R A V A R I A B L E R N A... 12 3.1. PRECISERA VARIABLER MANUELLT... 13 3.2 PRECISERA VARIABLER VIA DEFINE VARIABLE PROPERTIES... 15 4. LÄGGA IN DATA... 17 5. S P A R A... 18 6. GRUNDLÄGGANDE ANVÄNDNING OCH TIPS... 19 6.1 VARIABELTYPER... 19 6.2 VÄLJA VARIABLER VID ANALYSER... 19 6.3 SORTERA DATA/SORTERA VARIABLER... 21 6.4 ORGANISERA VARIABLER (TA BORT/LÄGGA TILL/FLYTTA)... 22 6.5 KOPIERA TABELL ELLER DIAGRAM... 23 6.6 SNABBT KOMMA ÅT TIDIGARE ANVÄNDA DATA-FILER I SPSS... 25 6.7 GENVÄG TILL TIDIGARE ANVÄNDA MENYER... 26 7. ANVÄNDBARA FUNKTIONER I SPSS... 27 7.1 LÄSA IN EXCEL-FILER I SPSS... 27 7.2 SELEKTERA DEL AV DATA, SELECTE CASES... 29 7.3 DELA UPP DATA (FÖR ATT UTFÖRA ANALYSER UPPDELADE PÅ GRUPPER), SPLIT FILE... 30 7.4 SELEKTERA DEL AV VARIABLER, VARIABLE SETS... 31 7.5 SKAPA OCH HANTERA KATEGORIVARIABLER... 32 7.5.1 Skapa kategorivariabel från en annan variabel, Recode into different variable... 32 7.5.2 Skapa kategorivariabel från en kontinuerlig variabel, Visual binning... 36 7.5.3 Göra om en kategorivariabel från text till talformat... 39 7.5.4 Ändra ordning på kategorier i en variabel... 40 7.6 SKAPA NYA VARIABLER AV BEFINTLIGA VARIABLER VIA COMPUTE... 42 7.6.1 Skapa gruppvariabler via Compute... 43 7.7 SYNTAX... 44 8. B E S K R I V A N D E S T A T I S T I K... 46 8.1 FREKVENSTABELL... 47 8.2 KORSTABELL OCH CHI2-TEST... 49 8.3 TABELL FÖR FLERVALSFRÅGOR... 52 8.4. BESKRIVANDE STATISTIK MED CENTRALMÅTT OCH SPRIDNINGSMÅTT... 54 8.4.1 Beskrivande statistik via Descriptives... 54 8.4.2 Beskrivande statistik via Explore... 55 8.5 REDIGERA TABELLER... 56 9. P A R A M E T R I S K T T E S T, JÄMFÖRELSE AV MEDELVÄRDEN.... 58 9.1 JÄMFÖRELSE TVÅ OBEROENDE GRUPPER.... 59 9.2 JÄMFÖRELSE AV TVÅ BEROENDE VARIABLER... 62 10. DIAGRAM... 64 10.1 HISTOGRAM MED NORMALFÖRDELNING.... 65 10.2 STAPELDIAGRAM... 67 10.3 ERROR BARS MED KONFIDENSINTERVALL.... 70 10.4 BOXPLOT... 73 10.5 SCATTERPLOT (SPRIDNINGSDIAGRAM).... 75 10.6 ANDRA MENYER FÖR DIAGRAM, BL.A. ATT SKAPA DIAGRAM INTERAKTIVT... 79 11 LÄNKAR OM SPSS... 83 3

1. Introduktion Forskning och Utveckling i Landstinget Västernorrland har SPSS som statistikverktyg kring forskning. Vi har bl.a. forskarplatser med datorer där SPSS är installerat. År 2016 bytte vi från SPSS 20 till 23. Uppdelningen av kompendiet följer delvis hur man börjar använda det, översikt över programmet (kap 2), sen precisera variabler (kap 3), lägga in data (kap 4), spara (kap 5). Därefter i kap 6, hur man hittar i menyerna och lite tips och grundläggande moment, t.ex. hur man väljer variabler vid analyser. Det är något som är bra att kunna oberoende av vad man vill göra i SPSS. Därefter kommer användbara funktioner, selektera data, splitta data, skapa nya variabler mm (kap 7). Kap 8-10 handlar om beskrivande statistik, test och diagram. Några få länkar till SPSS-information är inlagda i kap 11. Det finns mycket hjälp på nätet, på olika nivåer. 1.1 Data i kompendium Det data som kompendiet utgår ifrån är ett urval av 200 män och 200 kvinnor från en enkät vid hälsosamtal i Landstinget Västernorrland, där huvuddelen gäller de som är 40, 50 respektive 60 år. Femton variabler från hälsosamtalet används. Bakgrundsvariabler, Kön, Åldersgrupp, Civilstånd (ogift, gift/sambo, skild/separerad, omgift, änka/änkling, Ej svarat). Uppgifter om Längd och Vikt Blodtryck, del dels systoliskt dst och dels diastoliskt sbt. Uppgifter om motion, Vardagsmotion och Fysiskt motion (uppskattat antal minuter per vecka) Diabetes, Diabetes beräknad (ja/nej), Diabetes sedan tidigare (ja/nej), 12) och Diabetes hos föräldrar eller syskon (ja/nej) Rökning, Röker dagligen (ja/nej), och Röker ibland (ja/nej), Utöver dessa femton är några variabler tillagda för 8.3, Hantera flervalsfrågor Dessa är frågor om blodtrycksmedicin, kärlkrampsmedicin, lugnande sömnmedel, magsårsmedicin, blodfettssänkande. 4

2. Översikt av SPSS 2.1 S t a r t a S P S S 1) Klicka på Start och sedan på 2) Alla Program LVN IBM SPSS (Detta är vägen på en basarbetsplats) 3) Välj IBM SPSS Statistics 23. 4) Därefter får du ett fönster med olika valmöjligheter. Du kan klicka bort fönstret och komma åt filer od. direkt via menyn. a) Om du lägga in nytt datamaterial klicka på New Dataset. Du kan också välja Cancel och därefter skapa nytt dataset via menyerna. b) Om du vill öppna en datafil och inte hittar den i listan över Recent Files, välj Open another file. c) Du kan också bläddra igenom vissa av nyheterna, eller använda Tutorials. Denna kan vara bra att titta igenom. 5

2.2 Datafönster/ Data View Öppnar jag filen som kompendiet utgår från visas Data View, med själva data. Den visar data med variabelnamn. För man sedan markören till variabelnamnen högst upp visas ett mer utförligt datanamn. Det som visas är Name och Label (se Variabelvy) Nedan visas en kort beskrivning av menyikonerna och de mest använda menyerna. 2.2.1 Ikoner i meny 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Överst i programmet finns några ikoner med direktlänkar till delar i menyn. Här nedan redovisas kort vad dessa innebär. 1)-3) Open, Save, Print 4) Recall recently used dialogs: Den visar en lista på de senaste menyerna man varit inne i, vilket kan göra det smidigare om man t.ex. vill använda samma menyval flera gånger. 6

5)-6) Ångra, Upprepa 7)-8) Go to case, Go to variable: Via dessa kan man gå till en specifik rad eller en specifik kolumn/variabel, vilket kan vara smidigt om man har många variabler i datafilen (även under Edit ) 9) Variabels: Ungefär som en förkortad version av Variable View. Den visar en kort information om respektive variabel, en i taget. (Även under Utilites ) 10) Run descriptive statistics (Ny från version 21): Markerar du en eller flera kolumner och använder denna så får du både beskrivande statistik (median, medel, max, ) och en frekvenstabell. Vilken typ av beskrivande statistik du får beror på om variabeln är nominal/ordinal eller scale (se kriteriet Measure i Variable View). Den finns också om man högerklickar på en kolumner. 11) Find: Det är samma funktion som i Word. Antingen om man bara vill söka ett ord t.ex. om man snabbt vill komma till raden där en variabels värde är 15 eller söka och ersätta ett visst ord, t.ex. om man vet att det blivit skrivfel någonstans. (Även under Edit ) 12)-13) Insert cases/insert variables: Lägger in ett nytt fall (rad) eller kolumn (variabel), (Även under Edit ) 14) Split file: Du kan dela upp data utgående från en eller flera variabler så att allt det man gör visas uppdelat, t.ex. vill visa beskrivande statistik för variabeln Ålder uppdelat Kön. (Även under Data ). 15) Weight cases: Om man vill vikta data. Man viktar då utifrån värden från en variabel. (Även under Data ) 16) Select cases: Du kan selektera vissa individer/case/rader utifrån värdet på en variabel, så att den statistik jag skapar bara görs för det urvalet, t.ex. alla med Ålder >18, eller alla med värdet Kvinna på variabeln Kön. (Även under Data ) 17) Value labels: Har man lagt in labels/etiketter på variablerna (t.ex. variabeln Kön har värdena 1 och 2 och etiketterna Kvinna resp. Man) så växlar man här mellan att visa siffervärdena och att visa värdet på etiketterna. (Även under View ) 18) Use Variables Sets: Under Utilities Define variable set kan man markera ett urval av variablerna och kalla dem tex. Urval1. Man kan sen välja att bara visa variablerna från Urval1 via denna meny. Användbart om man har ett stort material och bara vill jobba med en del av den. 19) Show all variables: Fortsättning från 18), där man stället väljer att visa alla variabler. 20): Spell check: Vanlig rättstavning, men svenska finns ej med. 7

2.2.2 Innehåll i meny Det finns lite olika menyer. Data, Transform, Analyze och Graphs är de man oftast kommer i kontakt med, förutom File när man skall öppna (SPSS-filer, Excel-filer, mm) och spara en fil. Det är därför mest information om de fyra i kompendiet. 1) Data väljer man om man vill ändra i hur eller vad av data visas, t.ex. sortera data efter variabeln ålder (Sort cases), selektera ut bara kvinnor (Select cases), dela/splitta upp analyser i Kön (Split file) så att när man t.ex. gör en frekvenstabell för blodgrupp får vi en tabell för Kvinnor och en för Män. Dessa visas i kompendiet. Du kan också använda Transpose eller Restructure för att t.ex. på olika sätt lägga om filen så att rader blir kolumner och tvärtom. Med Aggregate kan du skapa en ny fil där varje rad står för kategorierna/värdena från en variabel istället för varje person, t.ex. medelålder, antal, för varje typ av civilstånd. Speciellt användbart om data består av persondata men där varje person kan ha flera rader, t.ex. varje besök en person gör i sjukvården under ett år. Dessa visas ej i kompendiet. 2) Transform väljer man när man vill ändra (transformera) eller skapa nya variabler från de variabler man har, t.ex. om du har vikt och längd om vill skapa en variabel för BMI (Compute variable), om du har ålder och vill skapa en ny variabel med åldersklasser (Recode into different variable). Visual binning är ett annat sätt att koda om en variabel, t.ex. från ålder till åldersgrupp där du både får kategorier och namn på varje kategori. Du kan också använda Date and Time wizard för att skapa en variabel med datumformat från en textvariabel. Denna tas ej upp i kompendiet. 3) Analyze väljer man när man t.ex. vill ta fram en frekvenstabell, räkna medelvärde eller göra ett test. 4) Graphs använder man när man vill du göra ett diagram, t.ex. histogram, stapeldiagram eller scatterplott. Du kan både använda menyer under Legacy dialogs för varje typ av diagram, eller Chart builder som är en mer interaktiv typ av diagram. Dessa tas upp i kompendiet, men inte nedanstående diagram. Numera kan du också göra ett diagram baserat på en karta. Om du inte vill basera den på USA ed måste du ladda ner en karta med rätt format. Det gör du under Utilities Map conversion utility. Under Graphboard template user finns varianter på diagram via kartor, men också mycket andra varianter av diagram som inte finns i ovanstående, som Bubbleplot. 8

2.3 Variabelfönster/ Variable View Klickar jag på Variable View får man beskrivning av variablerna. Här beskrivs kortnamn (Name, för t.ex. inte innehålla mellanslag), Label (utförligare namn) mm. Vissa av ikonerna i menyn går nu inte att trycka på, men menyn med File, ovs är densamma. Så för att göra tabeller analyser mm så spelar det ingen roll om har Data View eller Variable View framme. 9

2.4 Outputfilen/ SPSS Viewer När man gör en analys, diagram, tabell mm så hamnar resultatet i en output-fil. Den fylls på allt eftersom du gör fler analyser. Den kan ligga kvar under tiden du jobbar med och tar fram resultat i SPSS. Vill spara den kan det vara bra att ta bort analyser som du inte vill ha kvar, så att inte filen blir för stor och ohanterlig. visar den kod som motsvarar resultatet (i detta fall en tabell) man har skapat, en s.k. syntax. Den kan användas för att göra en syntaxfil. Mer om det i 7.7. Till vänster ovan syns ett träd där varje rad har en koppling (oftast) till ett fält i högra delen av fönstret. Ovan är Kön markerat i trädet och den är kopplad till tabellen (pilen). Redigera fält/ändra fält Varje resultat från SPSS består av en överskrift, t.ex. Frequencies, med delresultat under. 10

Ändra namn på text: Klickar du på Frequencies eller Kön ovan två ggr, eller dubbelklickar (bild 1 och 2 ovan) blir dessa blåmarkerade, och du kan redigera texten. Ta bort resultat: Antingen raderas fält via högra eller vänstra delen av outputfilen, varav den sista kan vara smidigare. I båda fallen är det enklast att använda delete-knappen. Klickar man på ikonen till vänster om namnet markeras hela grenen (övre pil i vänstra bilden ovan). Så för Kön markeras förstås bara Kön medan klickar man på Frequencies markeras även allt under denna (högra bilden). Vill du ta bort flera delar på en gång använder du Ctrl eller Shift, håll ner ctrl och klicka på de delar du vill ta bort eller håll ner Shift, klicka på två fält och allt däremellan markeras. Dölja fält: Dubbelklickar du på ikonen vid Frequencies eller ikonen vid Kön så döljs fältet. Den finns fortfarande kvar i outputfilen men visas ej. Du kan också klicka på en ikon, t.ex. Frequencies så att ikon och namn markeras, och sedan välja i menyn, View Hide. Markera en typ av fält Ibland kanske man vill kopiera alla tabeller, t.ex. för att sedan kopiera över det till Word. Ett enkelt sätt är då att bara markera alla tabeller via Edit Select All Pivot Tables och därefter kopiera. (se höger bild). Detta funkar också utmärkt om man vill dölja en typ av fält, tex, Log. Redigera Dubbelklickar du på t.ex. ett diagram kommer du till redigeringsläget. Vill du sen ändra på något i diagrammet, dubbelklicka där du vill ändra, t.ex. dubbelklickar du på y-axeln då får du alternativ på hur och vad du kan ändra på y-axeln. 11

3. P r e c i s e r a v a r i a b l e r n a Om man valt Cancel när man öppnat SPSS får man fram Data View - det fönster där datamaterialet skall läggas in. Nedan visas hur data för kompendiet ser ut. Varje rad betyder en person/enkät ed och varje kolumn motsvarar en variabel, lite som excel. Det spelar förstås ingen roll vad du gör först, lägger in data eller preciserar variablerna. OBS: Du kan också välja att läsa in data t.ex. från en excelfil. Se Kapitel 7.1 eller Variable View - det fönster där variablerna skall preciseras. Varje rad betyder en variabel och varje kolumn anger olika fält som man kan ställa in för variabeln. Man brukar börja i denna vy för att specificera variablerna. Längst ner till vänster i vardera vy finns 2 flikar med vilka man kan hoppa mellan Data View och Variable View. Alternativet finns även under menyn, View Data/Variable 12

3.1. Precisera variabler manuellt För att precisera variablerna behöver vi ha Variable View framme. Där finns det flera val, Name, Type, Width, Decimals, Label, Values, Missing, Columns, Align, Measures, Role. De som är fetmarkerade är de man normalt behöver och vissa förklaras nedan. Jag rekommenderar att man lägger in/korrigerar de fetmarkerade. Name: Kortnamn på variabeln. Här kan man inte använda mellanslag, ej börja med en siffra, och vissa tecken som t.ex. bindestreck är ej tillåtna. Jag rekommenderar också att ha dem så korta som möjligt eftersom det är det namn som syns längs upp i Datafönstret. Ju längre namn, desto bredare blir kolumnen för den variabeln. Ett tips är att använda stora bokstäver för första bokstaven i ett ord, eller _, t.ex. om frågan är Hur ofta brukar du spela tennis, skulle den kunna skrivas OftaBrukTen eller Ofta_Bruk_Ten. Type: Ofta har man bara vanliga siffervärden. Skapar du en ny variabel med att skriva in ett namn på Name får variabeln därför typen Numeric som standard. Två andra vanliga alternativ är textvariabler (String) eller datum (Date). För att välja annan typ, 1) Klicka på cellen under Type i den variabel du vill ändra, 2) Tryck på den blå rutan (se pil i vänster bild). Där kan du sedan välja alternativ. Väljer du Date kommer du att få ett antal alternativ för datumformat. Label: Här kan du skriva mer utförligt om namn/information om variabeln. Överskriften på tabeller och diagram kommer att tas från Label i första hand, och Name i andra. Eftersom Name lätt blir kortfattat kan det vara bra att lägga in ett mer läsbart namn under Label. Decimals: Här kan man specificera hur många decimaler som skall visas. Som standard har SPSS valt att visa 2 decimaler. I vissa fall är det naturligt att inte visa några decimaler, t.ex. för kategorivariabler som Kön. Om man lägger in ett värde 2,42 och har valt att bara en decimal skall visas så visas 2,4. Den andra decimalen är då inte borttagen, utan visas helt enkelt inte. Values: Om man lägger in en variabel Ålder och skriver 25 i data så behövs inget förtydligande. Om man däremot har en kategorivariabel som Kön kan man först lägga in data som siffror, te.x. 1 och 2. För att man sen skall förstå vad värdet betyder lägger man in en etikett på variabeln så att man ser av siffrorna betyder, I fallet med Kön, Kvinna=1 och Man=2. 1) Klicka i rutan för Values vid den valda variablen 13

2) Sätt siffervärdet vid Value och etiketten vid Label 3) OBS: Tryck Add för varje siffervärde/kategori innan du trycker Ok. Observera att om man lagt in dessa Labels på variabeln Kön, så kopplas det till hela variabeln. Missing: Har man kontinuerliga variabler, Numeric, så är tomt fält automatisk missing. För text-variabler kan man inte sätta missing. Däremot för kategorivariabler som är numeriska, t.ex. Kön som är satt som siffror och sedan har etiketter satta, via Values kan det vara bra. Civilstånd har en kategori, Ej svarat, kategori 6. Det är en missing. Klickar man på missing för variable Civilstånd får man flera val. För denna räcker det med att skriva in 6 i nedanstående fält, så kommer katgori 6 att visas som missing i tabeller od. Measure: Variabler som Kön och Ålder har olika egenskaper. Ålder är kontinuerlig och medelvärde kan därför vara lämpligt att beräkna, medan Kön är en kategorivariabel varför andelar är mer lämpligt att beräkna. I vissa analyser eller när man gör vissa figurer hanterar SPSS en variabel olika beroende av värdet på Measure. I vissa fall kan man inte ens välja en variabel som är inställd som nomimal, om metoden i SPSS kräver intervallskala. Man kan temporärt ändra det när man t.ex. skapar ett diagram, men det är bättre att göra det här direkt. Kontinuerlig variabel anges som Scale, medan en kategorivariabel anges som Ordinal eller Nominal. Nominal innebär att värdena för variabeln kan grupperas (Kön, bostadsort), medan värdena för en Ordinal (ålderklasser, enkätfrågor typ Mycket Bra/Bra/Dåligt.) variabel även kan rangordnas, men normalt gör inte SPSS någon skillnad på dessa två. Text-variabler (string) blir automatisk Nominal. 14

3.2 Precisera variabler via Define Variable properties Data Define Variable Properties För det mesta räcker det med att göra det manuellt. Fördelen med att använda denna meny kan vara Om man får samma typ av fil flera gånger där samma precisering av variabler skall göras, kan detta göras i denna meny, och sedan sparas i syntax och återanvändas. Se 7.7 Gör man en ändring i en variabel där samma ändringar skall göras in 10 andra variabler kan detta göras enkelt här. Denna visas bara lite översiktligt. 1) När man öppnar menyn så visas variabellistan och man får välja vilka variabler man vill precisera. a. Längst ner står hur många rader som skall scannas och värden som skall visas. Om alla kategorier visas på de första 200 behöver man inte se fler för att kunna precisera t.ex. etiketter. b. Nedan har jag för övnings skull satt vissa variabler som ordinal istället för scale. 15

2) Här kan du t.ex. ändra labels och spara dem som syntax. Du kan också skapa labels eller inställning på en variabel som du sen kopierar över till det andra variabler. 3) Vi skall här ändra Measurement level på Längd till Fysisk motion, från Ordinal till Scale. 4) Välj Längd, ändra från Ordinal till Scale (se pil nedan). Klicka sedan på To another variable. Höger fönster visas. Markera Vikt tom Fysisk motion. 5) Tryck på Copy så kommer Vikt tom Fysisk motion skalnivå ändras till Scale. a. Trycker du sen Ok så genomförs alla de ändringar du har gjort. b. Trycker du på Paste, så skapas en syntaxfil där dina ändringar sparas som kod och kan användas senare. Se 7.7 16

4. Lägga in data Om du vill läsa in en fil istället för att lägga in det manuellt värden, se.t.ex. 7.1 (Om att läsa in Excelfil). Om man lagt in Kön och Ålder och lägger in två personers värden så får man nedanstående Om man vill visa etiketterna för Kön kan man trycka på knappen (se pil i ovanstående bild). Resultatet ses nedan. Man kan också ändra det via menyn längst upp i fönstret (View Value labels) OBS: När man skall lägga in data rekommenderar jag att man skapar en variabel som visar vilken person/enkät en rad står för. Varför? 1) Det är lätt hänt att i farten råka skriva in fel värden när man lägger in data. Om man då hittar något värde som är onormalt högt eller som man direkt ser är felaktigt, kan man gå tillbaka till enkäten/persondata och kolla om värdet stämmer eller ej. Då bör man förstås ha liknande variabel till enkät ed. 2) För det andra så sorterar man om data ibland, antingen via Sort eller via Split file. Då kan man använda variabeln för att sortera om data i sin ursprungliga ordning. 17

5. S p a r a När materialet är inlagt spara. 1) Klicka på File Save As 2) Skriv in önskat namn och välj var filen skall sparas. Filen sparas som en sav-fil. a. Du kan här spara som andra format, csv, xls, Tips: Det kan vara bra att spara en fil som innehåller originaldata och sedan ha en eller flera filer som bearbetas. Välja vilka variabler som skall sparas. Väljer du knappen Variables kommer du till en meny där du kan Kryssa bort eller Kryssa i de variabler du vill spara, te.x. om du vill skapa en ny fil med bara några av variablerna. Skall du spara en out-putfil sparas den på samma sätt. Filen sparas då som en spv-fil. 18

6. Grundläggande användning och tips 6.1 Variabeltyper Till höger ses hur datamaterialet visas i en av menyerna. Intill variablerna så visas en bild. I korthet så anger de vilket typ av variabel det är, kan det mätas (linjal), kan det grupperas (bild med tre cirklar). Ett litet a innebär bara att det är en text-variabel. I vissa analyser och menyer styrs av valen och resultaten av den informationen. Se mer under 3) Precisera variabler 6.2 Välja variabler vid analyser När man använder programmet och t.ex. vill göra ett stapeldiagram eller ta fram en frekvenstabell får du fram ett fönster likt nedan. Välja variabler kan man göra på olika sätt. Välja en variabel i taget Om du vill välja en variabel, t.ex. variabeln Kön 1) Markera variabeln 2) Klicka på pil-knappen för lägga in variabeln i det högra fältet Du ser då att riktningen på pilen ändras till att peka mot det vänstra fältet. Skulle du klicka på pil-knappen igen så flyttas variabeln Kön tillbaka till vänsterfältet Om man bara har ett fält som variablerna kan läggas till kan man också dubbelklicka på en variabel för att få samma resultat som ovan. För vissa analyser finns det fler än ett fält som variablerna kan läggas till. Då funkar inte dubbelklick. 19

Välja fler än en variabel som ligger efter varandra Om du vill välja flera variabler som ligger direkt efter varandra, t.ex. variabeln Kön tom Civilstånd kan du naturligtvis välja in en och en, men ett annat sätt är: 1) Markera variabeln Kön 2) Håll ner skift-knappen på tangentbordet 3) Markera Civilstånd, så har du markerat alla variabler från Kön till Civilstånd a. Råkar du markera fel variabel, tryck på rätt variabel så markeras rätt område. 4) Klicka på pil-knappen för att lägga in variablerna i det högra fältet. Det blir naturligtvis mer användbart om man har många variabler i rad man vill markera. Välja fler än en variabel som INTE ligger efter varandra Om du vill välja flera variabler som inte ligger direkt efter varandra t.ex variabeln Kön, Diabetes sedan tidigare och Röker dagligen kan du naturligtvis välja in en och en enligt ovan, men ett annat sätt är: 1) Markera en av variablerna t.ex. Kön 2) Håll sen ner Ctrl-knappen på tangentbordet 3) Markera var och en av de andra variablerna a. Råkar du markera fel variabel, tryck på den variabeln igen så avmarkerar du den 4) Klicka på pil-knappen för att lägga in variabeln i det högra fältet. 20

6.3 Sortera data/sortera variabler Data Sort Cases Högerklicka på variabel Sort Ascending/Descending Ibland vill man kunna sortera data, t.ex. på Längd. Enklaste sättet är att högerklicka på en variabel (klicka då längst upp på variabelnamnet och inte i cellerna där datavärdena finns), som till höger och välj sortering i ökande eller sjunkande ordning. Alternativet finns även i menyn, under Data Sort Cases. Väljer man detta alternativ kan man även sortera på flera variabler samtidigt, t.ex. först på Kön sen på Längd. Nedan är Kön valt med ökande ordning (A Ascending) och Längd med sjunkande (D -Descending). OBS. Här är det viktigt att man har en variabel som visar originalordningen på data, t.ex. person eller enkätnummer, så att man alltid har en variabel som man kan sortera om data till originalordningen. Man kan också sortera på Variabel (se nedan) även om det nog är mer ovanligt. Då bör man, som i fallet med sortera data, spara en startordning så att man kan gå tillbaka till ursprungsordningen. I exemplet har jag valt att sortera på Name och spara nuvarande sortering (Attribute name) som Originalordning. Det namnet kommer sen att dyka upp i nedanstående lista(variable View Columns) när du nästa gång öppnar Sort Variables. 21

6.4 Organisera variabler (Ta bort/lägga till/flytta) Lägga till en variabel/ta bort en variabel i menyn Högerklicka på variabel Insert Variable Antag att man vill lägga till en variabel mellan Kön och Åldersgrupp. 1) Markera variabeln Åldergrupp (klicka där variabelns namn står) a. Högerklicka och välj Insert Variable. ELLER b. Klicka på knappen i menyn ELLER c. Välj Edit Insert Variable 2) Då läggs det till en ny variabel mellan Kön och Åldersgrupp. Flytta en variabel Vill du flytta en variabel 1) Tryck på variabelns namn för att markera variabeln man vill flytta. 2) Tryck igen på variabelnamnet, och dra variabeln så den hamnar mellan de två variablerna du vill flytta den till. Se till att muspekaren förs över variabelnamnen. Då skall en röd linje synas. Linjen markerar mellan vilka variabler variabeln kommer att flyttas 3) Då kan du släppa variabeln. Här är ordningen Kön Ålder Längd före, och Kön Längd Ålder efter. Du kan förstås också välja att klippa ut variabeln (högerklicka och välj Cut) och klippa in den i en ledig kolumn. 22

6.5 Kopiera tabell eller diagram Nedan visas hur det ser ut när man har gjort en frekvenstabell och ett histogram Att kopiera en tabell till word skiljer sig inte från andra sätt att kopiera i Word. På samma sätt som i Word finns en meny i SPSS Edit, där Copy och Copy Special finns om alternativ. I den senare finns det lite olika alternativ, vilka mest påverkar kopiering av tabell. Se sid 24 Vill du kopiera tabellen eller diagrammet och klistra över den till t.ex. Word 1) Markera tabellen 2) Använd menyn i SPSS (Edit Copy) eller ctrl-c 3) Öppna Word, och använd menyn i Word (Redigera Klistra in) eller ctrl-v. 4) Det ger en tabell som liknar en vanlig redigerbar Word-tabell och diagrammet blir förstås en bild. 23

Kön Frequency Percent Valid Percent Cumulative Percent Valid Kvinna 12 54,5 54,5 54,5 Man 10 45,5 45,5 100,0 Total 22 100,0 100,0 Vill du kopiera tabellen som bild eller i annat format. 1) Markera tabeller 2) Välj Edit Copy Special i menyn i SPSS (se bild nedan) 3) Väljer du Rich Plain (RTF) text får du tabellen ovan, Image ger bild ovs Vill du kopiera ett diagram, följ stegen för att kopiera en tabell. Samma alternativ nedan finns för både bild och tabell, men bara Image och EMF fungerar för ett diagram. Alternativ på vilket format man skall kopiera. Plain text Visar tabell utan tabellinjer Rich Text För att kopiera till Word od i tabellformat som i Word Excel Worksheet För att kopiera tabell till Excel Image För att kopiera över tabell eller diagram som bild (Word, Excel, ). Då kan man inte markera fält och redigera tabellen. Metafile Som Image men tabell och diagram blir skarpare, vilket mest märks vid förstoring. 24

6.6 Snabbt komma åt tidigare använda data-filer i SPSS Detta tips är mest användbart när man jobbar mycket på samma dator. SPSS håller i minnet vilka de senaste filerna som öppnats i SPSS på den datorn.(de senaste 9 filerna, antalet går att ändra). Under File Recently Used Data finns de datafiler som öppnats, även excel-filer. Under File Recently used Files finns filer som innehåller resultatet efter körningar (tabeller och diagram), så kallade outputfiler mm. När man öppnar en fil går det också att ställa in i vilken mapp den öppnar by default. Under Edit Options finns flera flikar. Välj fliken File Locations. Där kan man genom att trycka Browse (se pilen) välja vilken mapp jag vill att SPSS skall starta i när jag väljer att öppna en fil. På så sätt slipper man leta sig fram till den mapp man har sina SPSS-filer i varje gång man skall hämta sina SPSS-filer. 25

6.7 Genväg till tidigare använda menyer När man börjar jobba med SPSS kan det vara bra att gå den rätta vägen, dvs via menyerna för att lära sig hitta i programmet. Tycker man att man kan det tillräckligt bra, finns sen en knapp som visar de menyer man senast använt. Det gör det smidigt kan komma till en meny man använder ofta under en session, t.ex. för att göra frekvenstabell, eller om man använder en viss meny repetitivt dvs flera gånger i rad. Här är det Frequencies som var den senaste menyn som användes. 26

7. Användbara funktioner i SPSS De funktioner som tas upp här är Läsa in excel-filer eller andra format Selektera data/personer (Data Select Cases) Splitta data/individer så att analyser utförs för olika grupper (Data Split File) Multiple response set Skapa variabler av befintliga variabler o t.ex. Ålder till kategorivariabler som åldersgrupp Transform Automatic Recode, Transform Recode into different variable) Transform Visual Binning) Transform Automatic Recode o tex BMI av Vikt och Längd ( Transform Compute Variable) Via denna kan även kategorivariabler skapas. 7.1 Läsa in excel-filer i SPSS Istället för att alltid skapa ett dataformulär från början i SPSS kan välja att lägga in data i ett annat program först (t.ex. Excel), och därefter läsa in det i SPSS. Den uppgift som finns i kapitel 12 skulle kunna se ut som nedan om det var inlagt i Excel. 1) Vad man bör tänka på är att när man lägger in data i Excel för att läsas in i SPSS är det bra om första raden är namnet på variablerna och data sedan börjar från rad två. 2) Se till att Excelfilen är stängd. SPSS kan inte öppna en fil som redan är öppen i ett annat program. 3) Gå till File Open Data. Gå till mappen där Excelfilen är sparad. 27

4) Som standard visas.sav, SPSS-filer. Klickar man på Files of types så anges de olika format som SPSS kan öppna. Välj Excel så visas de excelfiler som finns i mappen. och Open. 5) Öppna filen och nedanstående meny visas. Som standard är alternativet läs första raden i excel som variabelnamn förkryssat. Den väljer också det data som finns i excelfilens första flik/blad. Har du data i en annan flik i excelfilen så ändra flik (se pil) 6) Tryck OK. Data förs nu in med variabelnamn. 7) Därefter kan det finnas saker att justera (Se Kapitel 3) a. Om kategorivariabler som Kön är inskrivna som siffror kan det vara bra att sätta tex. etiketter på dem. b. I SPSS finns det regler om hur variabelnamnet, Name, får se ut, varför den kan behöva korrigeras. c. Lägga till Labels 28

7.2 Selektera del av data, Selecte Cases Data Select cases Ibland vill man göra analyser bara på ett urval av data, t.ex. bara kvinnor 1) Gå till Data Select Cases och kryssa i If condition is satisfied och tryck på If a. Låt default-värdet under Output stå. Det innebär att alla data är kvar men att de rader som inte uppfyller kriteriet är bortselekterade. b. De andra alternativen i Output innebär 1) att en ny fil skapas med de selekterade raderna och 2) de icke selekterade raderna tas bort i nuvarande fil. 2) Följande sida visas (nedan). Kvinna var =1. Därför skriv bara Kön=1 som nedan. 3) Tryck Continue och i nästa fönster OK, så kommer bara kvinnor att selekteras. Gör man en frekvenstabell på rökning efter detta kommer bara kvinnornas värden visas. Det skapas då en variabel som heter filter_$ som är 1 för de som selekteras och 0 annars. Gör du en ny selektion används samma variabel, men du kan välja att spara variabeln filter_$ som med ett nytt namn. Variabeln används då inte längre som filter-variabel. Det kan vara smidigt om t.ex. har en krånglig selektion, som du vill spara som variabel. Nästa gång du använder filter kommer SPSS att skapa en ny filter-variabel. OBS: Om du inte längre vill selektera kvinnor, markera All cases i första bilden ovan, OK. 29

7.3 Dela upp data (för att utföra analyser uppdelade på grupper), Split File Data Split File 1) Gå till Data Split File 2) Välj Compare Groups och lägg in Kön som variabel i fönstret. a. Skillnaden mellan Compare Groups och Organize Outputs by Groups är att första alternativet visar resultaten för Kön tillsammans t.ex. tabellerna på för rökning för resp. kön sitter ihop. (Se tabell nedan) Andra alternativet skapar en tabell för män och en tabell för kvinnor separat. b. Man kan också lägga till fler variabler att separera på samtidigt. 3) Tryck OK. Det enda som händer är att SPSS sorterar om data efter Kön. Att det hänt någonting ser man sen när man gör en tabell diagram ed, t.ex. om man gör en frekvenstabell på Röker dagligen (se tabellen nedan). Visa alla: Om man vill ta bort uppdelningen med Split File, skall man inte ta bort variabeln. Markera istället översta alternativet i bilden ovan (Analyze all cases, do no create groups).(se pil) OBS: Observera att om man av någon anledning sorterar data på någon annan variabel, försvinner uppdelningen med Split File, Inställningen finns fortfarande kvar i Split File, men är inte aktiv. För att aktivera igen, gå in i Split File igen och trycka OK. Röker dagligen Kön Frequency Percent Valid Percent Cumulative Percent Kvinna Valid Ja 17 15,9 15,9 15,9 Nej 90 84,1 84,1 100,0 Total 107 100,0 100,0 Man Valid Ja 6 6,5 6,5 6,5 Nej 87 93,5 93,5 100,0 Total 93 100,0 100,0 30

7.4 Selektera del av variabler, Variable Sets Utilities Define Variable sets Utilities Use Variable sets Har man ett stort datamaterial kan det ibland vara svårt att jobba med, speciellt om man bara jobbar med en del av data. Då kan man skapa ett urval av Variablerna, så bara de man jobbar med är synliga. Den vänstra menyn nedan används för att skapa urval (Set) av variablerna, medan den högra används för att välja vilket urval du vill använda. 1) I den vänstra bilden att har jag skapat två urval med namnet Urval2 och Urval2 via Utilities Define Varible Sets a. Namnet på urvalet skrivs i översta fältet ovan. b. Vilka variabler som den skall innehålla läggs till det högra fältet (gråmarkerat), Variables in Sets (här har jag valt Kön tom SBT). c. Trycker jag sedan Add set, så läggs urvalet Urval1 till i listan. 2) Går jag sedan i Utilities Use Variable Sets visas de urval som skapats + de ursprungliga, Allvariablers och Newvariables. (höger figur) 3) Vill jag bara jobba med de variabler som ingår i Urval1 då skall Urval1 + Newvariables vara ikryssat. Anledningen är att om du jobbar med Urval1 så kanske du skapar nya variabler. Dessa ingår i urvalet Newvariables, varför den behöver vara ikryssad för att synas bland dina variabler. 4) Use Variable Sets och Show all variables finns också i snabbmenyn. Smidigt om man vill växla mellan ditt urval och alla variabler. 31

7.5 Skapa och hantera kategorivariabler Transform Recode into different variable Transform Recode into same variable Transform Visual Binning Transform Automatic recode Transform Compute Kategorivariabler kan både vara numeriska eller text, t.ex. Kön som Kvinna och Man eller som 1 och 2 där man lägger in etikett att 1= Kvinna, 2=Man. Båda varianterna funkar normalt, men några saker funkar bara för den senare, som att lägga in missing, och lättare att styra ordningen på kategorierna. Det finns olika sätt att skapa och hantera kategorivariabler. Skapa variabler av befintliga kontinuerliga variabler, t.ex. BMI-klasser av BMI Skapa variabler av befintliga kategorivariabler t.ex. BMI (4 gr) till BMI (3 gr) Ändra ordning på kategorier i en kategorivariabel Göra om en kategorivariabel från textvariabel (string) till numerisk. 7.5.1 Skapa kategorivariabel från en annan variabel, Recode into different variable Tips Har du fler variabler som skall kategoriseras på samma sätt kan du lägga in dem samtidigt. OBS: Exemplet nedan utgår från en kontinuerlig variabel, men man kan lika gärna utgå från en kategorivariabel. Antag att vi har räknat ut BMI. (Se 7.6). Klasserna för BMI är Undervikt= <18,5, Normal= 18,5-24,9, Övervikt= 25-29,9 och Fetma= >=30. Ett andra sätt visas i 7.5.2, och ett tredje via i 7.6.1, via Compute. 1) Gå till Transform Recode into different variable 2) Lägg först in BMI (BMI-->? kommer att visas) 3) I högerfältet, välj namn på nya variabeln, te.x. BMI_klasser, och tryck Change. Det ger bilden nedan a. Observera att du här kan lägga till fler variabler om de kodas på samma sätt. b. Under Old and new values finns fältet If. Det kan t.ex. användas om det skall kodas olika för män och kvinnor. Man lägger då in Om Kön=Man innan man går vidare. 4) Därefter, klicka på Old and New Variables. Här skall vi bestämma vad den nya variabel skall anta för värden. 5) För fortsättningen på exemplet, se sida 34. 32

Generellt om fältet Old and New values I det högra fältet anger man vilket värde den nya variabeln skall anta (BMI_Klasser), och i den vänstra vilka värden det motsvarar i den gamla variabeln (Vikt). a. Value väljer man om man har enstaka värden, tex. om man utgår från en kategorivariabel där man vill att enstaka värden skall hamna i en ny kategori. a. Range är lämpligt för intervall, t.ex. 21-25. b. Range, LOWEST through values innebär från minsta värdet till och med angivet värde. Det är lämpligt för första kategorin/första intervallet för en variabel, t.ex BMI lägre än 18,5. c. Range, value through HIGHEST innebär från och med angivet värde till största värdet och passar bra för sista kategorin/intervallet gruppen d. System-missing använder man där det saknas värden, t.ex. kanske man vill att det som är missing i den gamla skall klassas som Ej ifyllda. Då väljer man System-missing i den gamla och Value (.tex. 3) i den nya. Därefter får man sätta etiketten Ej ifyllda för värdet 3. e. Copy old value passar bra om den nya och gamla variabeln är lika förutom ngn kategori, t.ex. om man bara vill ändra en kategori. Då lägger man först in den kategori som skall vara annorlunda. Sen väljer man All other values (vänster) och Copy old value(s) (höger) OBS: I ovanstående kan man bara skriva siffror i fälten. Om variabeln man utgår från är en textvariabel (string) så kan man skriva text, men då blir bara Value, System- or usingmissing och All other values synliga. OBS: För varje val man anger, tryck på Add för att lägga in det i det vänstra fältet. Tryck bara Ok i nästa fönster för att skapa variabeln. Nedan visas hur exemplet görs 33

6) Första intervallet är alla upp till 18,5 i BMI, blir 1 i New value. Tryck Add 7) Se det vita fältet nedan till höger att första kategorin är införd. Nästa intervall är 18,5-25, som värdet 2, och det läggs lämpligen in som Range ovan till vänster. Tryck Add a. I exemplet är BMI uträknat från vikt och längd, och blir då ett decimaltal. 18,5 finns nu med i båda intervallen, upp till 18,5 och 18,5-25. En person som då har exakt 25,0 kommer att hamna första intervallet. Så första intervallet blir upp till och med 18,5, medan andra intervallet blir mer från (och inte med) 18,5 till och med 25 blir andra intervallet. Man kan skriva det (18.5, 25] 8) Kategorin 25-20, Övervikt, förs in på samma sätt. Sista kategorin, >=30, Fetma förs in som Range, Value through HIGHEST. Tryck Add, därefter Continue, och sen Ok i nästa fönster så skapar variabeln BMI_grupper. Resultatet ser du inte i outputfilen utan i datafilen. (se bild 2 nedan) 34

9) Nästa steg är att ange vad värdena 1, 2.. betyder. Det görs i Variable View. Man kan välja den fliken längst ner till vänster. (se Values under i kapitel 4) 10) Klicka på Values (och sen den blå knappen) för BMI_Klasser och ange etiketterna, t.ex. som nedan. Tryck Add för varje etikett man läggs in, därefter OK när man är klar med alla kategorier. 35

7.5.2 Skapa kategorivariabel från en kontinuerlig variabel, Visual binning Transform Visual binning Visual binning är en metod att skapa kategorivariabler av kontinuerliga variabler, där man samtidigt får etiketterna på en gång. 1) När man öppnar menyn får man först välja variabler. Här visas bara de kontinuerliga variablerna. Lägg över BMI till det högra fältet och tryck Continue. 2) Följande fönster visas (nedan) a. Översta pilen visar vart du skriver in namnet på den nya variabeln b. Vi nästa pil (Upper Endpoint) väljer man hur den nedre delen av intervallet skall räknas, tex. för BMI-kategori 18,5-25 om 18,5 skall ingå i intervallet (Included) eller inte (Excluded) c. Vid Make Cutpoint väljs gränser för respektive kategori d. Make Labels kryssar man i i slutet för att lägga till etiketter på varje kategori 36

3) Klicka på Make Cutpoints. Du får tre val i bilden nedan. a. Intervall med lika bredd. Detta är inte helt sant då man kan ändra detta i senare steg. Här skriver man in ett värde i två av de tre fälten. När du sen klickar i det tredje fältet skapas automatisk ett värde baserat på värdet i de två andra. b. Intervall där du delar in materialet i lika stora delar. Du väljer då antingen antalet gränser och får hur stor andel som varje dels skall innehålla, eller hur stor andel varje kategori skall innehålla och får då automatisk hur många gränser som skall skapas c. Den sista delar in materialet utgående från medelvärde och standardavvikelser 4) Välj första alternativet. Skriv in 18,5 som First cutpoint och 3 som Number of Cutpoints (För 4 intervall brukar normalt 3 gränsvärden räcka). Klicka sedan i fönstret 37

för Width så skapas värdet på ett värde automatisk. (se bild nedan) Du behöver inte bry dig om ifall värdet är konstigt just nu. Det kan ändras sedan. Tryck bara Apply. 5) Under Values nedan står inte riktigt de gränser vi hade tänkt oss, men det kan du ändra, antingen genom att ändra siffrorna se (6) ) eller manuellt att trycka och dra på lodräta linjerna i figuren för att ändra gränserna. 6) Klicka eller dubbelklicka på respektive värde (27,23 ovs) och ändra. Där det stå High skall man inte ändra. Den skall finnas där. Försöker man göra det t.ex. skriver 35 istället för High så skapas kategorin 35 som fjärde kategori, och High blir då automatisk en femte kategori. 7) Välj sedan Excluded (se pil) och tryck sedan på Make Labels. Följande visas nedan. Labels kan också ändras på samma sätt som Values ifall du inte är nöjd med texten. Tryck Ok så har du skapat en ny variabel där etiketterna finns med. Observera att kategorierna kan vara lite olika mot dem som skapades i 7.50.1 eftersom gränserna var lite olika, om värdet på undre gränsen skall ingå i intervallet eller ej. 38

7.5.3 Göra om en kategorivariabel från text till talformat Transform Automatic recode En kategorivariabel kan både vara rent text-format och numerisk, som kön (Kvinna/Man eller 1/2 där 1=Kvinna och 2=Man). När man t.ex. läser in en Excelfil till SPSS så blir kategorivariabler normalt i textformat. Gör man sedan t.ex. en frekvenstabeller så visas kategorierna i bokstavsordning, vilket kanske inte alltid är den ordning man vill ha det. Med ett numerisk format kan man styra det. Variabeln Diabetes hos föräldrar och syskon är en textvariabel. För att göra om den till numerisk: 1) Gå till Transform Automatic recode Lägg in variabeln och döp den nya. Jag brukar ofta skriva det gamla namnet och avsluta med _N för att markera att det är den numeriska varianten. a. I en textvariabel tolkas normalt inte tomt som missing. När man kodar om den är det bra om man kryssar i Treat blank string. (se pil ovan). Ett tomt fält får alltid ett siffervärde. Skillnaden är att med detta ikryssat så får det en etikett och läggs automatisk till som ett missing. 2) Tryck OK så skapas en ny variabel. Den ut som orignalvariabeln men har du ett siffervärde och etikett för varje kategori. OBS: Variabel som skapas läggs in i bokstavsordning, fallande eller stigande. Är man inte nöjd med ordningen, se nästa kapitel, 7.5.4. 39

7.5.4 Ändra ordning på kategorier i en variabel Transform Recode into same variable Tillvägagångssättet för denna är lika Recode into different variable, med den skillnaden att ändringarna du gör är på samma variabel. Menyn för Old and New values är densamma. Se till att den du tar rätt variabel så att du inte skriver över fel variabel. Denna kan t.ex. vara till nytta om man använt Automatic recode (se förra kapitlet 7.3.), där en ny variabel är skapad från en textvariabel, då kan denna meny användas för att ändra ordningen. En frekvenstabell på variabeln skapad från förra kapitlet, DiabetesFöräldrarSyskon_N, blir Diabetes föräldrar/syskon Frequency Percent Valid Percent Cumulative Percent Valid Ej svarat 3 1,5 1,5 1,5 Ja 46 23,0 23,0 24,5 Nej 144 72,0 72,0 96,5 Vet ej 7 3,5 3,5 100,0 Total 200 100,0 100,0 Här är Ej svarat kategori 1, Ja är kategori 2, Här skulle det vara lämpligt att byta ordning så att Ej svarat skulle bli missing (Sysmis, se bild), Ja blir kategori 1, Nej blir kategori 2 och Vet ej som kategori 3. Se bild nedan. Om man vill kan man istället för att välja System-missing på Ej svarat sätta det som kategori 4 (1 4) och därefter i Variable View, Missing lägga in att den kategorin skall tolkas som missing. 40

Observera dock att fastän ordningen har ändras så står det samma namn på respektive kategori. Se nedanstående tabell på den nya variabeln. Namnen på kategorierna står i samma ordning som i originalfilen, dvs etiketterna är oförändrade, Ej svarat är fortfarande = kategori 1. Jämför nedanstående tabell (på den nya variabeln) med tabellen på föregående sida för originalvariabeln. Om man vill kan man göra en korstabell på den gamla och nya variabeln så ser man det tydligt. Diabetes föräldrar/syskon Frequency Percent Valid Percent Cumulative Percent Valid Ej svarat 46 23,0 23,4 23,4 Ja 144 72,0 73,1 96,4 Nej 7 3,5 3,6 100,0 Total 197 98,5 100,0 Missing System 3 1,5 Total 200 100,0 Korrigera etiketterna Gå till fliken Variabel View och Values för den nya variabeln. Etiketterna för originalvariabeln syns till vänster. Korrigera etiketterna för den nya variabeln så att den blir som höger bild nedan. Där finns bara 3 kategorier, efter som Ej svarat sattes som missing. Gör gärna en korstabell med nya och gamla variabeln för att se om det blev korrekt. 41

7.6 Skapa nya variabler av befintliga variabler via Compute Transform Compute I 7.5 togs det upp hur man hanterar kategorivariabler och skapar nya. Ibland vill man ha större frihet att skapa nya variabler, t.ex. om man vill skapa en ny variabel BMI av Längd och Vikt. Via Compute kan man också skapa kategorivariabler, som BMI-Klasser. Allmänt I Compute finns det olika delar. a) Till vänster finns alla variabler b) Längst upp till vänster skriver man in namnet på den nya variabeln. c) I Numeric expression skrivs hur den nya variabeln skall se ut. Man kan antingen skriva in det manuellt, eller klicka in variabler och använda knapparna för + ovs. d) Teckenförklaringar: Upphöjt = **, & = Och, = Eller, ~= = Inte lika med e) I listan till höger visas olika funktioner. De kan klickas till fältet för Numeric expression eller skriva in manuellt. Klicka på en funktion så visas en förklaring till det, se pil. Casenum som visas skapar en variabel med nummerlista för alla rader det finns data på. f) Längst ner till vänster kan man selektera på en grupp, te.x. Kön=1. Som exempel, skapar variabeln BMI 1) Gå till Transform Compute 2) Skriv in BMI under Target Variable 3) Lägg in variabler under Numeric Expression via variabelfönstret till vänster. 4) Använd miniräknarfönstret (eller tangentbordet) för att lägga in siffror och tecken. ** betyder upphöjd men man kan också skriva (Längd * Längd). Observera att parentesen måste finnas med i sista alternativet för att formeln för BMI blir korrekt. a. /100 behövs för att längden är inlagd i cm istället för meter. 5) Trycker man Ok så kommer man få en ny variabel för BMI. 42

7.6.1 Skapa gruppvariabler via Compute Transform Compute I kapitel 7.5 visade hur man gjorde grupper av variabler, t.ex. BMI-klasser av BMI. Ett annat sätt är att använda Compute. Exemplet är förstås överförbart till andra exempel. BMI-Klasser kan t.ex. skapa via formeln Denna formel skapar variabeln BMI-klass: 1*(BMI<18.5) + 2*(BMI>=18.5& BMI<25) + 3*(BMI>=25 & BMI< 30) + 4*(BMI>=30) Observera att du måste skriva 18.5, inte 18,5, dvs 18 punkt 5 som decimaltal Formeln innehåller 2 delar a) de värden man vill ha på den nya variabeln och b) påståendet, vad som måste gälla för att den nya variabeln skall få resp. värde. Är ett påstående sant blir det en 1:a, är det falskt blir det en 0:a. Så för en person som har BMI 23 så kommer bara det andra uttrycket att gälla, 1*0 + 2*1 + 3*0 + 4*0, dsv bara det andra påståendet är sant, alla de andra blir 0. Därför gäller det att kontrollera att bara ett av uttrycken kan stämma. Exempel på fel i formeln Antag t.ex. att BMI bara har en decimal och det stått 1*(BMI<18.5) + 2*(BMI>=18.5& BMI<=25) + 3*(BMI>=25 & BMI< 30) + 4*(BMI>30) Det fetmarkerade visar att för person som har exakt 25 i BMI stämmer med 2 uttryck. Dennes BMI kommer då att bli 1*0+2*1+3*1+4*0 = 5, eftersom 25 stämmer med både andra och tredje uttrycket. Där blir det tydligt att ngt är fel, eftersom variabeln här bara har kategorierna 1-4. Det kan vara bra att dubbelkolla att det blev rätt. Det kan t.ex. göras med 1) korstabell (Se 8.2) med i ovanstående fall BMI mot BMI_klass, ifall det inte är för många fall, 2) om man sorterar data efter BMI och kollar brytgränserna för BMI_klass, eller 3) använda Split file på BMI_klass (Se 7.3)och sedan göra en frekvenstabell på BMI. Variabler med 2 kategorier Observera att om det bara stått BMI<25 i Numeric expression hade den nya variabeln blivit 1 om BMI< 25 och 0 om BMI>=25. SPSS sätter värdet 1 som resultat om ett uttryck stämmer. Olika kategorier en annan variabel, för kön Har man en variabel som kodas olika för män och kvinna kan man skriva in det samtidigt det här. Antag att den undre gränsen är 18,5 för kvinnor och 19,5 för män, och Kvinna har kategori 1 i Kön, och motsvarande för män är 2. Då kan man skriva 1*(BMI<18.5 & Kön=1) + 1*(BMI<19.5 & Kön=2) + 2*(BMI>=18.5& BMI<25 & Kön=1) 2*(BMI>=18.5& BMI<25 & Kön=2) + 3*(BMI>=25 & BMI< 30) + 4*(BMI>30) Hade Kön varit en textvariabel hade man istället fått skriva 1*(BMI<18.5 & Kön= Kvinna ) + 1*(BMI<19.5 & Kön= Man ) +.. 43

7.7 Syntax Om man går till File Open ser man att det förutom Data och Output finns Syntax När man skapar en tabell, diagram mm, så är sista steget att trycka på OK. Man kan också välja Paste. Om man t.ex. väljer att göra en frekvenstabell på Civilstånd och väljer OK så skapas tabellen på Civilstånd. Väljer du istället Paste skapas en ny fil, en syntaxfil (t ex. Syntax1.sps). Den kan man sen använda för att köra syntaxen för att skapa t.ex. tabellen. Syftet med syntax kan vara att man vill kunna gå tillbaka och se vad man hade gjort, eller man vill göra om samma sak flera gånger och vill slippa gå via menyerna Skall göra samma typ av formeln på flera och väljer att skapa den i syntax och fortsätter att göra resten i syntaxfilen Detta gäller speciellt om man har skapat nya variabler då det kan vara bra att ha det sparat exakt hur man gjort den. Man kanske vill göra om variabeln. Då kan man bara ändra i syntaxen och köra syntaxen igen istället för att gå hela vägen via menyerna. Se t.ex. syntax för BMI_klass (7.5 och 7.6) Exempel med Civilstånd Här är Civilstånd inlagt, och även ett stapeldiagram, via delmenyn Charts Väljer man då Paste istället för OK så får man följande syntaxfil. 44

Syntaxfilen består i detta fall av tre rader, först vilken meny/alternativ man valt, i detta fall Frequencies, och vilken/vilka variabler man vill göra det för. i. Ibland står det även Dataset Active, men det är inte så viktigt. Om man har flera sav-filer uppe så ser den till att man utgår från rätt fil. Därefter kommer det olika delar som har att göra vilka inställningar man valt. I detta fall 1) att ett stapeldiagram skapas 2) Order = Analysis säger vilken ordning analysen kommer. Den kommer från ett inställning Format Multiple Variables som finns Frequencies. Om man vill ta fram frekvenstabell på flera variabler samtidigt kan man 1) visa alla frekvenstabeller först, sedan alla diagram (Analysis, se syntax ovan), eller 2) tabell och diagram för en variabel i taget (Variable) Observera sen att syntaxen alltid avslutas med punkt, som ovan. Viss text blir också blå/grön/röd för att visa att dessa är fördefinierade av SPSS. MEAN är röd, men skriver jag t.ex. e i slutet, MEANE så blir det svart eftersom SPSS inte längre tolkar det som ngt av SPSS fördefinierat namn. Det läses som text. I många fall finns det defaultinställningar som inte behöver skrivas in i syntaxen, t.ex. ordning på kategorier. /Format= Dvalue, vilket betyder Descending Values istället för Ascending Value som är default. Hade man valt ett annat alternativ än det alternativ som är förvalt så hade det synts i syntaxen. Vill man sedan skapa tabellen från syntaxen, 1) markera texten, 2) välj Run Selection i menyn, eller tryck på den gröna pilen (se pil ovan). --------------------------------------------------------------------- När man t.ex. skapar BMI av Längd och Vikt så sker en beräkning. I sådana fall kommer en syntax att avslutas med Execute. Syntaxen för BMI blir Editera i syntaxfilen Syntax är också relativt smidigt att redigera direkt, tex, om man behöver ändra något. Vill jag göra en tabell på både Civilstånd och Kön så skriver jag bara in Kön efter Civilstånd i syntaxfilen. 45

8. B e s k r i v a n d e s t a t i s t i k För att se på olika sätt att välja variabler, se 6.2 Här visas hur man tar fram information från kategorivariabler (andelar mm via frekvenstabell och korstabell) och kontinuerliga variabler (medelvärde mm) För att visa antal och andelar Analyze Descriptive Statistics Frequencies Analyze Descriptive Statistics Crosstabs För att visa medelvärde mm Analyze Descriptive Statistics Descriptive Analyze Descriptive Statistics Frequencies Analyze Descriptive Statistics Explore Descriptive tar fram medelvärde/max/min/standardavvikelse medan Frequencies förutom antal och andelar har fler val av mått med bla median och kvartiler. I båda fallen kryssar man i vilka mått man vill ta fram. Explore har flest mått men har mindre flexibilitet, dvs man väljer i princip om man skall ha statistiska mått eller ej. Explore kan dessutom ta fram även diagram. Frequencies tar fram frekvenser (lämpligt för kategorivariabler) för variabler. 46

8.1 Frekvenstabell Analyze Descriptive Statistics Frequencies En användning för frekvenstabeller är att kontrollera variabler/data när data är inlagt. Syftet med det kan vara att ge en uppfattning om värdena i en variabel. Det passar bäst på kategorivariabler. Har man en kontinuerligt variabel med många utfall är det lämpligare med t.ex. Histogram. kontrollera om det finns några felinmatningen (vilket är att rekommendera) e.d i data. Då kan denna passa för alla variabeltyper, förutsatt att det inte är för mycket data. 1) Gå till Analyze Descriptive statistics Frequencies 2) Dubbelklicka på önskad variabel eller klicka på variabeln och sedan på pilen för att välja variabel i högerfönstret. a) För att välja flera variabler efter varandra, t.ex. alla variabler från Kön till Civilstånd, markera första variabeln du vill välja, håll ner skift på tangentbordet och markera Civilstånd. b) För att välja flera variabler som inte är efter varandra, t.ex. Kön Åldersgrupp och Diabetes sedan tidigare, håll ner ctrl och markera variablerna. 3) Under Statistics finns det faktiskt möjlighet att ta fram en del mått som medelvärde od. a) Om detta är syftet innebär det normalt att man har en kontinuerlig variabel. Då kan det vara lämpligt att bocka av visning av frekvenstabell (se pil i bild ovan) 4) Under Charts kan man välja olika diagram som passar för frekvenser 5) Under Format kan man t.ex. välja i vilken ordning variablerna skall visas och om resultatet skall visas mer separat för varje variabel. 6) När samtliga önskade variabler är valda klicka på OK. 7) Ett OUTPUT-fönster dyker upp som visar de efterfrågade frekvenstabeller, t.ex. på civilstånd nedan. 47

Den första tabellen visar hur mycket valida respektive missing det är i variablerna. Här har fyra personer som inte svarat på civilstånd, och denna typ av missing är här kodat, dvs en kategori på variabeln har satts som missing, se pil till nedersta tabellen (se 3)) Om det bara saknas värde så brukar det stå Missing System istället. De andra tabellerna visar antal och procent. Missing visas under Percent. Valid Percent visar andelen av de värden där det finns uppgifter på Kön. Det värdet är normalt mer korrekt att ange än Percent. Exempel: Om t.ex. 10 av 20 svarar Ja på en fråga och 10 ej svarar, vet vi inte om de som ej svarat hör till ja eller nej-gruppen. Vi kan bara uttala oss om de som har svarat. Cumulative Percent visar ackumulerad procent. Den är bara aktuell om det finns en naturlig ordning på kategorierna, t.ex. för åldersgrupp (ca 67,5% är 50 eller yngre). Hade kategorin Övrigt varit större hade det däremot varit osäkert, då vi inte vet vilka åldrar som ingår, är de yngre eller äldre? Däremot funkar den inte för variabeln Civilstånd, i alla fall inte i den ordning kategorierna ligger just nu. 48

8.2 Korstabell och chi2-test Analyze Descriptive Statistics Crosstabs Ibland är man inte bara ute efter frekvenstabell för en variabel, utan två variabler samtidigt, t.ex. Kön och rökvanor. För att välja variabler kan man inte bara dubbelklicka på en variabel, eftersom det finns 3 fält som de kan läggas in i 1) Gå till Analyze Descriptive Statistics Crosstabs 2) Markera t.ex. Kön och lägg in det under Rows, och sedan Röker dagligen under Columns. Kryssar man i Display clustered bar charts får man också ett diagram. I 10.2) visas hur man gör samma diagram via Graphs 3) Lägger man t.ex. Åldersgrupp i fältet Layer så får man en korstabell för varje kategori i åldersgrupp. 4) Vill du göra ett test, t.ex. chi-2test, klicka på rutan Statistics och kryssa i Chi-square och tryck på Continue 49

5) Vill du också visa andelar, tryck på Cells. Observed är förmarkerad. Kryssa i Row (för att summera andelar för respektive Kön då Kön är inlagt på rad), tryck Continue 6) Nedanstående bild får vi i outputfilen. Eftersom vi kryssade i Percentages Row så får vi andelar där totalen för en rad är 100%, i detta fall Kön. Så 15,9% kvinnor har svarat Ja på Röker dagligen och 84,1% har svarat nej, totalt 100%. Här är det viktigt att ha tillräckligt många för att tala om procent. Hade data bestått av t.ex. totalt 10 personer så skulle en skillnad på en person innebära 10%. En skillnad på bara en person skulle då innebära mycket i procent, vilket gör förändring i procent svårtolkat. Hade vi valt Percentages Column så hade vi fått hur av alla som t.ex. röker, hur stor andel är Kvinnor respektive Män. 50

Chi-2-test Om man i föregående exempel även valde att göra ett chi-2-test så fick man en andra tabell med utfallet av chi-2-testet. Vad som testas är om det finns något samband mellan Kön och Rökning, dvs är andelen rökare olika bland män och kvinnor? Börja med att bedöma detta via korstabellen ovan. Pearsons Chi-square får ett testvärde på 4,35. Ju större värde desto troligare att det finns samband mellan de valda variablerna. df, Frihetsgrader(Degrees of Freedom): Man behöver inte fastna på betydelsen av detta värde. I chi-2-test är df=(n1-1)*(n2-1) där n1, n2 är antalet kategorier i variablerna. I vårt fall är antalet kategorier 2 för både Kön och Rökning. => df=(2-1)*(2-1)=1. Df används för att veta vilket värde vi skall jämföra vårt testvärde med. Ju högre df, desto högre får testvärdet vara innan det blir signifikant. Tillförlitligt för små material? Chi-2-testet är lite känsligt får små material. Ju mindre data vi har desto mer påverkar slumpen hur stabila skillnaderna är. Man ser det bl.a. i texten under tabellen med testet. Här står det att 0 celler har mindre än 5 förväntade fall. Man brukar säga att för att Chi-2-testet skall fungera bra bör varje cell har ett förväntat värde på 5, om man utgår från att det inte finns några skillnader. I data är det 54% kvinnor och 46% män, 107 respektive 93. Om det inte finns ngt samband mellan Kön och Rökning borde det vara 54% rökare som är kvinnliga och 46% av manliga, dvs samma fördelning som bland könen. Eftersom det är 23 st rökare skulle det innebära 10,6 män resp 12,4 kvinnor. Det är detta som man menar med förväntat antal i cellerna för rökare. Ju färre personer, desto osäkrare. Är det 5 personer innebär 1 person 20%, 2 personer 40% ovs. Här luras procentvärdena lite eftersom det ser ut som skillnaderna är större än vad de egentligen är. Fischer s exact test använder man om man har ett litet material. I grundversionen av SPSS 23 fungerar detta bara med en 4-fältstabell, dvs två variabler där vardera variabel har två kategorier. Den läser man av under Exact Sig (2-sided). Asymptotic Significance = p-värdet. Vanligen väljer man 0,05 som gräns på om det eventuella sambandet är signifikant. Om p-värdet<0,05 bedömer man då att det finns ett signifikant samband, i detta fall mellan Kön och Rökning. Normalt brukar inte testvärdet redovisas i artiklar, endast p-värdet. Andelarna anges för att ge läsaren en förståelse för tolkningen av p-värdet. Är det signifikant bör man kunna läsa sig fram till att det finns en skillnad i andelarna mellan t.ex. andelen rökare i resp Kön. 51

8.3 Tabell för flervalsfrågor Analyze Multiple Response Ibland har man t.ex. enkätfrågor där man får svara på mer än ett alternativ. Eftersom varje variabel i SPSS bara kan ha ett svar så måste man föra in en variabel för varje svarsalternativ för variabeln. När man sedan skall göra statistik på frågan finns det ett alternativ för att presentera resultatet samlat för frågan. En fråga är om man under senaste 14 dagarna tagit, 1)blodtrycksmedicin, 2)Medicin för Hjärt-kärlkramp,.. 5) Blodfetter. Detta kan ses som en är en flervalsfråga, dvs man får kryssa i en eller flera. En variabel blir därför Ja om man kryssat för kategorin och Nej om man ej kryssat för det. För att kunna använda Multiple Response så funkar inte text-variabler (string), vilket dessa är. För denna övning så har dessa gjorts om till numeriska. För att göra det se, 7.5.3 och 7.5.4. Skapa först en ny variabel (Sets) enligt nedan: 1) Gå till Analyze Multiple Respons och välj Define Variable Sets 2) Lägg in variablerna i fältet Variables in Set 3) Här måste man välja namn och sedan mellan Dichotomies eller Categories. För att visa skillnaden så skapar vi två variabler, Röker1 och Röker2 a. Name=Använder_Medicin1, Dichomomies och Counted value 1, tryck Add b. Lägg in variablerna en gång till, välj Name=Använder_Medicin2, Categories och Range 1 till 2 (Ja=1, Nej=2), Tryck Add 4) Välj sedan Close. Det du har skapat nu är en ny variabel. Den kommer inte att synas bland de vanliga variablerna, utan bara under menyn Multiple Respons 52

5) Klicka sedan igen på Analyse Multiple Respons och välj Frequencies och lägg in Använder_Medicin1 och Anvönder_medicin2. Följande tabeller skapas. Case Summary Cases Valid Missing Total N Percent N Percent N Percent $Använder_Medicin1 a 200 100,0% 0 0,0% 200 100,0% $Använder_Medicin2 b 200 100,0% 0 0,0% 200 100,0% $Använder_Medicin1 Frequencies N Responses Percent Percent of Cases $Använder_Medicin1 a Blodtr_N 34 15,7% 17,0% Hjärtakärl_N 3 1,4% 1,5% Lugnande_N 5 2,3% 2,5% Magsår_N 16 7,4% 8,0% Blodfett_N 11 5,1% 5,5% AnvänderEj_N 142 65,7% 71,0% EjSvarat_N 5 2,3% 2,5% Total 216 100,0% 108,0% a. Dichotomy group tabulated at value 1. $Använder_Medicin2 Frequencies N Responses Percent Percent of Cases $Använder_Medicin2 a Ja 216 15,4% 108,0% Nej 1184 84,6% 592,0% Total 1400 100,0% 700,0% a. Group I Tabell 1 visas att det är 200 svarande på båda, utan missing. Tabell 2 visar varianten där man räknar antalet Ja-svar, antalet 1:or. 216 ja-svar varav den medicin som är vanligast är Blodtrycksmedicin. 142 har svarat Använder ej Medicin. 216 svar av 200 innebär att det är vissa som har fler än en medicin. 15.7% av de 200 individerna använder blodtrycksmedicin, 17.0% av alla 216 svaren var på blodtrycksmedicin. (se pil ovan) Tabell 3: Blir mer en summering av antalet svar i respektive kategori. Denna variant passar bättre om man t.ex. har en fråga där varje person får välja de 3 viktigaste egenskaperna av 10 förslag. Länkar man sedan ihop svaren kommer kategorierna bestå av dessa 10 svarsalternativ och fördelningen på dem. Se länkarna nedan för exempel. http://www.unige.ch/ses/sococ/cl/////spss/cmd/multrespset.html http://www.unige.ch/ses/sococ/cl////spss/cmd/multrespfreq.html 53

8.4. Beskrivande statistik med centralmått och spridningsmått Om man har kontinuerliga variabler är det lämpligt att räkna medelvärde, standardavvikelse, median mm. Det finns minst fyra menyer för detta. I Descriptives kan du välja några av de vanligaste måtten. I Explore kan du inte välja mått men får däremot flera än i Descriptives + att det går att dela upp resultatet utifrån en annan variabel, t.ex. Kön. I Frequencies finns alternativet Statistics som funkar ungefär som Descriptives men har fler mått, som t.ex. median. Means ger ungefär samma resultat som Frequencies + att det går att dela upp resultatet utifrån en annan variabel, t.ex. Kön. De första tre finns under Analyze Descriptive Statistics medan Mean ligger under Analyze Compare Means. Endast de två första redovisas här. 8.4.1 Beskrivande statistik via Descriptives 1) Gå till Analyze Descriptive Statistics Descriptives enligt ovan. Det ger det vänstra fönstret nedan. 2) Välj den/de variabler du vill ta fram statistik på. 3) Trycker du Ok får du medelvärde, max, min och standardavvikelse. 4) Under Option (högra fönstret) kan du även välja några andra mått. Median går dock inte att ta fram via denna meny. 54

8.4.2 Beskrivande statistik via Explore Analyze Descriptive Statistics Explore Här kan du ta fram flera mått som median mfl + olika diagram. 1) Gå till Analyze Descriptive Statistics Explore 2) Under Dependent List väljer du vilka variabler du vill ta ut beskrivande statistik, t.ex. DST och SBT (Diastoliskt och Systoliskt blodtryck). 3) Vill du t.ex. ta ut medelvärde od för vardera könen, kan du lägga in Kön i Factor List. Då kommer du dels att få tabeller för Kvinnor och dels för Män 4) I Explore kan du både få tabeller och diagram. Längst ner kan du välja om du t.ex. vill ha tabeller (Statistics) men inte diagram (Plots), eller tvärtom, eller båda (Both). 5) Under Statistics uppe till höger finns några valmöjligheter, men vanligen kan den hoppas över 6) Under Plots kan man t.ex. välja histogram och test av normalfördelning. 7) Under Options kan man styra hur missing skall hanteras. a. Om du lägger in flera variabler under Dependent List så är grundinställningen att bara räkna på de individer har valida värden på alla valda variabler, Exlude cases listwise. Det gör att respektive mått kan jämföras eftersom de är räknade på samma personer/rader. Väljer man pairwise utgår den från missing per enskild variabel. 55

8.5 Redigera tabeller Det finns lite sätt att redigera en tabell. Här nedan har jag gjort en tabell med beskrivande statistik. Descriptive Statistics N Minimum Maximum Mean Std. Deviation Vardagsmotion 178 0 840 133,04 180,780 Fysisk motion 178 0 840 228,57 183,969 Valid N (listwise) 178 Om man dubbelklickar på en tabell kommer man i in redigeringsläget. Det syns inte alltid, men högerklicka på tabellen så visas menyn ovan till vänster. Högerklicka jag på Vardagsmotion ovan får jag mer möjligheter. 1) Du kan t.ex. direkt göra en graf utifrån tabellen (funkar inte alltid bra), sorterar rader, ändra tabellens utseende, lägga in text under tabell (footnote), 2) Klickar du för Toolbar, kan du te.x. fetmarkera delar av tabell. En användbar funktion är Pivoting trays. Har du använt Pivotabeller i Excel så funkar det på liknande sätt. I denna tabell finns det två delar av tabellen som man kan flytta runt, Statistics och Variables. Här kan du ha många fler delar, beroende på vilken tabell du gör. Du har radoch kolumndel + Layer. 56

Du kan trycka och dra t.ex. Statistics från Columns till Row. I nedanstående exempel har jag använt tabellen ovan och bytt plats på Statistics och Variables. Smidigt om man t.ex. har för bred tabell. I bilden nedan har jag lagt Variables i Layer. Layer innebär att den bara visar en kategori i taget. Här syns bara Vardagsmotion. För att visa den andra variabeln klickar jag på listen där Vardagsmotion syns, (se bild nedan). 57

9. P a r a m e t r i s k t t e s t, jämförelse av medelvärden. Analyze Compare Means Independent Samples T-test Analyze Compare Means Paired Samples T-test Test för att jämföra medelvärden tillhör parametriska test. För att göra t-test antas att data är normalfördelat (Kan bedömas med Histogram och testas i Explore). Är inte data normalfördelat kan man använda ickeparametriska tester (Analyze Non parametric tests). Vill du testa om en variabel är normalfördelad kan du göra det under Analyze Explore Plots och Normality plot with tests. I kompendiet beskrivs bara parametriska test. Det finns lite olika typer av test för att jämföra medelvärdesskillnader. Skillnader i medelvärde mellan A) 2 oberoende grupper t.ex. skillnad i blodtryck mellan man och kvinna. (t-test för två oberoende grupper) Analyze Compare Means Independent Samples T-test B) 2 mättillfällen t.ex. skillnaden i blodtryck för en grupp, före och efter en intervention (Parat t.-test eller t-test för beroende observationer) Analyze Compare Means Paired Samples T-test C) Fler än 2 oberoende grupper (ANOVA) D) Fler än 2 mättillfällen (ANOVA med upprepade mätningar). Denna finns ej i basversionen av SPSS, utan i extramodulen Advanced. Här kommer endast A) och B) att tas upp. 58

9.1 Jämförelse två oberoende grupper. Analyze Compare Means Independent Samples T Test Här vill vi testa en kontinuerlig variabel, mellan två grupper, t.ex. om det är någon skillnad i medelvärde på DBP mellan könen. 1) Klicka på Analyze Compare Means Independent Samples T Test 2) Vi vill testa medelvärdet på variabeln DST. Därför är det den som skall väljas till Test Variable List. Om du t.ex. även vill testa SBT mellan könen kan du lägga in den på en gång. 3) Placera variabeln med grupptillhörigheten, Kön, i Grouping Variable. Namnet på fältet antyder också att det måste vara en kategorivariabel som skall väljas. Man kan välja en variabel med fler än två kategorier, men man kan bara välja ut två av kategorierna i testet. 4) Innan nästa steg behöver vi vet vilka kategorinamn som variabeln har. a) Om variabeln är inlagd som siffror är det siffrorna som skall användas. Kommer du inte ihåg vilka siffror det är kan du högerklicka på variabeln Kön, ett fält Variable Information visas (vänster bild nedan). Klicka man på den visas höger bild. Första kategorin visas. De andra kategorierna visas i en rullist om man klicka i fältet där pilen visar. b) Om kategorierna är inlagda som text är det dessa som skall användas. Om du inte kommer ihåg vilka namnen är kan du inte använda ovanstående metod. Du måste i så fall titta på variabeln i Variable View. Se Values i kapitel 3). 59

Klicka nu på Define Groups för att ange vilka grupper som skall jämföras. 5) Vi kontrollerade ovan och såg att Kvinna =1 och Man= 2. Ange värdet 1 för den oberoende variabeln på Group 1 och 2 på Group 2, som ovan 6) Klicka på Continue och OK i nästa fönster. Utskrift från SPSS: T-Test Group Statistics Kön N Mean Std. Deviation Std. Error Mean DST Kvinna 107 79,07 9,877,955 Man 92 84,17 9,293,969 Denna tabell visar bara beskrivande statistik för vardera grupp. Eftersom t-test använder sig av varje grupps medelvärde resp. standardavvikelse är det bra att studera denna tabell först. Verkar det finnas ngn skillnad om man studerar skillnaden mellan medelvärdena? Verkar det vara stor spridning? (Man kan räkna med att om Std. Error Mean är mer än skillnaden i medelvärde lär det inte var ngn skillnad) Std Error Mean kan ses som osäkerheten i medelvärdesskillnaden. 60

Levene's Test for Equality of Variances F Sig. t df Sig. (2-tailed) DST Equal variances assumed,016,901-3,738 197,0 Equal variances not assumed -3,755 195,381,0 Dessa två tabeller visar samma sak. Den första är bara kopierad till Word som en Word-tabell. Den andra är inklistrad som bild för att hela tabellen lättare skall få plats i Word. (Enklast är om du använder du Edit Copy Special Image i SPSS) De två första kolumnerna (Levene's Test for Equality of Variances) testar om spridningen är lika i grupperna, för att se om vi skall titta på övre eller undre raden för vårt t-test. Är p-värdet (Sig.) lägre än 0,05 betyder att spridningen mellan grupperna bedöms vara olika, och vi skall titta på den nedre raden. I vårt fall är sig p=0,901 vilket är högre så vi läser av den övre raden. Sedan visas vårt testvärde, (t), frihetsgraden (df) och sedan p-värdet (Sig.(2-tailed)). Eftersom vårt p=0,000 är lägre än 0,05 kan vi dra slutsatsen att det finns en signifikant skillnad i DST beroende på kön (tdf=197=-3,74 p<0,001) (H0 kan förkastas). I tabellen står det p=0,000, det betyder att inte att p-värdet är 0, utan att det inte ryms inom 3 demimaler. Då brukar man skriva p<0,001. Vi kan även se i de sista två kolumnerna som visar nedre och övre gräns för konfidensintervallet att det finns en signifikant skillnad eftersom konfidensintervallet för medeldifferensen inte täcker in värdet noll. Konfidensintervallet säger att med 95% säkerhet ligger medeldifferensen i populationen inom gränserna (-7.6, -2,4). Den visar bl.a. att medeldifferensen är negativ, dvs inte 0 => signifikant skillnad med 95% säkerhet. Frihetsgraden är här (n1-1)+(n2-1)= (107-1)+(93-1) eftersom vi har 107 resp 93 i resp grupp. Ett sätt att beskriva det är att Df kommer från att man i beräkningen av standardavvikelse skattar medelvärdet och förlorar då information. Om man har 3 värden 1, 2 och 3 och räknar ut medelvärdet, då räcker det att veta medelvärdet (2) och 2 av de andra värdena för att vet vad det 3:e värdet skall bli. På det sätter kan man säga att man har tappat information/frihetsgrad! Det är inget man behöver kunna eller fastna på. 61

9.2 Jämförelse av två beroende variabler Analyze Compare Means Paired-Samples T Test Här jämförs två variabler som är mätt på samma individ. De två variabler skall förstås mäta samma sak, t.ex. före och efter intervention. I data finns bara två kontinuerliga parade variabler som skulle kunna testat med parat t-test. Vardagsmotion och Fysisk motion är båda mått på motionsaktivitet (mätt i antalet spenderade minuter/vecka). Testa om medeltiden skiljer mellan vardaglig och fysisk motion. Variablerna är inte särskilt normalfördelade men använder det som övning. 1) Klicka på Analyze Compare Means Paired-Samples T Test. 2) Markera Vardagsmotion och lägg in den med pilrutan. Den kommer automatisk att läggas under Variable1. Samtidigt läggs en rad till för nästa par, men du måste avsluta först paret innan du kan lägga till variabler till pair2 om det är fler par man vill testa.. 3) Nästa variabel du lägger in läggs in under Variable2. 4) Klicka därefter OK. Det finns en ruta option, men där kan du i princip bara ändra konfidensgrad för konfidensintervall. 5) Man kan också byta plats på variablerna under Variable1 och Variabler2, via 62

Utskrift från SPSS: T-Test Första tabellen visar enkel beskrivande statistik för mätningarna. Här kan man studera skillnaden i medelvärde. Vad det gäller spridningsmåtten (standardavvikelse och standard error) så ger de ingen information om det är en signifikant skillnad mellan måtten. Dessa visar spridningen i resp. mätning. Det t-testet tittar på är differensen, och därför är det spridningen i differenserna som är det viktiga. Om alla har olika värden vid vardagsmotion, startar vid olika värden så finns det en viss variation före respektive efter. Ökar alla sedan exakt lika mycket, t.ex.1 så är förändringen konstant vilket ger noll variation mellan individerna, standardavvikelsen=0, oberoende av variationen före. Eftersom det är två mätningar på samma individ kan man titta på hur överensstämmelsen är mellan mätningarna, korrelation. Detta visas i andra tabellen Om det t.ex. finns en systematik i förändringarna mellan mättillfällena eller små förändringar i förhållande till storleken på värdena, lär korrelationen/sambandet vara högt. Är det mer slumpmässiga skillnader lär den vara låg, nära 0. Det som testas är om korrelationen =0, dvs om inget samband finns. Den tredje tabellen visar testet, medelvärde, standardavvikelse, Standard Error (osäkerheten i medelvärdet). Därefter kommer ett 95% konfidensintervall. Den säger att skillnaden i medelvärde i den tänkta populationen ligger med 95% säkerhet mellan 57,98 och 133,07, dvs medelvärdet är större än 0. Det skulle då tala för att en skillnad i medeldifferens. Därefter kommer själva resultatet från testet. Ju större (+ eller -) testvärdet (t) är, desto troligare är det att det finns skillnad i medelvärde mellan mättillfällena. P-värdet är <0,05 vilket skulle innebära att den skillnad man ser i medelvärde (95,52) inte har uppkommit av slumpen. Det finns då en statistisk signifikant skillnad mellan mättillfällena på 5% signifikansnivå. Df är här n-1 där n= stickprovsstorleken. Här hade vi 178 (då det saknades värden på 22 av 200 personer, för vardagligt och/eller fysisk motion) värden i stickprovet. Df blir då 178-1 då ett medelvärde är skattat och använt i standardavvikelsen. 63

10. Diagram Det finns lite olika grafer/diagram man kan göra i SPSS. I grunden finns tre sätt att göra diagrammen, via menyer i Analyze, te.x. Frequencies och Explore, via Graphs Legacy Dialogs (se fig 1 nedan) och en mer interaktiv Graphs Chart Builder (se fig 2). I kompendiet visas hur man gör 1) Histogram, 2) Stapeldiagram 3) Error Bars 4) scatterplot via det första alternativet, sedan 5) interaktiva sättet lite mer översiktligt. Man kan säga att histogram och stapeldiagram är liknande diagram, men för olika typer av variabler. Stapeldiagram är lämpligt för kategorivariabler och histogram är lämpligt för kontinuerliga variabler. Vill du korrigera ett diagram, dubbelklicka på diagrammet i outputfilen. Några exempel på vad du kan göra kan ses i efterföljande exempel, 10.2)-10.5). 64

10.1 Histogram med normalfördelning. Histogram är lämpligt för kontinuerliga variabler, för att kolla av materialet. Ta med normalfördelningskurva för att avgöra om de är approximativt normalfördelade. 1) Klicka på Graphs Legacy Dialogs Histograms 2) Klicka på DST och lägg den under Variable. Vill man t.ex. göra histogram för SBT också så måste man först göra histogrammet för DST eftersom man kan bara kan lägga in en variabel i taget. a. Om man t.ex. vill visa DST separat för Man respektive Kvinna, lägg in Kön under Rows eller Columns. Endast kategorivariabler är lämpliga här. 3) Klicka i rutan för Display normal curve och sedan OK 4) I Output -fönstret finns nu histogram för variabeln DST. 5) Vill man göra fler histogram, upprepa steg 1-3. 65

Tolkning: En kontroll av normalfördelningsantagande görs inför valet om t-test kan användas eller ej. T-test bygger på att data kommer från en normalfördelning. Gäller inte detta finns icke-parametriska alternativ. Där används oftast median istället för medelvärde. DST verkar följa en approximativt normalfördelade i detta exempel, då stolparna följer normalfördelningskurvan rätt bra. Oftast behöver man ha minst en 30 försökspersoner innan man kan bedöma om variabeln är normalfördelad via histogram + att med ett större antal personer brukar t-test funkar även för data som inte helt är normalfördelade. Därför finns det procedurer som testar om data är normalfördelat eller ej, så man lättare kan bedöma normalfördelningsantagandet. Det kan göras under alternativet Plots i menyn Analyze Explore (se 8.4.2). Väljer man att testa icke-parametriskt väljer man motsvarande test under Analyze Nonparametric Tests. 66

10.2 Stapeldiagram Graphs Legacy Dialogs Bar Har man kategorivariabler är stapeldiagram lämpligt. Dock finns det även alternativ för att göra diagram för kontinuerligt data i denna meny. 1) Gå till Graphs Legacy Dialogs Bar 2) Vill göra ett diagram på Rökning uppdelat på Kön så välj alternativ a) ii) nedan. Man kan också göra detta diagram via Korstabell, se 8.2) Det flera andra alternativ a) Summaries of groups of cases väljs när man vill göra diagram på kategorivariabler. Även kontinuerliga variabler kan användas. Då visas inte antal eller andelar, utan t.ex. medelvärde. i) Simple ger stapeldiagram rakt av på en variabel, tex. Civilstånd. Det är en motsvarighet till histogram, med den skillnaden att här bestämmer variabelns kategorier vilka och hur många staplar som visas i diagrammet, medan histogram förutsätter att variabelns värden kan delas in i kontinuerliga intervall. Som en frekvenstabell i bildformat ii) Clustered kan t.ex. visa Civilstånd uppdelat på Kön, så att tex. andel gifta visas för Man resp Kvinna, antingen andel gifta bland män resp kvinnor eller andel män som är ogifta. Är t.ex. 2 av 10 gifta bland både män och kvinnor (och lika många män som kvinnor), är det 50% män bland ogifta men 20% ogifta bland män. Det senare är normalt mest rimligt. Som en korstabell i bildformat. iii) Stacked visar samma sak som ii) men istället för att staplarna står bredvid varandra ligger de ovanpå varandra. Som en korstabell i bildformat. b) Summaries of Separate variables är det mer tänkt för att beskriva kontinuerligt data i staplar. Här måste man lägga in minst två variabler. Man kan te.x. välja att visa medelvärdet, maxvärdet, median, andelen värden över 50 ovs. Principen är i övrigt densamma som i 2a). Skillnaden är att man kan lägga in flera variabler samtidigt. i)-iii) fungerar på samma sätt, men där iii) är svårt att använda korrekt. Här kan man också lägga till konfidensintervall. 67

c) Values of individual cases redovisar värden på individer, inte grupper av individer värde som i a) och b). Ett användningsområde för denna är när man t.ex. redan har summerade värden i data, tex. om data består av en variabel Civilstånd men där värdena i data står för antalet eller andelen personer som är gift, ogift,.. och inte individens värde. Det finns då bara fem värden. Då visar diagrammet värdena rakt av. Har man använt Excel och skall göra diagram så fungerar det på liknande sätt, dvs att man utgår från summerade data för att göra diagrammet. 3) Om vi återgår till vårt exempel är det Civilstånd uppdelat på Kön som man vill göra. Vi väljer alternativ a) och ii) 4) Om man vill utgå från Kön och se hur andelen gifta/ogifta/ är bland Män resp Kvinnor skall Civilstånd läggas under Category axis och Kön på Define Clusters by. Välj också % of cases. Tryck Ok a) Under Options kan man lägga till Error bars med t.ex. konfidensintervall, men då skall man förstås ha en kontinuerlig variabel där medelvärde är valt under Bars represent. 68

I diagrammet ovan summeras andelen manliga ogifta, manliga gifta, ovs till 100%, så den visar skillnaden i andel gifta,.. mellan könen. Observera att om man i detta data hade få personer, så bör bara försiktig med att bara visa andelar i sådana fall, en skillnad på en person då betyder mer än 1%. Då kanske man skulle ha valt antal istället. Du ser också i bilden att vissa namn på kategorier saknas. Det får vi rätta till. 5) Dubbelklicka på diagrammet. Ett fönster med diagrammet öppnas, Chart Editor, som visar olika menyer, File, Edit, 6) Vi vill ändra på visningen av kategorierna, så dubbelklicka på kategorierna på x-axeln 7) Ett fönster med Propertions öppnas, där fem flikar visas. Välj Labels & Ticks och välj Staggered under Label orientation som visas i bilden. Tryck Apply, så kommer diagrammet att se ut som i vänster bild. a) Generellt gäller, klicka på den del du vill ändra så bör du komma till rätt properties. 8) Om du är nöjd, klicka för att stänga Chart Editor så visas bara bilden i outputfönstret. 69

10.3 Error bars med konfidensintervall. Analyze Legacy Dialogs Error Bar När man använder medelvärde och t-test t.ex. för att jämföra två grupper är ett sätt att illustrera skillnaden med Error Bar, Den visar en linje med medelvärde i mitten + linjer som visar vald spridning kring medelvärdet, t.ex. konfidensintervall eller +- en standardavvikelse Säg att vi vill göra ett diagram för konfidensintervall för SBT (Systoliskt blodtryck) uppdelat på Kön. 1. Gå till Graphs Legacy Dialogs Error Bar 2. I grunden så bygger den på att visa en graf på två eller fler grupper. Här ges några alternativ a. Summaries for groups of cases: Denna innebär att själva mätvariabel finns i en variabel och en annan variabel bestämmer vilka grupper som jämförs, t.ex. SBT och Kön b. Summaries of separate variables Denna innebär att det finns en variabel för varje mätvariabel, te.x. DBP och SBT. Här skall variabler ha samma enhet, t.ex. inte lämpligt att visa välja DSP och Vikt i samma diagram. c. Skillnaden mellan Simple och Clustered är att det senare har en tredje variabel, dvs andra kategorivariabel, t.ex. SBT och Kön + Åldersgrupp vilket för varje Kön visas Error-bars för varje kategori av Åldersgrupp. 3. I exemplet har vi SBT på en variabel och uppdelningen i Kön anges i en annan variabel. Det ger valet Simple och..groups of cases. Klicka sen Define 70

4. Under Variable väljer vi den variabel som skall mätas, i detta fall SBT, och under Category Axis den variabel som bestämmer för vilka grupper diagrammet skall visas. Vi väljer Kön. 4.1. Om du hade valt Summaries of separate variables så hade det bara funnits ett fält för variabler, som motsvarat fälten Variable och Categorical Axis ovan. 4.2. Om Clustered hade valt, så hade ytterligare ett fält funnits, efter Categorical Axis. 5. Under Bar represent (se pil) kan man välja 1) Confidensintervall for mean, 2) Standard Error of Mean (2 på Multiplier innebär = Confidence Interval for Mean ) och 3) Standard deviation. I 2) och 3) kan du välja t.ex. hur många standardavvikelser från medelvärdet som skall visas. 6. Här kan man också lägga in t.ex. Åldersgrupp som variabel, under Panel By, Rows eller Column. Man får då flera figurer i en, en för varje kategori av Åldersgrupp. Var och en av figurerna visa medelvärde mm för SBP för resp. Kön. Ju fler kategorier i den variabel man lägger in i t.ex. Rows desto mindre blir varje figur. (se figur nedan) 7. Låt defaultvärdet på Bars Represent stå kvar, som bilden ovan. Tryck Ok. 71

8. I ovanstående bild är Åldersgrupp inlagt på Rows. En frekvenstabell på Åldersgrupp visar att det bara är 3 personer i Åldersgruppen Övrigt. Den gruppen är också svår att jämföra med de andra då vi inte vet vilka åldrar det är. Därför kan det vara lämpligt att plocka bort den kategorin från diagrammet. 9. För att korrigera, 1) Dubbelklicka först på diagrammet i outputfilen, så visas Chart Editor (se pil i vänster bild). 2) Dubbelklicka på texten för kategorierna för Åldersgrupp. Då visas Properties för kategori-axeln. 3) Välj fliken Categories. Markera kategorin Övrigt och klicka på det röda krysset ( se pil i höger bild) så flyttas kategorin över till fältet Excluded. 4) Tryck på Apply. Diagrammet kommer nu endast att visa kategorierna för 40, 50 och 60. 10. Stäng sedan fönstret för Chart editor, så visas diagrammet bara i outputfilen. Tolkning av diagram: Första bilden ovan (på föregående sida) visar alternativet med Konfidensintervall på SBT för variabeln Kön. I den andra har man också delat upp det på Åldersgrupp. Här anges konfidensintervallets av linjen med en ring för medelvärdet. En sådan bild kan ge en hint, om man vill jämföra grupperna, om det är någons skillnad i medelvärde mellan grupperna. Om konfidensintervallen för de båda grupperna ej överlappar så bör t-testet för skillnaden visa på signifikant skillnad. Motsatsen gäller dock inte, dvs om linjerna överlappar i bilden ovan kan det fortfarande finnas signifikant skillnad. Går inte in mer på detta här. 72

10.4 Boxplot Graphs Legacy Dialogs Boxplot Ett sätt att beskriva spridningen i data är boxplot. Den visar spridning utifrån median och kvartiler. 1) Klicka på Graphs Legacy Dialogs Boxplot 2) Vad ovanstående alternativ betyder kan läsa t.ex. under kapitel 10.3) Error Bars. Simple här betyder en kontinuerlig variabel och en kategorivariabel. Här väljer vi att titta på variabeln BMI uppdelat på Åldersgrupp, dvs alternativet Simple och groups of cases. 3) Välj BMI på Variable och Åldersgrupp på Category Axis. Som övning lägger jag också in Civilstånd på Label cases. a. Observera att Label cases inte är obligatorisk. Det är ett tillval. 4) Tryck OK 73

Utskrift från SPSS: Tolkning Boxplotten visar fördelningen på BMI mellan Åldersklass. Den sista, Övrigt ålder har bara tre individer. Den kan man ta bort från diagrammet. Se 10.3, punkt 8)-10) Boxen anger de 50% mittersta värdena. För 40 år är det 75% av individerna som är lägre än ca 29 och 25% som är lägre än ca 24 (se heldragna pilar) och ca 50% ligger då mellan 24 och 29 i BMI. Dessa två värden anger den s.k. övre respektive undre kvartilen, också kallad Q1 och Q3. Skillnaden mellan dem brukar anges med Kvartilavstånd. Linjerna (Whiskers) utanför boxen skall sedan ange max och min, så länge det är normal spridning (se streckade linjer). Om det finns några värden som ligger ovanligt långt ifrån de övriga anges de speciellt, som ring (Outliers) eller kryss (Extreme values). Bedömningen på om de är ovanligt höga eller låga utgår från storleken på boxen. Normalt räknar man att whiskers är maximalt 1,5 ggr boxens bredd. Outliers är då värden mellan 1,5-3 ggr bredden och extremvärden 3 ggr boxens bredd. Om ett värde är outliers beror också på värdet på medianen. Ett BMI i två grupper kan klassas olika (normal i en och outlier i en andra) beroende på hur stort kvartilavstånd det är (boxens höjd) och hur stor medianen är. Värden för outliers och extremvärden anges här av vilken kategori av Civilstånd de har, Om du hade lämnat fältet för Label cases by tomt så hade det istället visat radnumret på individen i datafilen. Observera då att radnumret inte är unikt i data. Sorterar jag data efter BMI så kommer t.ex. rad vara en annan person. Tolkningen av ovanstående bild är att medianen och spridningen är i princip lika mellan grupperna. Observera att det finns olika typer av boxplottar, varför man får läsa sig till om hur t.ex. en boxplot i en artikel är definierad. Detta är den SPSS och flera andra visar. 74

10.5 Scatterplot (spridningsdiagram). Graphs Legacy Dialogs ScatterPlot Korrelation är ett mått på hur två variabler samvarierar. Det anges av t.ex. Pearsons korrelationskoefficient. Den anger om det finns ett linjärt samband mellan två variabler. Den kan räknas ut via t.ex. Bivariate under menyn Analyze Correlate Bivariate. För att få en uppfattning om det finns ett samband kan man göra ett diagram. Där kan man också se om tolkningen av korrelationskoefficienten sammanfaller med diagrammet. Ibland kan det finnas några värden som påverkar sambanden mycket mer jämfört med de andra värdena, så att korrelationskoefficienten blir missvisande. Så kontrollera först med ett diagram. Man kan t.ex. kontrollera med att ta bort ett eller två värden, antingen manuellt eller bara i tanken. Kvarstår samband, eller förändras det relativt mycket? Om det senare inträffar är kanske sambandet inte så stabilt och måttet inte så trovärdigt. I data skulle man kunna studera sambandet mellan DST och SBD, Vardagsaktivitet och Fysisk aktivitet, Längd mot Vikt. Jag väljer här DST mot SBD. 1) Klicka på Graphs Legacy Dialogs Scatter/Dot 2) Välj Simple, och tryck Define 75

3) Lägg in SBT under Y Axis, DST under X axis och Kön under Set markers by. Tryck Ok. a. Då man lägger in variabler för en Scatterplot bör man under Y axis lägga den variabel som är den beroende och under X axis den som är oberoende. Den oberoende påverkar den beroende, eller den oberoende förklarar den beroende. Man kan också t.ex. lägga in Kön på Set markers by så visas vardera kön med olika färger. Det sista är ett tillval. 4) Om man vill se om det finns ett linjärt samband kan man dra en linje genom materialet, en regressionslinje. Dubbelklicka då på figuren ovan i SPSS. Ett nytt fönster öppnas med figuren, en Chart editor. Detta fungerar på samma sätt i andra diagram. 5) Högerklicka sen i editorn, och välj Add Fit Line at Subgroups (eller Total), som i bilden ovan. Man kan också gå via menyn, Elements Fit line at subgroups. Se nedan. 76

6) Eftersom båda variablerna här använde samma enhet skulle man kunna ändra så att skalan är densamma för de båda. Då blir diagrammet lättare att läsa. Så dubbelklicka på värdena på y-axeln, Scale. Den visar min 80 max 180. Stäng inte fönstret utan klicka på värden på x-axeln, som visar 50-120. Ändra nu så att båda visar 50-180. Ändra på y-axeln, tryck på Apply innan du växlar till andra axeln. Den visar då hur det linjära sambandet skulle se ut. Överst till höger i figuren visas R 2 Linear =0,61 och 0,41. Det kallas förklaringsgrad. Det finns en variation i både DST och SBT. Förklaringsgraden kan tolkas som att av variationen i variabeln SBT så kan 62 respektive 41% förklaras av variationen i DST. Korrelationen för sambandet = R, dvs roten ur R 2, dvs 0,78 och 0,64. Figuren visar om det verkar finns ngt linjärt samband. Figuren visar också i genomsnitt hur stor skillnad det är mellan DST och SBT (vid 90 i DST är SBT ca 130, så ca 40 enheter). Detta tack vare att jag ändrade så att båda axlarna visar samma skala. Ekvationen för respektive Kön visar också bl.a. hur mycket SBT förändras av varje steg på DST. För Man, den övre formeln och linjen som startar i 90, så ökar SBT med en enhet då DST ökar med en enhet, dvs SBT förändras i ungefär samma storleksordning som DST. Det innebär också att oberoende vilket värde det är på DST så är det lika stor skillnad på DST och SBT, i genomsnitt. Motsvarigheten hos Kvinna är 1,22, dvs SBT ökar med 1,22 enheter när DST ökar med en enhet. Det innebär att ju större DST är desto större är skillnaden mellan DST och SBT för Kvinnor. 77

Under Analyze kan man också räkna ut korrelationen, via Analyze Correlate Bivariate Correlation. Vill du dela upp det i Kön kan du använda Data Split file (se höger bild), innan du räknar ut korrelationen. (se 7.3) Resultatet blir Correlations Kön DST SBT Kvinna DST Pearson Correlation 1,783 ** Sig. (2-tailed),000 N 107 107 SBT Pearson Correlation,783 ** 1 Sig. (2-tailed),000 N 107 107 Man DST Pearson Correlation 1,637 ** Sig. (2-tailed),000 N 92 92 SBT Pearson Correlation,637 ** 1 Sig. (2-tailed),000 N 92 92 **. Correlation is significant at the 0.01 level (2-tailed). Korrelationskoefficienten är 0,78 och 0,64, som redan nämnts ovan. Den är relativt hög. En korrelation på 0 innebär inget samband, 1 innebär fullständigt positivt samband (vet vi värden på den ena variabeln vet också värden på den andra variabeln). Korrelationen ligger mellan -1 och 1. Att korrelationen är högre på Kvinna betyder att kvinnornas värden är mer samlade kring linjen än motsvarande för männen. Korrelationen har inget med hur stor lutningen är. Nästa värde som anges är p-värdet. Det som testas är om korrelationen = 0, det behövs inte mycket för att det skall blir signifikant. Här är p-värdet =0,000 <0,05, dvs signifikant. Egentligen är inte p-värdet 0. Dubbelklickar man på tabellen i SPSS och sen på p-värdet ser vi att de är 0,0000..24, många nollor. Det man brukar skriva då är p<0,001. Det finns tydligen ett signifikant linjärt samband mellan DST och SBT för båda könen. 78

10.6 Andra menyer för diagram, bl.a. att skapa diagram interaktivt Graphs Chart Builder Det finns fler menyer för diagram. En är Graphs Graphboard Template Choser där t.ex. Bubbleplot och diagram på karta finns tillgänglig. Se Graphboard Template Choser Detailed för översikt. För att göra diagram på karta behövs en karta i rätt format. Se t.ex. Utilities Mapp conversion utility. Inget mer tas upp för dessa. Nedan visar hur man använder menyn Graphs Chart builder från vilken man kan göra en massa olika diagram interaktivt. Första två sidorna visar generellt om meny. Sen visas ett exempel på hur man gör ett stapeldiagram för Kön. Allmänt 1) När man öppnar menyn så kommer först nedanstående fråga. Den kommer alltid, så länge man inte kryssar för att den inte skall visas igen. a. Graph Builder bygger på att variablerna har definierade skalnivåer och är korrekta. (Se Variable View och Measure. Se 3.1). På så sätt känner den av att för t.ex. en nominal variabel, Kön, är det lämpligt att visa andelar, men inte medelvärde. b. Om man temporärt vill ändra skalnivån på en variabel kan man göra det i menyn. Se nästa sida. Om skalnivåerna är definierade på alla variabler 2) Tryck Ok ovan => Kommer du direkt till menyn för grafer Om skalnivåerna ej är definierade på alla variabler 2) Du måste då definiera skalnivån innan du kan fortsätta. a. Antingen väljer du att trycka på define Define Variable Properties så kommer du in i menyn Define Variable Properties (Finns under Data ). Där du får liknande inställningar som vi Variable View, fast i menyform. b. Eller väljer du att trycka Ok kommer du till nedanstående meny för att ändra skalnivåerna. i. Väljer du Scan data så ställer SPSS själv in lämplig skalnivå och går direkt till Grafmenyn. ii. Väljer du Assign Manually kommer du till en meny där du får välja skalnivå för de variabler som saknar värde på skalnivå. Därefter måste du gå till Graphs Chart builder igen, 79

3) Nedan visas den vy som kommer upp när Graph Builder äntligen öppnas. Klickar du på en kategorivariabel, t.ex. Kön, så visas vilka kategorier som ingår (se övre pil). Det funkar inte om variabeln är textvariabel. Du kan också ändra på skalnivån på en variabel, temporärt, genom att högerklicka på variabeln (se höger bild). OBS: Det ändrar inte inställningen på skalnivån under Variable View I Chart Builder bestämmer man först hur skelettet ser ut, därefter bygger man på skelettet med variabler. I vänstermenyn finns de klasser av diagram man kan göra, och i fönstret bredvid finns olika varianter av denna. Man kan här göra alla möjliga rimliga och orimliga diagram, tolkningsbara, icke tolkningsbara, så man måste fundera vad man vill visa, och vilka variabler som är lämpliga använda var. OBS Här är det en fördel att du lagt in etiketter på kategorivariabler. För att välja typ av diagram så klickar du på menyn till vänster, väljer ett diagram och drar den till det vita fältet. I ovanstående har vanligt enkelt stapeldiagram valts. Se pil. Ett vanligt stapeldiagram av en variabel har en x-axel som visar vilka kategorier som en variabel har, en y-axeln som visar antalet/andel som hamnar i varje kategori och en stapel för varje kategori som visar antalet/andelen i den kategori. Det är en form av skelett av ett stapeldiagram. 80

Längst till höger visas Element properties. Under Statistics kan man välja olika mått. Här har SPSS föreslagit Count utifrån att variabelns skalnivå är nominal. Vill du ändra något så måste du alltid trycka Apply för att ändringen skall slå igenom. Du kommer också se förändringen på diagrammet i fönstret. Dock är inte stapelhöjden o.d. i diagrammet en bild av hur staplarna kommer att se ut i färdig form. Exempel: Antag nu att skalnivåer är definierade för alla variabler, och att du skall göra ett stapeldiagram för Kön. 1) Gå till Graphs Chart builder, klicka Ok. 2) Klicka på alternativet Bar i vänstermenyn 3) Klicka och dra på den första varianten av stapeldiagram (där pilen visar ovan). Dra den till det tomma fältet ovan. Resultatet ses nedan (visar bara den övre delen av menyn) 4) Den visar nu skelettet för diagrammet och frågar nu efter variabler. Det normala är att stapeldiagram bara en variabel och den läggs på x-axeln. Testa med annat om man vill! 5) Välj variabeln Kön och dra den till x-axeln. Nu visas en överblick på hur diagrammet kan se ut (se nästa sida). Höjden på staplarna i överblicken är har inget att göra med hur fördelning ser ut på variabeln. Klicka också på knappen Elemental Properties, om den inte visas. Där visar den bl.a. vad SPSS tycker passa bra som mått, Count. Den kan man klicka på och ändra, t.ex. till procent. Vill du ändra, välj t.ex. Percentage och tryck Apply, 81

6) Tryck OK. Här räcker det för att vi kan göra klart diagrammet. I andra fall kräver SPSS fler variabler som måste läggas till för att diagrammet skall kunna skapas. Det ser man på att man ej kan trycka på OK-knappen. När man valt ett stapeldiagram visas också ett fönster uppe till höger. Om det försvinner eller ej kommer upp klickar man bara på Element properties. (se pilar, första bilden på föregående sida). Väljer man Percent får man sen välja procent av vad, t.ex. av totalen (Grand Total) eller av respektive kategori (om man t.ex. har valt stapeldiagram med cluster) Vilka inställningsmöjligheter som kommer upp beror dels på vilket diagram du har valt, men också vilket typ av variabel du har valt. En kontinuerlig variabel och en kategorisk har olika egenskaper och därför olika valmöjligheter. 82