Introduktion till SPSS



Relevanta dokument
Mata in data i Excel och bearbeta i SPSS

Idiotens guide till. Håkan Lyckeborgs SPSS-föreläsning 4/ Av: Markus Ederwall, 21488

Intro till SPSS Kimmo Sorjonen (0811)

Richard Öhrvall, 1

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Histogram, pivottabeller och tabell med beskrivande statistik i Excel

Marknadsinformationsmetodik Inlämningsuppgift

Kort manual till SPSS 10.0 för Mac/PC

Datainmatning TÄNKTA BETECKNINGAR. Variabelnamn/kolumnbeteckning, Dummyvärden, som matas in beroende på aktuellt svarsalternativ

Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet. SPSS (PASW) 18 for Windows - a guided tour

Uppgift 1. Produktmomentkorrelationskoefficienten

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel vers. 2010

Datorövning 1 Statistik med Excel (Office 2010, svenska)

Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet Per-Erik Isberg. SPSS for Windows 12 - a guided tour

SPSS En guidad tur. Vad ska jag göra idag? Följ instruktioner som följer, om du behöver hjälp det är bara att fråga en lärare!

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel

2.1 Minitab-introduktion

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Marknadsinformationsmetodik Inlämningsuppgift

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

InStat Exempel 4 Korrelation och Regression

Datorövning 1 Enkel linjär regressionsanalys

Introduktion till PAST

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

En introduktion till och första övning for Excel

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

2 Dataanalys och beskrivande statistik

En kort instruktion för arbete i SPSS

Tillämpad statistik att samla och sammanfatta data Laboration 1: Deskriptiv statistik

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Lösningar till SPSS-övning: Analytisk statistik

Medicinsk statistik II

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Analytisk statistik. Tony Pansell, optiker Universitetslektor

OBS! Vi har nya rutiner.

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

Data Editor, datainmatning och dataredigering

Grunderna i SPSS Martin Gellerstedt 0. INTRODUKTION KOM IGÅNG MED INMATNING, KODNING OCH DATATRIXANDE... 3

*****************************************************************************

Laborationer i statistik för A:1, Lab 1

OBS! Vi har nya rutiner.

Introduktion till PSPP

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Statistik och epidemiologi T5

Universitetskanslersämbetets Högskoleutforskare. En introduktion till analysvyn exemplet måluppfyllelse

DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET. BESKRIVANDE STATISTIK. SANNOLIKHETSLÄRA.

Introduktion till. Minitab version 14

Liten handledning i Excel och StarOffice Calc i anslutning till Datorövning 1

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Laboration 3: Urval och skattningar

IT-system. BUP Användarmanual

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

Handledning för konstruktion av tabeller och diagram med Excel

Manual till ADADnet s statistikmodul

Attila Szabo Niclas Larson Gunilla Viklund Mikael Marklund Daniel Dufåker. GeoGebraexempel

Arbeta med normalfördelningar

Hämtning av sekundärdata och introduktion till Excel

Gamla tentor (forts) ( x. x ) ) 2 x1

Obligatorisk uppgift, del 1

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Datoro vning 1-2 Statistisk analys av kodade svar

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg/Jep Agrell. Laboration 2. Statistiska test

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

Laboration 3: Urval och skattningar

Föreläsning G60 Statistiska metoder

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Sänkningen av parasitnivåerna i blodet

Datorövning 2 Statistik med Excel (Office 2003, engelska)

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Laboration Fuzzy Logic

Paneler - VCPXX.2. Programmeringsmanual för VCP-paneler. Revision 2

Inledning till OpenOffice Calculator Datorlära 2 FK2005

Grunderna i SPSS Martin Gellerstedt 0. INTRODUKTION KOM IGÅNG MED INMATNING, KODNING OCH DATATRIXANDE... 3

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Medelvärde, median och standardavvikelse

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Datorövning 1 Introduktion till Minitab och Excel

Statistiska samband: regression och korrelation

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Värdena för en diskret variabel (med få värden) kan redovisas i en tabell över frekvensfördelningen, dvs antalet observationer för de olika värdena.

Grundläggande statistik kurs 1

Guide till att använda Audacity för uttalsövningar

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

FACIT (korrekta svar i röd fetstil)

Transkript:

Introduktion till SPSS..

Innehåll 1 Introduktion till SPSS 1 1.1 Data Editor 1 1.2 Viewer 1 2 Variabler och Mätskalor 2 2.1 Kvantitativa variabler (Numeriska variabler) 2 2.2 Kategoriska variabler (Kvalitativa variabler) 2 3 Importera data 3 3.1 Inmatning av data direkt i SPSS 3 3.2 Typer av variabler i SPSS 3 3.3 Value Labels 4 3.4 Importera data via Excel 5 4 Beskrivning av data 6 4.1 Tabeller 6 4.1.1 Frekvenstabell 6 4.1.2 Deskriptiv statistik, medelvärde, standardavvikelse 6 4.1.3 Deskriptiv statistik i flera grupper 7 4.1.4 Korstabeller 7 4.2 Histogram & Plottar 8 4.2.1 Boxplot 8 4.2.2 Histogram 9 4.2.3 Scatter plot 10 4.3 Exportera figurer & tabeller från SPSS till Word & Power Point 11 5 Analys 12 5.1 T-test för ett stickprov 12 5.2 T-test för 2 oberoende stickprov 13 5.3 T-test för Parade mätningar 14 5.4 -test (ChiTvå test) 15 5.5 Korrelation 16 5.6 Linjär regression Fel! Bokmärket är inte definierat. 6 Labbuppgifter 18

1 INTRODUKTION TILL SPSS Beskrivningar av typen Analyze->Descriptive Statistics->Frequencies kommer vi upprepade tillfällen att användas. Det som menas är att ni först trycker på (1) Analyze i menyn, sedan (2) Descriptive Statistics och slutligen (3) Frequencies, vilket illustreras i bilden nedan. 1. 1.1 DATA EDITOR Detta är huvudfönstret I SPSS som kommer upp när man startar programmet. I Windows aktivitetsfält har detta fönster en röd ikon. Här kan man se och hantera sina data. Man kan skapa nya variabler eller ändra inställningar för befintliga. Längst ner i vänstra hörnet av fönstret finns två flikar, Data View och Variable View. I Data View kan man se och ändra på värdet för sina observationer, d.v.s. de uppmätta värden man har matat in. När man skall mata in data skall man stå under denna flik. Innan man börjar med detta ska man dock mata in vilka variabler man ska ha, detta gör man under Variable View. I bilden nedan har två variabler matats in, namn och längd. 1.2 VIEWER I detta fönster kommer alla resultat från att presenteras. I Windows aktivitetsfält har det en blå ikon. Du behöver inte stänga detta fönster efter varje nytt resultat, lämna det istället öppet. Ny resultat kommer alltid längst ner. En stor skillnad mot t.ex. Excel är att inget i detta fönster kommer uppdateras om du ändrar i din datafil. Om du t.ex. gör ett diagram för längd och sedan går in och matar in 100 nya värden kommer diagrammet i Viewer fortfarande vara detsamma. Om du vill ha med dina nya siffror måste du göra ett nytt diagram. 1

2 VARIABLER OCH MÄTSKALOR 2.1 KVANTITATIVA VARIABLER (NUMERISKA VARIABLER) I SPSS betecknas kvantitativa variabler med scale. Kvantitativa variabler mäts i siffror och har två viktiga egenskaper; numren har en ordning ( 1< 2<3 o.s.v) och skalstegen är lika stora (det är t.ex. lika stor skillnad mellan 1 och 2 som mellan 5 och 6). Kvantitativa variabler kan antingen vara diskreta eller kontinuerliga. En kontinuerlig variabel kan anta alla värden, t.ex. decimal tal, medan en diskret variabel bara kan anta vissa värden, t.ex. heltal. Mått så som längd och vikt är kontinuerliga variabler medan sådant som mäts i antal, t.ex. barn, äpplen och benbrott, är exempel på diskreta variabler. 2.2 KATEGORISKA VARIABLER (KVALITATIVA VARIABLER) En kategorisk variable beskriver en egenskap (kvalité) och behöver inte ha ett numeriskt värde. De kan vara ögonfärg, blodgrupp, upplevd stressnivå eller nationalitet. Till skillnad från kvantitativa variabler så behöver inte kategoriska ha ett numeriskt värde och det finns inget bestämt skalsteg mellan kategorierna. Kategorier i ordinalskala (i SPSS ordinal) har en inbördes rangordning men har till skillnad från diskreta variabler inget mätbart avstånd mellan kategorierna. Man kan t.ex. säga att en kategori är bättre än en annan men inte hur mycket bättre. Ett exempel är skolbetyg. Det har en ordning (IG<G<VG<MVG), men kan man säga att det är lika stor skillnad på ett IG och G som ett VG och MVG? Ibland låter man ett numeriskt värde beteckna en viss kategori, det är t.ex. möjligt att byta ut betygen ovan till 1-4. Tänk dock på att detta inte innebär att det är lämpligt att behandla variabeln som kvantitativ, då skalstegen inte har någon egentlig numerisk betydelse förutom ordning i det här fallet. Vi hade lika gärna kunnat kalla IG för 1, G för 5, VG för 15 och MVG för 25. Kvantitativa variabler kan lätt omvandlas till ordinaldata genom att man delar in det i interval. Ett exempel är avstånd till arbetet som kan mätas som en kontinuerlig variabel i km, men kan även mätas i ordinalskala med kategorierna 1:0-10km, 2: 11-20km och 3: >20km. Kategorier utan rangordning är i nominalskala (i SPSS nominal). Ett exempel på det är färger och blodgrupp. Man kan inte generellt säga att t.ex. röd är bättre än gul eller att blodgrupp A är bättre än B. 2

3 IMPORTERA DATA 3.1 INMATNING AV DATA DIREKT I SPSS Öppna SPSS. Markera Type in data och tryck på OK. Börja med att ange vilka variabler du skall mata in genom att byta till fliken Variable View. I tabellen som visas betecknar varje rad en variabel. Börja med att skriva in ett variabelnamn på första raden i kolumnen Name. Tänk på att hålla namnen korta, inte använda mellanslag och undvik å,ä och ö. I kolumnen Label skriver du in en etikett till din variabel så att du (och andra) förstår vad den betyder. För enkätsvar kan det t.ex. vara lämpligt att skriva in enkätfrågan. Välj sedan lämplig mätskala för dina variabler, se avsnitt 2. För kategoriska variabler, t.ex. ja/nej-frågor är det bra att skapa Value Labels, se nästa avsnitt. För att mata in dina värden, välj Data View längst ner till vänster. Du kommer nu se att variablerna du matade in i steget innan ligger som kolumner i tabellen. Ställ dig på översta raden under första kolumnen och fyll i värdet. Tryck Enter på tangentbordet för att hoppa till nästa rad. Observera att du bara kan mata in siffror, för att mata in text eller datum se nästa avsnitt. 3.2 TYPER AV VARIABLER I SPSS Beroende på vilken typ av data man har kan det vara lämpligt att ändra typ på variabeln i SPSS. Det som väljs automatiskt är Numeric, vilket tillåter inmatning av numeriska variabler. Ibland vill man mata in en kort text eller ett datum, det är då nödvändigt att byta typ. För att mata in en variabel med text, välj Variable View längst ner till vänster. Mata in en ny variabel på samma sätt som har beskrivits ovan. För att ändra variabel till text, tryck i rutan bredvid variabelnamnet, under kolumnen Type. När du trycker i rutan kommer en knapp med tre små punkter upp i rutan. Tryck på denna. Välj String i dialogen som kommer upp. I rutan bredvid Characters anger du det maximala antalet tecken du kan ha i en observation. 3

3.3 VALUE LABELS Det är viktigt att definiera datum på rätt sätt i SPSS. För att ändra en variabel till datum gå tillväga på samma sätt som för att ändra till text, men välj Date i dialogrutan nedan. Du bör även välja vilket format du ska ha på dina datum. Det är även möjligt att ändra detta format senare, SPSS konvertera då automatiskt det du matat in till det nya formatet. Som du ser i listan finns det många format att välja mellan, det som är markerat är yyyy/mm/dd. Det betyder att de fyra första siffrorna är år, sedan månad och sist dag, alltså av typen 2003/02/15. Format med tre m, mmm, betyder att månaden skrivs som en engelsk trebokstavsförkortning (Jan, Feb, Mar, Apr, May, etc). Tre d, ddd, betyder att vilket att det är dag nummer x på året, t.ex. skulle 2012/12/31 bli 2012366 i formatet yyyyddd, då sista december är årets 366:e dag på ett skottår. Ofta när man matar in en kategorisk variabel låter man en siffra beteckna en kategori, t.ex. låter man kanske 1 betyda man och 2 betyda kvinna, eller 0 nej och 1 ja, etc. I vissa av SPSSprocedurerna krävs t.o.m. att man har matat in data på detta sätt. I resultaten vill man dock oftast hellre ha kategorin uttryckt som text, gör man t.ex. ett diagram vill man hellre att det står män och kvinnor än 1 och 2. I SPSS löser man detta genom att skapa value labels. Skapa value labels genom att gå in på Variable View-fliken. Tryck i rutan som är under kolumnen Values på samma rad som variabeln du vill skapa labels för. En liten knapp med tre punkter kommer nu upp i rutan. Tryck på denna. Dialogrutan nedan kommer nu upp. Om vi t.ex. vill översätta 1 till Män och 2 till Kvinnor, börjar vi med att fylla i 1 i rutan Value: och Män i Label. Tryck sedan på Add. Upprepa sedan proceduren med 2 och Kvinnor. Tyck Add igen. När alla etiketter är inmatade, tryck OK. 4

3.4 IMPORTERA DATA VIA EXCEL Att importera en Excel-fil till SPSS är enkelt. Tryck File->Open>Data. Under Files of Type välj Excel, som visas I bilden nedan. Bläddra fram filen, markera den och tryck Open. I rutan som kommer upp sedan väljer du vilket excelblad din data ligger i. Om du har variabelnamn på översta raden skall Read variable names from the first row of data vara markerat. För att en Excel-fil skall gå att läsa är det viktigt att den är strukturerad på rätt sätt. Översta raden bör innehålla namn på variablerna, alltså en kolumn per variabel. Sedan bör varje rad vara en observation, precis som i SPSS. Det är viktigt att inte ha några tomma rader eller kolumner, då detta ibland ställer till problem. En annan sak att tänka på är att i varje kolumn vara konsekvent med vilket format man använder. Om man matar in som text skall man göra det hela tiden, och är det siffror skall man använda siffror hela tiden i kolumnen. Om du har datum i din fil, se till att de är inställda på datumformat i Excel. 5

4 BESKRIVNING AV DATA 4.1 TABELLER 4.1.1 FREKVENSTABELL En frekvenstabell används för att för kategoriska variabler visa antal och andel som hör till en viss kategori. T.ex. kan man visa antal och andel män och kvinnor med en frekvenstabell. För att skapa en frekvenstabell tryck Analyze->Descriptive Statistics->Frequencies. Dialogrutan nedan visas. I rutan (1) finns en lista på variabler som finns tillgängliga i din datafil. För att analysera en variabel, markera den i (1), tryck på knappen (2). Variabeln hamnar nu i rutan (3), som är en lista över vilka variabler du vill analysera. Se till att (4) är ikryssad, annars blir det ingen frekvenstabell. 4.1.2 DESKRIPTIV STATISTIK, MEDELVÄRDE, STANDARDAVVIKELSE För att ta fram deskriptiv statistik för en variabel tryck Analyze->Descriptive Statistics->Descriptives. Följande dialogruta visas: På samma sätt som för frekvenstabeller är (1) en lista över tillgängliga variabler och (3) en lista vilka variabler som har markerats för analys. Markera en variabel i (1) och tryck knappen (2). Variabeln hamnar då i (3). Tryck OK när du valt alla variabler du vill analysera. 6

4.1.3 DESKRIPTIV STATISTIK I FLERA GRUPPER Ibland vill man ha en tabell med deskriptiv statistik indelat i grupper, t.ex. ålder för män och kvinnor separat. Detta gör man enkelt i SPSS genom att trycka Analyze-> Compare Means -> Means. Under Dependent List: placerar man de variabler man vill analysera, t.ex. ålder eller vikt. I Independent List: lägger man den variabeln som delar upp materialet i grupper, t.ex. kön. Man kan även dela in i grupper med flera variabler, för att göra detta lägger man in den första indelningsvariabeln under Independent List: och tyrcker sedan Next. Texten Layer 1 of 1 kommer nu ändras till Layer 2 of 2. Lägg nu in den andra indelningsvariabel under Independent List:. 4.1.4 KORSTABELLER För att skapa en korstabell tryck Analyze->Descriptive Statistics->Crosstabs. Under Row(s) lägger ni variabeln som ska vara rader i tabellen och under Column(s) variabel för kolumner. Om ni trycker på knappen Cells kan ni välja vad som skall visas i tabellen. Det som är valt från början är Observed under Counts. Det betyder att antalet i varje cell kommer visas i tabellen. Något som ofta också är intressant är den procentuella andelen, som kan väljas under Percentages. Det finns tre olika sätt att räkna ut andelen, Row betyder att man räknar ut andelen i varje cell genom att dela antalet i cellen med det totala antalet på raden. Om vi har åldersgrupp och kön som i exemplet nedan får vi alltså fram hur många procent i varje åldersgrupp som är män och kvinnor. Väljer man Columns delar man istället med det totala antalet i kolumnen, vilket i exemplet nedan ger den procentuella åldersfördelningen för män och kvinnor separat. Väljer man Total delar man med det totala antalet, alltså får man t.ex. fram vilken andel av totalen som är kvinnor i åldersgrupp 1. 7

4.2 HISTOGRAM & PLOTTAR 4.2.1 BOXPLOT En boxplot visar värdenas spridning. Kortsidorna på lådan markerar värdenas undre och övre kvartil. Den undre kvartilen (1a kvartilen) är den punkt där 25% av värdena ligger under (är mindre än) den punkten och den övre kvartilen (3e kvartilen) markerar var 75% av värdena ligger under den punkten. Avståndet mellan dessa kvartiler kallas för kvartilavstånd eller interquartile range (IQR). Vanligen markeras även medianen (2:a kvartilen). En vanlig variant (och standard i SPSS) är box-andwhiskers plot där två linjer som går ut från lådan markera de största värdena som inte är extremvärden (outliers). I SPSS beräknas denna gräns som 1.5 kvartilavstånd från övre eller nedre kvartilen. Extremvärdena markeras ofta ut med en egen symbol (i SPSS en cirkel). För att göra en boxplot i SPSS tryck Graphs->Legacy Dialogs->Boxplot. Välj Summaries of separate variables och tryck Define. I ruta (1) markerar du den variabel du vill använda och använder pilen (2) för över den till rutan Boxes Represented (3). Tryck OK. Du kan välja mer än en variabel och får då flera boxar i samma graf. 8

4.2.2 HISTOGRAM Ett histogram visar värdenas fördelning. Histogram används ofta för att bedöma om värdena tillhör en viss fördelning, t.ex. normalfördelningen. Då just normalfördelningen är ett så vanligt antagande så kan man i många program (t.ex. SPSS) välja att rita in en normalfördelningskurva. Normalfördelningskurvan visar hur värdena skulle ligga om de var perfekt normalfördelade. För att göra ett histogram i SPSS tryck Graphs->Legacy Dialogs->Histogram. I ruta (1) markerar du den variabel du vill använda och använder pilen (2) för över den till rutan Variable (3). Tryck OK. Om du vill ha en normalfördelningskurva kryssa i boxen Display normal curve (4) innan OK. Om du vill ha olika histogram för olika grupper lägg till grupperings variabeln under Rows. Du kan ändra så att Y-axeln mäts i procent istället för antal. För att göra detta dubbelklickar du på diagrammet i Outputfönstret. Ett nytt fönster som heter Chart Editor kommer nu upp. Dubbelklicka på Frequency, som ligger bredvid Y-axeln. Properties-rutan till vänster kommer nu upp. Välj fliken Variables. Under Percent klicka på nedåtpilen för att få fram rullgardinsmenyn. Välj sedan Y Axis. Klicka sedan Apply. 9

4.2.3 SCATTERPLOT I en scatterplot (kallas ibland punkt- eller spridningsdiagram på svenska) kan du se hur variabelvärden förhåller sig mot varandra. Man kan t.ex. se om det verkar finnas ett linjärt samband mellan variablerna. För att göra en scatter plot i SPSS tryck Graphs->Legacy Dialogs->Scatter/Dot. Välj Simple scatterplot och tryck på Define. Markera den variabel du vill ha på den vertikala axeln (Y-axeln) i ruta (1). Använd pilarna för att föra över den till rutan Y Axis (2). Markera i ruta (1) den variabel du vill ha på horisontella axeln (X-axeln). Använd pilarna för att föra över den till rutan X Axis (3). Tryck OK. 10

4.3 EXPORTERA FIGURER & TABELLER FRÅN SPSS TILL WORD & POWER POINT För att spara dina figurer och tabeller i en Word eller Powerpoint fil gå till Output fönstret. Högerklicka på den figur eller tabell du vill spara och välj Export. Om du inte vill ha med allt i Output så markera Selected i rutan Objects to export (1). I rutan Document (2) bestämmer du vart du ska expotera figuren/tabellen. I menyn Type (2a) väljer du vilken form de ska sparas i (t.ex i ett word dokument.doc, eller som PowerPoint.ppt). Under File name (2b) skriver du var du vill spara filen samt under vilket namn. Skriver du t.ex C:\Documents\Scatterplot1.doc) kommer filen sparas i mappen Documents under namnet Scatterplot1.doc. Du kan även bläddra dig fram genom att trycka Browse-knappen bredvid. När du valt filnamn, tryck OK. 11

5 ANALYS 5.1 T-TEST FÖR ETT STICKPROV Om du vill jämföra medelvärdet i ditt stickprov med ett specifikt värde använder du ett t-test för ett stickprov. Tryck Analyze-> Compare Means -> One Sample T-test. I ruta (1) visas en lista over vilka variabler som finns i ditt dataset. Markera den variabel du vill analysera här. Tryck sedan på knapp (2) för att lägga till en variabel till analysen. I ruta (3) ser du en lista över vilka variabler du har valt att analysera. I (4) skriver du det värde du vill jämföra medelvärdet på din variabel med. Tips! Om du skriver 0 i rutan (4) räknas ett 95% konfidensintervall ut för din variabel. Tänk på att p-värdet inte är intressant i det här fallet, om inte 0 är just värdet du vill jämföra medelvärdet på din variabel med. Ett exempel på resultat visas nedan. Vi ser att här har man valt att jämföra medelvärdet för variabeln Längd med 183 (Test Value). Under Mean Difference ser vi att differensen mellan testvärdet och stickprovsmedelvärdet är -2,8, d.v.s. ligger stickprovets medelvärde på 180,2. Vi ser dock att konfidensintervallet är mellan -5,8 och 0.2 och att p-värdet är 0.065, alltså finns det ingen signifikant skillnad. 12

5.2 T-TEST FÖR 2 OBEROENDE STICKPROV Detta t-test används för att testa om två oberoende grupper har olika medelvärden. Oberoende betyder här att den ena gruppens resultat inte påverkar den andra gruppen, t.ex. skulle det vara rimligt att anta att genomsnittsvikten hos en grupp män i Stockholm är oberoende av den hos en grupp i Göteborg. Om vi däremot hade mätt vikten hos stockholmarna två gånger hade den första och den andra vikten inte varit oberoende av varandra. För att köra ett t-test för 2 oberoende stickprov tryck. Analyze-> Compare Means -> Independent Samples T test. Under test Variable(s) lägger du var som skall testas, t.ex. systoliskt blodtryck som i exemplet nedan. Det går bra att lägga till flera variabler samtidigt. Du behöver en variabel som säger vilken grupp individerna tillhör under Grouping Variable. När du lagt in variabeln här trycker du Define Groups och fyller i vilka grupper du vill jämföra. I exemplet nedan har en variabel för kön lagts till, och grupperna är 1 för män och 2 för kvinnor. När grupperna är definierade trycka man Continue och sedan OK. Ett exempel på resultat visas nedan. Vi ser att det finns två rader i tabellen, en för Equal variances assumed och en för Equal variances not assumed. Vilken man ska läsa av beror på om det är rimligt att anta att variansen är lika i båda grupperna. I det här fallet gör vi det, och läser alltså av på översta raden. P-värdet står under Sig. (2-tailed), och är i exemplet 0.083, d.v.s. inte signifikant på 5% nivån. Under Mean Difference visas den uppmätta skillnaden i stickprovet (grupp 1 grupp 2). I exemplet ser vi att män hade 3.9 enheter lägre blodtryck i genomsnitt. Vi får även ett 95% konfidensintervall till höger i tabellen. I exemplet ser vi att konfidensintervallet säger att män kan ligga från 8.2 enheter lägre till 0.5 enheter högre än kvinnor, vilket visar på en ganska stor osäkerhet i våra resultat. 13

5.3 T-TEST FÖR PARADE MÄTNINGAR Ett parat T-test används när det finns en tydlig relation mellan stickproven. Det kan till exempel vara när man har gjort mätningar både före och efter en intervention och vill undersöka om interventionen hade någon effekt. Det kan även vara när man mäter samma variabel på två olika sätt, t.ex. blodtryck sittande och blodtryck liggande. Analyze-> Compare Means -> Paired-Samples T test Ett exempel på resultat visas i tabellen nedan.här har man jämfört vikt före med vikt efter en speciell diet. Under Mean ser man hur stor den genomsnittliga skillnaden mellan de två mätningarna var, alltså säger resultatet att personerna har gått ned i genomsnitt 1.0 kg. Vi får även ett 95% konfidensintervall för nedgången som är 0.2 till 1.9 kg. Vi får ett p-värde på 0.017. 14

5.4 -TEST (CHITVÅ TEST) För att få fram ett chitvåtest tryck Analyze->Descriptive Statistics->Crosstabs. Lägg sedan till de variabler du vill ha i korstabellen, vilket finns beskrivet i avsnitt 4.1.4. Tryck sedan Statistics. För att få fram chitvåtestet markera Chi-square och tryck Continue. Om du har ett litet stickprov rekommenderas att du även trycker på Exact-knappen och väljer Exact, då detta ger ett mer korrekt resultat. Exempel på resultat visas i tabellen nedan. Oftast är man intresserad av det två-sidiga p- värdet, vilket har markerats nedan. Chitvåtestet står på översta raden. Om man inte har klickat i Exact får man bara fram Asymp. Sig. (2-sided). Har man däremot valt Exact får man även upp Exact Sig. (2-sided). Ett alternativ till chitvåtestet är Fishers exakta test, vilket visas om man valt Exact. Fishers exakta test är lämpligt att använda om stickprovet är litet eller om man har flera celler med lågt antal förväntade observationer (ingen bör vara under 1, mindre än 20% bör vara under 5, vilket visas under punkt a. under tabellen). 15

5.5 KORRELATION För att ge ett mått på hur mycket två variabler samvarierar kan man beräkna olika korrelationskoefficienter. Innan man beräknar korrelationen mellan två variabler skall man alltid undersöka hur det ser ut grafiskt med hjälp av en scatterplot. Eftersom Pearsons koefficient mäter graden av linjärt samband mellan variablerna är det förstås lämpligt att sambandet ser ut att vara linjärt, d.v.s. att det skulle kunna beskrivas med en rät linje. Om det däremot rör sig om ett kurvformat samband kan man istället använda Spearmans koefficient; den bygger på rangordning av observationen och mäter graden av ökande eller avtagande samband. Båda koefficienterna kan anta värden mellan -1 och 1, där 1 betyder ett perfekt (linjärt) ökande samband och -1 ett perfekt (linjärt) avtagande samband. Om koefficienten blir 0 betyder det att man inte kan hitta något samband av den aktuella formen, vilket dock inte nödvändigtvis betyder att det inte finns något, exempelvis skulle en perfekt u-formad kurva kunna ge koefficienten 0 för både Spearman och Pearson. För att räkna ut korrelationen tryck Analyze->Correlate->Bivariate. Under Variables lägger du in de variabler du vill analysera. Klicka i både Pearson och Spearman under Correlation Coefficients. Resultatet presenteras i två tabeller: en för Pearson och en för Spearman. Både tabellerna läses av på samma sätt. Nedan visas tabellen för Pearsons koefficient. Vi ser att det i exemplet finns två rader och två kolumner med längd och vikt. Eftersom en variabel är perfekt korrelerad med sig själv får vi en korrelation på 1 i både Längd-Längd och Vikt-Vikt. Det vi är intresserade av är Längd-Vikt, alternativ Vikt-Längd, som ger samma resultat. Nedan ser vi att korrelationen mellan längd och vikt är 0,736. Det finns även ett p-värde att läsa av i tabellen under raden Sig. (2-tailed). P-värdet blir i fallet nedan enligt SPSS 0,000, vilket dock är lämpligare att utrycka som <0.001. Alltså kan vi säga att korrelationen är signifikant skild från noll. 16

5.6 LINJÄR REGRESSION Regression används för att med hjälp av en ekvation beskriva sambandet mellan en variabel och en eller flera andra, den variabeln som beror på de andra kallar man beroende variabel och de andra oberoende. I linjär regression förutsätter man att sambandet mellan variablerna kan beskrivas med en linje, något som naturligtvis inte alltid är lämpligt. För linjär regression med bara en beroende och en oberoende variabel kan man lätt se om antagandet är rimligt genom en scatterplot. För att köra en regression, tryck Analyze-> Regression-> Linear. Den beroende variabeln läggs under Dependent och den oberoende under Independent(s). Tryck sedan OK. Som resultat får vi flera tabeller. I ovanstående tabell ser vi att Pearsons korrelationskoefficient R blir 0.72. Determinationskoefficienten, R 2 blir 0.52, alltså kan vi säga att i vår modell förklaras 52% av variationen i den beroende variabeln av variationen i den oberoende. I ovanstående tabell se vi vad värdet på koefficienterna i ekvationen blir. I exemplet ovan blir ekvationen, vilket säger att för varje ökning i ålder med 1 år ökar blodtrycket med 1.22 enheter. Vi har även ett p-värde för ålder längst till höger i tabellen som är <0.001, detta säger att lutningen på linjen är signifikant skild från 0. 17

6 LABBUPPGIFTER I filen nhanes2007.sav finns uppgifter om 920 amerikanska män och kvinnor i åldern 50 till 60 år som har deltagit i ett program som studerar hälsa och näringsstatus hos det amerikanska folket (NHANES http://www.cdc.gov/nchs/nhanes.htm). I den här labben ska vi bland annat undersöka skillnaden mellan rapporterad och uppmätt vikt hos deltagarna. Börja med att öppna filen och gå in på Data View för att undersöka vilka variabler som finns tillgängliga. 1. Det är alltid bra att börja med att göra en översiktig samman ställning av de material du ska använda. Vilka variabler tycker du är av intresse? Hur många värden saknas för de aktuella variablerna? Hur många män/kvinnor finns det i materialet? Vad är medelvärde och standardavvikelse för de olika variablerna? För att göra resultatet mer lättolkat bör du lägga in value labels för variabeln Gender, se avsnitt 3.3. Gender är kodad så 1 betyder män och 2 betyder kvinnor. 2. Är det någon signifikant skillnad mellan rapporterad och faktiskt vikt? Jämför Selfreported weight med Measured Weight med hjälp av ett parat t-test- Innan man gör ett t-test kan det vara en bra idé att undersöka fördelningen hos variabeln man är intresserad av. För t-testet skall fungera krävs att man har normalfördelning alternativt att man har ett stort stickprov. I det här fallet är stickprovet så stort att t-testet är okänsligt för avvikelser från normalfördelningen, dock kan det fortfarande vara bra att undersöka så man inte har några extrema outliers eller andra saker som verkar underliga i datamaterialet. 3. Är det någon signifikant skillnad mellan rapporterad och faktiskt vikt för kvinnor respektive för män? För den här jämförelsen rekommenderar vi att du först splittar data i män och kvinnor. Klicka Data-> Split File. Markera först Compare groups den variabel du vill dela in grupperna efter och använd pilen för att föra över den till rutan Groups Based on och tryck OK. Sen kör du de test och analyser du vill så kommer resultaten att visas för respektive grupp. Vill du sen använda hela materialet igen klicka Data-> Split File och tryck på Reset. 18

4. Vilka andra variabler tror du kan påverka skillnaden mellan den egenrapporterade och den uppmätta vikten? Börja med att se om du genom att göra scatterplottar med din beroende variabel (WeightDiff) och de variabler du misstänker kan ha ett samband. Kan du se något samband? 5. Gör en linjärregression med dina variabler. Vilka blev signifikanta? Om inte alla blev signifikanta på 5% nivån, ta bort den variabel med högst p-värde och gör om analysen. Upprepa tills du bara har signifikanta variabler. OBS! De oberoende variablerna i din modell bör vara just oberoende. Kolla att de inte är starkt korrelerade innan du gör din regressionsanalys. 6. Undersök fördelningen av BMI hos diabetiker och icke-diabetiker genom att göra ett histogram. Lägg Doctor told you have diabetes under Rows när du gör histogrammet. Ändra skalan på Y-axeln till procent. Verkar det rimligt att anta att det är samma fördelning? Ser någon ut att vara normalfördelad? 7. Skiljer sig genomsnittligt BMI mellan diabetiker och icke-diabetiker? Använde t-test för oberoende stickprov grupperat på Doctor told you have diabetes (1 och 2). 8. Undersök om diabetes är oberoende av etnicitet med hjälp av ett chitvåtest. Skapa även en korstabell med lämpliga procentsatser. 9. Det är allmänt känt att långa personer tenderar att väga mer en korta. Gör en scatterplot på längd och vikt. Räkna sedan ut korrelationen mellan variablerna. Hur stark är korrelationen jämfört med vad du förväntade dig? Tycker du det är lämpligt att använda Spearmans eller Pearsons korrelationskoefficient i det här fallet? 19