Kvantitativa, statistiska analysmetoder en överblick. Mikael Nygård, Åbo Akademi

Relevanta dokument
Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

Data och metoder för statistiska analyser

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Intervjumetodik. Fördjupad forskningsmetodik, allmän del, vt Mikael Nygård, Åbo Akademi

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Kvantitativ metod. Föreläsning Kristin Wiksell

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Medicinsk statistik II

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Att välja statistisk metod

Uppgift 1. Deskripitiv statistik. Lön

för att komma fram till resultat och slutsatser

Hur skriver man statistikavsnittet i en ansökan?

OBS! Vi har nya rutiner.

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Urval och insamling av kvantitativa data. SOGA50 16nov2016

Analytisk statistik. Tony Pansell, optiker Universitetslektor

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Uppgift 1. Produktmomentkorrelationskoefficienten

KVANTITATIV FORSKNING

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Kvantitativ strategi viktiga begrepp II. Wieland Wermke

Checklista för systematiska litteraturstudier 3

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Tentamen Metod C vid Uppsala universitet, , kl

Hur man tolkar statistiska resultat

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Statistik 1 för biologer, logopeder och psykologer

Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

OBS! Vi har nya rutiner.

Föreläsning 5: Att generalisera

Repetitionsföreläsning

Hypotestestning och repetition

Medicinsk statistik II

Statistik 1 för biologer, logopeder och psykologer

Föreläsning G60 Statistiska metoder

F3 Introduktion Stickprov

Studietyper, inferens och konfidensintervall

KVANTITATIV FORSKNING

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Studentens namn: Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

Provmoment: Ladokkod: Tentamen ges för: Tentamen VVT012 SSK05 VHB. TentamensKod: Tentamensdatum: Tid:

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 HP. Ten1 9 HP. 19 e augusti 2015

Statistiska analyser C2 Bivariat analys. Wieland Wermke

EXAMINATION KVANTITATIV METOD

Föreläsning 5: Att generalisera

Gamla tentor (forts) ( x. x ) ) 2 x1

Experimentell design. Kvasiexperimentell design. Sambandsstudier

Introduktion till statistik för statsvetare

Statistik och epidemiologi T5

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Laboration 3: Urval och skattningar

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Metod1. Intervjuer och observationer. Ex post facto, laboratorie -, fältexperiment samt fältstudier. forskningsetik

Samhällsvetenskaplig metod, 7,5 hp

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Föreläsning 7 och 8: Regressionsanalys

, s a. , s b. personer från Alingsås och n b

Population. Antal tänder. Urval

Statistik och epidemiologi T5

Checklista för systematiska litteraturstudier*

F9 SAMPLINGFÖRDELNINGAR (NCT

Laboration 3 Inferens fo r andelar och korstabeller

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Metoduppgift 4 - PM. Barnfattigdom i Linköpings kommun Pernilla Asp, Statsvetenskapliga metoder: 733G02 Linköpings universitet

EXAMINATION KVANTITATIV METOD vt-11 (110319)

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

Tentamen vetenskaplig teori och metod, Namn/Kod Vetenskaplig teori och metod Provmoment: Tentamen 1

Tentamen: Vetenskapliga perspektiv på studie- och yrkesvägledning, 7,5hp distans (D1) & campus (T1), ht12

OBS! Vi har nya rutiner.

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Föreläsning 5. Kapitel 6, sid Inferens om en population

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Lösningar till SPSS-övning: Analytisk statistik

Föreläsning 4. Kapitel 5, sid Stickprovsteori

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Medicinsk statistik I

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Transkript:

Kvantitativa, statistiska analysmetoder en överblick Mikael Nygård, Åbo Akademi

Fem centrala frågor inom (kvantitativ) forskning VAD vill vi veta? VARFÖR vill vi veta något om detta? Om VEM vill vi veta något? HUR ska vi ta reda på detta? HUR ska vi svara på vår problemställning (VAD)?

VAD och VARFÖR?

Problemställningen Det centrala i all forskning är själva problemställningen, som vanligen uttrycks i en (rad) frågeställning(ar) och/eller hypotes(er) -> anger målet med forskningen, dvs. vad vill vi ha svar på? T.ex.: trivs anställda som får vara med och bestämma på arbetsplatsen bättre än andra? Drabbas flickor i högstadieåldern av depression i högra grad än pojkar? Är högerpartier mer kritiska till skatter än vänsterpartier? Leder generösa arbetslöshetsbidrag till lägre vilja att ta emot arbete?

Problemställningen, forts. Vilka begrepp och teorier använder vi för att göra problemställningen meningsfull och forskningsbar? T.ex. hur definierar vi depression och vad vet vi om ungdomsdepressioner från tidigare? -> litteratursökning och inläsning behövs! Viktigt att i detta skede också fundera vilken typ av information/data vi vill få fram och vad vi vill/kan göra med denna (t.ex. mäta samband mellan arbetstrivsel och andra variabler såsom graden av medbestämmande)

Kvantifierbara data Data som kan uttryckas i siffror, t.ex. som frekvenstabeller, korstabeller, medelvärden etc Användbart om vi vill beskriva egenskaper hos en grupp människor, t.ex. med procent, medeltal och dyl. Är nödvändiga om man vill göra en s.k. hypotesprövning med hjälp av statistiska tester. Detta gör man t.ex. om man antar att olika grupper av individer skiljer sig åt och vill pröva om detta är statistiskt hållbart

Att göra problemställningen mätbar - operationalisering Att operationalisera innebär att man skapar variabler som beskriver de egenskaper man är intresserad av och funderar hur man skall gå tillväga för att mäta värdet på dessa variabler, t.ex. med enkätfrågor Två huvudtyper av variabler: Kategoriserade: enheterna är indelade i grupper, t.ex. kön eller blodgrupp, med ett visst antal givna variabelvärden Kontinuerliga: beskriver en kontinuerlig egenskap som har en glidande skala, t.ex. längd, antal utbildningsår, arbetstrivsel

Kom ihåg validitetsfrågorna! Teoretiskt mått på mätmetodens och datamaterialets relevans ( lämplighet, meningsfullhet ) för undersökningens syfte och problemställningar, dvs. hur bra lyckas vi egentligen mäta det vi avser att mäta? För att en undersökning skall ha hög validitet räcker det inte med att datainsamlingen och analysen är noggrant utförda

Exempel: hur ska vi mäta arbetstrivsel? Den latenta ( teoretiska ) nivån Teoretisk variabel Graden av arbetstrivsel Den manifesta ( verkliga ) nivån Empirisk variabel Subjektiv skattning av trivsel (t.ex. hur bra trivs du på din nuvarande arbetsplats? ) Antal besök hos arbetsplatshälsovården etc

Även frågor om reliabilitet viktiga Reliabilitet = teoretiskt mått på graden av tillförlitlighet och noggrannhet i själva mätprocessen Att mäta = att tilldela något ett värde (tal) enligt vissa på förhand fastställda regler Hög reliabilitet föreligger om oberoende mätningar av samma fenomen ger i det närmaste identiska resultat Orsaker till låg reliabilitet: Slumpmässiga fel (skrivfel, missförstånd etc.) Systematiska fel (stavfel, otydlig formulering etc.)

Förhållandet mellan validitet och reliabilitet Teoretiskt definierad variabel Begreppsvaliditet Operationaliserad variabel Validitet Tabulerade data (t.ex. i en SPSS-datamatris) Mätreliabilitet

Variablernas datanivåer Kategoriserade och kontinuerliga variabler ligger på olika s.k. datanivåer, dvs. de skiljer sig åt beträffande mängden och kvaliteten information de har Kategoriserade variabler: Nominaldata: variabelvärdena kan inte rangordnas, t.ex. kön Ordinaldata: värdena kan rangordnas, t.ex. befattningstyp Kontinuerliga variabler: Intervalldata: numeriska skillnader mellan variabelvärdena, dock utan nollpunkt, t.ex. blodtrycksvärden, anställningsår, lön Kvotdata: samma som ovan, men med en nollpunkt, t.ex. antal fortbildningskurser

Variabeltypens betydelse Avgör bl.a. vilka typer av deskriptiva mått som kan användas Nominaldata: frekvenser, typvärde Ordinaldata: samma som ovan + median Intervalldata: som ovan + medeltal och standardavvikelse Kvotskala: som ovan + procent

Ett exempel... Inom arbetslivsforskningen har man länge utgått från teorin om att medbestämmande har en positiv effekt på arbetstagarens välbefinnande. Ju mer man själv kan påverka arbetstider m.m. desto mer trivs man. Vi vill undersöka om detta stämmer för socialarbetare Frågeställning: finns det ett samband mellan medbestämmande och arbetstrivsel? Forskningshypotes: personer med hög grad av upplevd medbestämmanderätt tenderar uppleva en högre grad av arbetstrivsel (på ett sätt som inte kan förklaras pga. slumpen)

Saker som följaktligen blir av intresse för oss... Frågor om arbetstrivsel -> definiera och operationalisera variabeln arbetstrivsel Frågor om medbestämmande -> definiera och operationalisera variabeln medbestämmande I detta fall är arbetstrivsel den beroende variabeln, den som ska förklaras, medan medbestämmande utgör den oberoende variabeln, den som ska förklara Man bör även fundera över eventuella alternativa förklaringar och bakgrundsvariabler (mot vilka man kontrollerar sambandet man intresserar sig för)

Oberoende variabeln Beroende variabel Upplevd medbestämmanderätt Andra tänkbara oberoende variabler: Tillfredsställelse med egen lön? Uppskattning av förman? Uppskattning av kollever Personlighetsfaktorer, t.ex. känslomässig stabilitet etc Upplevd arbetstrivsel Vilka samband vi testar, och vilka oberoende variabler vi prövar, bestäms ofta av den förförståelse vi får från tidigare forskning. Denna inläsning hjälper oss således att formulera hypoteser om samband, som vi sedan kan testa statistiskt

Vårt forskningsupplägg i korthet Vår problemställning kunde uttryckas så här: Syftet är att undersöka graden av subjektiv arbetstrivsel bland socialarbetare samt i vilken utsträckning graden av medbestämmande påverkar denna Vi behöver alltså få in numeriska data som vi kan analysera statistiskt -> hur ska vi få tag i detta data? Vi vill kunna presentera resultaten i form av en deskriptiv (beskrivande) del, t.ex. genom tabeller, där vi beskriver olika gruppers egenskaper (medeltal, procent mm.), samt göra ett statistiskt test där vi prövar vår forskningshypotes om arbetstrivseln

Om VEM vill vi veta något?

Vilket datamaterial? Vi vill alltså undersöka arbetstrivseln och dess samband med medbestämmande bland socialarbetare Hur vi ska få fram lämpliga data om detta som gör att vi meningsfullt kan svara på våra forskningsfrågor och testa vår hypotes? Frågor om urval samt datats beskaffenhet och representativitet blir centrala

Totalundersökning eller urval? Vanligen baseras dylika undersökningar på stickprov, dvs. på ett urval inom den grupp (population) man är intresserad av (i vårt fall socialarbetare) Totalundersökningar ovanliga pga. av de ofta blir för dyra, tidskrävande eller annars oändamålsenliga Stickprovet bör vara representativt, dvs. det ska ge en bild av populationen i miniatyr (eller åtminstone försöka ge en så bra bild som möjligt) Stora bortfall i t.ex. enkätundersökningar är problematiska eftersom representativiteten blir lidande Ett lågt bortfall är dock i sig ingen garanti för hög representativitet (bortfallsanalyser viktiga)

Exempel på strategier för att minimera bortfall Några exempel på saker som ökar förtroendet och motivationen att delta: Ge tillräcklig information om forskningens syfte och vad den ska användas till Ge noggranna anvisningar för deltagande Visa hur du säkerställer konfidentialiteten (dvs. håller svaren som respondenterna gett hemliga) Använd följebrev (missiv) i samband med enkäter eller innan intervjuer Påminnelse till de som inte besvarat enkäter Tumregel: ju krångligare och mer krävande metoder man använder, desto större risk för bortfall (och mätfel)

Bortfallsanalys och -hantering Man använder kända egenskaper hos populationen och jämför med egenskaperna hos den grupp som svarat Är det t.ex. grupper som tenderar ha en viss åsikt som mer sällan har svarat? Är äldres deltagande lägre än yngres? etc Ger en bild av om och hur bortfallet påverkar undersökningens tillförlitlighet Ett sätt att korrigera (stora) bortfall är att göra s.k. imputationer av enheter (t.ex. låta SPSS beräkna nya enheter på basis av medeltal). Detta kräver dock viss eftertanke och noggranna kontroller av vilket utfallet blir

Olika former av representativa urval Slumpmässiga urval Icke-slumpmässiga urval

Slumpmässiga urval Ett urval där alla enheter har en lika stor chans att komma med T.ex. vi har en låda med 1000 svarta och vita glaskulor och vill veta hur stor andel kulor som är vita respektive svarta. Om vi slumpmässigt väljer ett tillräckligt stort antal kulor kan vi få en tillförlitlig uppskattning av proportionen vita/svarta kulor i lådan Resultaten från urvalet blir med andra ord statistiskt representativa för populationen. Vi kan alltså lita på att våra resultat, med undantag av en viss accepterad felmarginal, gäller för alla kulor i lådan Ju större stickprov, desto mindre risk för att slumpen resulterar i ett icke-representativt urval

Några vanliga typer av slumpmässiga urval Obundet slumpmässigt urval: Alla enheter i en given population har lika stor chans att komma med i stickprovet Stratifierat urval: Indelning av populationen i olika strata från vilka ett lika stort antal enheter väljs slumpmässigt Används när man vill säkerställa att vissa grupper har en viss representation i urvalet Klusterurval: Används för att dela in en stor population i mindre delar för att inom dessa göra slumpmässiga urval

Icke-slumpmässiga urval Är inte statistiskt representativa, men kan dock användas för att påvisa systematiska skillnader mellan olika grupper, t.ex. i medicinska tester Några former av icke-slumpmässiga urval: Bekvämlighetsurval (väljer de som är lättast att få tag i) Urval genom självselektion (t.ex. söka svarande genom tidningsannons) Kvoturval (man väljer ett antal enheter med vissa egenskaper, t.ex. 50% kvinnor, 50% män) Subjektivt urval (val enligt eget tycke) Snöbollsurval (deltagare engagerar andra inom sina nätverk)

Vårt forskningsupplägg, forts. Vi vill alltså undersöka arbetstrivseln bland socialarbetare och dess koppling till medbestämmande. Vi behöver data för detta vilket data ska vi välja? Undersökningens typ och våra resurser (pengar, tid, personalresurser etc) avgör oftast datafrågan. Idag finns det många färdigt insamlade datamaterial (t.ex. ESS, FSD), så det lönar sig inte alltid att samla eget data I vårt fall fokuserar vi på österbottniska socialarbetare och socialhandledare (N= ca 550 år 2012) och gör ett icke-slumpmässigt urval (150) i alla kommuner/städer i Mellersta, Södra och Kustösterbotten

HUR ska vi ta reda på det?

Viktiga frågor angående HUR Vilken datainsamlingsmetod? Vilka frågor ska ställas och hur ska de utformas? Vilka dataanalysmetoder?

När använda enkäter? Då man vänder sig till en större grupp individer (är i regel snabb och billig jämflört med intervju) Då man har relativt klara frågeställningar och fokuserar på ett litet antal intressanta aspekter (man vet m.a.o. vilka detaljer man är intresserad av) Då man vill få kvantifierbara data

När använda intervjuer? Då man vänder sig till en liten grupp individer (mer tidskrävande och dyrare än enkäter) Då man inte på förhand är helt på det klara med vad som är av intresse istället för att binda sig till vissa givna aspekter håller man alla möjligheter öppna. Vad som är relevant bestäms inte på förhand, utan på basis av vad som framkommer av intervjuerna Då man är intresserad av kvalitativa egenskaper och inte i främsta hand är ute efter att mäta eller kvantifiera något

För- och nackdelar med intervju och enkät Intervju: Enkät: Fördelar: Hög svarsprocent Flexibilitet Detaljrikedom (går på djupet) Billig Stora grupper Hög grad av strukturering och standardisering Kvantifierbarhet Nackdelar: Dyra och tidskrävande Små grupper Intervjuareffekten Svårt att kvantifiera Låg svarsprocent Låg grad av flexibilitet Begränsad till endast ett fåtal intressanta aspekter

Något om frågeformulering Problemställningen dikterar frågornas INNEHÅLL Metodologin dikterar frågornas UTFORMNING

Variabeltyper och datanivå? Kategoriserade svar med två eller flera kategorier -> alternativ-/kategorifrågor Ska svaren beskriva ett kategoriskt eller kontinuerligt värde som är känt för respondenten, t.ex. ålder, yrke, inkomst -> öppna svarsalternativ eller alternativ- /kategorifrågor Ska svaren beskriva ett kontinuerligt värde, men där man måste förklara för respondenten vad ett givet variabelvärde betyder? -> skalerade frågor/attitydformulär (mäter styrkan eller intensitet i attityder och känslor

Alternativ-/kategorifrågor Vilken är Er utbildning? Vilken är Er ålder? Hur länge har Du jobbat på denna arbetsplats? Grundskola ( ) Yrkesutbildning ( ) Folkskola ( ) Gymnasium ( ) etc. år Under 1 år ( ) 1-5 år ( ) 6-10 år ( ) Över 10 år ( )

Skalerade frågor/attitydfrågor Uttrycks ofta som ett påstående som man ska ta ställning till eller som en direkt fråga De olika svarsmöjligheterna är olika värden på en skala som uttrycker en s.k. semantisk differential Viktigt att man förklarar vad de olika värdena betyder Finns olika sätt att konstruera dessa, t.ex. Guttman, Likert m.fl.

Exempel på skalerad frågor (Likertfrågor) 1. Jag trivs på min nuvarande arbetsplats Instämmer helt ( ) 1 Instämmer delvis ( ) 2 Tveksam ( ) 3 Tar delvis avstånd ( ) 4 Tar helt avstånd ( ) 5 2. Ledningen lyssnar alltid på mina åsikter Instämmer helt ( ) 1 Instämmer delvis ( ) 2 Tveksam ( ) 3 Tar delvis avstånd ( ) 4 Tar helt avstånd ( ) 5

Några enkla regler för hur man konstruerar enkätfrågor Håll formuläret så kort som möjligt Ta de enklaste frågorna först, de svåraste sist Undvik frågor i början som kan påverka hur man tolkar senare frågor Frågor med liknande svarsalternativ på samma ställe Undvik dubbelfrågor och s.k. ledande frågor Undvik laddade ord och uttryck Avsluta med utrymme för kommentarer Genomför en pilotstudie på en försöksgrupp som så långt det är möjligt motsvarar den avsedda populationen

Summavariabler - skalor Enskilda frågor är i regel behäftade med reliabilitetsproblem, därför vanligt att man använder flera frågor (summavariabel/skala) för att beskriva samma sak Varje fråga innehåller vanligen mätningsfel Dessa mätningsfel kan långt neutraliseras genom att man kombinerar flera frågor (indikatorer) För att veta hur bra de enskilda frågorna mäter det underliggande fenomenet kan man med SPSS:s hjälp räkna ut en s.k. Cronbach s Alpha-koefficient (variera mellan 0 och 1) som fungerar som ett mått på skalans reliabilitet (ju närmare 1, desto högre reliabilitet)

Vårt forskningsupplägg, ännu en gång... Vi vill arbetstrivseln bland ett urval av österbottniska socialarbetare. Vi vill få fram kvantifierbara data, men hittar inga lämpliga existerande datamaterial, så vi väljer att konstruera och sända ut ett eget frågeformulär till 150 personer Frågorna består dels av katergori-/alternativfrågor (bakgrundsvariabler), skalerade frågor (t.ex. frågor om arbetstrivsel) samt några enstaka öppna frågor

HUR ska vi svara på vår problemställning (VAD)? - > statistisk dataanalys

Vad är statistisk dataanalys? Analys och tolkning av kvantitativa data -> förutsätter numeriskt datamaterial Används dels för att beskriva data, t.ex. hur dess olika variabler fördelar sig, eller för att testa samband mellan variabler (t.ex. arbetstrivsel och medbestämmande) Statistiska sambandsanalyser utförs oftast med hjälp av hypotestestning (statistisk inferens) Relativt lätt att använda om man har tillgång till programvaran SPSS (eller andra statistikprogram)

Statistisk dataanalys Vi kan som sagt skilja mellan två huvudtyper av statistisk dataanalys: Deskriptiv statistisk analys: vi vill veta något om en viss variabels fördelning (t.ex. med hjälp av centralmått, spridning, tabeller och diagram/figurer) Statistiska analyser baserade på statistisk inferens, där vi t.ex. analyserar samband mellan olika variabler eller testar hypoteser om exempelvis skillnader i fördelningar (t.ex. mellan urval/sampel och population eller mellan olika sampel)

Deskriptiv statistisk analys Vi kan t.ex. börja med att analysera fördelningen för våra variabler med en frekvensanalys i SPSS Vi kan exempelvis ange hur många av de som svarat som är socialhandledare (n, %), hur hög arbetstrivseln är i genomsnitt etc. I detta skede bör också svarsutfallet analyseras. I vårt fall svarade 136 av de samplade 150 personerna (ca 91 %), vilket gör bortfallet litet men ändå värt att analysera

Exempel på deskriptiv analys av vårt datamaterial Tabell 1. Fördelningen av respondenter enligt befattning och övriga variabelkategori (n = 136) Socialarbetare Socialhandledare (n=78) (n=58) Variabler: Kön (kvinna, man) i procent 82.2% 17.8% 80.7 % 19.3% Ålder (medeltal, standardavvikelse) 42 5,73 39 6,11 Arbetstrivsel (medeltal, stand.avv.) 2.7 6.232 3,112 5.884 Medbestämmande (medeltal, stand.avv.) n 3.6 n 7.204 n 3.7 n 5.345 n

Statistisk inferens Handlar om att man drar slutsatser från empiriska data under en osäkerhet orsakad av slumpmässighet i data Det är t.ex. vanligt att man önskar dra slutsatser från ett slumpmässigt urval (sampel) till en viss population Grundförutsättningen är vanligen att urvalet är slumpmässigt och normalfördelat Går t.ex. ut på att vi beräknar olika karakteristika (egenskaper) för urvalet (t.ex. medelvärden) samt anger konfidensintervall (säkerhetsintervall) inom vilka urvalets karakteristika ligger

Hypotestestning och signifikansnivå Hypotes = antagande om hur något förhåller sig (det vi vill testa statistiskt) Två olika hypoteser används: Forskningshypotes (H 1 ): det påstående vi vill testa (t.ex. det finns ett samband mellan arbetstrivsel och graden av medbestämmande som inte är slumpmässigt) Nollhypotes (H 0 ): det som gäller ifall forskningshypotesen är falsk (inget samband finns) Signifikansnivån (p, Sig.) anger risken för att sambandet är skenbart, slumpmässigt genererat (bör helst vara mindre än 0.05 -> vi kan med 95 % säkerhet anta att sambandet gäller, dvs. att det inte är skenbart

Några vanliga statistiska test Korrelationstester (r xy, r s och C xy ) Regressionstester (regressionskoefficient) χ 2 -testet av skillnader mellan fördelningar Testning av medelvärdet i ett stickprov (t-test) Testning av skillnaden mellan två fördelningars medelvärden (t-test)

Exempel: korrelations- och regressionstest Forskningshypotes i vårt fall: personer med hög grad av upplevd medbestämmanderätt tenderar uppleva en högre grad av arbetstrivsel (på ett sätt som inte kan förklaras pga. slumpen) Vi genomför med SPSS ett korrelationstest samt ett regressionstest där vi testar hur våra huvudsakliga variabler (arbetstrivsel och medbestämmande) samt andra eventuella mellanliggande variabler förhåller sig till varandra

Korrelations- och regressionstest Statistiska test som kan användas för att mäta samband mellan variabler och testa forskningshypoteser Skillnaden är främst att korrelationstest (t.ex. Pearsons koefficient) endast mäter graden av samvariation mellan olika variabler (utan att vi vet något om sambandets riktning), medan regressionsanalys (OLS=ordinary least squares, minsta kvadratmetoden) ger oss en funktion för sambandet (y = a + bx) och en ide om riktningen i sambandet (dock inte bevis på kausalitet)

Korrelationstest med Pearsons korrelationskoefficient (SPSS) Signifikanstest (pvärde); anger risken för att vi ska tro att sambandet finns när det egentligen inte finns Pearsons korrelationskoefficient Arbetstrivsel Grad av upplev d medbes tämmande Correlations Pears on Correlation Sig. (2-t ailed) N Pears on Correlation Sig. (2-t ailed) N Grad av upplev d medbes tä Arbetstrivsel mmande 1,709**,000 136 136,709** 1,000 **. Correlation is signif icant at the 0.01 lev el (2-tailed). 136 136

Tolkningar från korrelationstestet Det finns ett ganska starkt och positivt samband (0.709) mellan arbetstrivsel och medbestämmande Detta samband är statistiskt signifikant (Sig. = 0.000, dvs. p > 0.05) =>Vi kan alltså så här långt anta forskningshypotesen Men finns det även andra faktorer som kan tänkas spela roll här och hur påverkar dessa i så fall detta samband? Vi beaktar därför även tre andra tänkbara variabler och gör först en ny korrelationsanalys och sen en multivariat regressionsanalys (OLS) med hjälp av SPSS

Först resultat från korrelationsanalysen av de fyra intressanta variablerna (SPSS) Correlati ons Signifikansnivå (pvärde), ska vara under 0.05 Pearson s korrelationskoefficient Nöjd med egen lön Arbetstrivsel Uppsk.av närmast e f örman Pears on C orrelation Sig. (2-t ailed) N Pears on C orrelation Sig. (2-t ailed) N Pears on C orrelation Sig. (2-t ailed) N Grad av Uppsk.av upplev d Uppsk.av Nöjd med närmaste medbes tä arbets gru egen lön Arbetstrivsel f örman mmande ppen 1,525**,388**,554**,308**,000,000,000,000 136 136 136 136 136,525** 1,674**,709**,303**,000,000,000,000 136 136 136 136 136,388**,674** 1,593**,428**,000,000,000,000 136 136 136 136 136 Grad av upplev d medbes tämmande Uppsk.av arbetsgruppen Pears on C orrelation Sig. (2-t ailed) N Pears on C orrelation Sig. (2-t ailed) N **. Correlation is signif icant at the 0.01 lev el (2-tailed).,554**,709**,593** 1,294**,000,000,000,001 136 136 136 136 136,308**,303**,428**,294** 1,000,000,000,001 136 136 136 136 136

Tolkningar från korrelationstestet Det starka och signifikanta samband mellan arbetstrivsel och medbestämmande kvarstår (0.709) eftersom även detta är en bivariat analys, men vi ser också att andra faktorer påverkar arbetstrivseln -> verkar som om det undersökta sambandet inte är så entydigt som vi trodde Vi vill därför kolla hur medbestämmande påverkar arbetstrivsel när man samtidigt kontrollerar för inverkan av andra variabler. Vi genomför därför en multivariat regressionsanalys (dvs. en beroende och fyra oberoende variabler) och där iden är att testa vilken (relativ) förklaringsgrad variabeln medbestämmande har när vi samtidigt kontrollerar för påverkan från andra variabler

Multivariata regressionstestet (SPSS) Model 1 a. Model 1 Model Summary Adjust ed Std. Error of R R Square R Square the Estimate,787 a,619,608,598 Predictors: (Constant), Uppsk.av arbetsgruppen, Grad av upplev d medbestämmande, Nöjd med egen lön, Uppsk.av närmast e f örman Intercept (konstant) (Const ant) Grad av upplev d medbestämmande Nöjd med egen lön Uppsk.av närmas te f örman Uppsk.av arbetsgruppen a. Dependent Variable: Arbet striv sel Beroende variabeln Coefficients a Uns tandardized Coef f icients Standardized Coef f icients Regressionskoefficienter B Std. Error Beta t Sig.,466,217 2, 154,033,372,070,397 5, 328,000,153,061,164 2, 483,014,358,065,388 5, 466,000 -, 029,059 -, 030 -, 491,624 De fyra oberoende variablerna Signifikansnivåer Förklaringsgrad, dvs hur stor del av variationen i arbetstrivsel förklaras av modellen nedan? Standardfel

Tolkningar från regressionstestet Till att börja med kan vi se på Model Summary där vi kan konstatera regressionsmodellen förmår förklara en relativt stor andel (ca. 60 %) av den totala variationen i arbetstrivsel (r 2 =.608) och att medelfelet är 0.598 - > dvs. ca 60 % av variationen i uppmätt arbetstrivsel hänger samman med de fyra oberoende variablerna i modellen För att kunna säga något mer exakt om vad medelfelet i detta fall säger om modellens statistiska kvalitet, behöver vi dock göra diverse tilläggsanalyser. Men på i det stora hela verkar testet dock fungera

Tolkningar, forts. Ser vi närmare på betakoefficienterna (Coefficients) finner vi, som väntat, att det finns ett starkt, positivt, samband mellan arbetstrivsel och medbestämmande (Beta=0.397) och att detta samband är signifikant på 0.05-nivån, dvs. att vi kan anta forskningshypotesen med 95% säkerhet Även lönen (Beta=0.164) och uppskattning av förman (Beta=0.388) har positiv betydelse för arbetstrivseln (men endast det senare sambandet är signifikant på 0.05-nivån). Däremot spelar uppskattning av arbetsgruppen inte spelar lika viktig roll för arbetstrivsel och är negativt korrelerat (Beta= -0.030, Sig. = 0.624)

Sammanfattning Kvantitativa data och statistiska metoder är bra på många sätt, bland annat för att de oftast ger mycket reliabel information om många analysenheter, vi kan med andra ord säga något om många enheter, t.ex. uttala oss om sambandet mellan arbetstrivsel och medbestämmande bland österbottniska socialarbetare För att statistiskt testa kausalsamband måste vi dock ha diakroniskt data, dvs. tidsseriedata Nackdelarna hänger samman med validiteten och att vi sysslar med s.k. social reduktionism, dvs. det att vi ofta använder enkla och enskilda variabler för att mäta väldigt komplicerade och mångfacetterade fenomen, vilket kan leda till problem