Data och metoder för statistiska analyser En introduktion Mikael Nygård, Åbo Akademi
Fyra centrala frågor inom (kvantitativ) forskning VAD vill vi veta? VARFÖR vill vi veta något om detta? Om VEM vill vi veta? HUR ska vi ta reda på det?
VAD och VARFÖR?
Problemställningen Det centrala i all forskning är själva problemställningen, som vanligen uttrycks i en (rad) frågeställning(ar) och/eller hypotes(er) Anger vad som är målet med forskningen; vad vill vi ha svar på för frågor? T.ex.: drabbas flickor i högstadieåldern av depression i högra grad än pojkar? Och om så är fallet, vilka förklaringar kan vi finna till denna skillnad?
Problemställningens teoretiska och metodologiska grund Vilka begrepp och teorier använder vi för att göra problemställningen meningsfull och forskningsbar? T.ex. hur definierar vi depression och vad vet vi om ungdomsdepressioner från tidigare? -> litteratursökning och inläsning behövs! Viktigt att fundera vilken typ av information/data vi vill få fram och vad vi kan göra med denna (t.ex. mäta samband mellan depression och intensivitet i sociala kontakter, att förebygga depression)
Kvantifierbara data Data som kan uttryckas i siffror, t.ex. frekvenser Man bör operationalisera det man är intresserad av (variablerna), dvs. göra det mätbart Användbart om man vill beskriva egenskaper hos en grupp människor, t.ex. med procent, medeltal och dyl. Är nödvändiga om man vill göra en s.k. hypotesprövning med hjälp av statistiska tester. Detta gör man t.ex. om man antar att olika grupper av individer skiljer sig åt och vill pröva om detta är statistiskt hållbart
Att göra problemställningar mätbara - operationalisering Att operationalisera innebär att man skapar variabler som beskriver de egenskaper man är intresserad av och funderar hur man skall gå tillväga för att mäta värdet på dessa variabler, t.ex. med enkätfrågor Två huvudtyper av variabler: kategoriserade och kontinuerliga variabler Kategoriserade: enheterna är indelade i grupper, t.ex. kön eller blodgrupp, med ett visst antal givna variabelvärden Kontinuerliga: beskriver en kontinuerlig egenskap som har en glidande skala, t.ex. längd
Validitet Teoretiskt mått på mätmetodens och datamaterialets relevans ( lämplighet, meningsfullhet ) för undersökningens syfte och problemställningar, dvs. hur bra lyckas vi egentligen mäta det vi avser att mäta? För att en undersökning skall ha hög validitet räcker det inte med att datainsamlingen och analysen är noggrant utförda
Exempel: hur ska vi mäta religiositet? Den latenta ( teoretiska ) nivån Teoretisk variabel Graden av religiositet Den manifesta ( verkliga ) nivån Empirisk variabel Antal kyrkbesök per år Dokumenterad bibelkunskap etc.
Reliabilitet Teoretiskt mått på graden av tillförlitlighet och noggrannhet i själva mätprocessen Att mäta = att tilldela något ett värde (tal) enligt vissa på förhand fastställda regler Hög reliabilitet föreligger om oberoende mätningar av samma fenomen ger i det närmaste identiska resultat Orsaker till låg reliabilitet Slumpmässiga fel (skrivfel, missförstånd etc.) Systematiska fel (stavfel, fel formulering etc.)
Förhållandet mellan validitet och reliabilitet Teoretiskt definierad variabel Begreppsvaliditet Operationaliserad variabel Validitet Tabulerade data (t.ex. i en SPSS-datamatris) Mätreliabilitet
Variablernas datanivåer Kategoriserade och kontinuerliga variabler ligger på olika s.k. datanivåer, dvs. de skiljer sig åt beträffande mängden och kvaliteten information de har Kategoriserade variabler: Nominaldata: variabelvärdena kan inte rangordnas, t.ex. kön Ordinaldata: värdena kan rangordnas, t.ex. anställningstid Kontinuerliga variabler: Intervalldata: numeriska skillnader mellan variabelvärdena, dock utan nollpunkt, t.ex. temperatur Kvotdata: samma som ovan, men med nollpunkt, t.ex. längd
Variabeltypens betydelse Avgör vilka typer av deskriptiva mått och tester som kan användas Nominaldata: frekvenser, typvärde Ordinaldata: samma som ovan + median Intervalldata: som ovan + medeltal och standardavvikelse Kvotskala: som ovan + procent
Ett exempel på VAD/VARFÖR Inom arbetslivsforskningen har man länge utgått från teorin om att medbestämmande har en positiv effekt på arbetstagarens välbefinnande. Ju mer man själv kan påverka arbetstider m.m. desto mer trivs man. Vi vill undersöka om detta stämmer för HVC-anställda i Svenskösterbotten Frågeställning: finns det ett samband mellan medbestämmande och arbetstrivsel? Forskningshypotes: personer med hög grad av upplevd medbestämmanderätt tenderar uppleva en högre grad av arbetstrivsel (på ett sätt som inte kan förklaras pga. slumpen)
Saker som följaktligen blir av intresse för oss... Frågor om arbetstrivsel -> definiera och operationalisera variabeln arbetstrivsel Frågor om medbestämmande -> definiera och operationalisera variabeln medbestämmande I detta fall är arbetstrivsel den beroende variabeln, den som ska förklaras, medan medbestämmande utgör den oberoende variabeln, den som ska förklara Man bör även fundera över eventuella alternativa förklaringar och bakgrundsvariabler (mot vilka man kontrollerar sambandet man intresserar sig för)
Oberoende variabler Upplevd medbestämmanderätt Beroende variabel Tillfredsställelse med egen lön? Arbetstrivsel Uppskattning av närmaste förman? Uppskattning av kolleger?
Forskningsupplägget Vi vill alltså undersöka om den upplevda medbestämmanderätten spelar någon roll för arbetstrivseln bland HVC- anställda i svenska Österbotten Vi behöver alltså få in data om detta som vi kan behandla statistiskt -> behov av numeriska data (t.ex. enkät) Resultaten presenteras i form av en deskriptiv (beskrivande) del, t.ex. tabeller där man beskriver olika gruppers egenskaper (medeltal, procent mm.), samt eventuellt ett test där man prövar forskningshypotesen
Datamaterialet För detta ändamål har ett stratifierat slumpmässigt urval på 150 respondenter gjorts bland 8 HVC i Svenskösterbotten Enkätundersökning med 90,6 % bortfall Svaren på frågorna presenteras i en SPSS-datamatris
Om VEM vill vi veta något?
Totalundersökning eller urval? Vanligen baseras dylika undersökningar på stickprov, dvs. på ett urval bland den grupp man är intresserad av Totalundersökningar ovanliga pga. av de ofta blir för dyra eller oändamålsenliga Stickprovet bör vara representativt, dvs. det ska ge en bild av populationen i miniatyr Stora bortfall i t.ex. enkätundersökningar är problematiska eftersom representativiteten lätt blir lidande (OBS! Ett lågt bortfall är i sig ingen garanti för representativitet)
Strategier för att minimera bortfall Intervjuer med fasta svarsalternativ Enkla, korta och begripliga frågeformulär Följebrev (missiv) Säkerställande av konfidentialitet Påminnelser till de som inte besvarat frågeformuläret (vanligen 2 gånger) Tillräcklig information om forskningens syfte och noggranna anvisningar för besvarandet
Bortfallsanalys Man använder kända egenskaper hos populationen och jämför med egenskaperna hos den grupp som svarat Är det t.ex. grupper som tenderar ha en viss åsikt som mer sällan har svarat? Ger en bild av om och hur bortfallet påverkar undersökningens tillförlitlighet Ett sätt att korrigera (stora) bortfall är att göra imputation av enheter (t.ex. låta SPSS beräkna nya enheter på basis av medeltal). Detta kräver dock viss eftertanke och noggranna kontroller av vilket utfallet blir
Olika former av representativa urval Slumpmässiga urval Icke-slumpmässiga urval
Slumpmässiga urval Ett urval där alla enheter har en lika stor chans att komma med T.ex. vi har en låda med 1000 svarta och vita glaskulor och vill veta hur stor andel kulor som är vita respektive svarta. Om vi slumpmässigt väljer ett tillräckligt stort antal kulor kan vi få en tillförlitlig uppskattning av proportionen vita/svarta kulor i lådan Resultaten från urvalet blir med andra ord statistiskt representativa för populationen. Vi kan alltså lita på att våra resultat, med undantag av en viss accepterad felmarginal, gäller för alla kulor i lådan Ju större stickprov, desto mindre risk för att slumpen resulterar i ett icke-representativt urval
Några vanliga typer av slumpmässiga urval Obundet slumpmässigt urval Alla enheter i en given population har lika stor chans att komma med i stickprovet Stratifierat urval Indelning av populationen i olika strata från vilka ett lika stort antal enheter väljs slumpmässigt Används när man vill säkerställa att vissa grupper har en viss representation i urvalet Klusterurval Används för att dela in en stor population i mindre delar för att inom ett antal delar göra obundna slumpmässiga urval
Icke-slumpmässiga urval Är inte statistiskt representativa, kan dock användas för att påvisa systematiska skillnader mellan olika grupper, t.ex. i medicinska tester Bekvämlighetsurval (de som är lättast att få tag i) Urval genom självselektion (t.ex. söka svarande genom tidningsannons) Kvoturval (man vill ha ett visst antal personer med vissa egenskaper) Subjektivt urval (val enligt eget tycke)
HUR vill vi ta reda på det?
Viktiga frågor angående HUR Vilken datainsamlingsmetod? Vilka frågor ska ställas och hur ska de utformas? Vilka dataanalysmetoder?
När använda enkäter? Då man vänder sig till en större grupp individer (är i regel snabb och billig jämflört med intervju) Då man har relativt klara frågeställningar och fokuserar på ett litet antal intressanta aspekter (man vet m.a.o. vilka detaljer man är intresserad av) Då man vill få kvantifierbara data
När använda intervjuer? Då man vänder sig till en liten grupp individer (mer tidskrävande och dyrare än enkäter) Då man inte på förhand är helt på det klara med vad som är av intresse istället för att binda sig till vissa givna aspekter håller man alla möjligheter öppna. Vad som är relevant bestäms inte på förhand, utan på basis av vad som framkommer av intervjuerna Då man är intresserad av kvalitativa egenskaper och inte i främsta hand är ute efter att mäta eller kvantifiera något
För- och nackdelar med intervju och enkät Intervju: Enkät: Fördelar: Hög svarsprocent Flexibilitet Detaljrikedom (går på djupet) Billig Stora grupper Hög grad av strukturering och standardisering Kvantifierbarhet Nackdelar: Dyra och tidskrävande Små grupper Intervjuareffekten Svårt att kvantifiera Låg svarsprocent Låg grad av flexibilitet Begränsad till endast ett fåtal intressanta aspekter
Kombination av enkät och intervju? Det finns inget som hindrar att man kombinerar enkäter med intervjuer Man kan t.ex. bygga en enkät på inledande intervjuer Man kan även använda sig av mellanformer av dessa två för att kombinera de starka egenskaperna hos bägge (t.ex. intervju med fasta svarsalternativ, t.ex. telefonintervju)
Intervjuer, enkäter och deras mellanformer Intervju med fasta svarsalternativ (t.ex. telefonintervju Intervju med öppna frågor Frågeformulär med fasta svarsalternativ Frågeformulär med öppna svarsalternativ
Frågornas standardisering och strukturering Hög grad av standardisering Hög grad av strukturering Enkät/intervju med fasta svarsalternativ Kvantitativ analys av resultat Låg grad av strukturering Enkät/intervju med öppna frågor Pilotstudier, diagnosticerande enkäter/intervjuer Låg grad av standardisering Fokuserade intervjuer, t.ex. en läkares upptagning av tidigare sjukdomshistoria Samtalsintervjuer, dvs. intervjuer där man önskar göra en kvalitativ analys av resultaten
För- och nackdelar med olika mellanformer Fördelen med intervjuer med fasta svarsalternativ (t.ex. via telefon eller besök) är att man får kvantifierbara data samtidigt som man i regel får en högre svarsprocent Nackdelar: dyrt och tidskrävande Fördelarna med enkäter med öppna frågor är att man når flera personer och att man inte är bunden vid vissa givna svarsformer i oklara situationer (t.ex. då det gäller ett område man inte vet så mycket om på förhand) Nackdelar: ofta låg svarsprocent ( man orkar inte formulera svar... ), svårt att kvantifiera svaren
Frågeformulering Problemställningen dikterar frågornas INNEHÅLL Metodologin dikterar deras UTFORMNING
Vilken variabeltyp och datanivå är det fråga om? Kategoriserade svar med två eller flera kategorier -> alternativ-/kategorifrågor Ska svaren beskriva ett kategoriskt eller kontinuerligt värde som är känt för respondenten, t.ex. ålder, yrke, inkomst -> öppna svarsalternativ eller alternativ- /kategorifrågor Ska svaren beskriva ett kontinuerligt värde, men där man måste förklara för respondenten vad ett givet variabelvärde betyder? -> skalerade frågor/attitydformulär (mäter styrkan eller intensitet i attityder och känslor
Alternativ-/kategorifrågor Vilken är Er utbildning? Vilken är Er ålder? Hur länge har Du jobbat på denna arbetsplats? Grundskola ( ) Yrkesutbildning ( ) Folkskola ( ) Gymnasium ( ) etc. år Under 1 år ( ) 1-5 år ( ) 6-10 år ( ) Över 10 år ( )
Skalerade frågor/attitydfrågor Uttrycks ofta som ett påstående som man ska ta ställning till eller som en direkt fråga De olika svarsmöjligheterna är olika värden på en skala som uttrycker en s.k. semantisk differential Viktigt att man förklarar vad de olika värdena betyder Finns olika sätt att konstruera dessa, t.ex. Guttman, Likert m.fl.
Exempel på skalerad fråga (Likertskalan) 1. Jag får inte tillräcklig information på min arbetsplats Instämmer helt ( ) 1 Instämmer delvis ( ) 2 Tveksam ( ) 3 Tar delvis avstånd ( ) 4 Tar helt avstånd ( ) 5 2. Ledningen lyssnar alltid på mina åsikter Instämmer helt ( ) 1 Instämmer delvis ( ) 2 Tveksam ( ) 3 Tar delvis avstånd ( ) 4 Tar helt avstånd ( ) 5
Några enkla regler för hur man konstruerar enkätfrågor Håll formuläret så kort som möjligt Ta de enklaste frågorna först, de svåraste sist Undvik frågor i början som kan påverka hur man tolkar senare frågor Frågor med liknande svarsalternativ på samma ställe Undvik dubbelfrågor och s.k. ledande frågor Undvik laddade ord och uttryck Avsluta med utrymme för kommentarer Genomför en pilotstudie på en försöksgrupp som så långt det är möjligt motsvarar den avsedda populationen
Summavariabler - skalor Enskilda frågor är i regel behäftade med reliabilitetsproblem, därför vanligt att man använder flera frågor (summavariabel/skala) för att beskriva samma sak Varje fråga innehåller vanligen mätningsfel Dessa mätningsfel kan långt neutraliseras genom att man kombinerar flera frågor (indikatorer) För att veta hur bra de enskilda frågorna mäter det underliggande fenomenet kan man räkna ut en s.k. Cronbach s Alpha-koefficient som fungerar som ett mått på summavariabelns/skalans reliabilitet
Statistisk dataanalys
Vad är statistisk dataanalys? Analys och tolkning av kvantitativa data Används närmast för att testa systematiska samband mellan variabler Utförs ofta med hjälp av hypotestestning (statistisk inferens) Förutsätter ett kvantitativt datamaterial Relativt lätt att använda om man har tillgång till programvaran SPSS
Statistisk dataanalys Vi kan i princip skilja mellan två huvudtyper av statistisk dataanalys Den första huvudtypen är s.k. deskriptiva analyser, där vi vill veta något om en viss variabels fördelning (t.ex. med hjälp av centralmått, spridning, stapeldiagram) Den andra typen är statistiska analyser baserade på statistisk inferens, där vi t.ex. analyserar samband mellan olika variabler eller testar hypoteser om exempelvis skillnader i fördelningar (t.ex. mellan urval/sampel och population eller mellan olika sampel)
Statistisk inferens Handlar om att man drar slutsatser från empiriska data under en osäkerhet orsakad av slumpmässighet i data Det är t.ex. vanligt att man önskar dra slutsatser från ett slumpmässigt urval (sampel) till en viss population Grundförutsättningen är här att urvalet är slumpmässigt och normalfördelat Går t.ex. ut på att vi beräknar olika karakteristika (egenskaper) för urvalet (t.ex. medelvärden) samt anger konfidensintervall (säkerhetsintervall) inom vilka urvalets karakteristika ligger
Hypotestestning Hypotes = antagande om hur något förhåller sig (det vi vill testa statistiskt) Två olika hypoteser används: Forskningshypotes (H 1 ): det påstående vi vill testa (t.ex. pojkar har lättare att lära sig matte än flickor) Nollhypotes (H 0 ): det som gäller ifall forskningshypotesen är falsk Signifikansnivån (p, Sig. ) anger risken för att sambandet är skenbart, slumpmässigt (bör helst vara mindre än 0.05 -> vi kan med 95 % säkerhet anta att resultatet gäller, dvs. inte är slumpmässigt
Några vanliga statistiska test Korrelationstester (r xy, r s och C xy ) Regressionstester (regressionskoefficient) χ 2 -testet av skillnader mellan fördelningar Testning av medelvärdet i ett stickprov (t-test) Testning av skillnaden mellan två fördelningars medelvärden (t-test)
Exempel: korrelations- och regressionstest Forskningshypotes: personer med hög grad av upplevd medbestämmanderätt tenderar uppleva en högre grad av arbetstrivsel (på ett sätt som inte kan förklaras pga. slumpen) Vi genomför med SPSS ett korrelationstest samt ett regressionstest där vi testar hur våra variabler samt andra eventuella mellanliggande variabler förhåller sig till varandra
Korrelationstest med Pearsons korrelationskoefficient Signifikanstest (pvärde); anger risken för att vi ska tro att sambandet finns när det egentligen inte finns Pearsons korrelationskoefficient Arbet striv sel Grad av upplev d medbes tämmande Correl ati ons Pears on Correlation Sig. (2-t ailed) N Pears on Correlation Sig. (2-t ailed) N Grad av upplev d medbes tä Arbet striv sel mmande 1,709**,000 136 136,709** 1,000 **. Correlation is signif icant at the 0.01 lev el (2-tailed). 136 136
Tolkning Det finns ett ganska starkt och positivt samband mellan arbetstrivsel och medbestämmande Detta samband är statistiskt signifikant (p > 0.05) =>Vi kan alltså anta forskningshypotesen Men finns det även andra faktorer som kan tänkas spela roll här och hur påverkar dessa i så fall detta samband? Vi beaktar därför även en rad andra tänkbart intressanta faktorer, dvs. tillfredsställelse med lön, uppskattning från närmaste förman samt uppskattning från arbetsgruppen
Pearson s Korrelations -koefficient Correlati ons Signifikansnivå (pvärde) Nöjd med egen lön Arbet striv sel Uppsk.av närmast e f örman Pears on Correlation Sig. (2-t ailed) N Pears on Correlation Sig. (2-t ailed) N Pears on Correlation Sig. (2-t ailed) N Grad av Uppsk.av upplev d Uppsk.av Nöjd med närmaste medbes tä arbets gru egen lön Arbet striv sel f örman mmande ppen 1,525**,388**,554**,308**,000,000,000,000 136 136 136 136 136,525** 1,674**,709**,303**,000,000,000,000 136 136 136 136 136,388**,674** 1,593**,428**,000,000,000,000 136 136 136 136 136 Grad av upplev d medbes tämmande Uppsk.av arbet sgruppen Pears on Correlation Sig. (2-t ailed) N Pears on Correlation Sig. (2-t ailed) N **. Correlation is signif icant at the 0.01 lev el (2-tailed).,554**,709**,593** 1,294**,000,000,000,001 136 136 136 136 136,308**,303**,428**,294** 1,000,000,000,001 136 136 136 136 136
Tolkningar Det föreligger ett stark och signifikant samband mellan arbetstrivsel och medbestämmande men även en rad andra faktorer påverkar arbetstrivseln -> verkar som om det undersökta sambandet inte är entydigt som vi trodde, utan att det finns en rad mellanliggande faktorer som påverkar hur medbestämmande påverkar arbetstrivseln Vi vill därför kolla hur medbestämmande påverkar arbetstrivsel när man kontrollerat för dessa andra variabler Detta kan göras på olika sätt, vi väljer dock att genomföra en multipel regressionsanalys
Multipelt regressionstest Model Summary Förklaringsgrad Model 1 a. Model 1 Adjust ed Std. Error of R R Square R Square the Estimate,787 a,619,608,598 Predictors: (Constant), Uppsk.av arbetsgruppen, Grad av upplev d medbestämmande, Nöjd med egen lön, Uppsk.av närmast e f örman Intercept (konstant) (Constant) Grad av upplev d medbes tämmande Nöjd med egen lön Uppsk.av närmast e f örman Uppsk.av arbetsgruppen a. Dependent Variable: Arbets triv sel Coefficients a Uns tandardized Coef f icients Standardized Coef f icients Regressionskoefficienter B Std. Error Beta t Sig.,466,217 2, 154,033,372,070,397 5, 328,000,153,061,164 2, 483,014,358,065,388 5, 466,000 -, 029,059 -, 030 -, 491,624 Signifikansnivåer Standardfel
Tolkning Vi finner det starkaste sambandet mellan medbestämmande och arbetstrivsel (regressionskoefficienten =.397) Vi kan även konstatera att vår modell förmår förklara en relativt stor andel (ca. 60 %) av den totala variationen i arbetstrivsel (r 2 =.608) med ett acceptabelt standardfel (.598) Även tillfredsställelse med lönen (.164) och uppskattning av närmaste förman (.388) har en viktig betydelse för den upplevda arbetstrivseln Däremot försvinner sambandet mellan uppskattning av arbetsgruppen och arbetstrivsel när man kontrollerar för de andra variablerna
Sammanfattning Kvantitativa, statistiska data och metoder är bra på många sätt, bland annat för att de oftast ger mycket reliabel information om många analysenheter På basis av denna information är det möjligt att göra olika statistiska analyser av kausalsamband Nackdelarna hänger närmast samman med att vi här har att göra med en hög grad av reduktionism, dvs. det att vi använder enskilda variabler för att mäta komplicerade fenomen, kan ibland göra validiteten lidande