Kvantitativa metoder en introduktion Mikael Nygård, Åbo Akademi, vt 2018
Vad är kvantitativ metod? Kvantitativa (siffermässiga) analyser av verkligheten: beskrivning och förklaringar av fenomen i fokus! Intresserar sig för det gemensamma, representativa eller olika förklaringar Fokuserar på att beskriva fördelningar av variabler eller samband mellan olika variabler (t.ex. utbildning och hälsa) Jag-det-relation mellan forskare och det undersökta Används närmast när vi vill uttala oss om många människor, t.ex. finländare
Kvantifierbara data Data som kan uttryckas i siffror, t.ex. som frekvenstabeller, korstabeller, medelvärden etc. Användbart om vi vill beskriva egenskaper hos en större grupp människor, t.ex. procenttal, medeltal eller fördelningar Är nödvändiga ifall vi vill testa hypoteser med hjälp av statistiska metoder, t.ex. t-test eller χ2-test
Problemställningen Som i all forskning är utgångspunkten för kvantitativ forskning problemställningen, som vanligen uttrycks i form av ett syfte samt en (rad) frågeställning(ar) och/eller hypotes(er) -> anger målet med forskningen, dvs. vad vill vi veta? Exempel på syfte: att studera arbetstrivseln och dess förklaringar Exempel på frågeställning/hypotes: trivs anställda som får vara med och bestämma på arbetsplatsen bättre än andra?
Problemställningen, forts. Vilka begrepp och teorier använder vi för att göra problemställningen meningsfull och forskningsbar? T.ex. hur definierar vi arbetstrivsel och vilka teorier och tidigare studier finns det om detta från tidigare? Litteratursökning och inläsning behövs!
Att göra problemställningen mätbar - operationalisering Att operationalisera innebär att man väljer variabler som beskriver de egenskaper man är intresserad av och funderar hur man skall gå tillväga för att mäta värdet på dessa variabler Två huvudtyper av variabler: Kategoriserade: enheterna är indelade i grupper, t.ex. kön eller blodgrupp, med ett visst antal givna variabelvärden Kontinuerliga: beskriver en kontinuerlig egenskap som har en glidande skala, t.ex. längd, antal utbildningsår, arbetstrivsel
Validitet Viktig sak att tänka på när vi väljer variabler Teoretiskt mått på mätmetodens och datamaterialets relevans ( lämplighet, meningsfullhet ) för undersökningens syfte och problemställningar, dvs. hur bra lyckas vi egentligen mäta det vi avser att mäta? För att få en valid operationalisering räcker det sålunda inte med att datainsamlingen och analysen är noggrant utförda
Exempel: hur ska vi mäta arbetstrivsel? Den latenta ( teoretiska ) nivån Teoretisk variabel Graden av arbetstrivsel Den manifesta ( verkliga ) nivån Empirisk variabel (indikator) Subjektiv skattning av trivsel (t.ex. hur bra trivs du på din nuvarande arbetsplats? ) Antal besök hos arbetsplatshälsovården????
Reliabilitet Reliabilitet = teoretiskt mått på graden av tillförlitlighet och noggrannhet i själva mätprocessen Att mäta = att tilldela något ett värde (tal) enligt vissa på förhand fastställda regler Hög reliabilitet föreligger om oberoende mätningar av samma fenomen ger i det närmaste identiska resultat Orsaker till låg reliabilitet: Slumpmässiga fel (skrivfel, missförstånd etc.) Systematiska fel (otydlig formulering etc.)
Förhållandet mellan validitet och reliabilitet Teoretiskt definierad variabel Begreppsvaliditet Operationaliserad variabel Validitet Tabulerade data (t.ex. i en Excel- eller SPSSdatamatris) Mätreliabilitet
Variablernas datanivåer Kategoriserade och kontinuerliga variabler ligger på olika s.k. datanivåer, dvs. de skiljer sig åt beträffande mängden och kvaliteten av information Kategoriserade variabler: Nominaldata: variabelvärdena kan inte rangordnas, t.ex. kön Ordinaldata: värdena kan rangordnas, t.ex. befattningstyp Kontinuerliga variabler: Intervalldata: numeriska skillnader mellan variabelvärdena, dock utan nollpunkt, t.ex. blodtrycksvärden, anställningsår, lön Kvotdata: samma som ovan, men med en nollpunkt, t.ex. antal fortbildningskurser
Variabeltypens betydelse Avgör bl.a. vilka typer av analyser som kan utföras, t.ex. deskriptiva statistiska mått: Nominaldata: frekvenser, typvärde Ordinaldata: samma som ovan + median Intervalldata: som ovan + medeltal och standardavvikelse Kvotdata: som ovan + procent
Ett exempel... Inom arbetslivsforskningen har man länge utgått från teorin om att medbestämmande har en positiv effekt på arbetstagarens välbefinnande. Ju mer man själv kan påverka arbetstider m.m. desto mer trivs man Frågeställning: finns det ett samband mellan medbestämmande och arbetstrivsel? Forskningshypotes: personer med hög grad av upplevd medbestämmanderätt tenderar uppleva en högre grad av arbetstrivsel (på ett sätt som inte kan förklaras av slumpen)
Saker som följaktligen blir av intresse för oss... Frågor om arbetstrivsel -> definiera och operationalisera variabeln arbetstrivsel Frågor om medbestämmande -> definiera och operationalisera variabeln medbestämmande I detta fall är upplevd arbetstrivsel den beroende variabeln, det som ska förklaras, medan upplevt medbestämmande utgör den oberoende variabeln, det som vi tror förklarar Man bör även fundera över eventuella alternativa förklarande variabler och bakgrundsvariabler
Oberoende variabel Beroende variabel Upplevt medbestämmande Andra tänkbara oberoende variabler: Tillfredsställelse med lön? Uppskattning av förman? Uppskattning av kolleger Bakgrundsvariabler: Kön, ålder, etc. Upplevd arbetstrivsel Vilka samband vi testar, och vilka oberoende variabler vi prövar, styrs ofta av den förförståelse vi får från tidigare forskning. Denna hjälper oss således att formulera hypoteser om samband, som vi sedan kan testa statistiskt
Data och urval Hur vi ska hitta lämpligt data som gör att vi meningsfullt kan undersöka vår problemställning? Här kommer vi in på frågor om urval (om vem vill vi uttala oss?) samt datafrågor (om vem och vilka variabler innehåller datamaterialet information?) Datamaterialet avgör vilka analysmetoder som är möjliga att använda och urvalsmetoden hur representativa våra resultat är
Totalundersökning eller urval? Vanligen baseras dylika undersökningar på stickprov, dvs. på ett urval inom den grupp (population) man är intresserad av Totalundersökningar ganska ovanliga pga. av de ofta blir för dyra, tidskrävande eller annars oändamålsenliga Stickprov bör vara representativa, dvs. de ska ge en bild av populationen i miniatyr (eller så bra bild som möjligt) Stora bortfall i t.ex. enkätundersökningar är problematiska eftersom representativiteten blir lidande Ett lågt bortfall är dock i sig ingen garanti för hög representativitet (bortfallsanalyser viktiga)
Olika former av urval Slumpmässiga urval Icke-slumpmässiga urval
Slumpmässiga urval Ett urval där alla enheter har en lika stor chans att komma med T.ex. vi har en låda med 1000 svarta och vita glaskulor och vill veta hur stor andel kulor som är vita respektive svarta. Om vi slumpmässigt väljer ett tillräckligt stort antal kulor (t.ex. 100) kan vi få en tillförlitlig skattning av proportionen vita/svarta kulor i lådan Resultaten från urvalet blir med andra ord statistiskt representativa för populationen. Vi kan alltså lita på att våra resultat, med undantag av en viss accepterad felmarginal, gäller för alla kulor i lådan Ju större stickprov, desto mindre risk för att slumpen resulterar i ett icke-representativt urval
Några vanliga typer av slumpmässiga urval Obundet slumpmässigt urval: Alla enheter i en given population har lika stor chans att komma med i stickprovet Stratifierat urval: Indelning av populationen i olika strata från vilka ett lika stort antal enheter väljs slumpmässigt Används när man vill säkerställa att vissa grupper har en viss representation i urvalet Klusterurval: Används för att dela in en stor population i mindre delar för att inom dessa göra slumpmässiga urval
Icke-slumpmässiga urval Är inte statistiskt representativa, men kan dock användas för att påvisa systematiska skillnader mellan olika grupper, t.ex. i medicinska tester Några former av icke-slumpmässiga urval: Bekvämlighetsurval (väljer de som är lättast att få tag i) Urval genom självselektion (t.ex. söka svarande genom tidningsannons) Kvoturval (man väljer ett antal enheter med vissa egenskaper, t.ex. 50% kvinnor, 50% män) Subjektivt urval (val enligt eget tycke) Snöbollsurval (deltagare engagerar andra inom sina nätverk)
Statistisk inferens Handlar om att man drar slutsatser ur empiriska data under osäkerhet orsakad av slumpmässighet i data Det är t.ex. vanligt att man önskar dra slutsatser från ett slumpmässigt urval (sampel) till en viss population Grundförutsättningen är vanligen att urvalet är slumpmässigt och normalfördelat Går ut på att vi beräknar olika karakteristika (egenskaper) för urvalet (t.ex. medelvärden) samt anger konfidensintervall (säkerhetsintervall) inom vilka urvalets karakteristika ligger
Datamaterial och datainsamling Vilket datamaterial ska vi välja? Påverkar vilka analyser som är möjliga att göra samt representativiteten för våra resultat Därtill avgör våra resurser (pengar, tid, personalresurser etc.) ofta vilket data som lönar sig att använda Idag finns det många färdigt insamlade kvantitativa datamaterial (t.ex. ESS, GERDA, registerdata) - det lönar sig med andra ord inte alltid att samla eget data Detta återkommer vi till i ett senare skede
Sammanfattning Grunden för kvantitativ metod ligger i problemställningen, i frågor om operationalisering, data och urval Vi väljer kvantitativa metoder ifall vi vill använda numeriska data för att beskriva ett fenomen eller söka förklaringar Handlar oftast om att kunna uttala sig om många människor