Data och metoder för statistiska analyser

Relevanta dokument

Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Kvantitativa, statistiska analysmetoder en överblick. Mikael Nygård, Åbo Akademi

Intervjumetodik. Fördjupad forskningsmetodik, allmän del, vt Mikael Nygård, Åbo Akademi

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Kvantitativ metod. Föreläsning Kristin Wiksell

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Att välja statistisk metod

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Urval och insamling av kvantitativa data. SOGA50 16nov2016

Medicinsk statistik II

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

KVANTITATIV FORSKNING

för att komma fram till resultat och slutsatser

Analytisk statistik. Tony Pansell, optiker Universitetslektor

KVANTITATIV FORSKNING

Kvantitativ strategi viktiga begrepp II. Wieland Wermke

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Uppgift 1. Deskripitiv statistik. Lön

Provmoment: Ladokkod: Tentamen ges för: Tentamen VVT012 SSK05 VHB. TentamensKod: Tentamensdatum: Tid:

Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

EXAMINATION KVANTITATIV METOD

Tentamen Metod C vid Uppsala universitet, , kl

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Checklista för systematiska litteraturstudier 3

Uppgift 1. Produktmomentkorrelationskoefficienten

Hur skriver man statistikavsnittet i en ansökan?

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

Studentens namn: Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Föreläsning G60 Statistiska metoder

OBS! Vi har nya rutiner.

Föreläsning 5: Att generalisera

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 HP. Ten1 9 HP. 19 e augusti 2015

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Li#eratur och empiriska studier kap 12, Rienecker & Jørgensson kap 8-9, 11-12, Robson STEFAN HRASTINSKI STEFANHR@KTH.SE

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Samhällsvetenskaplig metod, 7,5 hp

Studietyper, inferens och konfidensintervall

Gamla tentor (forts) ( x. x ) ) 2 x1

Introduktion till statistik för statsvetare

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

OBS! Vi har nya rutiner.

Medicinsk statistik II

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Laboration 3: Urval och skattningar

Repetitionsföreläsning

Metod1. Intervjuer och observationer. Ex post facto, laboratorie -, fältexperiment samt fältstudier. forskningsetik

Checklista för systematiska litteraturstudier*

Statistik och epidemiologi T5

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Beteendevetenskaplig metod. Metodansats. För och nackdelar med de olika metoderna. Fyra huvudkrav på forskningen Forskningsetiska principer

Statistik 1 för biologer, logopeder och psykologer

Forsknings- och undersökningsmetodik Skrivtid: 4h

1) FRÅGOR OM RESPONDENTENS SOCIAL-DEMOGRAFISKA DATA: - Hur gammal är du?... år (= öppen fråga)

Statistik och epidemiologi T5

Inferensstatistik. Hypostesprövning - Signifikanstest

Föreläsning 5: Att generalisera

Hypotestestning och repetition

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Statistik 1 för biologer, logopeder och psykologer

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Bilaga 6 till rapport 1 (5)

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Population. Antal tänder. Urval

Föreläsning G70 Statistik A

Kommun och landsting 2016

Experimentell design. Kvasiexperimentell design. Sambandsstudier

Hur man tolkar statistiska resultat

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Anvisningar till rapporter i psykologi på B-nivå

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Examinationsuppgift 2014

Föreläsning 5. Kapitel 6, sid Inferens om en population

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Laboration 3 Inferens fo r andelar och korstabeller

F3 Introduktion Stickprov

Dataanalys kopplat till undersökningar

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Transkript:

Data och metoder för statistiska analyser En introduktion Mikael Nygård, Åbo Akademi

Fyra centrala frågor inom (kvantitativ) forskning VAD vill vi veta? VARFÖR vill vi veta något om detta? Om VEM vill vi veta? HUR ska vi ta reda på det?

VAD och VARFÖR?

Problemställningen Det centrala i all forskning är själva problemställningen, som vanligen uttrycks i en (rad) frågeställning(ar) och/eller hypotes(er) Anger vad som är målet med forskningen; vad vill vi ha svar på för frågor? T.ex.: drabbas flickor i högstadieåldern av depression i högra grad än pojkar? Och om så är fallet, vilka förklaringar kan vi finna till denna skillnad?

Problemställningens teoretiska och metodologiska grund Vilka begrepp och teorier använder vi för att göra problemställningen meningsfull och forskningsbar? T.ex. hur definierar vi depression och vad vet vi om ungdomsdepressioner från tidigare? -> litteratursökning och inläsning behövs! Viktigt att fundera vilken typ av information/data vi vill få fram och vad vi kan göra med denna (t.ex. mäta samband mellan depression och intensivitet i sociala kontakter, att förebygga depression)

Kvantifierbara data Data som kan uttryckas i siffror, t.ex. frekvenser Man bör operationalisera det man är intresserad av (variablerna), dvs. göra det mätbart Användbart om man vill beskriva egenskaper hos en grupp människor, t.ex. med procent, medeltal och dyl. Är nödvändiga om man vill göra en s.k. hypotesprövning med hjälp av statistiska tester. Detta gör man t.ex. om man antar att olika grupper av individer skiljer sig åt och vill pröva om detta är statistiskt hållbart

Att göra problemställningar mätbara - operationalisering Att operationalisera innebär att man skapar variabler som beskriver de egenskaper man är intresserad av och funderar hur man skall gå tillväga för att mäta värdet på dessa variabler, t.ex. med enkätfrågor Två huvudtyper av variabler: kategoriserade och kontinuerliga variabler Kategoriserade: enheterna är indelade i grupper, t.ex. kön eller blodgrupp, med ett visst antal givna variabelvärden Kontinuerliga: beskriver en kontinuerlig egenskap som har en glidande skala, t.ex. längd

Validitet Teoretiskt mått på mätmetodens och datamaterialets relevans ( lämplighet, meningsfullhet ) för undersökningens syfte och problemställningar, dvs. hur bra lyckas vi egentligen mäta det vi avser att mäta? För att en undersökning skall ha hög validitet räcker det inte med att datainsamlingen och analysen är noggrant utförda

Exempel: hur ska vi mäta religiositet? Den latenta ( teoretiska ) nivån Teoretisk variabel Graden av religiositet Den manifesta ( verkliga ) nivån Empirisk variabel Antal kyrkbesök per år Dokumenterad bibelkunskap etc.

Reliabilitet Teoretiskt mått på graden av tillförlitlighet och noggrannhet i själva mätprocessen Att mäta = att tilldela något ett värde (tal) enligt vissa på förhand fastställda regler Hög reliabilitet föreligger om oberoende mätningar av samma fenomen ger i det närmaste identiska resultat Orsaker till låg reliabilitet Slumpmässiga fel (skrivfel, missförstånd etc.) Systematiska fel (stavfel, fel formulering etc.)

Förhållandet mellan validitet och reliabilitet Teoretiskt definierad variabel Begreppsvaliditet Operationaliserad variabel Validitet Tabulerade data (t.ex. i en SPSS-datamatris) Mätreliabilitet

Variablernas datanivåer Kategoriserade och kontinuerliga variabler ligger på olika s.k. datanivåer, dvs. de skiljer sig åt beträffande mängden och kvaliteten information de har Kategoriserade variabler: Nominaldata: variabelvärdena kan inte rangordnas, t.ex. kön Ordinaldata: värdena kan rangordnas, t.ex. anställningstid Kontinuerliga variabler: Intervalldata: numeriska skillnader mellan variabelvärdena, dock utan nollpunkt, t.ex. temperatur Kvotdata: samma som ovan, men med nollpunkt, t.ex. längd

Variabeltypens betydelse Avgör vilka typer av deskriptiva mått och tester som kan användas Nominaldata: frekvenser, typvärde Ordinaldata: samma som ovan + median Intervalldata: som ovan + medeltal och standardavvikelse Kvotskala: som ovan + procent

Ett exempel på VAD/VARFÖR Inom arbetslivsforskningen har man länge utgått från teorin om att medbestämmande har en positiv effekt på arbetstagarens välbefinnande. Ju mer man själv kan påverka arbetstider m.m. desto mer trivs man. Vi vill undersöka om detta stämmer för HVC-anställda i Svenskösterbotten Frågeställning: finns det ett samband mellan medbestämmande och arbetstrivsel? Forskningshypotes: personer med hög grad av upplevd medbestämmanderätt tenderar uppleva en högre grad av arbetstrivsel (på ett sätt som inte kan förklaras pga. slumpen)

Saker som följaktligen blir av intresse för oss... Frågor om arbetstrivsel -> definiera och operationalisera variabeln arbetstrivsel Frågor om medbestämmande -> definiera och operationalisera variabeln medbestämmande I detta fall är arbetstrivsel den beroende variabeln, den som ska förklaras, medan medbestämmande utgör den oberoende variabeln, den som ska förklara Man bör även fundera över eventuella alternativa förklaringar och bakgrundsvariabler (mot vilka man kontrollerar sambandet man intresserar sig för)

Oberoende variabler Upplevd medbestämmanderätt Beroende variabel Tillfredsställelse med egen lön? Arbetstrivsel Uppskattning av närmaste förman? Uppskattning av kolleger?

Forskningsupplägget Vi vill alltså undersöka om den upplevda medbestämmanderätten spelar någon roll för arbetstrivseln bland HVC- anställda i svenska Österbotten Vi behöver alltså få in data om detta som vi kan behandla statistiskt -> behov av numeriska data (t.ex. enkät) Resultaten presenteras i form av en deskriptiv (beskrivande) del, t.ex. tabeller där man beskriver olika gruppers egenskaper (medeltal, procent mm.), samt eventuellt ett test där man prövar forskningshypotesen

Datamaterialet För detta ändamål har ett stratifierat slumpmässigt urval på 150 respondenter gjorts bland 8 HVC i Svenskösterbotten Enkätundersökning med 90,6 % bortfall Svaren på frågorna presenteras i en SPSS-datamatris

Om VEM vill vi veta något?

Totalundersökning eller urval? Vanligen baseras dylika undersökningar på stickprov, dvs. på ett urval bland den grupp man är intresserad av Totalundersökningar ovanliga pga. av de ofta blir för dyra eller oändamålsenliga Stickprovet bör vara representativt, dvs. det ska ge en bild av populationen i miniatyr Stora bortfall i t.ex. enkätundersökningar är problematiska eftersom representativiteten lätt blir lidande (OBS! Ett lågt bortfall är i sig ingen garanti för representativitet)

Strategier för att minimera bortfall Intervjuer med fasta svarsalternativ Enkla, korta och begripliga frågeformulär Följebrev (missiv) Säkerställande av konfidentialitet Påminnelser till de som inte besvarat frågeformuläret (vanligen 2 gånger) Tillräcklig information om forskningens syfte och noggranna anvisningar för besvarandet

Bortfallsanalys Man använder kända egenskaper hos populationen och jämför med egenskaperna hos den grupp som svarat Är det t.ex. grupper som tenderar ha en viss åsikt som mer sällan har svarat? Ger en bild av om och hur bortfallet påverkar undersökningens tillförlitlighet Ett sätt att korrigera (stora) bortfall är att göra imputation av enheter (t.ex. låta SPSS beräkna nya enheter på basis av medeltal). Detta kräver dock viss eftertanke och noggranna kontroller av vilket utfallet blir

Olika former av representativa urval Slumpmässiga urval Icke-slumpmässiga urval

Slumpmässiga urval Ett urval där alla enheter har en lika stor chans att komma med T.ex. vi har en låda med 1000 svarta och vita glaskulor och vill veta hur stor andel kulor som är vita respektive svarta. Om vi slumpmässigt väljer ett tillräckligt stort antal kulor kan vi få en tillförlitlig uppskattning av proportionen vita/svarta kulor i lådan Resultaten från urvalet blir med andra ord statistiskt representativa för populationen. Vi kan alltså lita på att våra resultat, med undantag av en viss accepterad felmarginal, gäller för alla kulor i lådan Ju större stickprov, desto mindre risk för att slumpen resulterar i ett icke-representativt urval

Några vanliga typer av slumpmässiga urval Obundet slumpmässigt urval Alla enheter i en given population har lika stor chans att komma med i stickprovet Stratifierat urval Indelning av populationen i olika strata från vilka ett lika stort antal enheter väljs slumpmässigt Används när man vill säkerställa att vissa grupper har en viss representation i urvalet Klusterurval Används för att dela in en stor population i mindre delar för att inom ett antal delar göra obundna slumpmässiga urval

Icke-slumpmässiga urval Är inte statistiskt representativa, kan dock användas för att påvisa systematiska skillnader mellan olika grupper, t.ex. i medicinska tester Bekvämlighetsurval (de som är lättast att få tag i) Urval genom självselektion (t.ex. söka svarande genom tidningsannons) Kvoturval (man vill ha ett visst antal personer med vissa egenskaper) Subjektivt urval (val enligt eget tycke)

HUR vill vi ta reda på det?

Viktiga frågor angående HUR Vilken datainsamlingsmetod? Vilka frågor ska ställas och hur ska de utformas? Vilka dataanalysmetoder?

När använda enkäter? Då man vänder sig till en större grupp individer (är i regel snabb och billig jämflört med intervju) Då man har relativt klara frågeställningar och fokuserar på ett litet antal intressanta aspekter (man vet m.a.o. vilka detaljer man är intresserad av) Då man vill få kvantifierbara data

När använda intervjuer? Då man vänder sig till en liten grupp individer (mer tidskrävande och dyrare än enkäter) Då man inte på förhand är helt på det klara med vad som är av intresse istället för att binda sig till vissa givna aspekter håller man alla möjligheter öppna. Vad som är relevant bestäms inte på förhand, utan på basis av vad som framkommer av intervjuerna Då man är intresserad av kvalitativa egenskaper och inte i främsta hand är ute efter att mäta eller kvantifiera något

För- och nackdelar med intervju och enkät Intervju: Enkät: Fördelar: Hög svarsprocent Flexibilitet Detaljrikedom (går på djupet) Billig Stora grupper Hög grad av strukturering och standardisering Kvantifierbarhet Nackdelar: Dyra och tidskrävande Små grupper Intervjuareffekten Svårt att kvantifiera Låg svarsprocent Låg grad av flexibilitet Begränsad till endast ett fåtal intressanta aspekter

Kombination av enkät och intervju? Det finns inget som hindrar att man kombinerar enkäter med intervjuer Man kan t.ex. bygga en enkät på inledande intervjuer Man kan även använda sig av mellanformer av dessa två för att kombinera de starka egenskaperna hos bägge (t.ex. intervju med fasta svarsalternativ, t.ex. telefonintervju)

Intervjuer, enkäter och deras mellanformer Intervju med fasta svarsalternativ (t.ex. telefonintervju Intervju med öppna frågor Frågeformulär med fasta svarsalternativ Frågeformulär med öppna svarsalternativ

Frågornas standardisering och strukturering Hög grad av standardisering Hög grad av strukturering Enkät/intervju med fasta svarsalternativ Kvantitativ analys av resultat Låg grad av strukturering Enkät/intervju med öppna frågor Pilotstudier, diagnosticerande enkäter/intervjuer Låg grad av standardisering Fokuserade intervjuer, t.ex. en läkares upptagning av tidigare sjukdomshistoria Samtalsintervjuer, dvs. intervjuer där man önskar göra en kvalitativ analys av resultaten

För- och nackdelar med olika mellanformer Fördelen med intervjuer med fasta svarsalternativ (t.ex. via telefon eller besök) är att man får kvantifierbara data samtidigt som man i regel får en högre svarsprocent Nackdelar: dyrt och tidskrävande Fördelarna med enkäter med öppna frågor är att man når flera personer och att man inte är bunden vid vissa givna svarsformer i oklara situationer (t.ex. då det gäller ett område man inte vet så mycket om på förhand) Nackdelar: ofta låg svarsprocent ( man orkar inte formulera svar... ), svårt att kvantifiera svaren

Frågeformulering Problemställningen dikterar frågornas INNEHÅLL Metodologin dikterar deras UTFORMNING

Vilken variabeltyp och datanivå är det fråga om? Kategoriserade svar med två eller flera kategorier -> alternativ-/kategorifrågor Ska svaren beskriva ett kategoriskt eller kontinuerligt värde som är känt för respondenten, t.ex. ålder, yrke, inkomst -> öppna svarsalternativ eller alternativ- /kategorifrågor Ska svaren beskriva ett kontinuerligt värde, men där man måste förklara för respondenten vad ett givet variabelvärde betyder? -> skalerade frågor/attitydformulär (mäter styrkan eller intensitet i attityder och känslor

Alternativ-/kategorifrågor Vilken är Er utbildning? Vilken är Er ålder? Hur länge har Du jobbat på denna arbetsplats? Grundskola ( ) Yrkesutbildning ( ) Folkskola ( ) Gymnasium ( ) etc. år Under 1 år ( ) 1-5 år ( ) 6-10 år ( ) Över 10 år ( )

Skalerade frågor/attitydfrågor Uttrycks ofta som ett påstående som man ska ta ställning till eller som en direkt fråga De olika svarsmöjligheterna är olika värden på en skala som uttrycker en s.k. semantisk differential Viktigt att man förklarar vad de olika värdena betyder Finns olika sätt att konstruera dessa, t.ex. Guttman, Likert m.fl.

Exempel på skalerad fråga (Likertskalan) 1. Jag får inte tillräcklig information på min arbetsplats Instämmer helt ( ) 1 Instämmer delvis ( ) 2 Tveksam ( ) 3 Tar delvis avstånd ( ) 4 Tar helt avstånd ( ) 5 2. Ledningen lyssnar alltid på mina åsikter Instämmer helt ( ) 1 Instämmer delvis ( ) 2 Tveksam ( ) 3 Tar delvis avstånd ( ) 4 Tar helt avstånd ( ) 5

Några enkla regler för hur man konstruerar enkätfrågor Håll formuläret så kort som möjligt Ta de enklaste frågorna först, de svåraste sist Undvik frågor i början som kan påverka hur man tolkar senare frågor Frågor med liknande svarsalternativ på samma ställe Undvik dubbelfrågor och s.k. ledande frågor Undvik laddade ord och uttryck Avsluta med utrymme för kommentarer Genomför en pilotstudie på en försöksgrupp som så långt det är möjligt motsvarar den avsedda populationen

Summavariabler - skalor Enskilda frågor är i regel behäftade med reliabilitetsproblem, därför vanligt att man använder flera frågor (summavariabel/skala) för att beskriva samma sak Varje fråga innehåller vanligen mätningsfel Dessa mätningsfel kan långt neutraliseras genom att man kombinerar flera frågor (indikatorer) För att veta hur bra de enskilda frågorna mäter det underliggande fenomenet kan man räkna ut en s.k. Cronbach s Alpha-koefficient som fungerar som ett mått på summavariabelns/skalans reliabilitet

Statistisk dataanalys

Vad är statistisk dataanalys? Analys och tolkning av kvantitativa data Används närmast för att testa systematiska samband mellan variabler Utförs ofta med hjälp av hypotestestning (statistisk inferens) Förutsätter ett kvantitativt datamaterial Relativt lätt att använda om man har tillgång till programvaran SPSS

Statistisk dataanalys Vi kan i princip skilja mellan två huvudtyper av statistisk dataanalys Den första huvudtypen är s.k. deskriptiva analyser, där vi vill veta något om en viss variabels fördelning (t.ex. med hjälp av centralmått, spridning, stapeldiagram) Den andra typen är statistiska analyser baserade på statistisk inferens, där vi t.ex. analyserar samband mellan olika variabler eller testar hypoteser om exempelvis skillnader i fördelningar (t.ex. mellan urval/sampel och population eller mellan olika sampel)

Statistisk inferens Handlar om att man drar slutsatser från empiriska data under en osäkerhet orsakad av slumpmässighet i data Det är t.ex. vanligt att man önskar dra slutsatser från ett slumpmässigt urval (sampel) till en viss population Grundförutsättningen är här att urvalet är slumpmässigt och normalfördelat Går t.ex. ut på att vi beräknar olika karakteristika (egenskaper) för urvalet (t.ex. medelvärden) samt anger konfidensintervall (säkerhetsintervall) inom vilka urvalets karakteristika ligger

Hypotestestning Hypotes = antagande om hur något förhåller sig (det vi vill testa statistiskt) Två olika hypoteser används: Forskningshypotes (H 1 ): det påstående vi vill testa (t.ex. pojkar har lättare att lära sig matte än flickor) Nollhypotes (H 0 ): det som gäller ifall forskningshypotesen är falsk Signifikansnivån (p, Sig. ) anger risken för att sambandet är skenbart, slumpmässigt (bör helst vara mindre än 0.05 -> vi kan med 95 % säkerhet anta att resultatet gäller, dvs. inte är slumpmässigt

Några vanliga statistiska test Korrelationstester (r xy, r s och C xy ) Regressionstester (regressionskoefficient) χ 2 -testet av skillnader mellan fördelningar Testning av medelvärdet i ett stickprov (t-test) Testning av skillnaden mellan två fördelningars medelvärden (t-test)

Exempel: korrelations- och regressionstest Forskningshypotes: personer med hög grad av upplevd medbestämmanderätt tenderar uppleva en högre grad av arbetstrivsel (på ett sätt som inte kan förklaras pga. slumpen) Vi genomför med SPSS ett korrelationstest samt ett regressionstest där vi testar hur våra variabler samt andra eventuella mellanliggande variabler förhåller sig till varandra

Korrelationstest med Pearsons korrelationskoefficient Signifikanstest (pvärde); anger risken för att vi ska tro att sambandet finns när det egentligen inte finns Pearsons korrelationskoefficient Arbet striv sel Grad av upplev d medbes tämmande Correl ati ons Pears on Correlation Sig. (2-t ailed) N Pears on Correlation Sig. (2-t ailed) N Grad av upplev d medbes tä Arbet striv sel mmande 1,709**,000 136 136,709** 1,000 **. Correlation is signif icant at the 0.01 lev el (2-tailed). 136 136

Tolkning Det finns ett ganska starkt och positivt samband mellan arbetstrivsel och medbestämmande Detta samband är statistiskt signifikant (p > 0.05) =>Vi kan alltså anta forskningshypotesen Men finns det även andra faktorer som kan tänkas spela roll här och hur påverkar dessa i så fall detta samband? Vi beaktar därför även en rad andra tänkbart intressanta faktorer, dvs. tillfredsställelse med lön, uppskattning från närmaste förman samt uppskattning från arbetsgruppen

Pearson s Korrelations -koefficient Correlati ons Signifikansnivå (pvärde) Nöjd med egen lön Arbet striv sel Uppsk.av närmast e f örman Pears on Correlation Sig. (2-t ailed) N Pears on Correlation Sig. (2-t ailed) N Pears on Correlation Sig. (2-t ailed) N Grad av Uppsk.av upplev d Uppsk.av Nöjd med närmaste medbes tä arbets gru egen lön Arbet striv sel f örman mmande ppen 1,525**,388**,554**,308**,000,000,000,000 136 136 136 136 136,525** 1,674**,709**,303**,000,000,000,000 136 136 136 136 136,388**,674** 1,593**,428**,000,000,000,000 136 136 136 136 136 Grad av upplev d medbes tämmande Uppsk.av arbet sgruppen Pears on Correlation Sig. (2-t ailed) N Pears on Correlation Sig. (2-t ailed) N **. Correlation is signif icant at the 0.01 lev el (2-tailed).,554**,709**,593** 1,294**,000,000,000,001 136 136 136 136 136,308**,303**,428**,294** 1,000,000,000,001 136 136 136 136 136

Tolkningar Det föreligger ett stark och signifikant samband mellan arbetstrivsel och medbestämmande men även en rad andra faktorer påverkar arbetstrivseln -> verkar som om det undersökta sambandet inte är entydigt som vi trodde, utan att det finns en rad mellanliggande faktorer som påverkar hur medbestämmande påverkar arbetstrivseln Vi vill därför kolla hur medbestämmande påverkar arbetstrivsel när man kontrollerat för dessa andra variabler Detta kan göras på olika sätt, vi väljer dock att genomföra en multipel regressionsanalys

Multipelt regressionstest Model Summary Förklaringsgrad Model 1 a. Model 1 Adjust ed Std. Error of R R Square R Square the Estimate,787 a,619,608,598 Predictors: (Constant), Uppsk.av arbetsgruppen, Grad av upplev d medbestämmande, Nöjd med egen lön, Uppsk.av närmast e f örman Intercept (konstant) (Constant) Grad av upplev d medbes tämmande Nöjd med egen lön Uppsk.av närmast e f örman Uppsk.av arbetsgruppen a. Dependent Variable: Arbets triv sel Coefficients a Uns tandardized Coef f icients Standardized Coef f icients Regressionskoefficienter B Std. Error Beta t Sig.,466,217 2, 154,033,372,070,397 5, 328,000,153,061,164 2, 483,014,358,065,388 5, 466,000 -, 029,059 -, 030 -, 491,624 Signifikansnivåer Standardfel

Tolkning Vi finner det starkaste sambandet mellan medbestämmande och arbetstrivsel (regressionskoefficienten =.397) Vi kan även konstatera att vår modell förmår förklara en relativt stor andel (ca. 60 %) av den totala variationen i arbetstrivsel (r 2 =.608) med ett acceptabelt standardfel (.598) Även tillfredsställelse med lönen (.164) och uppskattning av närmaste förman (.388) har en viktig betydelse för den upplevda arbetstrivseln Däremot försvinner sambandet mellan uppskattning av arbetsgruppen och arbetstrivsel när man kontrollerar för de andra variablerna

Sammanfattning Kvantitativa, statistiska data och metoder är bra på många sätt, bland annat för att de oftast ger mycket reliabel information om många analysenheter På basis av denna information är det möjligt att göra olika statistiska analyser av kausalsamband Nackdelarna hänger närmast samman med att vi här har att göra med en hög grad av reduktionism, dvs. det att vi använder enskilda variabler för att mäta komplicerade fenomen, kan ibland göra validiteten lidande