SOPA62 - Kunskapsproduktion i socialt arbete 1. Beskrivande statistik och lite hypotesprövning 1 Kvantitativ vs Kvalitativ metod Kvantitativt: Man definierar precisa begrepp och ställer därefter frågor (eller observerar) i anslutning till det väldefinierade. Ofta ganska stora studier; kanske 50 till 500 undersökta. Kvalitativt: Man ställer öppnare frågor: Om jag säger våld, vad tänker du då på i förhållande till din arbetsplats? Ibland väldigt få intervjuade; kanske färre än tio. 2 1
Sekundärdata Man använder data som andra samlat in, kanske för helt andra syften än vad jag har med min studie. Sammanställningar: Statistikansvariga myndigheter Statistiska Centralbyrån, SCB (www.scb.se) Socialstyrelsen (www.sos.se) Riksförsäkringsverket (www.rfv.se) Brottsförebyggande rådet (www.bra.se) och ytterligare 20 andra. Databaser: bland annat SCB och SSD Statistiska Centralbyrån, SCB (www.scb.se). Databaser med t.ex. Antal bidragsmånader för män/kvinnor 25-34 år i Landskrona kommun 2006 Svensk Samhällsvetenskaplig Datatjänst (www.ssd.gu.se). Här finns en mängd datamaterial man efter ansökan kan få tillgång till för forskningsändamål, t.ex. ValU, SOM och enskilda undersökningar. 3 Statistisk modellering 4 2
Statistisk slutledning Population Stickprov Inferens eller slutledning: Att från stickprovsdata kunna dra slutsatser om hela populationen. 5 Grundbegrepp Population: den grupp individer vi vill skaffa oss kunskap om alla 10-åringar i Sverige alla familjer/hushåll i kommunen med en frånskild förälder alla arbetslag med den här typen av arbetsuppgifter Individ: undersökningsenhet person familj/hushåll arbetslag Variabel: egenskap som mäts hos individerna och dessa egenskaper kan mätas på olika nivåer 6 3
Datanivåer, skaltyper Nominalskala anger endast kategori eller grupptillhörighet (ex. kön, utbildning) Ordinalskala ( ordnade kategorier ) möjligt att rangordna värden (ex. symptom: inga, små, måttliga, svåra) Intervallskala Kvotskala riktiga numeriska mätvärden (ex. ålder, inkomst) och datanivån avgör vilken analysmetod som kan användas 7 Case: Tioåringars kompetens och levnadsförhållanden Vi vill belysa barns sätt att uppfatta sig själva, förhålla sig till andra och handskas med sin vardag. Samtidigt vill vi relatera barnens eget perspektiv till lärarnas och föräldrarnas perspektiv och uppmärksamma skillnader mellan pojkar och flickor. Slutligen vill vi lyfta fram social kompetens som ett centralt begrepp. 8 4
Gresham & Elliot Består av 34 påståenden med svarsalternativen aldrig (1), ibland (2), ofta (3) eller mycket ofta (4). Exempel: Jag frågar först innan jag lånar saker. Jag håller ordning i min skolbänk. Jag gör läxorna i tid. Innehåller delskalorna samarbete, självhävdelse, självkontroll och empati som vägs ihop till en totalpoäng. Lärarskalan och föräldraskalan innehåller färre påståenden och alltså lägre totalpoäng. 9 SPSS Data Editor Kolumn = variabel, egenskap Rad = individ, observation 10 5
Genomsnitt och spridning genomsnittsmått medelvärde (mean, average) median (median) typvärde (mode) spridningsmått standardavvikelse (standard deviation) kvartiler (quartiles) variationsområde (range) 11 Medelvärde och standardavvikelse Descriptive Statistics Gresham - Sociala färdigheter totalt (barn) Gresham - Sociala färdigheter totalt (lärare) Gresham - Sociala färdigheter totalt (förälder) Valid N (listwise) N Minimum Maximum Mean 245 75 126 100,64 10,298 255 44 112 83,44 14,617 211 34 67 47,91 6,067 200 Std. Deviation och vad innebär detta? 12 6
Vad betyder värdena? Aritmetiska medelvärdet Medelvärdet är materialets tyngdpunkt Standardavvikelsen normalfördelningsregeln säger att av alla observationer finns cirka 68 % inom en standardavvikelse från medelvärdet cirka 95 % inom två standardavvikelser från medelvärdet normalgränser s 13 Gissa! Vad är medelålder och standardavvikelse för personerna i den här undersökningen? 14 7
KASAM / SOC KASAM = känsla av sammanhang / SOC = Sence of Coherence (Uppgifterna hämtade ur Salutogenes, KASAM och socionomer, Jan Gassne, Lund Dissertation in Social Work 30, 2008.) n Medelvärde Standardavvikelse Studenter 388 140 20 Socialarbetare 119 155 15 a) Ungefär hur ser ett histogram för studenternas värden ut? b) Hur stor andel av studenterna har ett värde över/under 140? c) Hur stor andel av socialarbetarna har ett värde över/under 140? 15 Median och kvartiler Medianen ( var är mittgubben? ) Medianen (md) delar materialet i två delar, den hälft med lägst värden och den hälft med högst värden. Kvartilerna Kvartilerna delar materialet i fjärdedelar. (det finns även deciler, percentiler, ) 16 8
Median och kvartiler Statistics Gresham - totalt (barn) Gresham - totalt (lärare) Gresham - totalt (förälder) Kön Pojke Flicka Pojke Flicka Pojke Flicka N Valid Percentiles Minimum Maximum 25 50 75 130 80 126 93.00 99.00 105.00 115 75 125 93.00 102.00 110.00 135 44 110 67.00 79.00 89.00 120 57 112 80.00 90.00 97.75 111 34 63 43.00 47.00 52.00 100 35 67 45.00 49.00 52.00 och vad betyder det här då? 17 Box-and-whiskers plot Gresham-score uppdelat på kön Flickor Pojkar 70 80 90 100 110 120 130 140 18 9
Analysvariabel eller förklarande variabel Variablerna (frågorna) kan ofta delas upp i två delar beroende på vad de ska användas till Analysvariabler (responsvariabler, beroende variabler). Förklarande variabler (bakgrundsvariabler, förklarande var.) Och sedan försöker man med statistiska metoder avgöra om resultatet på analysvariabeln beror på individernas värde på den förklarande variabeln. 19 Kan stickprovsresultatet generaliseras? Hypotesprövning! Filosofin bakom hypotesprövning För att testa en (noll-) hypotes H o mot ett alternativ H 1, tar man ett stickprov om n observationer, beräknar medelvärde eller procenttal och sen försöker man bedöma om de data man fått i stickprovet är osannolika/sannolika under förutsättning att H o är korrekt! 20 10
Språklådan SAOL, trettonde upplagan, 2006 signifikant, adj.; betecknande, betydelsefull (statistiskt) säkerställd, inte slumpmässig 21 Hypotesprövning stickprovet Exempel (Tioåringarna): Vi vill testa om det är en jämn könsfördelning i den bakomliggande populationen. Kön Valid Pojke Flicka Total Frequency Percent 137 52.9 122 47.1 259 100.0 22 11
Hypotesprövning hypoteser Formulering av hypoteser H 0 : Jämn könsfördelning ( Fifty-fifty ) H 1 : Ej jämn könsfördelning Test av frekvenser/procenttal görs med 2 -test 23 Hypotesprövning testfunktion Val av testfunktion 2 O E E 2 Där O = Observerat antal och E = förväntat (Expected) antal om nollhypotesen är korrekt. Fråga: Vad förväntar vi oss om det är exakt jämn könsfördelning i den populationen som stickprovet tagits ur? Hur många av de 259 barnen ska vara pojkar respektive flickor? 24 12
Hypotesprövning testresultat Kön Pojke Flicka Total Observed N Expected N Residual 137 129.5 7.5 122 129.5-7.5 259 Test Statistics Chi-Square a df Asymp. Sig. Kön.869 1.351 a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 129.5. 0 0,869 25 Hypotesprövning beslutsregel När ska man acceptera respektive förkasta H 0? Eftersom sannolikheten 0,351 = 35 % inte är liten kan vi inte utesluta att det vi fått är en slumpmässigt avvikelse. H 0 kan ej förkastas ( accepteras ) Beslutsregel: Förkasta H 0 om testets p-värde är mindre än 5 % 5 % = = Testets signifikansnivå p-värde = sannolikheten för det observerade värdet på testfunktionen (eller ett ännu mer extremt) givet att H 0 är sann 26 13
Hypotesprövning verbal tolkning Det är ganska troligt att få fördelningen 137 pojkar och 122 flickor om man slumpmässigt drar 259 barn från en population med jämn könsfördelning. Slutsats Vi kan inte påvisa någon avvikelse från jämn könsfördelning. Den skillnad vi fått är att betrakta som slumpmässig. 27 Hypotesprövning förutsättningar 2 -test - egenskaper Kräver endast nominaldata Kräver att stickprovet inte är litet; förväntade frekvenser större än 5 Enkelt att generalisera till större tabeller 28 14
Hypotesprövning korstabell 2 -testet kan även användas för att jämföra procenttal i två populationer, dvs i en korstabell. Exempel: Hur klarar barnen skolarbetet? Finns det någon skillnad mellan pojkar och flickor? Kön * Hur klarar barnet skolarbetet Crosstabulation Kön Total Pojke Flicka Count % within Kön Count % within Kön Count % within Kön Hur klarar barnet skolarbetet Medel/under medel Över medel Total 61 48 109 56.0% 44.0% 100.0% 46 54 100 46.0% 54.0% 100.0% 107 102 209 51.2% 48.8% 100.0% 29 Hypotesprövning korstabell Formulering av hypoteser H 0 : Ingen skillnad mellan pojkar och flickor H 1 : Skillnad mellan pojkar och flickor Förväntade frekvenser Om nollhypotesen är sann är det lika stor andel som är över medel i båda grupperna. En rimlig uppskattning av denna andel är 48,8 % (102/209) 30 15
Hypotesprövning korstabell Förväntade frekvenser Kön * Hur klarar barnet skolarbetet Crosstabulation Kön Total Pojke Flicka Count Expected Count % within Kön Count Expected Count % within Kön Count Expected Count % within Kön Hur klarar barnet skolarbetet Medel/under medel Över medel Total 61 48 109 55.8 53.2 109.0 56.0% 44.0% 100.0% 46 54 100 51.2 48.8 100.0 46.0% 54.0% 100.0% 107 102 209 107.0 102.0 209.0 51.2% 48.8% 100.0% 31 Hypotesprövning korstabell Resultat från SPSS: Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Chi-Square Tests Asymp. Sig. Value df (2-sided) 2.072 b 1.150 1.692 1.193 2.075 1.150 2.062 1.151 209 a. Computed only for a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided).167.097 b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 48. 80. Slutsats: Vi kan 32 16