Differential Item Functioning i matematik med fokus på kön.

Relevanta dokument
Flickor, pojkar och matematik. En DIF-studie av TIMSS-resultaten bland svenska 13-åringar

Högpresterande gymnasieelever i TIMSS. Svenska gymnasieelevers prestation i matematik och fysik i ett internationellt perspektiv

TIMSS 2015 frisläppta uppgifter. Uppgifter i matematik, årskurs 4 och 8

På vilka sätt kan mönster vara en ingång till att utveckla förmågan att uttrycka och argumentera för generaliseringar algebraiskt?

Är svenska elever dåliga i algebra och geometri?

Forskarutbildningen i Beteendevetenskapliga

Publikationer inom VALUTA-projektet

Prestationsskillnader mellan flickor och pojkar i NO

6 Selektionsmekanismernas betydelse för gruppskillnader på Högskoleprovet

Rätt eller fel? Ett försök med ett nytt verbalt prov för högskoleprovet. Kerstin Andersson

ASSESSMENT AND REMEDIATION FOR CHILDREN WITH SPECIAL EDUCATIONAL NEEDS:

Vad säger forskningen om programmering som kunskapsinnehåll? Karin Stolpe, föreståndare NATDID liu.se/natdid

Könsskillnader i skolresultat NATIONELL STATISTIK I URVAL. Könsskillnader i skolresultat 1

Matematiksatsning Stödinsatser. Matematiksatsning Stödinsatser. Bakgrund OECD. Undersökningar på olika nivåer. Vad kan observeras

Matematikpolicy Västra skolområdet i Linköping

DIAMANT. NaTionella DIAgnoser i MAtematik. En diagnosbank i matematik för skolåren före årskurs 6.

Second handbook of research on mathematics teaching and learning (NCTM)

Goals for third cycle studies according to the Higher Education Ordinance of Sweden (Sw. "Högskoleförordningen")

Kristina Säfsten. Kristina Säfsten JTH

Resultatnivån i de svenskspråkiga skolorna i Finland. Heidi Harju-Luukkainen Kari Nissinen Sofia Stolt Jouni Vettenranta

x 2 2(x + 2), f(x) = by utilizing the guidance given by asymptotes and stationary points. γ : 8xy x 2 y 3 = 12 x + 3

BILDER AV SKOLAN. - Vad är det som driver kunskapsbildningen? - Hur ser bilden av framtidens skola ut? Mikael Alexandersson

Hur kan forskningen bidra till utvecklingen av matematikundervisningen?

Programmering på vetenskaplig grund? Några forskningsresultat. Karin Stolpe, föreståndare NATDID liu.se/natdid

Terminsplanering årskurs 6 Matematik Ärentunaskolan

Figur 1: Påverkan som processer. Vad tycker elever om matematik och matematikundervisning?

Förslag den 25 september Matematik

State Examinations Commission

7.5 Experiment with a single factor having more than two levels

Under det senaste året har Nämnarens

Vilka typer av matematiska resonemang (ut)värderas i skolmatematiken?

Supplemental Instruction (SI) - An effective tool to increase student success in your course

Arbetsplatsträff 8 mars 2011

Provbetyg E Provbetyg D Provbetyg C Provbetyg B Provbetyg A. Totalpoäng Minst 37 poäng Minst 59 poäng Minst 77 poäng Minst 95 poäng Minst 106 poäng

måndag, 2010 oktober 11

Kursplan. FÖ3032 Redovisning och styrning av internationellt verksamma företag. 15 högskolepoäng, Avancerad nivå 1

Learning study elevers lärande i fokus

Kursplan. AB1029 Introduktion till Professionell kommunikation - mer än bara samtal. 7,5 högskolepoäng, Grundnivå 1

UPPGIFTSRAPPORT TILL RAPPORT Matematikuppgifter i TIMSS 2003

Matematik på lågstadiet genom algebra och problemlösning. Ämnesdidaktiskt utvecklingsarbete

En snabbguide för att söka forskningsartiklar i utbildningsvetenskap

Del ur Lgr 11: kursplan i matematik i grundskolan

Ibland när resultatet av TIMSS diskuteras kan man få höra att svenska elever

PISA (Programme for International

Begåvning, utbildningsval och utbildningsresultat

Mona Røsseland Författare till Pixel. Vad innebär den nya läroplanen? Hur möter ni den nya utmaningen med Pixel

Sammanfattning. Rapportens syfte

EVALUATION OF ADVANCED BIOSTATISTICS COURSE, part I

Kursplan. MD1052 Matematik I med didaktisk inriktning. 30 högskolepoäng, Grundnivå 1. Mathematics for Secondary School Teachers Years 7-9

Sy$e. Möjliga innebörder i förmågan a5 föra och följa algebraiska resonemang undersöka förmågan att kunna föra algebraiska resonemang

TIMSS 2008 Advanced Skolsamordnarträff

Tentamen i matematisk statistik

Lokal pedagogisk planering

Förskolan framgångsfaktor enligt OECD

SEMINARIUM OM TIMSS OCH PISA PETER NYSTRÖM

Stiftelsen Allmänna Barnhuset KARLSTADS UNIVERSITET

Resultat från kursprovet i matematik 1a, 1b och 1c våren 2014 Karin Rösmer, Katarina Kristiansson och Niklas Thörn PRIM-gruppen

Bridging the gap - state-of-the-art testing research, Explanea, and why you should care

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Centralt innehåll. I årskurs 1.3

Resultaten av ämnesproven för årskurs 9 år 2005

LNM110, Matematik i barnens värld 30 högskolepoäng

Hur läser år 8-eleverna i Stockholm?

ESN lokala kursplan Lgr11 Ämne: Matematik

MATEMATIK 3.5 MATEMATIK

Resultat från kursprovet i matematik 1a och 1b vårterminen 2015 Karin Rösmer, Katarina Kristiansson och Niklas Thörn PRIM-gruppen

Resultat från Skolenkäten hösten 2018

OBS! Vi har nya rutiner.

Att stödja starka elever genom kreativ matte.

Följande resultat erhålls (enhet: 1000psi):

utvärderingsavdelningen Dnr 2014: (40)

Läsförståelsen har försämrats, men hur är det med ordavkodningen?

Den framtida redovisningstillsynen

Högskoleprovet våren och hösten 2014

Dnr. U2008/5466/SAM

Promemoria U2015/06066/S. Utbildningsdepartementet. Vissa timplanefrågor

Att använda den didaktiska modellen organiserande syften för att planera och analysera naturvetenskaplig undervisning

Det finns flera aspekter av subtraktion som lärare bör ha kunskap om, en

Lokal pedagogisk planering i matematik för årskurs 9

PEC: European Science Teacher: Scientific Knowledge, Linguistic Skills and Digital Media

Undervisning och lärande i lab-salen

MATEMATIK 5.5 MATEMATIK

1. INLEDNING. I avsnitt 5 beskrivs resultatvariablerna procent rätt, nationell rashpoäng och internationell rashpoäng samt deras användningsområden.

Lgr 11 matriser i Favorit matematik 4 6

Vad säger forskningen om antagning och urval till högre utbildning

Semantic and Physical Modeling and Simulation of Multi-Domain Energy Systems: Gas Turbines and Electrical Power Networks

1. Compute the following matrix: (2 p) 2. Compute the determinant of the following matrix: (2 p)

Att skriva en matematisk uppsats

Kursplan. NA3009 Ekonomi och ledarskap. 7,5 högskolepoäng, Avancerad nivå 1. Economics of Leadership

HÖGSKOLEPROVET HÖSTEN Provdeltagargruppens sammansättning och resultat

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Tillfällen att utveckla fördjupad förståelse en bristvara?

Designförändringar mellan PISA 2012 och PISA 2015 en metodstudie

Anställningsprofil för universitetslektor i matematikämnets didaktik

bedömning Per Berggren och Maria Lindroth

Kurser för utbildning på forskarnivå sammanställning Courses at third-cycle level/phd Courses overview Obligatoriska kurser/obligatory Courses

Skolverkets rapport nr 168 Högskoleverkets rapportserie 1999:7 R

Upprepade mönster (fortsättning från del 1)

Kursplanen i matematik grundskolan

: 2( 34# 4 : 4 34# : 4 5# : 4 5# : (

Transkript:

Differential Item Functioning i matematik med fokus på kön. En studie av TIMSS resultaten bland elever på NT-linje och NV program i gymnasieskolans sista årskurs. Anita Wester Christina Jonsson

Abstract The instruments and results making up the basis for this study are taken from TIMSS, the Third International Mathematics and Science Study, which was carried out in 1995. This study analyzes the results of students in their final year of secondary school (in Sweden this is students at the N- or T-track or NVprogram) having taken advanced mathematics courses. The purpose of the study has been to examine differential item functioning in mathematics with focus on gender. The results show that, it is difficult, if not impossible, to predict the presence or direction of DIF in any individual item. Looking at the category level (instead of individual items) one might predict a higher frequency of items with positive DIF (favoring females) among routine procedure items, and a higher frequency of negative DIF items (favoring males) among problemsolving items. Numbers, equations & functions items as well as calculus items give more often positive DIF while statistics items more often are flagged as negatively DIF. The need for further research on this topic is obvious.

INLEDNING Vid utvärdering av matematikkunskaper hos elever har könsskillnader i prestation, bland andra faktorer, varit föremål för många forskningsinsatser. Prestationsskillnaderna har studerats med olika utgångspunkter och olika förutsättningar. Till exempel har elevernas ålder varierat avsevärt, uppgiftsformatet (flervalsuppgifter- öppna uppgifter) har varierat och olika metoder för att fastställa skillnader i prestation mellan flickor och pojkar har använts, bland annat lösningsfrekvenser och DIF (Differential Item Functioning, definition, se nedan). I det senare fallet har olika modeller tillämpats. Bakgrund I de studier som nedan presenteras har, om inget annat anges, skillnad i prestation mellan pojkar och flickor definierats utifrån skillnader i lösningsfrekvens. I en omfattande undersökning av Willingham & Cole (1997), konstateras att i yngre åldrar tenderar flickor att prestera bättre än pojkar på prov som betonar numerisk räkning och rutinkunskaper. Högre upp i åldrarna presterar män bättre än kvinnor på mer avancerade prov som betonar problemlösning och resonemang. Beller & Gafni (1995) har studerat könsskillnader i prestation i matematik och naturvetenskap med på IAEP (International Assessment of Educational Progress) från 1991. De åldersgrupper som studerats är 9- och 13-åringar och studien har en komparativ inriktning med 20 deltagande länder. Resultaten visar att könsskillnaderna i matematikprestation generellt var mycket små bland 9- åringarna. I gruppen 13-åringar kunde en viss skillnad skönjas, såtillvida att pojkar presterade bättre än flickor i matematik. Detta gäller dels för matematikprestationen i sin helhet och dels för innehållskategorierna taluppfattning, geometri, statistik & sannolikhetslära, algebra & funktionslära liksom för de tre kognitiva nivåerna begreppsförståelse, kunskap om lösningsprocedurer, problemlösning. I sin summering av resultaten från ETS Gender Study konstaterar Cole (1997) bland annat att könsskillnader i prestation förändrades över tid. Könsskillnaderna var mycket små i årskurs 4, men pojkarna förbättrade sig något mer än flickorna vad gäller matematiska begrepp från årskurs 8 till årskurs 12. Data från SIMS (the Second International Mathematics Study) har använts av Ethington (1990) för att studera könsskillnader i prestation i matematik i ett internationellt perspektiv. Den metod som användes var variansanalys. Åtta länder ingick i studien och de innehållskategorier som studerades var bråk, proportionalitet/procent, algebra, geometri och mätning. Resultaten visade inga 1

påtagliga könsskillnader i prestation i någon av de undersökta innehållskategorierna. De små skillnader som kunde urskiljas gick oftare i flickornas favör än i pojkarnas. Hyde, Fennema & Lamon (1990) studerade med hjälp av meta-analys 1 prestationsskillnader i matematik mellan flickor och pojkar. Analysen omfattade 100 olika studier och den visade att det genomsnittliga resultatet (d) för samtliga stickprov sammantagna var att de kvinnliga studerande presterande marginellt bättre än de manliga (d = -.05). Uppdelat på kategori visar resultatet att kvinnor presterade bättre än män i numerisk räkning, medan männen hade något högre resultat i komplex problemlösning. Beträffande förståelsen av matematiska begrepp var skillnaden obetydlig till kvinnornas fördel. En undersökning av ålderstrender inom ramen för samma studie (Hyde et al, 1990) indikerade att flickor var något bättre i numerisk räkning under grundskolan. Det förelåg inga prestationsskillnader i problemlösning under grundskoletiden; skillnaderna till männens fördel framträdde under gymnasietiden och ökade ytterligare i college. Prestationsskillnaderna mellan män och kvinnor var minst, och till kvinnornas fördel, i stickprov som var generella (dvs ej selekterade). Ju mer selekterade stickproven var desto större blev prestationsskillnaden till männens fördel. Prestationsskillnadens storlek har dock minskat över åren om man jämför studier som presenterats 1973 eller tidigare med undersökningar som publicerats 1974 eller senare. Hyde et al (1990) drar slutsatsen att prestationsskillnader mellan könen i matematik är små i dagsläget, men det faktum att kvinnor presterar sämre än män i problemlösning i gymnasieskolan måste uppmärksammas. I en nyligen genomförd longitudinell studie över tre år har Fennema et al (1998) undersökt skillnader mellan pojkars och flickors prestation i matematik i årskurserna 1-3. I undersökningen deltog 38 flickor och 44 pojkar som intervjuades 5 gånger och ombads att lösa uppgifter av följande slag: Talförståelse, additionand subtraktionsproblem, icke-rutin-problem samt mer omfattande problem. 1 Meta-analys definieras av Educational Testing Service (1992) på följande sätt: Metaanalysis is a way of providing a quantitative review of the literature. With metaanalysis, the researcher collects all the relevant studies, just as he or she would for any review of the literature, and computes a measure of the size of the effect in each sample. One measure of effect size (d) is: Mb Mg d = SD The effect size is the mean for boys minus the mean for girls divided by a standard deviation, which in most cases is a pooled within-group standard deviation. (p 58). För en detaljerad beskrivning av meta-analys och olika metoder att genomföra meta-analys, se Hunter & Schmidt (1990). 2

Man fann inga skillnader i prestation, utom för kategorin omfattande problem (extension problems), där pojkar presterade bättre än flickor. Däremot fann man under hela 3-årsperioden starka och konsistenta skillnader mellan pojkars och flickors val av strategi för att lösa uppgifterna. Flickorna använde mer konkreta strategier, som t ex modellering och aritmetik, medan pojkarna i större utsträckning använde sig av abstrakta strategier som reflekterade begreppsförståelse. I årskurs 3 fann man vidare att pojkarna i högre grad använde egna algoritmer, som byggde på begreppsförståelse, medan flickorna oftast använde standardalgoritmer, som byggde på konkret modellering eller aritmetik. Försök att förklara dessa skillnader mellan flickor och pojkar i val av strategi har gjorts av exempelvis Sowder (1998). Hon är matematik-didaktiker och menar att resultaten indikerar viktiga skillnader i inlärning, och att flickornas tendens att använda mera konkreta strategier kan medföra sämre förståelse av viktiga grunder/teorier som är en förutsättning för vidare matematikinlärning. Detta kan i sin tur förklara att könsskillnader i prestation ökar ju högre upp i skolsystemet man kommer. Hyde & Jaffe (1998), feministiska socialpsykologer, anser att skillnaderna beror på att flickor och pojkar behandlas olika i klassrummet och att de uppmuntras att lösa problem på olika sätt. Differential Item Functioning En beskrivning av könsskillnader utifrån skillnader i uppgiftens lösningsfrekvens kan dock i vissa situationer ge en felaktig bild av de faktiska prestationsskillnader som föreligger. En analysmetod som går längre än att bara jämföra lösningsfrekvenser vid studiet av prestationsskillnader i t ex matematik är Differential Item Functioning (DIF). Denna typ av undersökning har på senare tid vunnit alltmera terräng och betraktas numera som det kanske mest fruktbara sättet att studera könsskillnader i prestation. Differential Item Functioning innebär att man konstanthåller prestationen vid gruppjämförelser av p-värden för varje enskild uppgift. För att ge insikt i förfaringssättet refereras den definition som Angoff (1993) gav av DIF: Finally, the expression differential item functioning (DIF) came into use, referring to the simple observation that an item displays different statistical properties in different group settings (after controlling for differences in the abilities of groups).... (p 4). In en undersökning av Berberoglu (1995) studerades förekomsten av DIF in inträdesprövningarna i matematik till universitet i Turkiet (University Entrance Examinations). Testet består av 32 flervalsuppgifter, av vilka 19 mäter förmåga i numerisk räkning, 5 är uppgifter med kontext och mäter begrepp och principer 3

i geometri. Resultaten visade att beräkningsuppgifter gynnade manliga studenter, medan uppgifter med kontext och geometri gynnade kvinnliga studerande. Detta indikerar, enligt författaren, att kvinnor är bättre på uppgifter som mäter verbal och spatial förmåga, medan män är bättre på beräkningsuppgifter. Resultatet går emot många av de studier som presenterats i litteraturen. Lane, Wang & Magone (1996) har undersökt DIF (med hjälp av LDFA, som utläses Logistic Discriminant Function Analysis) med fokus på kön bland elever i årskurs 6 och 7 med hjälp av QCAI (QUASAR Cognitive Assessment Instrument) som innehåller öppna uppgifter i matematik (se också Wang & Lane, 1996). De fann att av de 36 uppgifterna befanns två gynna pojkar medan fyra gynnade flickor. De två som var DIF till pojkarnas fördel handlade om geometri samt kvoter/proportioner, medan de som gynnade flickor fanns i kategorierna taluppfattning, överslagsberäkning, mönster och proportionalitet. Det totala antalet uppgifter i varje innehållskategori av artikeln framgår dock inte av artikeln, vilket begränsar värdet av den, eftersom det ju inte är antalet uppgifter med DIF per se utan snarast andelen DIF-uppgifter som är intressant. Förekomst av DIF på öppna uppgifter har också undersökts av Lawrence, Lyu & Feigenbaum (1995), som genomförde sin undersökning på basis av uppgifter i SAT I. Resultatet visar att förekomsten av DIF på de öppna uppgifterna är marginell och resultaten liknar de som erhållits vid DIF-studier av flervalsuppgifter i SAT. En granskning av uppgifternas diskrimination (i form av biserial korrelation (r bis ) mellan uppgiften och den totala testpoängen) i relation till förekomst av DIF visade att uppgifter med hög diskrimination (r bis >.60) uppvisade kraftigare DIF i såväl negativ (gynnar män) som positiv riktning (gynnar kvinnor). Uppgifter med lägre grad av diskriminering (r bis <.60) uppvisade endast positiv DIF. Kulick & Hu (1989) har undersökt uppgifternas svårighetsgrad i relation till DIF på flervalsuppgifter i SAT, verbal och matematisk del. De fann inget samband mellan uppgiftens svårighetsgrad och DIF med fokus på kön, vare sig på den verbala eller matematiska delen av provet. Vid Educational Testing Service (ETS) genomförde Carlton & Harris (1992) en undersökning med syfte att utröna om vissa karakteristika hos prov eller flervalsuppgifter är associerade med DIF. De fann att manliga studerande presterade relativt sett bättre än kvinnliga på uppgifter i geometri/aritmetik, medan kvinnliga studerande presterade relativt sett bättre på uppgifter i aritmetik/algebra och blandade uppgifter. Vidare konstaterar man att män presterade relativt sett bättre på uppgifter innehållande figurer, diagram eller tabeller, medan det omvända gällde för uppgifter utan grafer. 4

Det mest anmärkningsvärda resultatet är dock, enligt Harris och Carlton (1993), att kvinnliga studerande presterade relativt sett bättre än manliga på abstrakta uppgifter samt på uppgifter som innehöll variabler, som X eller a medan männen hade ett högre resultat, relativt sett, på uppgifter som var hämtade från verkligheten (se också Ramstedt, 1996). Detta resultat kan antyda att manliga studerande oftare än kvinnliga använder matematik i vardagen (Harris & Carlton, 1993). Sammanfattningsvis konstateras att manliga och kvinnliga studerande som uppnår samma totalpoäng uppvisar långtifrån samma svarsmönster. Sammanfattningsvis kan konstateras att forskningen om könsskillnader i prestation i matematik har genomförts från en rad skilda utgångspunkter och med olika metoder. Resultatbilden är heller inte entydig och det är svårt att peka ut några tendenser eller trender i materialet. SYFTE Syftet med denna studie har varit att undersöka förekomsten av DIF, med fokus på kön, hos uppgifter i matematik. Följande frågeställningar har studerats: 1. Är förekomsten av uppgifter med DIF till förmån för pojkar respektive flickor densamma i olika innehållskategorier i matematik? 2. Är förekomsten av uppgifter med DIF till förmån för pojkar respektive flickor densamma på olika svårighetsnivåer? 3. Är förekomsten av uppgifter med DIF till förmån för pojkar respektive flickor densamma för uppgifter som kräver olika kognitiva funktioner (processer) eller förmåga? 4. Finns det någon relation mellan förekomst av DIF och uppgifternas diskriminationsförmåga? METOD Material och genomförande De data som utgör underlag för denna studie är hämtade från TIMSS som administrerades till tre stickprov av elever i gymnasieskolans avgångsklasser under våren 1995. I föreliggande studie fokuseras resultaten för elever på NT-linje och/eller NV-program i gymnasieskolans avgångsklasser. För ytterligare beskrivning av studien och dess resultat, se Skolverket (1996 & 1998). Analyserna har genomförts med hjälp av ConQuest Programme för DIF-studier som baseras på Rasch 1-parametermodell. Metoden beskrivs av Wu, Adams, & Wilson (1997) på följande sätt: Within the context of Rasch modelling an item is deemed to exhibit differential item functioning (DIF) if the response probabilities for that item cannot be fully explained by the ability of the student and a fixed set of difficulty pa- 5

rameters for that item. Through the use of its multi-faceted modelling capabilities, and more particularly its ability to model interactions between facets, ConQuest provides a powerful set of tools for examining DIF (s 77). IRT baserade modeller 2 kräver normalt stickprov på mellan 200-1000 individer, beroende på modell, för att fungera optimalt (se också Suen, 1990). I denna studie ligger stickprovsstorleken relativt lågt (se också under rubriken Deltagare) och dessutom är samplingsförfarandet sådant att vi ej har obundet slumpmässigt urval. Det har därför varit nödvändigt att genomföra en viktning av stickprovsresultaten för att kunna uttala oss om den studerade populationen, som totalt omfattar drygt 16 000 elever (för ytterligare detaljer, se Törnkvist, 1998). Statistiska test har använts för att avgöra om en uppgift är DIF med avseende på kön. Dessa test har utförts på signifikansnivån 5%. I analysen ingår 47 flervalsuppgifter, fördelade på 3 häften. Bland uppgifterna finns 10 så kallade ankaruppgifter som återfinns i alla häften 3. Uppgifterna har kategoriserats med avseende på innehållskategori och kognitiv process som behövs för att lösa uppgiften (se tabell 1). Detta har gjorts centralt och gemensamt för samtliga deltagande länder. 2 För en beskrivning av olika modeller se t ex Hambleton & Swaminathan (1985). 3 Uppgifterna benämns I 1-10. 6

Tabell 1. Totala antalet uppgifter fördelade på innehållskategori och kognitiv process. Innehållskategori Kognitiv process Totalt Rutinprocedurer Grundläggande förståelse Problemlösning Ekvationer 7 1 5 13 Derivata/Integraler 8 1 3 12 Geometri 6 5 4 15 Statistik 2 1 2 5 Logik 1-1 2 Totalt 24 8 15 47 Av tabell 1 framgår att mer än hälften av alla uppgifter löses med hjälp av rutinmässiga procedurer. Kategorierna logik och statistik innehåller betydligt färre uppgifter än övriga tre kategorier. Deltagare Det svenska stickprovet i TIMSS population 3, matematikspecialisterna, dvs. elever från gymnasieskolans avgångsklasser med teknisk-/naturvetenskaplig inriktning, består av 760 elever, 275 flickor och 485 pojkar. Antalet elever per häfte och uppgift presenteras i tabell 2. Tabell 2. Antalet elever per häfte och uppgift. Häfte nr Uppgift nr Antal elever Flickor Pojkar 3A I1-I10 + J1-J14 94 154 3B I1-I10 + K1-K11 91 166 3C I1-I10 + L1- L12 90 165 Totalt I1-10 275 485 Tabell 2 visar att ungefär lika många elever besvarat de tre häftena. Vidare framgår att 10 uppgifter, I1-I10, förekommer i alla häften och sålunda besvarats av totalt 760 elever, varav 275 flickor och 485 pojkar. 7

RESULTAT Provresultaten i sin helhet samt definitioner av de poängskalor som använts vid internationella och nationella jämförelser finns presenterade i Skolverket (1998). På nationell nivå används en raschskala med medelvärdet 150 och standardavvikelsen 10. Medelvärdet för pojkarna är 151 och för flickorna 149. DIF-analyserna i denna studie visar att totalt 13 uppgifter flaggas som DIF, vid 5%-signifikansnivå. Av dessa är nio uppgifter DIF till flickornas favör, medan fyra uppgifter gynnar pojkarna (se tabell 3). Tabell 3. Antalet uppgifter som flaggats som DIF (5%-nivån) till flickornas fördel (fl) respektive pojkarnas fördel (po), totalt samt uppdelat på kategori och typ av kognitiv process. Innehållskategori Kognitiv process Totalt Rutinprocedurer Grundläggande förståelse Problemlösning Ekvationer 2 fl 1 fl - 3 fl Derivata/Integraler 2 fl - 1 fl 3 fl Geometri 1 fl, 1 po - 1 fl 2 fl,1 po Statistik - 1 po 2 po 3 po Logik 1 fl - - 1 fl Alla 6 fl, 1 po 1 fl, 1 po 2 fl, 2 po 9 fl,4 po Sex av de nio uppgifter som gynnar flickorna finns i kategorierna ekvationer samt derivata/integraler. Tre av de fyra uppgifter som gynnar pojkarna handlar om statistik. Sex av nio uppgifter som är DIF i flickornas favör är rutinuppgifter (kräver rutinfärdigheter), två handlar om problemlösning och en kräver grundläggande förståelse. Av de uppgifter som är DIF till pojkarnas fördel handlar två av fyra om problemlösning, en kräver grundläggande förståelse och en är en rutinuppgift. I tabell 4 presenteras lösningsfrekvens (p) för de uppgifter som flaggats som DIF för flickor respektive pojkar. 8

Tabell 4. Lösningsfrekvens (p) för de uppgifter som flaggats som DIF för flickor (fl) respektive pojkar (po). Uppgift nr Kön p I 08 fl.78 L 11 fl.74 J 13 po.66 L 06 fl.64 J 05 fl.58 I 01 fl.58 I 05 po.55 J 01 fl.53 L 10 po.53 J 02 fl.49 J 06 fl.45 K 09 po.45 J 10 fl.16 Av tabell 4 framgår att det inte föreligger något tydligt samband mellan riktning av DIF och uppgiftens lösningsfrekvens. Det genomsnittliga p-värdet (lösningsfrekvensen) exakt detsamma,.55, för uppgifter som är DIF till pojkarnas respektive flickornas förmån. I båda fallen ligger den genomsnittliga lösningsfrekvensen på.55. DIF med fokus på kön är alltså inte relaterat till uppgifternas lösningsfrekvens om man utgår från genomsnittsvärdet. I tabell 5 presenteras diskriminationsförmåga (r bis ), i form av punkt-biserial korrelation, för de uppgifter som flaggats som DIF. Tabell 5. Diskrimination (r bis ) för de uppgifter som flaggats som DIF för flickor (fl) respektive pojkar (po). Uppgift nr Kön r bis I 08 fl.78 J 01 fl.52 L 10 po.46 J 05 po.44 J 13 po.41 J 01 fl.40 L 06 fl.40 J 05 fl.35 J 02 fl.32 J 06 fl.31 L 11 fl.31 I 08 fl.30 K 09 po.24 J 10 fl.10 9

Uppgifternas diskriminationsförmåga, tabell 5, ligger i genomsnitt på.39 för uppgifter som är DIF till pojkarnas förmån och på.33 för de uppgifter som är DIF till flickornas fördel. Av tabell 5 framgår att det kan skönjas en tendens till samband mellan uppgifternas diskriminationsförmåga och DIF. Lägre diskriminationsförmåga tenderar att oftare vara relaterad till positiv DIF, dvs DIF till flickornas förmån. DISKUSSION Av de 47 uppgifter som ingått i analysen har en dryg fjärdedel, eller 13 uppgifter flaggats som DIF. Nio av dessa gynnar flickor medan fyra favoriserar pojkarna. Begreppen gynnar, favoriserar osv. skall naturligtvis inte tolkas i absoluta termer, utan med denna formulering avses t ex att en viss uppgift fungerar bättre bland flickorna än bland pojkarna i relation till andra typer av uppgifter. DIF sett i förhållande till innehållskategorier visar att sex av nio uppgifter som gynnar flickor finns i de två kategorierna ekvationer respektive derivata/integraler, medan ingen uppgifter i dessa båda kategorier är DIF till pojkarnas förmån. Denna resultatbild överensstämmer med Harris & Carltons (1993) resultat, att kvinnliga studerande presterade bättre än manliga på abstrakta uppgifter som innehöll variabler, som X eller a. Tre av fyra uppgifter som är DIF till pojkarnas favör tillhör kategorin statistik, medan ingen statistikuppgift gynnar flickorna. Kategorin logik innehåller endast två uppgifter totalt, vilket gör att det är svårt att dra några slutsatser om eventuella DIF-tendenser och utfallet i kategorin geometri ger inte något entydigt resultat. Trots att ovanstående resonemang antyder vissa tendenser eller mönster i utfallet av DIF med fokus på kön är det viktigt att komma ihåg att det absoluta flertalet av alla uppgifter som analyserats inte flaggas som DIF. Det innebär alltså att 10 av 13 ekvationer, nio av 12 derivata/integraler samt att 12 av 15 geometriuppgifter inte uppvisar någon DIF. Kategorierna statistik (fem uppgifter, varav tre DIF) och logik (2 uppgifter, varav en DIF) innehåller mycket få uppgifter, vilket alltså gör det svårt att dra alltför långtgående slutsatser i ena eller andra riktningen. Den genomsnittliga lösningsproportionen för uppgifter med såväl positiv som negativ DIF är.55. Det föreligger alltså ingen synbart samband mellan uppgiftens svårighetsgrad och DIF med fokus på kön, ett resultat som överensstämmer med vad Kulick & Hu (1989) fann i sin studie av flervalsuppgifter på SAT, verbal och matematisk del. Analyser av DIF i relation till vilken kognitiv förmåga som krävs för att lösa uppgiften visar att sex av de nio uppgifter som uppvisar positiv DIF (gynnar 10

flickor) kräver rutinfärdigheter, två är av problemlösningskaraktär och en kräver grundläggande förståelse. Av uppgifterna med negativ DIF handlar två av fyra om problemlösning, en kräver grundläggande förståelse och en är en rutinuppgift. Liknande resultat har presenterats av Hyde et al (1990) som fann att flickor presterade bättre än pojkar i numerisk räkning, medan männen presterade något högre i komplex problemlösning. Också här är det emellertid på sin plats att varna för allför vidlyftiga slutsatser. De allra flesta uppgifter i varje kategori uppvisar nämligen inte någon DIF alls. Vi bör alltså erinra oss att 17 av de 24 rutinuppgifterna inte visar DIF, detsamma gäller sex av åtta uppgifter som kräver grundläggande förståelse samt 11 av 15 problemlösningsuppgifter. Uppgifternas diskrimination i relation till riktningen av DIF har studerats av Lawrence et al (1995). De fann bland annat att uppgifter med lägre grad av diskriminering (<.60) uppvisade endast positiv (gynnar flickor) DIF. Någon sådan tendens har inte kunnat skönjas i föreliggande studie. Samtliga 13 uppgifter med DIF hade visserligen en diskriminationsförmåga under.60, men de gynnade såväl flickor (9 uppgifter) som pojkar (4 uppgifter). För uppgifter med positiv DIF var variationsvidden.52 -.10 och för uppgifter med negativ DIF.46 -.24. Den genomsnittliga diskriminationsförmågan för uppgifter med positiv DIF är.33 och för uppgifter med negativ DIF.39. Sammanfattningsvis kan konstateras att, även om vissa tendenser kan skönjas i ovanstående resultat, det är svårt, för att inte säga omöjligt, att kunna predicera om en enskild uppgift kommer att flaggas som DIF eller inte. Däremot kan man möjligen titta på kategorinivå, dvs. om ett prov t ex innehåller rutinuppgifter och problemlösningsuppgifter kommer positiv DIF i högre omfattning att kunna prediceras bland rutinuppgifterna, medan det omvända gäller för problemlösningsuppgifter, dvs. bland dessa kommer fler uppgifter med negativ DIF att kunna förutsägas. Ekvationer samt derivata/integraler ger fler uppgifter med positiv DIF medan statistikuppgifter oftare ger negativ DIF. Det är alltså svårt att, utifrån föreliggande studie där könsskillnader i prestation studerats med konstanthållen förmågenivå, dra några entydiga slutsatser om huruvida specifika uppgiftskarakteristika (innehåll, svårighetsgrad, diskrimination, kognitiv process) skulle medföra att en uppgift gynnar flickor eller pojkar. 11

REFERENSER Angoff, W.H. (1993). Perspectives on Differential Item Functioning Methodology. In P. Holland & H. Wainer (Eds.), Differential Item Functioning (pp. 3-23). Dublin: Educational Research Center. Beller, M., & Gafni, N. (1995). International Perspectives on the Schooling and Learning Achievement of Girls and Boys as Revealed in the 1991 International Assessment of Educational Progress (IAEP). Jerusalem: National Institute for Testing and Evaluation. Berberoglu, G. (1995). Differential Item Functioning (DIF) Analysis of Computation, Word Problem and Geometry Questions across Gender and SES Groups. Studies in Educational Evaluation, 21, 439-456. Carlton, S.T., & Harris, A.M. (1992). Characteristics Associated with Differential Item Functioning on the Scholastic Aptitude Test: Gender and Majority/Minority Group Comparisons. (ETS Research Report No. 92-64). Princeton, NJ: Educational Testing Service. Cole, N.S. (1997) The ETS Gender Study: How Females and Males Perform in Educational Settings. Princeton, NJ: Educational Testing Service. Educational Testing Service. (1992). Sex Equity in Educational Opportunity, Achievement, and Testing. Proceedings of the 1991 ETS Invitational Conference. Princeton, NJ: Educational Testing Service. Ethington, C.A. (1990) Gender Differences in Mathematics: An International Perspective. Journal for Research in Mathematics Education, 21(1), 74-80. Fennema, E.; Carpenter, T.P., Jacobs, V.R., Franke, M.L., & Levi, L.W. (1998). A Longitudinal Study of Gender Differences in Young Children s Mathematical Thinking. Educational Researcher, 27(5), 6-11. Harris, A.M., & Carlton, S.T. (1993). Patterns of gender Differences on mathematics Items on the Scholastic Aptitude Test. Applied Measurement in Education, 6(2), 137-151. Hambleton, R.K., & Swaminathan, H. (1985). Item Response Theory. Principles and Applications. Boston: Kluwer-Nijhoff Publishing. 12

Hunter, J.E., & Schmidt, F.L. (1990). Methods of Meta-Analysis. Correcting Error and Bias in Research Findings. London: SAGE Publications. Hyde, J.S., Fennema, E., & Lamon, S.J. (1990). Gender Differences in Mathematics Performance: A Meta-Analysis. Psychological Bulletin, 107(2), 139-155. Hyde, J.S., & Jaffee, S. (1998). Perspectives From Social and Feminist Psychology. Educational Researcher, 27(5), 14-16. Kulick, E., & Hu, P.G. (1989). Examining the Relationship between Differential Item Functioning and Item Difficulty. (College Board Report No. 89-5). New York: College Entrance Examination Board. Lane, S., Wang, N., & Magone, M. (1996). Gender-Related Differential Item Functioning on a Middle-School Mathematics performance Assessment. Educational Measurement: Issues and Practice, 15(4), 21-27, 31. Lawrence, I.M., Lyu, C.F., & Feigenbaum, M.D. (1995). DIF data on freeresponse SAT I mathematical items. (ETS Research Report No. 95-22). Princeton, NJ: Educational Testing Service. Ramstedt, K. (1996). Elektriska flickor och mekaniska pojkar. Om gruppskillnader på prov en studie av skillnader mellan flickor och pojkar på centrala prov i fysik. (Avhandling för doktorsexamen). Umeå: Umeå Universitet, pedagogiska institutionen. Skolverket. (1996). TIMSS. Svenska 13-åringars kunskaper i matematik och naturvetenskap i ett internationellt perspektiv. (Skolverkets rapport Nr. 114). Stockholm: Liber Distribution Publikationstjänst. Skolverket. (1998). TIMSS. Kunskaper i matematik och naturvetenskap hos svenska elever i gymnasieskolans avgångsklasser (Skolverkets rapport Nr. 145). Stockholm: Liber Distribution Publikationstjänst. Sowder, J.T. (1998). Perspectives From Mathematics Education. Educational Researcher, 27(5), 12-13. Suen, H.K. (1990). Principles of Test Theories. Hillsdale, NJ: Lawrence Erlbaum Associates, Publishers. Törnkvist, B. (1998). TIMSS. Teknisk rapport. (Provmemoria nr 132). Umeå: Umeå universitet. Enheten för pedagogiska mätningar. 13

Wang, N., & Lane, S. (1996). Detection of Gender-Related Differential Item Functioning in a Mathematics Performance Assessment. Applied Measurement in Education, 9(2), 175-199. Willingham, W.W., & Cole, N.S. (1997). Gender and Fair Assessment. Educational Testing Service, Princeton, NJ. Mahwah, NJ: Lawrence Erlbaum Associates, Publishers. Wu, M.L., Adams, R.J., & Wilson, M.R. (1997). ConQuest. Generalised Item response Modelling Software. Draft Release 2. Australian Council for Educational Research (ACER). 14