pedagogiska rapporter

Relevanta dokument

ÖKAR RELIABILITETEN VID DIFFERENTIELL POÄNGSÄTTNING?

EFFEKTER AV ÖVNING OCH INSTRUKTION PÄ ETT KVANTITATIVT-NUMERISKT PROV VID KONSTANT HÅLLANDE AV VERBAL OCH ICKE-VERBAL FORMAGA

Effekter av öyning och instruktion på testprestation

pedagogiska nr UPPGIFTSFORMAT, PARTIELL KUNSKAP OCH SÄKERHET PÅ ETT KVANTITATIVT-NUMERISKT PROV Widar Henriksson * $

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Försök att rymma svaren i den platsen som finns. Skriv tydligt! Svara sammanhängande och med enkla, tydliga meningar.

6 Selektionsmekanismernas betydelse för gruppskillnader på Högskoleprovet

8 Den sociala bakgrundens betydelse för prestationer på Högskoleprovet

OBS! Vi har nya rutiner.

diskriminering av invandrare?

gogìska rapporter nr EFFEKTER AV ÖVNING OCH INSTRUKTION PÄ ETT KVANTITATIVT-NUMERISKT PROV Widar Henriksson

Provmoment: Tentamen 3 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Obs! Beakta sekretess. TESTRESULTAT Rapport framtagen: , 16:20

pedagogiska rapporter

Jag tycker jag är -2. Beskrivning av instrumentet och dess användningsområde. Översikt. Vilka grupper är instrumentet gjort för?

Högskoleprovet Kvantitativ del

pedagogiska rapporter Umeå nr

TENTAMEN. PC1307/1546 Statistik (5 hp) Måndag den 19 oktober, 2009

Information till eleverna

Statistik 1 för biologer, logopeder och psykologer

Högskoleprovet Kvantitativ del

Anvisningar till rapporter i psykologi på B-nivå

TENTAMEN PC1307 PC1546. Statistik (5 hp) Onsdag den 20 oktober, Ansvarig lärare: Bengt Jansson ( , mobil: )

Försök att rymma svaren i den platsen som finns. Skriv tydligt! Svara sammanhängande och med enkla, tydliga meningar.

Försök att skriva svaren inom det utrymme på sidan som finns. Skriv tydligt! Svara sammanhängande och med enkla, tydliga meningar.

PEC: European Science Teacher: Scientific Knowledge, Linguistic Skills and Digital Media

7.5 Experiment with a single factor having more than two levels

Vad säger forskningen om antagning och urval till högre utbildning

Högskoleprovet Kvantitativ del

Kristina Säfsten. Kristina Säfsten JTH

Försök att skriva svaren inom det utrymme på sidan som finns. Skriv tydligt! Svara sammanhängande och med enkla, tydliga meningar.

Maximalt antal poäng för hela skrivningen är 20 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 17 poäng.

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Vetenskap och evidens

Differentiell psykologi

Försök att skriva svaren inom det utrymme som finns på sidan. Skriv tydligt! Svara sammanhängande och med enkla, tydliga meningar.

Forskarutbildningen i Beteendevetenskapliga

FÖRMÅGAN ATT UNDERSÖKA

Tentamen i Matematik 2: M0030M.

OBS! Vi har nya rutiner.

8.1 General factorial experiments

Historia Årskurs 9 Vårterminen 2014

Studiedesign MÅSTE MAN BLI FORSKARE BARA FÖR ATT MAN VILL BLI LÄKARE? 2/13/2011. Disposition. Experiment. Bakgrund. Observationsstudier

Differentiell psykologi

Fuktighet i jordmåner. Variansanalys (Anova) En statistisk fråga. Grafisk sammanfattning: boxplots

FORSKNINGSKOMMUNIKATION OCH PUBLICERINGS- MÖNSTER INOM UTBILDNINGSVETENSKAP

Högskoleprovet Kvantitativ del

Bearbetning och Presentation

Försök att skriva svaren inom det utrymme som finns på sidan. Skriv tydligt! Svara sammanhängande och med enkla, tydliga meningar.

Motverka studieavbrott. effekter på fullföljandet av studier och studieavbrott bland barn i skolåldern och ungdomar.

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Antalet personer som skriver högskoleprovet minskar

Kritisk granskning av forskning

Differentiell psykologi

Kvalitativa metoder II

Studiehandledning Kvantitativa metoder i socialt arbete

INNEHÅLLSFÖRTECKNING

Second handbook of research on mathematics teaching and learning (NCTM)

OBS! Vi har nya rutiner.

Det finns en stor mängd appar till surfplattor som kan användas för att

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Tentamen i Metod C-kurs

TENTAMEN KVANTITATIV METOD (100205)

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Läsförståelsen har försämrats, men hur är det med ordavkodningen?

EXAMINATION KVANTITATIV METOD

Studiedesign MÅSTE MAN BLI FORSKARE BARA FÖR ATT MAN VILL BLI LÄKARE? 5/7/2010. Disposition. Studiedesign två huvudtyper

Den gröna påsen i Linköpings kommun

Vad är. Patient Reported Outcome Measures och andra begrepp. Kerstin Hagberg. RTP, PhD, Docent

Vad är. Kliniska utvärderingsmetoder Kliniska utfallsmått. Patient Reported Outcome Measures och andra begrepp. Kerstin Hagberg RTP, PhD, Docent

Evidensgrader för slutsatser

Data på individ/hushålls/företags/organisationsnivå. Idag större datamänger än tidigare

ASSESSMENT AND REMEDIATION FOR CHILDREN WITH SPECIAL EDUCATIONAL NEEDS:

GHQ-12 General Health Questionnaire-12

Differentiell psykologi

Vad beror benägenheten att återvinna på? Annett Persson

Psykologi för effektivt lärande

Betygskriterier för examensarbete/självständigt arbete

Omtentamen i Metod C-kurs

Datorbaserade analysmetoder (6 hp) VT 2009

Tentan består av 15 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 33 poäng för att få välgodkänt.

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Bilaga 5 till rapport 1 (5)

BUS Becks ungdomsskalor

Tentamen vetenskaplig teori och metod, Namn/Kod Vetenskaplig teori och metod Provmoment: Tentamen 1

Tentamen i matematisk statistik

Vetenskaplig teori och metod Provmoment: Tentamen 1 Ladokkod:

Mall för granskning av vetenskapliga artiklar om mätmetoder

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 7 maj, 2011

Tentamen Metod C vid Uppsala universitet, , kl

Learning study på vilket sätt bidrar det till lärares lärande? Angelika Kullberg

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Metodikuppgifter (C), Svarsblankett C

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

Session: Historieundervisning i högskolan

OBS! Vi har nya rutiner.

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

Mönster. Ulf Cederling Växjö University Slide 1

Transkript:

f i- pedagogiska rapporter Umeå nr 96 1981 INSTRUKTION AVSEENDE STRATEGI OCH PARTIELL KUNSKAP PÅ ETT KVANTITATIVT-NUMERISKT PROV Widar Henriksson C K * 0 A m * J 3 UNIVERSITETET I UMEÅ ISSN 0348-9388

Henriksson, W. Instruktion avseende strategi och partiell kunskap i ett kvantitativt-numeriskt prov. Pedagogiska rapporter, Umeå, 1981, nr 96. SAMMANFATTNING Studiens syfte var att studera effekter av en övnings- och två instruktionsbetingelser på poängen i ett kvantitativtnumeriskt prov (NOG), vilket ingår som ett av totalt sex delprov i det s k högskoleprovet. Övning definierades som genomgång av en annan NOG-version som förprov, och skillnâden mellan de två instruktionsbetingelserna, som båda innefattade övning och instruktion i en viss problemlösningsstrategi, var att i den ena men inte den andra ingick information om hur förekomst av partiell kunskap skulle utnyttjas. Den försöksuppläggning som användes baserades på fyra grupper och i studien ingick 362 elever från gymnasiets årskurs 3. Utifrån erhållna data kunde konstateras att varken betingelsen övning eller någon av de två instruktionsbetingelserna hade någon effekt i detta sammanhang, indikerat av frånvaron av skillnad i poäng mellan de som erhållit respektive inte erhållit dessa betingelser.

Henriksson, W. Instruction about strategy and partial knowledge on a quantitative-numerical test. Pedagogiska rapporter, Umeå, 1981, nr 96. SUMMARY The aim was to study the effects of three treatments, practice and two types of instruction, on the result of a quantitativenumerical test (NOG), one of the six subtests in the so-called Swedish Scholastic Aptitude Test. Practice was defined as having taken another NOG- test as pretest and the difference between the two treatments of instruction, both consisting of practice and instruction in a certain problem-solving strategy, was that information on how to use partial knowledge was given in one treatment but not in the other. The design was based on four groups and the subjects were 362 students from grade 3 in the upper secondary school. The obtained data showed that neither of the treatments, practice and the two types of instruction, had any effect, as indicated by the absence of difference in score between those who had and those who had not been given these treatments.

I två tidigare studier (Henriksson, 1981 a, b) undersöktes 1 effekter av övning och instruktion på ett kvantitativtnumeriskt prov betecknat KVR och bestående av tre delprov (I, II, III). I dessa studier innebar betingelsen övning en upprepad testning med ett parallellt test och betingelsen instruktion kunde ses som uppdelad på två moment där det första momentet innebar instruktion avseende generellt tillämpbara testtagningsstrategier medan det andra momentet innebar instruktion avseende specifika problemlösnings- strategier, speciellt anpassade till respektive delprov (I, II, III) i KVR. I föreliggande studie har intresset fokuserats enbart till ett av de tre delproven i föregående studier nämligen det andra (II), fortsättningsvis betecknat NOG. Detta delprov, men däremot inte de två övriga delproven (I, III) ingår i den nuvarande versionen av det s k högskoleprovet (Skolöverstyrelsen, 1981). Den avgörande skillnaden mellan denna studie och genomförandet av experimentbetingelserna i anslutning till delprov II i föregående studier var dels att instruktionstidens längd väsentligt utökats, dels att instruktionsbetingelsen delats upp med avseende på närvaro/ frånvaro av information om hur förekomst av partiell kunskap skulle utnyttjas. Kunskap om innebörden i begreppet partiell kunskap i detta sammanhang kan erhållas utifrån en allmän beskrivning av en NOGuppgift, aom kan sägas bestå av en frågestam och två informationspåståenden (bilaga 1). Den uppgift som föreläggs den testade är att göra en bedömning av huruvida tillräcklig information föreligger för att en frågeställning ska kunna besvaras om man betraktar enbart det ena (1), enbart det andra (2) eller i vissa fall båda informationspåståendena tillsammans (1 och 2). För att kunna besvara en NOG-uppgift tillfredsställande måste den testade följaktligen ta ställning till båda informationspåståendena, och i en situation där denne enbart kan ta ställning exempelvis till det ena

påståendet men inte det andra, har denne följaktligen viss 2 men inte tillräcklig eller fullständig kunskap för att besvara uppgiften. Begreppet partiell kunskap betecknar denna företeelse. I ett flertal studier har förekomsten av partiell kunskap hos problemlösande individer uppmärksammats. Jacobs & Vandeventer (1970) fann vid sin analys av olika individers svarsbeteenden på Ravens matriser, att de alternativ som visserligen inte var korrekta men kunde anses som delvis korrekta hade relativt höga positiva samband med totalpoängen på testet. Detta tog de som indicium på förekomst av partiell kunskap. Även Wood (1976) fann stöd för förekomst av partiell kunskap eftersom han kunde konstatera att vissa individer, som angett att de enbart gissat på ett flertal uppgifter, erhöll en högre poäng på dessa än vad som kunde förklaras enbart utifrån en slumpmässig gissning. Liknande iakttagelser här också gjorts såväl betydligt tidigare (t ex Granich, 1931) som senare (t ex Mead & Smith, 1957; Ebel, 1968; Rowley & Traub, 1977). Givet ett accepterande av förekomst av partiell kunskap och att uppgifterna i ett visst test inom ett område återspeglar denna kunskapsaspekt blir en rimlig konsekvens att partiell kunskap bör reflekteras i individens testpoäng. Två problem är innefattade i ett realiserande av detta. Det ena problemet sammanhänger med att personlighetsvariabeln "risktagande" kommer in i bilden om direkt eller indirekt uttalade gissningsbegränsande åtgärder innefattas i instruktionen. Diamond & Evans sammanfattade dittillsvarande studier i en litteratursammanställning år 1973, men även efter denna tidpunkt har en mängd studier genomförts i syfte att belysa detta problemområde (t ex Jacobs, 1975; Cross & Frary, 1978). Sammantagna indikerar dessa studier att de individer som inte besitter personlighetsegenskapen "risktagare" missgynnas medan de som däremot besitter denna egenskap gynnas.

och då i den bemärkelsen att den förstnämnda individkategorin 3 undviker att gissa, trots trolig förekomst av partiell kunskap, medan den senare individkategorin inte undviker att gissa. Ett generellt och relativt accepterat sätt att eliminera detta fenomen har då varit att ge mer eller mindre uppenbara gissningsinstruktioner antingen i den allmänna testinstruktionen eller i speciella instruktioner i anslutning till ett testtagande. (Jfr bilaga 1). Det andra problemet sammanhänger med själva poängsättningsförfarandet, där olika alternativ till den konventionella rättningen av en multiple-choice uppgift (poäng enbart för korrekt alternativ) föreslagits i syfte att innefatta inte enbart fullständig kunskap utan även partiell kunskap i en testpoäng. Den ackumulerade litteraturen fram till 1970 inom detta problemområde (betecknat differentie11 poängsättning), summerades av Wang & Stanley (1970). Med utgångspunkt från denna uppsummering, men med referenser till senare genomförda studier, kan i sak tre inriktningar utkristalliseras. I vissa studier har därvid expertbedömningar eller logiska bedömningar utnyttjats för att i förväg göra en viktning av samtliga svarsalternativ (t ex Hambleton, Roberts & Traub, 1970; Patniak & Traub, 1973). I andra studier har empiriska vikter som härletts utifrån data utnyttjats (Wedman, 1973; Reilly & Jackson, 1973), medan det också förekommit att den testade själv fått ta ställning till samtliga alternativ genom att t ex ange sannolikheter, eller motsvarande, för att respektive alternativ skulle vara korrekt (Koehler, 1971; Hopkins, Hakistian & Hopkins, 1973). Den idé som kan sägas ligga bakom samtliga metoder för differentiell poängsättning är att den på så sätt bildade testpoängen antas på ett bättre sätt återspegla den bakomliggande färdigheten eller förmågan och den ökade exaktheten uttrycks vanligtvis i termer av reliabilitet och validitet. Iakttagelsen har därvid ofta varit att det skett en viss ökning av reliabiliteten men samtidigt också en

minskad eller oförändrad validitet (Gilman & Ferry, 1972; 4 Wedman, 1973; Hanna, 1975; Cross & Frary, 1970; Giles & Cross, 1980). Vissa har dock samtidigt erhållit antingen den motsatta relationen (Hambleton, Roberts & Traub, 1970) eller också inkonsistenta relationer i ökning - minskning mellan reliabilitet och validitet (Hakstian & Kansup, 1975). Fortsättningsvis ägnas framställningen åt en konkretisering av begreppen gissning, partiell kunskap och differentiéll poängsättning beaktat vad som hittills sagts angående dessa begrepp och sett relativt hur de utformats i denna studie. För att konkretisera begreppet partiell kunskap antar vi att en individ som löser en viss NOG-uppgift klart kan inse att det ena informationspåståendet (1) är tillräckligt för att besvara frågeställningen men samtidigt inte alls kan ta ställning till det andra informationspåståendet (2). Denna kunskap återspeglas inte i individens testpoäng eftersom NOG-uppgifterna konventionellt rättas 0-1, dvs 1 poäng för korrekt alternativ och 0 poäng för övriga alternativ. En rimlig slutsats är därför att mer information kan extraheras ur svaren på flervalsfrågor om man ger olika poäng för olika svarsalternativ på samma fråga, dvs tillämpar ett differentiellt poängsättningsförfarande. I denna studie modelleras det korrekta lösningsbeteendet som ett rationellt sekvensiellt agerande där respektive uppgift delats upp i två alternativt tre delproblem vilka besvarats, var för sig. Graden av överensstämmelse mellan uppvisat och härlett rationellt lösningsbeteende har därvid legat till grund för en logisk a prioriviktning av respektive alternativ. Annorlunda uttryckt har således den differentiella poängsättningen baserats på relationen mellan avgivet svar och korrekt svar på respektive uppgift.

Genom att isolera begreppet partiell kunskap i den problemlösningsstrategi som tidigare instruerats, med.viss framgång 5 i ett fall (Henriksson, 1981 a) men inte i ett annat (Henriksson, 1981 b), skapades förutsättningar för att närmare kunna härleda orsaker till en eventuell uppkomst av övningsoch instruktionseffekter på NOG-provet. Instruktionen om den sekvensiella problemlösningsstrategin syftade nämligen till att maximera individens testpoäng utifrån dennes faktiska kunskap på området. När individen dessutom erhöll information om hur eventuell förekomst av partiell kunskap skulle utnyttjas, förväntades individen få möjligheter till poängtillskott utöver vad denne i en konventionell testsituation skulle ha erhållit utifrån sin faktiska kunskap. Detta tillskott förväntades tillkomma utifrån ett utnyttjande av en e 1imineringsstrategi kombinerad med en gissningsstrategi, vilka i kombination dels eliminerade NOG-uppgiftens fem alternativ till ett minimum givet individens faktiska kunskap, dels formulerade en rationell gissningsstrategi bland kvarvarande alternativ. Den differentiella poängsättningen utnyttjades i denna studie i första hand för att erhålla indikatorer på effekten av de två instruktionsbetingelserna i de situationer där individerna har partiell kunskap men också för att erhålla indikatorer på övningsbetingelsens effekt i samma situation. Om individen besitter partiell kunskap i en viss situation erhålls nämligen indikatorer på individens problemlösnings- beteende enbart om individen såväl utnyttjat den instruerade e 1 imi neringsstrategin som gissat med framgång. Om individen i motsvarande situation utnyttjat både eliminerings- och gissningsstrategin, men gissat fel, indikeras detta inte av en konventionell poängsättning (0-1). Den differenti ella poängsättning som tillämpades i denna studie gör dock detta.

i Syfte Det övergripande syftet var att undersöka om poängen på ett kvantitativt-numeriskt prov (NOG) påverkades av betingelserna övning och instruktion där den sistnämnda delats upp med avseende på närvaro eller frånvaro av information om hur förekomst av partiell kunskap skulle utnyttjas. 6 Betingelsen övning definierades som genomgång av en annan version av samma prov som förprov och gemensamt för de två instruktionsbetingelserna var att de bestod av dels allmän information om generellt tillämpbara testtagningsstrategier, dels specifik information och övning avseende en sekvensiell problemlösningsstrategi. Utifrån ovanstående allmänna utgångspunkter och definitioner var syftet mer precist uttryckt att undersöka effekter på poängen i ett eftertest (NOG 2) av betingelsen övning och betingelsen instruktion där den senare utformades på två sätt: med (Xj) och utan (Xjj) information om partiell kunskap. METOD Design Den design som studien baserats på kan beskrivas på följande sätt: Y b CT < CT X 1 1 x n Y Y a Y a CD > i 1 LU ( E 2 ) \ I ( K 2 )!

Beteckningar: Y b = förtest (NOG 1) 7 Y = eftertest (NOG 2) a Xj = instruktion med information om partiell kunskap XJJ = instruktion utan information om partiell kunskap E^, E^» K.2 = experiment- och kontrollgrupper Den använda designen är inte komplett och möjliggör därför inte skattningar av effekten av var och en av de tre betingelserna: övning, instruktion med information och instruktion utan information om partiell kunskap Orsaken till att designbetingelserna: Xj - Y a och Xjj - Y g K^) inte medtogs i studien var till viss del föranlett av ställningstagandet att i en reell situation utnyttjar en individ, som avser att genomgå ett prov vid en viss tidpunkt, en övningsbetingelse förutsatt att en sådan finns tillgänglig. Mätinstrument De prov som användes vid för- (Y^) och eftermätning (Y g ) utgjordes av två versioner av ett kvantitativt-numeriskt prov betecknat NOG. Detta prov ingår som ett av totalt sex delprov i det s k högskoleprovet. (För närmare information om proven, se Högskoleprovet, 1981. Orientering och exempel). Instruktionsmaterialet^ vilket delades ut i grupp E^ och E2 (se design) utgjordes av försättssidan till NOG 1 (bilaga 1) samt 10 NOG-uppgifter, där de fem första uppgifterna var relativt lätta (p=0.82-0.97) medan de fem därefter följande var något svårare (p = 0.27-0.59 ). Bland såväl de fem första som de fem sista uppgifterna var alternativen (A-E) som 1) Instruktionsmaterialet kan erhållas efter hänvändelse till författaren.

korrekt alternativ representerade. Försöksledarna (2 st) hade de 8 två instruktionerna (Xj, Xjj)^ i skriftlig form för att säkerställa likformighet i instruktionernas genomförande. I de två föregående studierna (Henriksson, 1981 a, b) utnyttjades också ett övnings- och instruktionsmaterial på motsvarande delprov (II). I föreliggande studie var antalet uppgifter i instruktionsmaterialet (=10 st) fördubblat jämfört med antalet uppgifter i de två föregående studierna. Procedur Samtliga grupper (E^, K^) erhöll respektive prov och svarsblankett (bilaga 2) i ett brunt kuvert. Gemensamt för grupperna var att svarsmarkeringarna gjordes på svarsblanketten. För experimentgrupperna (E^, E2) var proceduren följande: Sedan försökspersonerna genomgått NOG 1 (tid 30 min) genomfördes instruktionsfasen vilken för E-^-gruppen var ungefär 50 minuter och för E2~gruppen ungefär 30 minuter. Skillnaden i instruktionstid (20 min) utnyttjades, som tidigare angetts, för att inducera en eliminerings- och gissningsstrategi baserad på förekomst av partiell kunskap. I kontrollgrupperna (K^ och K2) genomfördes provbetingelserna under motsvarande provtider som i experimentgrupperna, dvs K.^: 30 + 30 minuter och 30 minuter. Samtliga betingelser genomfördes i klass rum, vilket innebar att antalet försökspersoner aldrig var större än trettio vid varje instruktions- eller testtillfälle. Studien genomfördes under en tidsperiod av fem på varandra följande dagar i ett urval av Stockholmsområdets gymnasiala skolor. 2) Skriftlig beskrivning av de två instruktionerna (Xj och X JJ) kan erhållas efter hänvändelse till författaren.

Sett relativt föregående studier (Henriksson, 1901 a, b) var den ena instruktionen (Xj) i princip samma som den som 9 tidigare getts i anslutning till del II, dock med det tillägget att det tog ungefär 35 minuter längre tid att genomföra instruktionen i föreliggande studie jämfört med den första studien (Henriksson, 1981 a). Orsaken till detta var dels att antalet instruktions- och övningsuppgifter utökats, dels att själva instruktionstempot minskats. Ytterligare en skillnad mellan instruktionens genomförande i föreliggande studie och tidigare studier var att den visualiserade beslutsmodellen nu inte alls utnyttjades. I de två tidigare studierna hade denna utnyttjats vid själva instruktionen och dessutom hade försökspersonerna tillgång till denna vid genomförandet av eftertestet. Stöd för att en visualisering av beslutsmodellen skulle förbättra och underlätta instruktionen hade därvid erhållits från exempelvis Arnold & Dwyer (1975). Beslutsmodellen utnyttjades inte vid instruktionen i denna studie beroende dels på det negativa utfallet av de två tidigare studierna, dels på att det också har hävdats att en visualisering i vissa fall snarare komplicerar än förenklar (Ehrenzweig, 1976; Wicker et al, 1978). Den förstnämnda uttrycker detta på följande sätt: "... precise visualization s or still worse 3 a straining of one's attention to see crystal-clearness where there is in fact none t will only produce wrong or unusable results" (s 152). Differentiel1 poängsättning För att erhålla indikationer på förekomst av partiell kunskap i NQG-provet har, förutom den konventionella 0-1 rättningen, även en differentiell poängsättningsprocedur tillämpats. Innebörden i denna har relaterats tidigare (s 3-4), och framgår konkret av sammanställningen på nästa sida.

Tabell 1. Översikt av relationen mellan avgivet svar och erhållen differentiell poäng för alternativ A-E 10 som korrekt alternativ. Korrekt alternativ Avgivet svar Poäng A A 2 B 0 C 1 D 1 E 1 B A 0 B 2 C 1 D 1 E 1 C A 1 B 1 G 3 D 0 E 2 D A 1 B 1 C 0 D 2 E 0 E A 1 B 1 C 2 0 E 3 Utifrån ovanstående översikt kan konstateras att uppgifter vars korrekta alternativ var A, B eller D erhöll maximalt 2 poäng/uppgift medan uppgifter vars korrekta alternativ var C eller E erhöll maximalt 3 poäng/uppgift. Den övergripande orsaken till denna poängskillnad utgjordes av det faktum att för den förstnämnda uppgiftskategorin (A, B, D) innebar lösningsprocessen ett ställningstagande till två delproblem, medan lösningsprocessen för den senare uppgiftskategorin (C, E) innebar ett ställningstagande till ytterligare ett delproblem, dvs sammanlagt tre delproblem.

Försökspersoner 11 Studiens försökspersoner utgjordes av totalt 362 elever från årskurs 3 på gymnasiet. Dessa var klassvis slumpmässigt fördelade på studiens experiment- och kontrollgrupper med det tillägget att respektive grupp E 2' K.^, 3 skulle bestå av fem klasser, en från var och en av de fem gymnasiala linjerna. Konkret innebar detta att inom respektive grupp fanns en klass från humanistisk-, samhällsvetenskaplig-, ekonomisk-, naturvetenskaplig- och teknisk linje. RESULTAT Inledningsvis presenteras i tabell 2 data för att i viss mån möjliggöra ett ställningstagande till huruvida de fyra grupperna var initiait jämförbara. Som indikator för jämförbarheten mellan grupperna har medelbetyg använts och dessa data presenteras i tabell 2. Tabell 2. Medelvärden (x), standardavvikelser (s) och antal försökspersoner (n) för angivna grupper i variabeln medelbetyg. Grupp n x s E 1 77 3.39 0.54 E 2 90 3.56 0.48 K 1 86 3.39 0.54 K 2 109 3.63 0.56 Säkra slutsatser angående gruppernas initiala jämförbarhet med avseende på prestation på det kvantitativt-numeriska provet (NOG) utifrån medelbetyg förutsätter ett relativt högt samband mellan medelbetyg och poäng på NOG (Y^). Detta är inte fallet i denna studie, vilket framgår av följande korrelationskoefficienter: E n : r =0.09, E 0 :r =0.49, 1 xy 2 xy

K-,:r =0.17, K!S 7 0.23. Några slutsatser angående gruppernas i xy jämförbarhet kan därför inte göras utifrån medelbetygsdata. 12 I tabell 3 presenteras läges- och spridningsmått för respektive grupp vid för- och eftertestningen. Tabell 3. Medelvärden (x), standardavvikelser (s) och antal försökspersoner (n) för angivna grupper vid för (Y. ) och eftertestning (Y ). 0 Grupp n Y K b Y a E 1 77 11.92 2.98 12.70 3.43 E 2 90 10.46 3.43 12.24 3.49 K x 86 11.16 3.17 12.67 3.50 K 2 109 12.57 3.02 Som framgår av tabell 3 har samtliga grupper ett högre gruppmedelvärde vid eftermätningen med NOG 2 (Y g ) jämfört med förmätningen med NOG 1 (Y^). Tabellutfallet indikerar också att varken övning (=genomgång av Y^) eller instruktion ( XJ, XJJ) hade någon nämnvärd effekt på testpoängen i eftertestet eftersom den grupp ( = K 2 ) som fick ingendera av betingelserna uppvisar en prestation på eftertestet som är ungefär i nivå med de grupper som fått endera (E 2, eller båda betingelserna. Vad avser relationen mellan medelbetyg (tabell 2) och poäng på förtestet (Y^) i respektive grupp framgår också att den grupp som hade högsta betygsmedelvärdet (=K 2 ) samtidigt också hade lägsta medelvärdet på förtestet (=10.46).

Studiens utfall har övergripande analyserats via en ensidig 13 variansanalys där poäng på eftertestet (Y_) utgjorde beroende a variabel och där de fyra grupperna (E^, 2* K^, betrak tades som fyra behandlingar utifrån de experimentella betingelser som respektive grupp erhållit. Utfallet av analysen visade att ingendera betingelsen hade någon effekt varken för hela undersökningsgruppen F C 3,358)«.43 eller när denna delats upp på linjekategorierna HUM + SH + EK; F ( 3, 212) =«0.38 respektive NA + TE; F(3,142)=0.42. Eftersom F-kvoterna i samtliga fall ej var signifikanta analyserades inte data vidare utifrån ett bildande av kontraster (se t ex Keppel, 1973, s 86). I tabell 4 redovisas utfallet av en différentiel! poängsättning (s 7) av erhållna data i eftertestet (Y ). Tabell 4. Medelvärden (x), standardavvikelser (s) och antal observationer (n) för respektive grupp (E^, E2» Kl, Ko) på eftertestet (Y ) när detta rättats a differentiellt. Grupp n X s E 1 77 41.01 4.93 E 2 90 39.88 6.05 K 1 86 40.71 4.95 K 2 109 40.40 5.12 Av tabellen framgår att en differentiell poängsättning av eftertestet ger ett likartat utfall som motsvarande konventionella poängsättning (tabell 3, s 10). Utfallet av en ensidig variansanalys blev för totalgruppen; F(3,358) =0.71, och för linjekategorierna HUM + SH + EK och NA + TE blev motsvarande värden; F(3,212)=0.35 respektive F(3,142)=0.48. I inget av fallen var F-kvoten signifikant.

I tabell 5 redovisas reliabilitets- och validitetmått i för- 14 och eftermätningen vid konventionell respektive differentiell poängsättning. Reliabiliteten i respektive mätning har uppskattats med KR 2 q oc h validiteten har definierats som sambandet mellan testpoäng och betyg. Avsikten med presentationen av dessa data är i första hand att utifrån reliabilitetsmåtten erhålla indikatorer på att de slutsatser som gjorts angående studiens betingelser utifrån konventionell och differentiell poängsättning har baserats på data som haft en någorlunda hög mätsäker- het. Tabell 5. Reliabilitet (KR20) och validitet (r X y) för respektive grupp (El, E2, Kl, K2) vid konventionell och differentiell poängsättning av för- (Y,) och efterprov (Y ). 3 Konventionel poäng Differentie11 poäng l Grupp Yb/Ya kr r 20 xy KR20 r xy E 1 Y b 0.60 0.10 0.61 0.09 E 2 K 1 k 2 Y a Y b v a Y b Y a Y a 0.70 0.14 0.61 0.17 0.70 0.49 0.72 0.49 0.69 0.22 0.70 0.16 0.65 0.10 0 0.67 0.17 0.71.00 0.71 0.05 0.59 0.28 0.59 0.23 Det föreligger vissa svårigheter att iaktta några tendenser till systematik i förändringen (ökning/minskning) av reliabilitets- eller validitetsmåtten då respektive test rättats differentiellt jämfört med konventionellt (jfr s 3). KR20 förblir i stort sett oförändrad medan r^^ uppvisar en något större och relativt osystematisk variation.

DISKUSSION 15 Studiens syfte var att studera eff.ekteri av två olika instruktioner, den ena med och den andra utan information om partiell kunskap. Som kontrollgrupper utnyttjades dels en grupp (K^) som erhållit övning utifrån ett förtest, dels en grupp (K^) som varken fått övning eller instruktion. Om man betraktar enbart de grupper som erhållit antingen instruktion och övning (=E^ och E2) eller enbart övning (K^) kan två iakttagelser göras. Den ena iakttagelsen är att det skett en poängökning från för- till eftertest (tabell 3, s 12) och den andra iakttagelsen är att effekten av övning och instruktion förefaller vara jämförbar med effekten av enbart betingelsen övning. Detta innebär således att de två instruktionerna med (Xj) och utan (Xjj) information om partiell kunskap inte hade någon ytterligare effekt på prestationen vid eftertestet (NOG 2) utöver den effekt som förtestet NOG 1 hade. Om man däremot betraktar samtliga fyra gruppers prestation vid eftertestet blir tolkningsbilden en annan, eftersom prestationen vid eftertestet (Y_) var relativt jämförbar för samtliga grupper (tabell 3, s 12). Detta innebär att den grupp (=«2) som inte alls erhållit någon experiment- betingelse (övning och/eller instruktion) presterade ungefär lika bra som de grupper (E^» E2' ^l^ som er hållit detta. Utfallet av variansanalysen indikerade också att varken grupp- eller linjetillhörighet påverkade utfallet. Detta kan också uttryckas på så sätt att oavsett om en individ fått övning och/eller instruktion eller inte så presterar denne ungefär samma resultat på ett NOG-prov. Experimentbetingelserna övning och instruktion verkar inte heller olika inom de olika linjekategorierna, indikerat av frånvaron av interaktionseffekt mellan grupp- och linjetillhörighet.

Slutsatsen angående frånvaron av instruktions- och övningseffekt 16 har i princip baserats på kontrollgruppens (K^) prestationsnivå på eftertestet. Tillämpandet av ett rando- miseringsförfarande medför vanligtvis att eventuella variationer exempelvis i initiait prestationsavseende förväntas ligga inom slumpens rum, men givet detta analyserades respektive grupps medelbetygsdata. Denna analys visade att spridningarna för respektive grupp var ganska lika (ungefär 0.5 betygsenheter) men att respektive grupps (E^, ^2' ^1 oc^ ^2^ betygsmedelvärde var: 3.39, 3.56, 3.39 och 3.63 (tabell 2). Det förelåg således en viss tendens till skillnad mellan grupperna men denna tendens kunde i denna studie inte utnyttjas för ställningstagande till gruppernas initiala jämförbarhet (jfr s 11). Slutsatsen utifrån randomiseringen kvarstår därför: grupperna kan betraktas som jämförbara. En begränsning som föreliggande studie hade, vilket också till viss del framkommit i diskussionen, var att den design som utnyttjades inte var så komplett att den möjliggjorde en analys av huvudeffekter av betingelserna övning och instruktion, med och utan information om partiell kunskap. För att möjliggöra detta skulle i så fall designen ha kompletterats med ytterligare två grupper där den ena erhållit instruktion med tillägg av information om partiell kunskap (Xj) medan den andra inte fått detta tillägg (X^j) och där båda grupperna erhållit Y men inte någon övning (Y^). En sådan design skulle kunna betecknas som en utökad variant av Solomon's 4-gruppsdesign (Campbell & Stanley, 1963, sö). Ställningstagandet att inte ta med dessa två grupper i designen baserades till viss del på att en förberedelse inför en reell provsituation där ett NOG-prov ingår (t ex reguljär prövning med Högskoleprovet) med största sannolikhet innebär att en övningsbetingelse utnyttjas, förutsatt att en sådan finns tillgänglig. Så är fallet exempelvis vad gäller högskoleprovet (Skolöverstyrelsen,

1981). Detta innebär då att betingelserna X T -Y, X TT -Y JL 3 1 1 0 17 representerar situationer som kan betraktas som relativt sällsynta i verkligheten. De verkliga situationer som representeras av studiens designbetingelser kan betraktas som betydligt vanligare. Ytterligare en begränsning med denna studie var att ett jämställande av grupperna, med avseende på prestationsförmåga utifrån en statistisk manipulation (se t ex Henriksson, 1981 b), inte kunde utföras i denna studie eftersom en sådan åtgärd förutsätter att det föreligger ett visst samband mellan kontrollvariabel (i detta fall medelbetyg) och beroende variabel (i detta fall poäng på NOG 2). Se t ex Keppel, 1973, s 477). Sambandet mellan medelbetyg och poäng på eftertestet framgår av tabell 5. Om utfallet i denna studie ses relativt utfallet i de två tidigare genomförda studierna (Henriksson, 1981 a, b) har studierna sammantagna indikerat att prestationen på NOGuppgifter inte i någon större utsträckning förefaller kunna påverkas av övning eller instruktion. Slutsatsen som den formulerades i föregående studier kvarstår därför även efter genomförande och analys av utfallet i denna studie - någon enkel och för individen lättetablerad strategi för problemlösning på NOG-uppgifter finns troligtvis inte (jfr delprov III, Henriksson 1981 a, b). De strategier för problemlösning som individerna själva kan generera utifrån övning på NOG (=genomgång av ett förprov) förefaller dessutom också vara lika effektiva/ineffektiva som den i denna studie logiskt uppbyggda och instruerade sekvensiella strategin.

REFERENSER Arnold, T.C., & Dwyer, F.M. Realism in visualized instruction. Perceptual and Motor Skills, 1975, 40^, 369-370. Campbell, D.T., & Stanley, 3.C. Experimental and quasiexperimental designs for research. Chicago: Rand McNally & Company, 1963. Cross, L.H., & Frary, R.B. Empirical choice weighting under "guess" and "do not guess" directions. Educational and Psychological Measurement, 1978, 38^, 613-620. Diamond, 3., S Evans, W. The correction for guessing. Review of Educational Research, 1973, 43_, 181-19. Ebel, R.L. Blind guessing on objective achievement tests. Journal of Educational Measurement, 1968, 5_, 321-325. Ehrenzweig, A. Unconscious scanning and dedifferentiation in perception. In A Rothenberg & C.R. Hausman (Eds.)*, The creativity question. Durham: Duke University Press, 1976. Giles, M.B., & Cross, L.H. The relationship of partial information and misinformation in multiple-choice test scores to test characteristics and personality variables. Paper presented at the annual meeting of American Educational Research Association, Boston, Massachusetts, 1980. Gilman, D.A., & Ferry, P. Increasing test reliability through self-scoring procedures. Journal of Educational Measuremen^, 1972, 9_, 205-207. Granich, L.A. A technique for experimenting on guessing in objective tests. Journal of Educational Psychology, 1931, 22, 145-156. Hakstian, A.R., & Kansup, W.A. A comparison of several methods of assessing partial knowledge in multiple- choice tests: II. Testing procedures. Journal of Educational Measurement, 1975, 1_2, 231-239. Hambleton, R.K., Roberts, D.M., & Traub, R.E. A comparison of the reliability and validity of two methods of assessing partial knowledge on a multiple-choice test. Journal of Educational Measurement, 1970, 7_, 75-82. Hanna, G.S. Incremental reliability and validity of multiplechoice tests with an answer-unti1-correct procedure. Journal of Educational Measurement, 1975, 1_2^ 175-178, Henriksson, W. Effekter av övning och instruktion på ett kvantitativt-numeriskt prov. Pedagogiska rapporter, Umeå, 1981, nr 94. (a).

Henriksson, W. Effekter av övning och instruktion på ett kvantitativt-numeriskt prov vid konstanthållande av verbaloch icke-verbal förmåga. Pedagogiska rapporter, Umeå, nr 95. (b). Hopkins, K.D., Hakstian, A.R., & Hopkins, B.R. Validity and reliability consequences of confidence weighting. Educational and Psychological Measurement, 1973, 33, 135-141. Jacobs, S.S. Behavior on objective tests under theoretically adequate, inadequate, and unspecified scoring rules. Journal of Educational Measurement, 1975, 1_2, 19-29. Jacobs, P., & Vandeventer, M. Information in wrong responses. Psychological Reports, 1970, 26_, 311-315. Keppel, G. Design and analysis; A researcher's handbook. Englewood Cliffs, New Jersey: Prentice-Hal1, Inc., 1973. Koehler, R.A. A comparison of the validities of conventional choice testing and various confidence marking procedures» Journal of Educational Measurement, 1971, 8_, 297-303. Mead, A.R., & Smith, B.M. Does the true-false, formula scoring formula work? Some data on an old subject. Journal of Educational Research, 1957, 5_1, 47-53. Patnaik, D., & Traub, R.E. Differential weighting by judged degree of correctness. Journal of Educational Measurement^ 1973, 10, 281-286. Reilly, R.R., & Jackson, R. Effects of empirical option weighting on reliability and validity of an academic aptitude test. Journal of Educational Measurement, 1973, 1, 185-194. Rowley, G.L., & Traub, R.E. Formula scoring, number-right scoring, and test-taking strategy. Journal of Educational Measurement, 1977, 1_4 (1), 15-22. Skolöverstyrelsen. Högskoleprovet 1981. Orientering och exempel. Stockholm: Liber Utbildningsförlaget, 1981. Wang, M.W., & Stanley, J.C. Differential weighting: A review of methods and empirical studies. Review of Educational Research, 1970, 40_, 663-705. Wedman, I. Reliabilitets- och validitetsstudier vid differentiell poängsättning av flervalsfrågor. Pedagogiska rapporter, Umeå, 1973, nr 32. Wicker, F.W., Weinstein, C.E., Yehich, C.A., & Brooks, J.D. Problem-reformulation training with insight problems. Journal of Educational Psychology, 1978, 70_ (3), 372-377. Wood, R. Inhibiting blind guessing: The effect of instructions. Journal of Educational Measurement, 1976, 13 (4), 297-307.

NOG1 Bilaga 1 Anvisningar Vaije uppgift inleds med att en fråga ställs. Därefter följer tvä påstå- 78:3 enden. (!) och (2), som innehåller olika slags information. Uppgiften är att avgöra hur mycket information som behövs för att besvara frågan. Uppgifterna besvaras genom att du anger vilket eller vilka av påståendena du behöver använda. Undersök noggrant de olika svarsförslagen innan du besvarar uppgiften. Vi böljar med ett övningsexempel: Hur mycket betalade Andersson i räntor för sina län under året? (1) Andersson hade 3 lån. Sammanlagda lånesumman var 145 000 kronor. (2) Vart och ett av Anderssons lån löpte med 10 % ränta. Lånebeloppen var 45 000 kronor, 10 000 kronor och 90 000 kronor. Tillräcklig information för lösningen erhålles A i (1) men ej i (2) B i (2) men ej i (1) C 1(1) tillsammans med (2) D i ( 1 ) och (2) var för sig E ej genom de båda påståendena Svarsförslagens innebörd A i (1) men ej i (2) = Den information som ges i (1) är tillräcklig. Enbart informationen i (2) räcker inte till. B i (2) men ej i (1) - Den information som ges i (2) är tillräcklig. Enbart informationen i (1) räcker inte till. C i (1) tillsammans med (2) = För att få tillräcklig information måste man använda både påstående (1) och (2). Enbart (1) eller enbart (2) ger ej tillräcklig information. D i (1) och (2) var för sig = Antingen (1) eller (2) kan användas, eftersom båda var för sig innehåller tillräckligt mycket information. E ej genom de båda påståendena = Inte ens genom att utnyttja både (1) och (2) kan man fä tillräcklig information. 12 3 Informationen i (1) räcker inte till för att besvara frågan. Informa- bi tionen i (2) är tillräcklig. Svarsförslag B är alltså rätt. Om uppgiften hade ingått i provet skulle du ha skrivit så här på svarsblanketten. Skriv alla svar på svarsblanketten. Skriv tydligt. Om du inte kan lösa en uppgift bör du ändå besvara uppgiften genom att försöka bedöma vilket svarsföislag som verkar bäst eller rimligast. Inget poingavdrag sker om du svarar fel. På nästa sida böljar provet som innehåller 20 uppgifter PROVTID: 30 minuter VÄND INTE BLAD FÖRRÄN PROVLEDAREN SÄGER TILL!

Bilaga 2 SVARSBLANKETT :a Provkombination Skola Linje Kön Betyg Prov 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30. 1 Prov 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1