Hur många poäng måste jag ha för att få VG?

Relevanta dokument
Betyg och bedömning. Lokala kursplaner. Konsten att synliggöra kurskriterier för elever och för oss själva

Granskning av likvärdig och rättssäker betygsättningen

Kursplanen är fastställd av Utbildningsnämnden för Musiklärarutbildningen att gälla från och med , höstterminen 2015.

Betyg och bedömning. Föreläsning den 18 februari Lars Nohagen, Cesam Centrum för de samhällsvetenskapliga ämnenas didaktik.

BETYG GYMNASIESKOLAN

ÄMNESPLANENS STRUKTUR. Syfte Centralt innehåll Kunskapskrav. Mål KUNSKAPSKRAV

Nationella prov i NO årskurs 6

Om ämnet Engelska. Bakgrund och motiv

Vad tänker du på när du ser ordet examination?

BETYG ÅRSKURS 6 ( - 9)

Skolverket Dokumentdatum: Dnr: : (22)

Nyheter i betygsvärlden och verktyg för. Nya skollagen. Nya skollagen. Gunilla Näsström Pedagogiska institutionen

Kursplanen i svenska som andraspråk

Arbetsmodell KUST Kurser Under ST. Ragnhild Mogren, Pedagogisk utvecklare

Väl godkänt (VG) Godkänt (G) Icke Godkänt (IG) Betyg

Betygsskalan och betygen B och D

Kvalitetsgranskning av gymnasieskolan Vipan i Lunds kommun

Guide för bedömning. Lgr11 den samlade läroplanen

Ramverk för bedömningsprocessen i verksamhetsförlagd utbildning i lärarutbildning

Riktlinjer för bedömning av examensarbeten

1. Skollagen 2. Läroplanen Lpo 94 / Lpf Grundskole- / Gymnasieförordningen

Skillnaden mellan betygsresultat på nationella prov och ämnesbetyg i årskurs 9, läsåret 2009/10

Kursplanen i hem- och konsumentkunskap

30-40 år år år. > 60 år år år. > 15 år

Nyheter Pedagogiska institutionen, Umeå universitet 1. Gunilla Näsström Pedagogiska institutionen

LSU110, Specialpedagogik i förskola, skola och samhälle, 15 högskolepoäng

Det svenska utbildningssystemet. Skollagen och betyg. Mål- och kriterierelaterade betyg. Mål- och kriterierelaterade betyg

LMS210, Människa, natur och samhälle för lärare 2, 30 högskolepoäng

Lärandemål 1 kunna arbeta och handla enligt den människo-, demokrati- och kunskapssyn som samhället genom läroplan för grundskolan ger uttryck för.

Riktlinjer och mallar för betygskriterier inom grundutbildningen i biologi (beslutat av BIG: s styrelse den 13 juni 2007)

Kursplanen i engelska

Bilaga 1: La rar- och rektorsenka t

ENGELSKA. Ämnets syfte. Kurser i ämnet

LSU210, Specialpedagogiskt perspektiv på skriftspråksutveckling och matematisk begreppsutveckling pedagogiska konsekvenser, 15 högskolepoäng.

LAU670, Allmänt utbildningsområde 2, Lärarprofessionens didaktiska uppdrag, 30 högskolepoäng

Lärande bedömning. Anders Jönsson

Ämne - Engelska. Ämnets syfte

Kursen ingår i Kompletterande pedagogisk utbildning (KPU) vid Lunds Universitet. Kursen omfattar andra terminen av sammanlagt tre.

Företagsekonomi 1. Daniel Nordström

Uppenbar risk för felaktiga betyg

Kursplaner och kunskapskrav i grundskolan, specialskolan och sameskolan

Skolans uppdrag är att främja lärande där individen stimuleras att inhämta och utveckla kunskaper och värden.

Delkurs 1. Nordiska språk och svensk språkhistoria, 7,5 hp

Kursplan ENGELSKA. Ämnets syfte. Mål. Innehåll. Insikt med utsikt

Ramverk för bedömningsprocessen i verksamhetsförlagd utbildning i förskollärarutbildning

Betygssystemets antaganden och historia

Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas i signerad slutversion till examinator

REV Dnr: 1-563/ Sid: 1 / 8

Bedömning som ett sätt att utveckla matematikundervisningen. Per Berggren och Maria Lindroth

Gunnar Hyltegren Dagens program

- indikerar om anpassning av undervisning krävs, tidseffektivt. - ökat elevinflytande (av alla elever), ökar motivation

Ämnesprovet i årskurs Svenska och svenska som andraspråk

Engelska (31-55 hp) Programkurs 25 hp English (31-55 cr) 92EN31 Gäller från: Fastställd av. Fastställandedatum. Revideringsdatum

Undervisningen i ämnet engelska ska ge eleverna förutsättningar att utveckla följande:

Bedömning för lärande

Bedömning, betygsättning och VFU - 15 hp

Nya samlade läroplaner

INSTITUTIONEN FÖR FYSIK

Bedömning och betygssättning på Kungsholmens Gymnasium/Stockholms musikgymnasium

Hur formulerar och tillämpar vi betygskriterier?

INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER

Relationen mellan provresultat och betyg i grundskolans årskurs 6 och årskurs

Kulturell identitet och interkulturellt förhållningssätt

Redovisning 1. Daniel Nordström

Utbildningsfrågor Dnr 2006:2230. Ämnesprovet 2006 i grundskolans åk 9 och specialskolans åk 10

NSÄA30, Svenska III inom ämneslärarprogrammet, årskurs 7 9, 30 hp

BUSN40, Knowledge Work and Organization, 7,5 högskolepoäng Knowledge Work and Organization, 7.5 credits Avancerad nivå / Second Cycle

Resultat från ämnesproven i årskurs 9 vårterminen

LIMP34, Betygsättning, didaktik och VFU, 15 högskolepoäng Grading, Didactics and Internship, 15 credits Avancerad nivå / Second Cycle

Mall för betygskriterier vid Institutionen för språkdidaktik

Sammanställning av uppgifter från lärarenkät vid ämnesprovet i svenska och svenska som andraspråk i åk 9, vt 2014

Bedömningsstödet, en beskrivning

Förstärkt tillsyn av skolors arbete med bedömning

Sammanfattning Rapport 2010:13. Undervisningen i matematik i gymnasieskolan

Broskolans röda tråd i Svenska

HÖGSKOLAN FÖR SCEN OCH MUSIK

En ny betygsskala UTBILDNINGSFÖRVALTNINGEN. Handläggare: Elisabeth Forsberg Uvemo Telefon: Till Utbildningsnämnden

Bedömning FÖR och AV Lärande

Resultatrapport 2013: Ämnesprov i svenska och svenska som andraspråk för årskurs 3

I figur 1 och 2 redovisas betygsfördelningen på delproven i svenska 1 respektive svenska som andraspråk 1.

En ny betygsskala (Ds 2008:13) Remiss från Utbildningsdepartementet

Om ämnet Idrott och hälsa

Beslut. efter kvalitetsgranskning av betygssättning på högskoleförberedande program vid Rosendalsgymnasiet i Uppsala kommun.

Bedömning för lärande. Per Berggren och Maria Lindroth

Pedagogik, kommunikation och ledarskap

Systematiskt*kvalitetsarbete*i*process*

Utvecklingssamtal och skriftlig information KOMMENTARER

SAMSTÄMMIGHET MELLAN MÅL OCH PROV. En studie av det svenska förarutbildningssystemet

ENGELSKA FÖR DÖVA. Ämnets syfte

Skriftliga omdömen och betygssättning i praktiken

I arbetet hanterar eleven flera procedurer och löser uppgifter av standardkaraktär med säkerhet, både utan och med digitala verktyg.

LME 210, Mediekunskap för lärare 2, 30 högskolepoäng

INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER

UNDERVISNINGSPROCESSER, KOMMUNIKATION OCH LÄRANDE, 10 POÄNG

Beslutsunderlag Lärarutbildningsnämnden Maria Jansdotter Samuelsson

Betyg och bedömning. Föreläsning den 13 februari Lars Nohagen, Cesam Centrum för de samhällsvetenskapliga ämnenas didaktik.

LHK160, Mat och måltider i ett hållbart samhälle, 15 högskolepoäng

Spanska (31-55 hp) Programkurs 25 hp Spanish (31-55 ) 92SP31 Gäller från: Fastställd av. Fastställandedatum. Styrelsen för utbildningsvetenskap

BUSR31 är en kurs i företagsekonomi som ges på avancerad nivå. A1N, Avancerad nivå, har endast kurs/er på grundnivå som förkunskapskrav

Nationella prov i åk 6 ur ett skolledarperspektiv

Transkript:

Hur många poäng måste jag ha för att få VG? En samstämmighetsanalys av betygskriterier och skriftliga prov i organisk kemi, kemi b. Joakim Bodén Anders Hofverberg Ht 2009 Examensarbete på lärarprogrammet, 15 hp Institutionen för Pedagogik, Umeå Universitet

Sammanfattning I skolan använder sig lärare av skriftliga prov som ett av underlagen vid betygssättning, men det finns dåliga och bra prov. Ett bra prov utvärderar det som avses. Kan det vara så att betyg på skriftliga prov i dagens skola grundas på annat än vad som avses i betygskriterierna? För att granska detta gjordes en kvalitativ samstämmighetsanalys av autentiska prov och betygskriterier gällande organisk kemi, kemi b på gymnasiet. Till detta användes Blooms reviderade taxonomi. Undersökningen ämnade visa om skriftliga prov i var konstruerade på sådant vis att eleverna tilläts visa på kvalitéer som motsvarar Väl Godkänt (VG) och Mycket Väl Godkänt (MVG). En kompletterande enkätundersökning genomfördes med avsikten att ta reda på ifall lärarna använder sig av skriftliga prov för att bedöma VG och MVG. De skriftliga proven i vår undersökning och betygskriterierna för VG och MVG visar mycket dålig samstämmighet. De skriftliga proven betonar en lägre kognitiv nivå än betygskriterierna. Samtidigt visar enkätundersökningen att de skriftliga proven endast är en av flera underlag vid betygssättning. Sökord: Samstämmighet, betyg, styrdokument

Innehållsförteckning 1. Inledning... 5 1.1 Syfte... 5 1.2 Frågeställningar... 5 2. Bakgrund... 6 2.1 Några viktiga begrepp... 6 2.1.1 Styrdokument... 6 2.1.2 Samstämmighet... 6 2.2 Samstämmighetsstudier... 6 2.3 Svenska betygssystemets utveckling... 7 2.3.1 Absoluta betygssystemet... 8 2.3.2 Relativa betygssystemet... 8 2.3.3 Idén bakom mål- och kunskapsstyrda betyg... 9 2.3.4 Mål- och kunskapsstyrda betygssystemet... 9 2.4 Bedömning och betygssättning... 10 2.4.1 Varför finns betygen... 10 2.4.2 Vad ska lärare bedöma?... 11 2.4.3 Vilka underlag har läraren till betygssättning?... 12 2.4.4 Betygskriteriernas funktion... 13 2.4.5 Likvärdigheten i det mål- och kunskapsrelaterade betygssystemet... 14 2.5 Olika typer av prov... 17 2.6 Samstämmighet... 17 2.7 Kategoriseringsmodeller... 18 2.7.1 En jämförelse... 19 2.7.2 Allmänt om Blooms reviderade taxonomi... 20 2.7.3 Blooms reviderade taxonomi kunskapsdimensionen... 21 2.7.4 Blooms reviderade taxonomi den kognitiva processdimensionen... 23 3. Metod... 25 3.1 Avgränsningar och urval... 25 3.2 Bortfall... 26 3.3 Analys av prov- och betygskriterier... 26 3.4 Enkät... 29 3.5 Forskningsetiska överväganden... 30 4. Resultat... 31 4.1 Samstämmighet mellan bedömarna (interbedömarreliabilitet)... 31 4.2 Enkäten... 31 5. Diskussion... 41 5.1 Enkäten... 41 5.1.1 Första enkätfrågan... 41 5.1.2 Andra enkätfrågan... 42 5.1.3 Tredje enkätfrågan... 43 5.1.4 Sammanfattande diskussion om enkäten... 43 5.2 Prov... 44 5.3 Betygskriterierna... 45 5.4 Samstämmighet mellan prov och betygskriterier... 46

5.5 Metoden... 48 5.5.1 Reliabilitet... 49 5.5.2 Validitet... 51 5.5.3 Generaliserbarhet... 52 5.6 Vidare forskning... 52 6. Slutsatser... 53 Källförteckning... 54 Bilagor Blooms reviderade taxonomi... Bilaga 1 Kursplan kemi b... Bilaga 2 Enkäten med följebrev... Bilaga 3

1. Inledning I de diskussioner som förs i media syns ett växande intresse för betygen, betygen som ett verktyg för att skilja, mäta eller jämföra (Nordebo 2009; Stockholm TT 2009). Oavsett i vilket syfte betygen används förväntas det av allmänheten att betygen sätts efter samma normer och kriterier i hela den Svenska skolan. Det förväntas också att eleverna tillåts visa sin förtrogenhet i ämnet och att läraren skall kunna utvärdera elevens olika kognitiva processer samt vilka typer av kunskapsdimensioner eleven behärskar. Att konstruera frågor som går att utvärdera och som utvärderar det som avses är en av de svåraste uppgifter som en lärare möter. Konstruerar läraren skriftliga prov som tillåter eleven att visa på förståelse, förtrogenhet och färdighet? Om inte, när bedöms då hur väl eleven kombinerar och tillämpar sina kunskaper? Frågorna är många och de går alla att relatera till detta examensarbetes huvudämne, hur betyg och bedömningar är relaterade till varandra. Genom att observera och delta vid bedömningstillfällen på den verksamhetsförlagda utbildningen (VFU) har vi kommit i kontakt med denna för läraryrket grundläggande process, och allt eftersom har en viss skepsis byggts upp. Bedöms det som avses bedömas? Och på de grunder som är avsedda? Det var frågor som dessa som avgjorde valet av ämne. Framförallt är det frågan om det finns en generell trend av att lägre kognitiva kvalitéer i en större kvantitet genererar höga betyg som fångat vårt intresse, då vi från både vår egen skolgång och senare erfarenheter tyckt oss skönja ett sådant mönster. 1.1 Syfte Syftet med detta arbete är att försöka belysa frågan om betygskriterierna och proven är samstämmiga. Det är framförallt de högre betygen väl godkänt (VG) och mycket väl godkänt (MVG) som intresserar oss då det har visats att dessa nivåer är svåra att visa på skriftliga prov, eftersom de innebär krav på en högre kognitiv nivå (Andersson 1999). 1.2 Frågeställningar Är de skriftliga proven som analyserats i undersökningen konstruerade på ett sätt som tillåter eleven att visa på VG- och MVG-kvalitéer? Är de skriftliga proven det verktyg som lärarna i denna undersökning använder sig av för att bedöma VG- och MVG-kvalitéer? 5

2. Bakgrund 2.1 Några viktiga begrepp 2.1.1 Styrdokument Det som termen styrdokument syftar på i denna rapport är alla de dokument som styr den svenska skolans utformning och, av störst relevans i detta fall, betygssättningen. Till dessa dokument räknas främst kursplaner och läroplaner, men även till viss del skollagen. 2.1.2 Samstämmighet Ordet samstämd definieras av Svenska Akademins Ordlista (SAOL på nätet 2007) som som passar väl ihop. Alignment, den engelska översättningen av samstämmighet, definieras som arrangement in a straight line (Oxford advanced learner s dictionary). Detta är ordets allmänna mening, men termen definieras vidare i dess användning som fackterm i den pedagogiskt inriktade forskningen. Överlag rör det sig om hur väl två olika objekt stämmer överrens, men vilka dessa objekt kan vara varierar med författarna. Webb (1997) menar att Alignment is the degree to which expectations and assessments are in agreement and serve in conjunction with one another to guide the system toward students learning what they are expected to know and do (s. 3). Bhola, Impara och Buckendahl (2003) specificerar expectations som a state s content standards for a specific subject area (s. 1). Det finns dock de som vill bredda begreppet till att omfatta även andra objekt. Porter et al. (2007) menar att samstämmighet har två dimensioner: horisontell samstämmighet, t.ex. inom en nivå av beslutsfattare, och vertikal samstämmighet, till exempel mellan beslutsfattare och skolor. I Porters modell för samstämmighetsanalys omfattas även lärarens undervisning av samstämmighetsbegreppet (Porter 2002; Porter et al. 2007). Vissa som utelämnar denna dimension väljer istället att anta att samstämmighet mellan styrdokument och lärarens undervisning är en förutsättning för samstämmighet i övrigt (La Marca et al. 2000). 2.2 Samstämmighetsstudier Ingen tidigare forskning på samstämmigheten mellan betygskriterier och prov har hittats under litteratursökningen till denna uppsats. Dock finns det andra typer av samstämmighetsanalyser som gjorts inom skolans värld. De flesta av dessa undersökningar är utförda i 6

USA och avser samstämmigheten mellan prov och mål ur styrdokumenten (se till exempel Liu & Fulmer 2008; Webb 1999). Detta beror enligt bland annat Bhola, Impara och Buckendahl (2003) och Porter et al. (2007) på en lag som kom i USA 2001, the No Child Left Behind (NCLB) Act. I denna lag slås det bland annat fast att USA:s stater måste ha utvecklat styrdokument (content standards) och bedömningsformer (assessments) som är samstämmiga. Det finns även undersökningar där stater i USA jämförs med andra länder (Liu et al. 2008). Förutom studier där utvärdering av samstämmigheten i ett visst system är i fokus och de metodbeskrivningar som beskrivs närmare i litteraturgenomgången (se 2.7 Kategoriseringsmodeller) och metoddelen (se 3.3 Analys av prov- och betygskriterier) i detta arbete, finns det även studier som koncentrerar sig på utvärdering av metoder för samstämmighetsanalyser. Även här är många studier utförda i USA (se till exempel Bhola, Impara & Buckendahl 2003; Rothman 2003) men även svenska studier påträffas (Näsström 2008; Stenlund 2006). 2.3 Svenska betygssystemets utveckling Att redogöra för betygssystemets historia kan göras med olika ansatser. Samhällets tendenser har avgörande betydelse för strukturen i skolan där historiska händelser inverkar med olika dignitet på skolverksamheten. Avsikten med denna del är dock inte att djupare beskriva de historiska och politiska skeenden som påverkar styrningen av skola. Fokus i denna återblick är på resultatet av de politiska besluten där tyngdpunkten landar i dagens betygssystem och dess roll i skolan. Betygens tillämpning i skolan är ett återkommande bryderi som har diskuteras, debatteras och formats av många (se till exempel: Andersson 1991,1999; Jansdotter Samuelsson & Nordgren 2008; Måhl 1991; Selghed 2006; Tohlin 2006). Historiskt har svenska skolan gått från det absoluta betygssystemet, där betygen saknade anvisningar och lärarens egen princip blev styrande för betygssättningen, via det relativa betygssystemet till dagens mål- och kunskapsstyrda betygssystem (Skolverket 2008). I följande avsnitt beskrivs dessa tre betygssystem och en kort redogörelse för några tankar kring växlingen mellan dessa presenteras. 7

2.3.1 Absoluta betygssystemet Bokstavssystemet som fanns i skolan fram till andra världskrigets slut speglar en statisk samhällsbild där förändringstakten är låg (Selghed 2006). Samhället går från ett jordbrukssamhälle mot ett mer industrialiserat samhälle där monarkin alltmer avtrubbas och demokratiska värderingar växer fram (Jansdotter Samuelsson & Nordgren 2008). Både Jansdotter Samuelsson och Nordgren (2008) och Selghed (2006) beskriver skeenden i samhället som strävar mot en liberalare politisk syn där kunskapsspridningen blir allt viktigare. Ett samhälle där människorna börjar flytta till jobben och kvalitéer som att skriva, läsa och räkna blir allt viktigare. Det parallella skolsystemet växer fram med en skola för alla och en skola för de blivande tjänstemännen, en skola som enligt Jansdotter Samuelsson och Nordgren (2008) inte hade några tydliga riktlinjer, en skola utan en förankrad betygsskala eller uniform organisation. De tidigaste betygen mätte absolut kunskap med hjälp av läroverkets studentexamina där man såg mänskligt tänkande som grund för kunskap (SOU 1992:86). Den rationalistiska kunskapsuppfattningen framställs av Selghed (2006) som förklaringen till tidens skolsyn där kunskap beskrevs som eviga sanningar och att lära sig saker utantill var av vikt och lärarna bedömde elevers flit, uppförande och begåvning. Allt eftersom kravet på högre utbildning höjdes och behovet av specialister ökade framställdes krav på att betygen även skulle fungera som urvalsgrund (Isling 1998). Kraftiga svängningar i samhället och en internationalisering ledde till att staten beslutade om att reformera skolsystemet (Selghed 2006). 2.3.2 Relativa betygssystemet I 1957 års skolberedning föreslås en relativ skala där medelstudenten i årskursen blir standard för bedömning (SOU 1961:30). Den sjugradiga bokstavsskalan ersätts med en femgradig sifferskala i vilken objektiv och kvantitativ kunskap var i fokus (Selghed 2006). Godkändgränsen tas bort. I en skola som skall inkludera alla människor bör inte en sådan skiljelinje ritas ut, skriver Andersson (1991) i sin bok De relativa betygens uppgång och fall. Med detta menar Andersson att beslutet är förenligt med det relativa tänkandet, samtidigt som han konstaterar att betyg i ordning och uppförande blir lik tidigare modell. Lgr 62 formas och den femgradiga relativa skalan blir verklighet där centralt utgivna skriftliga prov blir ett hjälpmedel för lärarna vid betygssättning (ibid.). I Jansdotter Samuelsson och Nordgren (2008) behandlas kvalitetsbegreppet i betygsättningen där standardproven från skolöverstyrelsen skall fungera som måttstock och hjälpmedel 8

till lärarnas bedömning och betygssättning. Vidare klarlägger Jansdotter Samuelsson och Nordgren kopplingen till normalfördelningskurvan där nationen skulle utgöra normen och att betygsfördelningen skall vara relativ. Denna strömning skedde inte bara i Sverige utan i stora delar av västvärlden (Korp 2006) och Jansdotter Samuelsson och Nordgren (2008) skildrar hur detta hade ett samband med att andra samhällsområden också gavs ökad statlig styrning i denna centraliseringsepok. Perioden fram till 1980 brukar även benämnas som en deprofessionaliseringsepok av skolan där centrala och externa verktyg formades av staten och lärarens tillvaro blev alltmer styrd (ibid.). Ändrade läroplaner gav samtidigt lärarna tydligare riktlinjer för samarbete mellan ämneskollegor, dels för att öka betygens likvärdighet, dels för att åstadkomma en strävan mot gemensamma mål (ibid.). Detta konstaterar Jansdotter Samuelsson och Nordgren (2008) gå stick i stäv med dåvarande betygssystem som urvalsmetod och kan ses som starten på reformeringen mot dagens betygssystem. I tider då man talar om vikten av rätt man på rätt plats (Selghed 2006) blev kritiken mot det relativa betygssystemet hård då det i själva verket endast beskrev hur en elevs kunskaper förhöll sig till en annans (Andersson 1991). I Anderssons bok De relativa betygens uppgång och fall (1991) belyser författaren kritiken mot det relativa betygssystemet och proklamerar kravet på målrelaterade betyg. 2.3.3 Idén bakom mål- och kunskapsstyrda betyg Selghed (2006) beskriver kriterierelaterad bedömning som ett försök att stipulera om en elev innehar en bestämd egenskap eller förmåga genom att dessa egenskaper eller förmågor jämförs mot fastlagda ramar. Med detta menar Selghed att resultatet som eleven presterar inte avses att jämföras med andra elevers resultat utan endast används för att utröna ifall eleven har nått ett mål. Dessa principer menar Selghed ligger till grund för Sveriges måloch kunskapsstyrda betygssystem. De delar av samhället där målbeskrivningar anses bringa framgång diskuterar Andersson (1999) och visar på en distinkt koppling till industrin och tydligheten med dess målbeskrivning. Den påverkan som sker på skolan genom samhällsströmningar i dessa tider och idag är påtaglig. 2.3.4 Mål- och kunskapsstyrda betygssystemet Debatten under 80-talet understryker behovet av resultat och målstyrning inom skolan och i slutet av 1989 tillsätts en expertgrupp som har till uppgift att arbeta fram en övergång från det relativa till det målrelaterade betygssystemet (Andersson 1991, 1999). I SOU 1992:86 9

beskriver dåvarande skolminister Göran Persson att utgångspunkten för det nya betygssystemet skall vara att elevernas faktiska prestationer bedöms mot uppställda mål. Urvalsmetoden tonas ner och kvalitativa och generella kunskapsmål hamnar i fokus (Jansdotter Samuelsson och Nordgren 2008). Andersson (1999) tar upp ännu ett yttrande i sin bok Varför betyg där skolministern berör kravet på jämförbarhet och påtalar att principen för detta är att ta fram tydliga mål- och kravbeskrivningar. Arbetet fram till införandet av Läroplanen för de frivilliga skolformerna (Lpf 94) genomsyras dock av en misstro från beredningen på jämförbarheten i det nya systemet. I det slutgiltiga förslaget (prop. 1994/95:85) som leder till Lpf 94 fanns en fyrgradig betygsskala: Icke Godkänt, Godkänt, Väl Godkänt och Mycket Väl Godkänt med ett tillägg på betygskriterier till betygen G och VG (Andersson 1999). Standardiserade relativa prov föregick dagens provskola där influenser under slutet av 90- talet styrde provkonstruktionen mot processer i lärandet (ibid.). Med detta menar Andersson att fokus har flyttats från den psykometriska traditionen mot en högre kognitiv nivå där klart mätbara metoder ersätts alltmer av mer öppna uppgifter som visar på förståelse och reflektion. Andersson vidhåller också att en vanlig uppfattning är att skriftliga prov ofta mäter minneskunskaper och faktakunskaper medan den fördjupade kognitiva nivån sällan eller aldrig nås. 2.4 Bedömning och betygssättning Följande definition av bedömning, som görs av Selghed (2006), är den innebörd som avses i detta arbete: Bedömning är den process som består av lärarens arbete med att bilda sig en uppfattning om elevens totala utveckling, det vill säga både kunskapsmässigt, språkligt, känslomässigt och socialt (s. 11). Vidare definierar Selghed betygsättning som ( ) att läraren, vid en given tidpunkt, skall sammanfatta sina bedömningar av elevens kunskaper och kunnande i de ämnen som ingår i kursplanen eller kursen och uttrycka detta i ett av betygen icke godkänd, godkänd, väl godkänd eller mycket väl godkänd, beroende på kvaliteten i kunskaperna och kunnandet hos eleven. (s. 11). 2.4.1 Varför finns betygen Jansdotter Samuelsson och Nordgren (2008) beskriver några allmänna tillämpningar hos betygen. Urvalsfunktionen hävdas vara betygens grundfunktion där rangordningen ger förtur till dem som klarar kriterierna för betygen bäst. Betygen kan samtidigt användas som en informationsbärare där en anvisning om elevens kunskapsutveckling i förhållande till betygskriterierna beskrivs. Denna information tolkas av mottagaren och kan sedan användas 10

på olika sätt. Ett av användningsområdena är att möjligheten att kontrollera likvärdigheten mellan skolor där nationella och internationella jämförelser verkar för en utökad jämlikhet. Betygen kan uppfattas som motiverande i vissa fall medan andra uppfattar betyget som förlamande. Den maktrelationen som betyget innebär uttrycker ramarna för eleverna och anger vad som värderas vid betygssättning. Dessa tillämpningar kan tematiseras med olika ansatser och Jansdotter Samuelsson och Nordgren visar på att det finns en relation mellan betygens funktion och lärarens professionella utrymme. Jansdotter Samuelsson och Nordgren (2008) hävdar att en för stark statlig kontroll inskränker på lärarens professionalism och kan leda till att läraryrket deprofessionaliseras. I propositionen till det betygssystem som sittande regering har arbetat fram (Prop.2008/09:66), så beskriver regeringen skälen till införandet av fler betygssteg. Genom fler betygssteg vill regeringen bland annat att lärarna ska ha möjlighet att göra mer precisa bedömningar av elevernas kunskapsnivåer och hur eleven utvecklas inom dessa ska bli tydligare. De hoppas också att eleverna ska känna att betygen blir rättvisare då tydligheten i bedömningen ökar. Tanken är även att fler elever kommer vara nära ett högre betyg och därför känna sig sporrade att satsa lite extra för att uppnå detta högre betygssteg. 2.4.2 Vad ska lärare bedöma? Selghed (2006) anser att lärare i Sverige har en unik position och påpekar hur viktigt det är för lärare som auktoritära bedömare och betygssättare att ha god förståelse för vad som skall bedömas och hur denna process är utformad. Andersson (1999) och Selghed (2006) analyserar styrdokumenten och konstaterar att dessa tydligt visar att läraren skall bedöma och betygssätta elevens formella kompetens. Andersson (1999) konstaterar att styrdokumenten inte ger stöd för betygssättning av personlighetsegenskaper och får medhåll av Selghed (2006) som väljer att använda sig av begreppet personlighets- och beteendeaspekter och vidhåller att lärare inte ska ta hänsyn till denna sociala utveckling. Jansdotter Samuelsson och Nordgren (2008) slår fast att sådana saker som uppförande, närvaro, flit, ambition och läxläsning inte ska ligga till grund för betyget. Det enda som egentligen bedöms är om eleven når en högre kunskapsnivå, något som i och för sig kan vara följden av flit och ambition. Däremot anser Jansdotter Samuelsson och Nordgren att det finns stöd för att arbetsprocessen bör inkluderas i den formativa bedömningen. Selgheds gör i boken Betyg i skolan från 2006 en analys av vad lärarna tar fasta på i elevers prestationer vid betygsättning, och detta resulterar i sex olika kategorier: 11

A. Elevens kunskaper och färdigheter B. Elevens sätt att agera i skolarbetet C. Eleven som person D. Skolorganisatoriska aspekter E. Externa krav och förväntningar F. Lärarens personliga läggning (s. 174) Selghed skriver senare i samma bok att detta tydligt visar på att aspekter som inte skall vägas in i betyget ändå vägs in och att några av dessa aspekter inte kan påverkas av eleven själv. Vidare ifrågasätter Selghed målen och kriteriernas formuleringar där han tycker sig se att dessa är vilseledande och försvårar betygssättningen (för ett exempel på betygskriterier, se bilaga. 2). Ändå är kravet på stöd till bedömning är något som har redovisats i flera undersökningar (Skolverket 2000, 2001). Styrdokumenten som är fastställda genom gängse normer av regeringen har olika ansatser. I gymnasieförordningen (SFS 1992:394) beskrivs bestämmelser för betygen. Här preciseras exempelvis användandet av nationella prov som likvärdighetsverktyg. I läroplanen för de fria skolformerna (Lpf 94), står det att: Betygen uttrycker i vad mån den enskilda eleven har uppnått de kunskapsmål som uttrycks i kursplanen för respektive kurs och som definieras i betygskriterier. ( ) Läraren ska vid betygsättningen utnyttja all tillgänglig information om elevens kunskaper i förhållande till kraven i kursplanen, beakta även sådana kunskaper som en elev tillägnat sig på annat sätt än genom den aktuella undervisningen, beakta såväl muntliga som skriftliga bevis på kunskaper, och göra en allsidig bedömning av kunskaperna och därvid beakta hela kursen. (s 16) 2.4.3 Vilka underlag har läraren till betygssättning? En tydlig tendens, enligt Korp (2006), är att lärare till största del använder sig av skriftliga prov vid betygssättning och muntliga prov eller mer informella bedömningar får litet utrymme. Dock använder sig lärare av flera olika typer av underlag vid betygssättning: Uppgifter som lärare i svenska och engelska tog upp som underlag för betygssättning var, utöver de nationella proven: Skriftliga och muntliga redovisningar och recensioner av litterära texter 12

Större och mindre prov som liknar de nationella proven eller någon del av dem Tal av olika slag och talövningar i grupp och par Autentiska skrivuppgifter ( ) Läxprov ( ) (Korp 2006 s. 206) Senare konstaterar Korp att det finns skillnader mellan olika program och skolor sett till omfattningen av underlaget. Hon menar att vissa program generellt har uppgifter som är av en återgivande natur medan andra program understryker vikten av analys och teori. Alla subjektiva bedömningar som görs anser Egidius (2005) vara av låg reliabilitet medan standardiserade flervalsfrågor är av hög reliabilitet. Dessa standardiserade frågor som enkelt kan klassificeras menar också Andersson (1999) visar på en hög reliabilitet samtidigt som denna klassificering innebär en förenkling av provfrågorna. 2.4.4 Betygskriteriernas funktion Betygskriterierna togs fram i och med införandet av det nya betygssystemet 1994 och kriterier för godkänt och väl godkänt för gymnasiekurser presenterades i SOLFS 1994:11 (Skolverket 1994). Kriterier för mycket väl godkänt kom först 2000 (Jansdotter Samuelsson & Nordgren 2008). Underlag för betygskriterierna togs fram av Skolverket i samarbete med 150 gymnasie- och komvuxlärare anställda inom Örebro kommun (Skolverket 1994). I Lpf 94 står det att betyget skall uttrycka: ( ) i vad mån den enskilda eleven har uppnått de kunskapsmål som uttrycks i kursplanen för respektive kurs (s. 15). Tanken med betygskriterierna är att de ska definiera detta närmare (Skolverket 1994). De ska alltså förtydliga kraven i kursplanen och därigenom fungera som ett stöd för läraren vid betygssättning (ibid.). Kunskapssynen baseras, liksom läroplanen Lpf 94, på SOU 1992:94, Skola för bildning, där de fyra olika kunskapsformerna fakta, förståelse, färdigheter och förtrogenhet beskrivs. Dessa kunskapsformer, de fyra f:en, är sammanvävda i betygskriterierna (Jansdotter Samuelsson & Nordgren 2008) I Skolverkets (1994) skrift Betygsboken återfinns en beskrivning över olika uttryck för nivåskillnader i betygskriterierna. Dessa nivåuttryck sammanfattas av Andersson (1994) som situationens komplexitet, graden av självständighet och resultatens kvalité. Vidare anges aktiva verb, som beskriver och förklarar, för att beskriva kvalitativa skillnader i elevernas kunskapsnivå och betyget väl godkänt ska visa på en verklig fördjupning av kunskaperna i 13

ämnet jämfört med betyget godkänt (Skolverket 1994, s. 10). Dock behöver inte stegen mellan olika betyg vara lika stora, det vill säga progressionen behöver inte vara linjär. Dessutom kan graden av kunskapsfördjupning som skiljer stegen åt variera mellan olika kurser (ibid.) Dock finns det kritiker som hävdar att kriterierna inte fungerar som de ska. Andersson (1999) anser att det inte finns några tydliga kvalitativa kunskapsnivåer och att det ofta saknas progression mellan godkänt och väl godkänt. Andersson menar vidare att betygskriterierna saknar bas i kunskapsteori, istället tycks det som om kursplanernas mål fått utgöra grunden för dem. Han får delvis medhåll av Jansdotter Samuelsson och Nordgren (2008) som skriver att den största skillnaden mellan de olika nivåerna ligger i vilken grad av självständighet och initiativ som krävs av eleverna. Dock menar Jansdotter Samuelsson och Nordgren att en viss progression kan anas, även om den är komplex och flerdimensionell. Avslutningsvis kan det konstateras att Andersson (1999) är starkt kritisk till betygskriteriernas utformning. Han menar på att de på riksnivå är både inkonsekventa och luddiga till den grad att lärarna får stora problem med sina tolkningar av dem. Ett annat problem som flera författare tar upp är att skillnaderna mellan mål och kriterier i skolans styrdokument är förvirrande och detta gör att fokus flyttas mot de mer stringenta betygskriterierna (Andersson 1999; Selghed 2006). Denna förvirring gör att läraren känner att stödet vid bedömningssituationerna är otillräckligt (Selghed 2006). 2.4.5 Likvärdigheten i det mål- och kunskapsrelaterade betygssystemet Ett problem som ofta lyfts fram i debatter kring betygssystem är rättviseaspekten där likvärdigheten i bedömningen anses vara ett stort problem (Nordebo 2009; Skolverket 2009; Stockholm TT 2009). Tidigare i denna rapport gjordes en historisk återblick gällande betygssättning och bedömning där det beskrevs hur betyget har gått från ett skiljeverktyg till ett mätverktyg. Politiska skeenden till trots sker en progression i skolan mot en mer strukturerad bedömning av människors kunskaper där validering av bedömningen är central (Egidius 2005). I Skolverkets Handlingsplan för en rättsäker och likvärdig betygssättning (2004b) konstateras att en rättvis betygssättning innebär att det betyg en elev fått i ett visst ämne eller i en viss kurs ska visa elevens kunskaper och färdigheter i det som skall ingå i kursen enligt kursplanen och som motsvarar betygskriterierna för betyget (Skolverket 2004b, s. 3). Senare definieras likvärdig bedömning som ett fall där ett betyg i en klass ska 14

vara jämförbart med samma betyg för en annan klass. Bedömningen skall alltså vara likvärdig för alla elever. Men är betygen verkligen rättvisa? Skolverkets analys av sambandet mellan nationella prov och kursbetyg visar flera resultat som aktualiserar denna debatt (Skolverket 2009). Skolverket (2000) skriver i sin nationella kvalitetsgranskning angående betygssättningen att det finns stora brister gällande en likvärdig och rättvis betygssättning, och dessutom har ansvaret i alltför stor utsträckning lagts på lärarna. Med detta menar Skolverket att kommuner och stat inte erbjudit lärarna och skolorna det stöd som behövdes vid införandet av det nya betygssystemet. I senare utredningar diskuteras hur främjandet av likvärdig betygssättning sett ut och vad som görs och gjorts (Skolverket 2007). Där nämns de nationella kursplanerna, inklusive både uppnåendemål och betygskriterier, som det viktigaste statliga verktyget för en likvärdig bedömning. Även fortbildning för aktiva lärare och krav på förtrogenhet gällande betygssättning för blivande lärare är metoder som staten använder sig av för att främja likvärdigheten. Dessutom ger Skolverket ut olika stöd för betygssättning, så som allmänna råd och kommentarer och olika bedömningsexempel. Skolverket avslutar uppräkningen på verktyg för likvärdig betygssättning genom att nämna stödet som de nationella proven utgör. De nationella proven ger en indikation på variationen mellan skolor och lärares tolkning av betygskriterierna (Skolverket 2009). Samtidigt förs en parallell diskussion om betygsglidningens roll för likvärdigheten inom skolan där skolverket beskriver tendensen att lärare sätter orimligt höga betyg (Skolverket 2004). Undersökningar visar på skillnader mellan nationella prov och slutbetyg. Dessa skillnader anses berättigade eller rimliga i enstaka och individuella fall men inte när det gäller en hel klass eller skola. Med detta visar skolverket först på att betygsglidningen finns och senare presenteras förklaringar till denna glidning. Det som påverkar likvärdigheten inom ramen för betygssättning är individuella tolkningar av mål- och betygskriterier samt kursplaner relativt till elevgruppen och individuell bedömning av prov (Skolverket 2007). Samtidigt visar utredningen från Skolverket (2007) att det finns förklaringar till betygsglidningen utanför ramarna för betygsbestämmelserna. Dessa är bland annat att lärare väger in faktorer som allmänna beteenden och attityder samtidigt som konkurrensen mellan skolor bidrar till variation och betygsinflation. I regeringens proposition för den nya läroplanen kan en större vikt vid nationella ämnesprov och ett större krav på underlag för betygssättningen utläsas (prop. 2008/09:87). I Skolverkets utredning från 2007 diskuteras några förslag som kanske skulle leda till en större samsyn mellan lärare och 15

öka likvärdigheten mellan slutbetyg och prov. Krav på skriftliga motiv vid avvikande betygssättning jämfört med provbetygen och sambedömning av prov anses vara två av de viktigare punkterna för att generera likvärdighet inom skolan. Jansdotter Samuelsson och Nordgren (2008) sammanfattar två ytterligare förklaringarna till otillfredsställande likvärdighet: 1) Brist på utbildning Här pekat Jansdotter Samuelsson och Nordgren på ett alltför litet stöd i samband med betygsövergången, bristande stöd i formen av otillräcklig utbildning och fortbildning. 2) Konstruktionsfel på betygssystemet Jansdotter Samuelsson och Nordgren ställer här en fråga angående förenligheten mellan likvärdighet och ett mål- och kriteriestyrt betygssystem. Denna fråga besvaras inte men det konstateras att betygssystemet är utformat för att ge information om individuella kunskapskvaliteter inte för att ge likvärdig information om ett inhämtat kunskapsmål (Jansdotter Samuelsson & Nordgren 2008 s. 58). Detta framhålles av kritiker som ett av de fundamentala problemen med dagens betygssystem då kravet på likvärdighet och lärarens professionalitet ställs mot varandra. Även Korp (2006) diskuterar bristen på likvärdighet i dagens svenska betygssystem. Hon beskriver ett antal olika former av variation mellan lärare, vilka hotar likvärdigheten. Vissa av dessa variationer rör relationen till de nationella proven, så som hur lärarna bedömer elevernas lösningar och svar och hur lärarna sedan väljer att använda sig av denna bedömning i betygssättningen. Lärarna väljer även att anpassa det nationella provet olika mycket till lokala förutsättningar och de aktuella elevernas villkor. Andra variationer som Korp tar upp är mer allmänna, så som lärarnas anpassning av kursen, att lärarna stundtals bryter mot reglerna för betygssättning, att elever blir godkända trots att de inte klarat kursens mål och att vissa lärare värderar beteendekriterier vid betygssättning. Denna sista punkt strider mot de gällande kursplanerna där sådana bedömningsgrunder saknas i både betygskriterier och kursmål. Det finns tendenser till att variationerna är kopplade till vilken typ av program det gäller (yrkes- eller studieförberedande) och skolmiljön (hög- respektive lågpresterande), men enligt Korp finns inga entydiga samband. 16

2.5 Olika typer av prov Prov genomförs på olika sätt och med olika ansatser. Proven kan utföras skriftligt eller muntligt, gruppvis eller individuellt, vid enstaka tillfällen eller över längre tid, praktiskt eller teoretiskt (Jansdotter Samuelsson & Nordgren 2008). Andersson (1999) påpekar att proven ofta blir en kompromiss mellan olika ramfaktorer där det är vanligt att högt strukturerade frågor kan kompletteras med öppna svar eller kommentarer. Jansdotter Samuelsson och Nordgren (2008) lyfter syftet med prov och belyser detta med en klassisks indelning i fyra kategorier: Diagnostisk: anger hur det nuvarande resultatet skiljer sig från det förväntade resultatet. Kan användas för att identifiera specifika problem som eleven kan ha. Formativt: en bedömning som hjälper elev att lära; används tillsammans med åtgärder som är framgångsrika i att överbrygga skillnader mellan faktiska resultat och förväntade resultat. Summativt: en bedömning som används för att intyga en avklarad utbildning, summera prestationer på en kurs, ge ett prognosvärde för framtida studier. Evaluerande: information från bedömningar används för att bedöma lärares och skolors prestationer. (Weeden, Winter & Broadfoot 2002, s.20, se Jansdotter Samuelsson & Nordgren 2008, s.116) Sammantaget ser Jansdotter Samuelsson & Nordgren en historisk distinktion som skiljer traditionella prov från alternativa, där de traditionella anses vara konventionella, skriftliga och summativa och de alternativa betraktas som formativa och praktiska. De alternativa ses som mer öppna prov där eleven ges ett större utrymme samtidigt som förståelse, förtrogenhet och färdigheter testas. Till denna historiska distinktion ställer sig Jansdotter Samuelsson och Nordgren frågande och hävdar att en enklare åtskillnad vore att skilja på bra och dåliga prov. Med ett bra prov menas ett prov som ger underlag för att bedöma det som provet avsåg (s.135), ett prov som ofta består av flera olika delar vilket gör att frågorna i provet inkluderar flera olika kunskapsnivåer och kognitiva nivåer (ibid). 2.6 Samstämmighet Webb (1997) framhåller vikten av att inte bara se på ett enstaka prov utan större system av bedömningar. Enskilda prov riskerar att visa låg samstämmighet med styrdokumenten då proven ofta är för smala för att täcka in hela bedömningsområdet. Att se till att det råder samstämmighet mellan styrdokument och bedömningsformer har en rad fördelar. Hansche (1998) sammanfattar det hela med orden: 17

Content standards, performance standards and assessments must be aligned so that what is taught is tested and what is tested is taught. No surprises, no questions, no controversy and no confusion. (s. 21) Rothman (2003) pekar på hur samstämmighet försäkrar provens validitet. Näsström (2008) framhåller också samstämmighetens vikt för validiteten av tolkningen av resultat från bedömningar, men betonar också att de två begreppen validitet och samstämmighet inte är synonymer. Validitet handlar om tolkningen av ett provresultat, samstämmighet rör även själva provet redan före någon genomfört det. (ibid.). En annan fördel är att ett samstämmigt system på ett effektivare sätt ger möjlighet för eleverna att nå goda studieresultat (Hansche 1998). Då prov och styrdokument är samstämmiga har lärare mer förtroende för dessa och använder dem i större utsträckning (Webb 1997). Lärarna ser också till att undervisningen följer styrdokumenten i större utsträckning då de litar på att bedömningarna är samstämmiga med dessa. Dessutom har lärarna lättare att omvandla målen i styrdokumenten och vad som tas upp på proven till konkret undervisning om länken mellan de båda blir tydligare (ibid.) Slutligen har Näsström (2003) konstruerat en modell för att beskriva vikten av samstämmighet. I denna modell är samstämmigheten länkar som binder samman de tre delarna undervisning (teaching), bedömning (assessment) och styrdokumenten (standards). Starka länkar håller ihop de tre delarna trots påfrestningar, men en svag länk kan få hela kedjan att brytas och delarna att falla isär. 2.7 Kategoriseringsmodeller För att analysera styrdokument och prov behövs en kategoriseringsmodell som antingen jämför de båda mot en gemensam referensram, eller jämför de båda direkt med varandra. Det finns ett antal olika sådana kategoriseringsmodeller att välja på, bland annat Porters kategoriseringsmodell (Porter 2002), Webbs modell (Webb 1999) och Blooms reviderade taxonomi (Anderson & Krathwohl 2001, se bilaga 1). I beskrivningen nedan används en svensk översättning av Blooms reviderade taxonomi så som den presenteras i Stenlund (2006). Översättningen av Webbs och Porters begrepp står författarna av denna rapport själva för. I dessa fall finns även originaltermerna med. 18

2.7.1 En jämförelse I Webbs modell jämförs provuppgifter och mål ur styrdokument i samma matris (Webb 1999). Målen står i raderna och varje kolumn motsvarar en provuppgift. Provuppgifterna kategoriseras enligt vilket/vilka mål de motsvarar och i den cell som denna träff motsvarar fylls den aktuella kunskapsdjupsnivån (depth-of-knowledge level) i. De fyra nivåer som Webb presenterar är: minnas (recall), skicklighet/begrepp (skill/concept), strategiskt tänkande (strategic thinking) och breddat tänkande (extended thinking) (ibid.). Porters modell och Blooms reviderade taxonomi påminner strukturellt om varandra då båda använder sig av en tvådimensionell matris för kategorisering av styrdokument och provfrågor separat. Båda modellerna har även kognitiv nivå som en av dimensionerna ( cognitive demand i Porters modell och cognitive process i Blooms reviderade taxonomi). Hur dessa kognitiva nivåer är organiserade och vilka de är skiljer sig dock åt mellan modellerna. Porters modell har reviderats vid ett flertal tillfällen, och det finns därför ett antal olika uppsättningar av kognitiva krav. Dessutom ser kategorierna olika ut för olika ämnen. I Porter och Smithson (2001a) presenteras sju kategorier anpassade för naturvetenskap: memorera (memorize), förstå begrepp (understand concepts), utföra procedurer (perform procedures), generera frågor/hypoteser (generate questions/hypotheses), samla in data (collect data), analysera och tolka information (analyze and interpret information) och använda information för att göra kopplingar (use information to make connections). Motsvarande kognitiva kategorier i Bloom är sex till antalet, nämligen: minnas, förstå, tillämpa, analysera, värdera och skapa (Anderson & Krathwohl 2001). I den senare är kategorierna ordnade enligt stigande kognitiv komplexitet, från att minnas till att skapa (Näsström 2008). I båda modellerna finns ett antal underrubriker som förtydligar de kognitiva nivåerna. Vad gäller den andra dimensionen så finns det stora skillnader mellan modellerna. Porter väljer att använda denna dimension åt topics, det vill säga specifika delområden av ett ämne (Porter 2002). Exempel på sådana delområden inom naturvetenskapen på high school, närmare bestämt inom organisk kemi, är organiska reaktioner och aromatiska kolväten (Porter 2001b). I Blooms revidera taxonomi utgörs denna andra dimension istället av olika former av kunskap: faktakunskaper, begreppskunskaper, procedurkunskaper och metakognitiv kunskap (Anderson & Krathwohl 2001). Dessa är, liksom gällande den kognitiva dimensionen, ordnade från det konkreta till det abstrakta (Näsström 2008). 19

Näsström (2008) framhåller Blooms reviderade taxonomi som effektivare än Porters modell för samstämmighetsanalyser mellan provuppgifter och styrdokument. Detta baseras bland annat på högre reliabilitet på grund av bättre samstämmighet mellan individuella bedömare, att färre mål och uppgifter träffade flera kategorier i matrisen (multikategorisering) och på att denna modell gav upphov till färre icke kategoriserbara mål (ibid.). Trots att Blooms reviderade taxonomi står sig bra i jämförelse med Porters modell vad gäller multikategorisering så ses detta ändå som ett problem då det framträder relativt frekvent (Näsström 2008). Detta bryter mot en av de fem regler som Hauenstein (1998) har satt upp för en fungerande samstämmighetsmetod, regler som Näsström (2008) använder sig av i sin utvärdering av Blooms reviderade taxonomi. Anledningen föreslås bland annat vara för breda och vaga mål i styrdokumenten, och målen i de svenska kursplanerna beskrivs som alltför ordrika (ibid.). Dock visar en annan undersökning i samma verk att ett förtydligande av målen genom uppdelning i mindre, tydligare mål ger relativt liten påverkan på multikategoriseringen, även om den minskade (från 89 till 60 % när det gäller antalet mål som multikategoriserades av minst en bedömare). Därmed föreslås multikategoriseringen snarare bero på det aktuella ämnets karaktär (matematik), instruktionerna till bedömarna och Blooms kategorier (ibid.). 2.7.2 Allmänt om Blooms reviderade taxonomi Redan 1956 presenterade Benjamin Bloom en modell för kategorisering av utbildningsrelaterade mål (Anderson & Krathwohl 2001). Verket där denna modell presenterades, The Taxonomy of Educational Objectives, The Classification of Educational Goals, Handbook I: Cognitive Domain (enkelt kallad the Handbook, Bloom 1956) fick stort genomslag över hela världen. Det faktum att boken har översatts till fler än 20 språk indikerar dess vida spridning (ibid.). Dock förändras synen på kunskap och lärande och därför har Anderson och Krathwohl, bearbetat denna kategoriseringsmodell för att skapa Blooms reviderade taxonomi. Den senare var även en av de bidragande författarna till den ursprungliga handboken. Anderson och Krathwohl (2001) beskriver ett antal skillnader mellan originalet och den reviderade taxonomin. Den största förändringen är införandet av en andra dimension, kunskapsdimensionen. Denna har sitt ursprung i den första kategorin från den ursprungliga modellen: kunskap. Kunskapskategorin har delats upp i dels en substantivdel (den nya kun- 20

skapsdimensionen), dels en verbdel (den första kategorin i den reviderade taxonomin: minnas). Även de övriga kategorierna har ändrats från substantiv till verb, till exempel har förståelse (comprehension) blivit förstå (understand). Anledningen till detta är en anpassning efter hur de flesta målen i styrdokumenten är utformade, där eleven skall kunna göra något (verb) med/om/i något (substantiv). Tanken är att verben skall gå att återfinna i den kognitiva dimensionen medan kunskapsdimensionen skall stå för substantiven. Ytterligare en förändring är att kategorierna skapa (create, tidigare synthesis) och värdera (evaluate, tidigare evaluation) bytt plats så att den kognitiva processen skapa nu är den mest komplexa kategorin. Vidare skriver Anderson och Krathwohl (2001) om hur de båda versionerna av taxonomin är ordnade hierarkiskt, dock med skillnaden att den reviderade versionen inte är kumulativt hierarkiskt. Med kumulativt hierarkiskt menas att de lägre nivåerna av förståelse måste vara uppnådda för att en elev skall nå de högre nivåerna. En förutsättning för detta är icke överlappande kategorier. Detta frångår den reviderade taxonomin ifrån genom att låta de mest avancerade delarna av en kognitiv nivå delvis överlappa de minst avancerade delarna av nästa kategori, något som beskrivs som en anpassning för att modellen ska vara mer användbar i lärares praktik. Överhuvudtaget är ett av målen med revisionen att göra taxonomin mer lättillgänglig för alla typer av lärare och användbar vid planering av undervisning, styrdokument, examinationsuppgifter och samstämmighetsanalyser av dessa. Tydligt beskrivna underkategorier till både de kognitiva processerna och kunskapsformerna är en förändring som gör taxonomin klarare och underlättar tolkningen av huvudkategorierna. 2.7.3 Blooms reviderade taxonomi kunskapsdimensionen De fyra kunskapsformerna som beskrivs i Blooms reviderade taxonomi är faktakunskap, begreppskunskap, procedurkunskap och metakognitiv kunskap (Anderson & Krathwohl 2001). Anderson och Krathwohl (2001) menar att dessa fyra former inte berör olika ämnesinnehåll, utan samma innehåll kan kategoriseras som olika kunskap beroende på vad som betonas. Olika betoning uppnås genom olika mål och metoder i undervisningen. Följande beskrivning av de fyra kategorierna baseras på Anderson och Krathwohl beskrivning av detsamma. Kunskapsdimensionen kan sägas motsvara mål-/provuppgifternas substantiv. 21

Minnas Förstå Tillämpa Analysera Värdera Skapa Fakta Begrepp Procedur Metakognitiv Faktakunskap är den mest konkreta formen av kunskap i taxonomin och kan definieras som tydligt isolerbara bitar information som har ett värde i sig. Denna kategori kan delas upp i de två underkategorierna kunskap om terminologi och kunskap om specifika detaljer och delar. Exempel ur den första underkategorin är vad tecken i det matematiska språket står för och förkortningarna för grundämnena. Exempel ur den andra kategorin datum för viktiga händelser och kunskap om ett lands viktigaste naturtillgångar. Minnas Förstå Tillämpa Analysera Värdera Skapa Fakta Begrepp Procedur Metakognitiv Nästa kategori är begreppskunskap och innefattar förhållandena mellan de bitar som ingår i faktakunskaperna och strukturer för att ordna dessa. Det finns tre underkategorier till begreppskunskapen: kunskap om klassificeringar och kategorier, kunskap om principer och generaliseringar och kunskap om teorier, modeller och strukturer. Exempel på kunskap om klassificeringar och kategorier är kunskap rörande ordklasser som verb och substantiv och kännedom om olika geologiska tidsperioder. Exempel på kunskap om principer och generaliseringar är kunskap om de grundläggande fysiska lagarna och Pytagoras sats. Exempel på den sista underkategorin är kunskap om genetiska modeller som DNA och hur en nations styrning är strukturerad och fungerar. Minnas Förstå Tillämpa Analysera Värdera Skapa Fakta Begrepp Procedur Metakognitiv Den näst mest abstrakta formen av kunskap är procedurkunskaper, hur man gör något. Denna kategori inkluderar tre olika underkategorier. Den första rör ämnesspecifika färdigheter och algoritmer, till exempel kunskap om algoritmer för lösning av andragradsekvationer och kunskap om färdigheter som används vid målning med vattenfärger. Nästa underkategori rör ämnesspecifika tekniker och metoder, till exempel kunskap om intervjuteknik och kunskap om vetenskapliga metoder. Den sista underkategorin är kunskap om kriterier för att avgöra när man ska använda lämpliga metoder. Exempel ur denna kategori är kunskap om kriterier för att avgöra vilken metod som skall användas för lösning av ekvationer och kunskap om kriterier för att avgöra vilken statistisk metod som är lämplig för bearbetning av insamlad data. 22

Den allra mest abstrakta formen av kunskap är metakognitiv kunskap, kunskapen om både kognition i allmänhet och sin egen kognition. Även här finns det tre underkategorier: strategisk kunskap, Minnas Förstå Tillämpa Analysera Värdera Skapa Fakta Begrepp Procedur Metakognitiv kunskap om inlärningsfrågor inkluderat lämplig kontextuell och villkorlig kunskap och kunskap om sig själv. Exempel på strategisk kunskap är att kunna olika minnesramsor och att känna till olika inläsningsstrategier. Exempel på den andra underkategorin är att veta att flervalsfrågor generellt ställer lägre krav på individen än öppna frågor och att veta att sammanfattning av inlästa texter kan ge en djupare förståelse. Exempel på kunskap om sig själv är känna till sina starka respektive svaga sidor. 2.7.4 Blooms reviderade taxonomi den kognitiva processdimensionen Den andra dimensionen, den kognitiva processdimensionen delas in i sex huvudkategorier som i sin tur delas upp i två till sju underkategorier. Beskrivningen av dessa är hämtade ur Anderson och Krathwohl (2001). Den kognitiva processdimensionen kan sägas motsvara mål-/provuppgifternas verb. Den minst komplexa kognitiva processen är att minnas. I detta ingår förmågan att plocka fram relevant kunskap ur minnet. Två underkategorier utgör denna kategori: känna igen och komma ihåg. Minnas Förstå Tillämpa Analysera Värdera Skapa Fakta Begrepp Procedur Metakognitiv Att känna igen går ut på att jämföra information som presenteras med information som hämtas ur minnet, till exempel att avgöra om ett påstående är sant eller falskt eller utifrån ett antal alternativ välja ut vilket som är rätt. Att komma ihåg kan till exempel innebära att räkna upp viktiga exportvaror i Bolivia eller rabbla multiplikationstabeller. Nästa huvudkategori är förstå, en bred kategori som går ut på att eleven på olika sätt ska skapa mening från information inhämtad via olika former av kommunikation. Den första underkategorin är Minnas Förstå Tillämpa Analysera Värdera Skapa Fakta Begrepp Procedur Metakognitiv tolka, vilket innebär att man omvandlar information från en form till en annan, till exempel från siffror till ord eller från ord till bilder. Den andra underkategorin, exemplifiera, går ut på att kunna se vad som är specifikt för en viss princip eller ett koncept och därefter illustrera detta med ett exempel. Den tredje underkategorin, klassificera, innebär en förmåga 23

att kunna föra in information i en viss kategori. Nästa underkategori är sammanfatta och innebär att kunna komprimera och kortfattat beskriva de viktigaste delarna av ett större område. Den femte underkategorin är dra slutsatser och går ut på att se samband och mönster i presenterad information. Jämföra är nästa underkategori och omfattar förmågan att hitta överrensstämmelse mellan ny information och den som redan har förvärvats. Den sista underkategorin som hör till förstå är förklara. Denna kategori handlar om att kunna konstruera en modell byggd på orsak och verkan för att klargöra en företeelse. Minnas Förstå Tillämpa Analysera Värdera Skapa Fakta Begrepp Procedur Metakognitiv Den tredje kognitiva processen som beskrivs i taxonomin är tillämpa och definieras som förmågan att på något sätt använda ett tillvägagångssätt för att lösa en uppgift. Här specificeras två underkategorier: verkställa och tillämpa. Dessa skiljs åt genom att den första behandlar kända situationer, den andra behandlar nya, mer okända situationer. Analysera är den fjärde kognitiva processen och går ut på att kunna bryta ner presenterat material till dess beståndsdelar och därefter kunna se hur dessa delar hänger ihop med varandra och med Minnas Förstå Tillämpa Analysera Värdera Skapa Fakta Begrepp Procedur Metakognitiv övergripande strukturer. Kategorin delas in i tre underkategorier. Den första av dessa är särskilja som rör förmågan att skilja på vilka delar som är relevanta respektive irrelevanta för lösande av en uppgift. Nästa underkategori är organisera och rör förmågan att strukturera beståndsdelarna av det presenterade materialet. Den sista underkategorin är tillskriva och handlar om att kunna läsa mellan raderna och kunna plocka ut det underliggande budskapet eller ursprungskällans åsikter ur kommunikationen. Minnas Förstå Tillämpa Analysera Värdera Skapa Fakta Begrepp Procedur Metakognitiv Den kognitiva process som värderats som näst mest komplex i Blooms reviderade taxonomi är värdera. Detta går ut på att bedöma något baserat på kvantitativa eller kvalitativa kriterier och standarder. Den första av de två underkategorierna är kontrollera och omfattar förmågan att i ett visst material söka efter fel så som motsägelser och vanföreställningar i förhållande till interna kategorier och standarder. Den andra av de två underkriterierna är kritisera och skiljer sig från den första genom att externa kategorier och standarder används som måttstock. 24