Test, betyg och urval

Relevanta dokument

UPP-testet: Mångfald gynnas av korrektion för skönmålning. Lennart Sjöberg Rapport 2010:2

Moralisk oenighet bara på ytan?

Edward de Bono: Sex tänkande hattar

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Perspektiv på kunskap

Vad är rättvisa skatter?

LENNART SJÖBERG: Information för urval Den enklaste formen for urval är lottning, men nackdelarna med den metoden är uppenbara.

Finns det vissa typer av människor som du inte gillar?

Översikt. Experimentell metodik. Mer exakt. Människan är en svart låda. Exempel. Vill visa orsakssamband. Sidan 1

Föreläsningar. Gruppövning, grupp A: Måndag 26/ sal 318 Gruppövning, grupp B: Måndag 26/ sal 318

Anvisningar till rapporter i psykologi på B-nivå

Korrelation och kausalitet

Kan vi handla omoraliskt mot. Är det rätt eller fel med abort?

Tolkningsrapport. Namn: Anna Karlsson. E-postadresser: Födelseår: ingenting utöver grundskola. Ledarskapserfarenhet:

Moralfilosofi. Föreläsning 4

Försök att rymma svaren i den platsen som finns. Skriv tydligt! Svara sammanhängande och med enkla, tydliga meningar.

Kapitel 4. Scanlon svarar genom att förneka att han skulle mena något sådant. (Se också introduktionen.)

för att komma fram till resultat och slutsatser

Riktlinjer för bedömning av examensarbeten

1. En oreglerad marknad involverar frihet. 2. Frihet är ett fundamentalt värde. 3. Därav att en fri marknad är moraliskt nödvändigt 1

Moralfilosofi. Föreläsning 2

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Statistik 1 för biologer, logopeder och psykologer

REMISSVAR Rnr Lilla Nygatan 14 Box STOCKHOLM Tel 08/ Fax 08/

Rätt chef på rätt plats Tre principer för en framgångsrik chefsrekrytering

Tolkningsrapport för Ann-Marie Klockdal

Man kan lära sig att bli lycklig

IBSE Ett självreflekterande(självkritiskt) verktyg för lärare. Riktlinjer för lärare

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Vår moral och framtida generationer

, s a. , s b. personer från Alingsås och n b

Subjektivism & emotivism

Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

Tentamen vetenskaplig teori och metod, Namn/Kod Vetenskaplig teori och metod Provmoment: Tentamen 1

Resultatnivåns beroende av ålder och kön analys av svensk veteranfriidrott med fokus på löpgrenar

TENTAMEN. SAMHÄLLSVETENSKAPLIG FORSKNINGSMETODIK Kurs 7 PC1307. Forskningsmetodik 10 poäng (ECTS) Måndag den 13 oktober, 2008

Naturalism. Föreläsning Naturalismen (tolkad som en rent värdesemantisk teori) är en form av kognitivism

1. Öppna frågans argument

6 Selektionsmekanismernas betydelse för gruppskillnader på Högskoleprovet

Statistik 1 för biologer, logopeder och psykologer

Hare Del III (Syfte) Syftet med delen: att visa varför det finns anledning att använda metoden från del II. Två frågor:

tidskrift för politisk filosofi nr årgång 10

11. Feminism och omsorgsetik

5. Administrationen vill, innan den motbevisar styrekonomens argument, klargöra bakgrunden till ärendet.

Skönmålning på UPP hos chefskandidater

Marcus Angelin, Vetenskapens Hus, Jakob Gyllenpalm och Per-Olof Wickman, Stockholms universitet

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

En nybörjarkurs i kritiskt tänkande

Utvärdering med fokusgrupper

Information om bedömning av reell kompetens

Seminariebehandling av uppsatser 1. Seminariebehandling av C- och D-uppsatser

GRANSKNINGSUNDERLAG. Te knis k de l. Kriterier för kva litets vä rderin g a v s ta n da rdis era de bedöm n in gs m etoder in om s ocia lt a rbete

Moralfilosofi. Föreläsning 2

Väl godkänt (VG) Godkänt (G) Icke Godkänt (IG) Betyg

FTEA12:4 Vetenskapsteori. Realism och anti-realism

9-10. Pliktetik. att man hävdar att vi ibland har en plikt att göra, eller låta

Lönediskriminering praxis bland män?

PETTER ASP. Uppsåtstäckning vid aberratio ictus replik på en replik NR 3

Tolkningsrapport. Namn: Anna Karlsson. E-postadresser: Födelseår: Testdatum: Rapport beställd av:

Etisk deklaration och etiska normer för studie- och yrkesvägledning

Provmoment: Tentamen 3 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Moralfilosofi. Föreläsning 4

Hare Del II (Metod) kunskap om hur det skulle vara för mig att befinna mig i deras. "reflektionsprincipen" (dock ej av H). Den säger följande: för att

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Hemtenta Vad är egentligen demokrati?

Tillämpad experimentalpsykologi [2] Tillämpad experimentalpsykologi [1] Empirisk forskningsansats. Tillämpad experimentalpsykologi [3] Variabler

Tentamen Metod C vid Uppsala universitet, , kl

Vad beror benägenheten att återvinna på? Annett Persson

Procentuell rankning Uppfattningsförmåga Slutledningsförmåga Siffertal, snabbhet och

I arbetet hanterar eleven flera procedurer och löser uppgifter av standardkaraktär med säkerhet, både utan och med digitala verktyg.

Kommentarer till behandlingen av data som ligger till grund för den statistiska utvärderingen av Genetisk Analys av Svenska Vorstehklubbens Jaktprov.

Åtgärdsprogram och bedömningar i åtgärdsprogramsprocessen

Utilizing research in the practice of personnel selection: General mental ability, personality, and job performance

Vetenskap och dataanalys. Hundkursen 14 september 2015 Hans Temrin

Nadia Bednarek Politices Kandidat programmet LIU. Metod PM

Tillämpningen av individuell lönesättning - problem och möjligheter Inför 2012 års forsknings- och innovationspolitiska proposition

PRIMITIV, CIVILISERAD, BARNSLIG

Psykologi som vetenskap

Till Utbildningsdepartementet TRE VÄGAR TILL DEN ÖPPNA HÖGSKOLAN (SOU 2004:29) U2004/912/UH

Objektivism. Föreläsning Objektivismen är (i likhet med naturalismen) en kognitivistisk teori

Linköpings universitet Statsvetenskap 2 METODUPPGIFT 4: Metod-PM. Hur utilitaristiska är de svenska riksdagspartierna?

Läsanvisning för STP:s granskningsrapporter

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Teorier om Hälsa och Sjukdom. Alla vetenskaper kräver tydligt definierade begrepp som beskriver vetenskapens objekt och deras relationer.

DECEMBER En kunskapssammanställning sammanfattning. Lön, motivation och prestation: Psykologiska perspektiv på verksamhetsnära lönesättning

MATEMATIKENS SPRÅK. Avsnitt 1

Kritisk granskning av forskning

Stockholm den 16 januari 2013

Övningshäfte 1: Logik och matematikens språk

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

MSG830 Statistisk analys och experimentplanering

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

SVANTE JANSON OCH SVANTE LINUSSON

Lektionsanteckningar 11-12: Normalfördelningen

Bilden av förorten. så ser medborgare i Hjälbo, Rinkeby och Rosengård på förorten, invandrare och diskriminering

Vanliga frågor om rekryterings- och utvecklingstester i Region Kronoberg

REMISSVAR Rnr Till Finansdepartementet. Avidentifiera jobbansökningar en metod för mångfald (SOU 2005:115) Fi2006/227

Komplexiologi löser de accelererande problemen med psykisk ohälsa!

Hemtentamen, politisk teori 2

OBS! Vi har nya rutiner.

Transkript:

Test, betyg och urval Den tillämpade differentialpsykologin har i hög grad utnyttjat psykologiska test framför allt för urval och rådgivning. Dessa test har i sin tur i övervägande grad varit begåvningstest. Personlighetstest har också kommit till användning men inte alls i lika stor utsträckning. Deras användbarhet har också blivit ifrågasatt på ett helt annat sätt än intelligenstestens. Jag kommer därför här huvudsakligen att behandla begåvningstestens problematik. Likartade synpunkter kan emellertid i allt väsentligt framföras med avseende på personlighetstesten. Under 60- och 70-talen har på många håll framförts stark kritik mot användningen av begåvningstest. De flesta av de gängse kritiska synpunkterna återfinns i C. G. Liungmans bok "Myten om intelligensen" (1970). Kritiken är ingalunda en unik svensk företeelse. Ett exempel ger David McClelland (1973) i en artikel med titeln "Testing for competence rather than for intelligence". :vicclellands artikel bygger på en föreläsning som han gav vid Educational Testing Service i Princeton år 1971. (Educational Testing Service är USA's kanske största företag för konstruktion och administration av test, framför allt för urval till universitet och andra högre utbildningsanstalter). McClelland framför en kritik mot användningen av begåvningstest, som i många stycken påminner om Liungmans, ehuru han i vissa avseenden går längre. _1cClelland framför också vissa tänkbara alternativ till ~egåvningstesten, som vi kommer att beröra något i det =öljande. Sammanfattningar av kritiken mot test ger också Cronbach (1975) och Jensen (1980). Jag skall här i korthet återge de väsentligaste punkterna _ kritiken mot begåvningstesten. Jag skall också ge några punkter på de kritiska inläggen. Eftersom Liungmans k blivit ofta använd i svensk universitetsundervisning cnder 70-talet ger jag först en detaljerad diskussion av.::en. 83

Den testkritik som har varit oftast förekommande har varit inriktad på testens värde för att mäta det som de ger sig ut för att mäta. Om testen är behäftade med systematiska fel som gynnar högre socialgrupper så är det givetvis olämpligt att använda dem, (åtminstone utan an korrigera för felen, men den möjligheten brukar sällan nämnas). Det kan emellertid hända att testen är rättvisande men ändå oetiska. I själva verket torde testkritiken ha sina rötter i sådana tankar. Därför behandlar jag de etiska problemen vid användning av test för urval i ett särskilt avsnitt. Test och skolbetyg utsätts ofta för likartad kritik. Jag kommer därför att ta upp också en del synpunkter på betygsproblematiken. Arv och miljö En av de mest inflammerade frågorna i detta sammanhang är problemet om arv och miljö. Somliga psykologer har påstått, att intelligensen till övervägande del är medfödd. Detta gällde framför allt i en tidigare period av psykologins historia (Galton, Burt och andra). Numera torde emellertid de flesta psykologer ha en mer nyanserad uppfattning. Man brukar tala om, att en människas genetiska struktur sätter en övre gräns för hur högt hennes intelligens kan utvecklas under maximalt gynnsamma miljöomständigheter. Aven denna formulering förkastas emellertid av sådana kritiker som Liungman. Vi skall titta litet närmare på hans argument. Ett strikt experimentellt bevis för att den mänskliga intelligensen har en genetisk komponent har inte framlagts och kommer knappast heller att framläggas. Ett sådant experimentellt bevis skulle nämligen förutsätta en strikt randomisering av miljöbetingelserna för de uppväxande individerna alltifrån konceptionsögonblicket. Detta är omöjligt att genomföra både av etiska och teoretiska skäl. De slutsatser som vi kan dra om den eventuella existensen aven genetisk komponent måste därför bli av tentativt slag. Därmed är det emellertid ingalunda sagt, att fältet kan lämnas öppet för allsköns subjektiva värderingar. Vi har givetvis fortfarande full rätt att kräva 84

någon form av rimlighet hos de argument, som framförs för den ena eller andra ståndpunkten. En typ av evidens för genetiska komponenter kommer från djurstudier. Som bekant kan man odla fram stammar av t ex råttor, som är särskilt skickliga att lära sig gå i labyrinter. I dessa fall kan det knappast betvivlas, att man verkligen lyckats isolera genetiska komponenter, som styr en avsevärd del av prestationen i fråga. Naturligtvis kan man som Liungman fråga sig, hur specifika dessa komponenter är. Det finns åtskilligt som talar för, att man i dessa avelsexperiment odlar fram en viss typ av djur, t ex sådana djur som är allmänt aktiva och lättstyrda av förstärkning. Det skulle alltså inte vara en specifik intellektuell komponent som på detta sätt påvisats vara genetiskt betingad. Exakt samma resonemang kan givetvis föras för den eventuella genetiska komponent som till en del bestämmer mänsklig intelligens. Den kan också ha en ospecifik natur. Icke desto mindre skulle det kunna vara en genetisk komponent med betydelse för intellektuella prestationer, och något annat tror jag inte att det krävs för att föra den diskussion om den sociala betydelsen av genetiskt betingad intelligens, som vi nedan skall kommentera. Som ovan nämnts, brukar de flesta psykologer hävda, att åtminstone någon del av intelligensen är genetiskt betingad. Man stödjer sig då huvudsakligen på resultat från studier av tvåäggs- och enäggstvillingar. Det har nämligen visat sig, att enäggstvillingar, som uppvuxit i skilda miljöer, är mera lika varandra i intellektuellt avseende än tvåäggstvillingar, som uppvuxiti skilda miljöer. Skillnaden i likhet är dessutom ganska betydande. Det kan tyckas, att dessa resultat ganska starkt talar för att åtminstone någon del av intelligensen är genetiskt betingad. Liungman hävdar emellertid, att vissa tvillingpar, som i verkligheten är enäggstvillingar, kan ha missklassificerats som tvåäggstvillingar. Att sådana misstag kan göras, säger sig självt; inte alla enäggstvillingar är så påfallande lika varandra fysiskt sett, att de utan vidare kan klassas som enäggstvillingar. En variation i likhet örekommer. Någonstans i fördelningens nedre del kan 85

missklassifikationer uppkomma.1 Vilken betydelse kan nu sådana misstag få för undersökningarnas resultat? Om man antar, att olikhet i intelligens samvarierar med olikhet i yttre karaterisrika hos enäggstvillingar, skulle man alltså till följd av denna felfaktor få ett urval av enäggstvillingar, som är systematiskt alltför lika varandra i intelligens. Vi skulle m a o överskatta den genetiska faktorns betydelse för gruppen enäggstvillingar. Och hur är läget för tvåäggstvillingarna? I denna grupp får vi alltså felaktigt in ett antal par av enäggstvillingar, som är ganska olika varandra. Vi kan emellertid utgå från att dessa sanna enäggstvillingpar i fördelningen av tvåäggstvillingar tillhör den övre delen med avseende på inompar-likhet. Felfaktorn medför för tvåäggstvillingarnas del, att vi kommer att överskatta likheten systematiskt. Samma felfaktor som ledde till att vi överskattade likheten för enäggstvillingar leder alltså till, att vi överskattar även likheten för tvåäggstvillingar. Det totala utfallet av dessa två felfaktorers inverkan beror naturligtvis dels på hur stor korrelationen är mellan likhet i intelligens och likhet i yttre karakteristika, och dels på hur stor proportion avenäggstvillingpar som felklassificerats. (Diskussionen borde egentligen även utvidgas till att gälla felklassificerade tvåaggstvillingpar. men en sådan utvidgning är inte nödvändig här, eftersom den inte för in några nya systematiska faktorer.) Det finns emellertid anledning att fråga sig, hur rimligt det är att anta, att det finns en korrelation mellan inompar-likhet i fysiska karakteristika och inompar-likhet i intelligens. Vi vet från en stor mängd differentialpsykologiska undersökningar, att fysiska karakteristika inte samvarierar med resultat i begåvningstest. Dessa resultat gäller dessutom ett stort variationsområde i fysiska karakteristika. För par av enäggstvillingar måste vi anta, att vi har en mycket liten variation i inompar-likhet, Bara detta gör att vi har anledning förvänta oss en obetydlig korrelation med andra variabler. I förening med det nyss 1 Risken är med moderna metoder närmast obefintlig och den var liten även i äldre studier. Resonemanget som följer är främst motiverat av att Liungman gör en stor affär av risken för missklassificeringar. 86

nämnda resultatet, att fysiska karakteristika inte korrelerar med intelligens, förefaller det rimligt att dra den slutsatsen att det knappast finns något fog för Liungmans antagande. Den felfaktor, som han framför som ett grundskott mot slutsatserna om att åtminstone någon del av intelligensen är genetiskt betingad, saknar all betydelse. Liungman är kritisk mot antagandet om att intelligensen har en övre gräns, satt av den genetiska strukturen. Man kan hålla med om att denna formulering är olycklig. Då är det förmodligen bättre att bara tala om, att den genetiska strukturen utgör en faktor med någon betydelse i sammanhanget. Att specificera hur denna faktor verkar är egentligen onödigt på detta stadium. Det förefaller i och för sig helt rimligt att tänka sig en additiv kombination av miljökomponenter och genetiska komponenter. Det är lika svårt att dra några kausala slutsatser om miljöns inverkan, som det är att dra sådana slutsatser om den genetiska strukturens inverkan. Tag t ex det av Liungman flera gånger framhållna förhållandet, att socialgruppsskillnader är små eller frånvarande i studier av intelligens hos småbarn, men att de uppkommer i senare åldrar. Kan detta tas till intäkt för slutsatsen, att det är miljöskillnader, som ligger bakom intelligensskillnader i senare åldrar? Knappast - och det av två skäl. För det första är småbarnstesten helt annorlunda än de test som används för äldre barn och vuxna. A v naturliga skäl kan småbarnstesten inte innehålla uppgifter som avser avancerade former av tänkande. Det är i stället fråga om enklare motoriska och perceptuella funktioner. Det är väl känt, att sådana funktioner korrelerar föga eller inte alls med test på tänkande i grupper av vuxna, där båda typerna av test kan ges till samma individer. För det andra är det inte alls säkert att skillnader som är att återföra på genetiska komponenter nödvändigtvis måste föreligga i tidig ålder. Varför skulle inte en genetiskt betingad skillnad kunna uppkomma först senare i livet, kanske i tonåren eller ännu senare? I den populära debatten och i många offentliga utredningar avseende utbildningsfrågor brukar det talas om, att rekryteringen till högre utbildning är "snedvriden". 87

De undersökningar som sådana uttalanden stödjer sig på brukar vara utförda ungefär på följande sätt: Man administrerar ett eller några intelligenstest till en grupp ungdomar. Man konstaterar även vilken socialgrupp som de tillhör genom att klassificera dem efter föräldrarnas yrke. Det visar sig regelmässigt, att rekryteringen till högre utbildning ej följer de frekvenser, som vore att förvänta med hänsyn till hela befolkningens fördelning i socialgrupper. En större del av dem som följer högre utbildning rekryteras ur högre socialgrupper. Detta gäller även om resultaten på intelligenstesten konstanthålls statistiskt, dvs det gäller även i grupper av personer som har samma testresultat (eller betygsresultat). Härav drar man den slutsatsen, att ungdomar ur högre socialgrupper orättvist gynnas av miljöfaktorer. Denna slutsats är emellertid inte alls nödvändig eller ens särskilt väl underbyggd. För det första vet vi, att testen är felbemängda. Den sanna testpoängen rnats inte perfekt genom den observerade testpoängen. Om vi hade kunnat gruppera de testade personerna med avseende på sann testpoäng, i stället för observerad testpoäng, skulle eventuellt de observerade skillnaderna i rekryteringsfrekvenser ha försvunnit. Man kan nämligen visa, att just den typ av skillnader som observerats är vad som är att förvänta med utgångspunkt i mätfelens effekter. Nu kan man emellertid hävda, att de flesta begåvningstest är ganska tillförlitliga, och att de observerade effekterna knappast kan ha uppkommit endast på grund av mätfel. En mer betydelsefull invändning är då: de använda testen täcker endast aven liten del av hela begåvningsområdet. Olika test på skilda typer av begåvning korrelerar inte perfekt. Den kände psykologen J. P. Guilford (1967) har t o m hävdat, att de korrelerar omkring O. Guilford har föreslagit, att det finns 120 typer av "intelligens", alla sinsemellan okorrelerade. Vi kommer därför med denna metodik endast att få en ytterst partiell täckning av begåvningsområdet. De observerade skillnaderna i rekryteringsfrekvenser kan tänkas vara att återföra på sådana begåvningskomponenter som vi ej lyckats mäta med de få test, som vi använt i vår undersökning. 88

Det kan tilläggas, att det av statistiska skäl oftast är mycket svårt att använda flera än ett fåtal kontroll variabler av den här typen. Kravet på stickprovsstorleken växer mycket kraftigt som en funktion av antalet använda kontrollvariabler. Om man verkligen vill dra några rimliga slutsatser om miljöfaktorernas eventuella betydelse i situationer som denna, bör man givetvis skaffa sig en uttömmande information om deras reella inverkan. Man bör m a o studera, om t ex studievanor och attityder till studier utvecklas på skilda sätt i skilda socialgrupper, och om dessa attityder i sin tur påverkar elevers och föräldrars beslutsfattande med avseende på val av utbildningsväg. På grund av omöjligheten att genomföra strikta experimentella studier kommer resultaten i bästa fall endast att ge stöd för mycket försiktiga tolkningar.,den argumentation som Liungman anför med avseende på genetiska komponenter i intelligensen är väsentligen ett utnyttjande av den s k "straw-rnan" tekniken. Han sätter upp en. tänkt debattmotståndare som han pådyvlar de mest extrema och orimliga synpunkter, som t ex synpunkten att intelligensen helt eller nästan helt är genetiskt betingad, och att miljön inte spelar någon roll. Det antyds också, att dessa synpunkter skulle vara representativa för moderna psykologer; ett helt horribelt påstående. Mot dessa synpunkter är det ju lätt att argumentera, och det är lätt att framstå som representant för någonting ganska rimligt, även om man själv hävdar något som vid närmare granskning egentligen är ganska orimligt, nämligen att intelligensen skulle helt sakna samband med den genetiska strukturen. Intelligens: ett enhetligt begrepp? Intelligensbegreppets kritiker utgår i allmänhet från att psykologer betraktar intelligensen som något enhetligt. Denna syn var också förhärskande inom den differentiella psykologin under detta sekels tre första decennier. Vid sekelskiftet framlade Spearman sin berömda tvåfaktorteori för intelligensen, enligt vilken varje intelligens- 89

krävande uppgift kan återföras på dels en specifik komponent och dels en generell komponent, som återkommer i alla sådana uppgifter. Spearmans teori kan sägas utgöra grunden för Binets historiska genombrott med det första framgångsrika intelligenstestet. Under 30-talet gjordes de första försöken i praktisk psykologi till en mer nyanserad syn på intelligensen och en uppdelning i komponenter, genomförd i praktisk testkonstruktion bl a av amerikanen Wechsler. Dessförinnan hade emellertid Spearmans tvåfaktorteori ersatts av Thurstones teoretiska ansats, som innebar en mer explorativ attityd till hur många faktorer som ingår i intelligensen. Thurstone räknade med något tiotal sådana faktorer; senare forskare - framförallt Guilford - har i sina teorier antagit existensen av ett stort antal oberoende intelligenskomponenter. Det är alltså knappast i enlighet med modern psykologi att anta, att intelligensen är en enhetlig dimension. Det som Liungman kallar "förmågan att tänka" består av många skilda förmågor beroende på vilken typ av uppgift som det är frågan om. Moderna intelligenstest konstrueras på så sätt, att man försöker finna uppgifter som är likartade till sitt innehåll, och som dessutom uppvisar statistiska samband med varandra. Lyckas man därmed, har man också konstruerat ett begåvningstest eller, om man så vill, ett intelligenstest. Tusentals sådana test finns. I vissa sammanhang kan vissa typer av test vara lämpliga, i andra sammanhang andra. Ett sätt att förringa begåvningstestens betydelse är att tala om dem som "verbala" test. På detta sätt vill man ofta göra gällande att testen egentligen bara mäter sådant som ordkunskap och förmåga att förstå och formulera språkliga meddelanden. Till stor del har testpsykologerna själva ansvaret för denna terminologiska slapphet. Bakom etiketten "verbala test" kan det dölja sig de mest skilda typer av uppgifter, alltifrån sådana tämligen triviala typer som ordkunskap och orddefinitioner till lösandet av komplicerade matematiska problem, som angivits i normalprosa. I det senare fallet är det inte rimligen förmågan att förstå det språkliga meddelandet som är avgörande, utan det är förmågan att lösa det kommunicerade prob- 90

lemet. Liungman och många med honom generaliserar emellertid lätt utifrån exempel på några enkla typer av i verklig mening verbala test (definitionsprov) till alla typer av test, som utnyttjar språkliga meddelanden i de enskilda testuppgifterna. Det finns ingenting som talar för att alla sådana typer av test verkligen har någon gemensam begåvningskomponent, som skulle ha att göra med förmågan att förstå språkliga meddelanden och uttrycka sig korrekt. Denna till synes banala och självklara punkt tror jag är utomordentligt viktig i den aktuella debatten, då man i allmänhet vill avfärda begåvningstestens betydelse med hänvisning till deras påstådda känslighet för verbalt kunnande, något som man anser sig ha anledning tro vara att återföra på miljöinflytelser. En annan typ av missförstånd, som man ofta möter, och som återfinns både hos Liungman och McClelland, utgår från att begåvningstestens innehåll inte i sin konkreta form kan återfinnas i verkliga arbetsuppgifter. Detta är många gånger en i och för sig riktig anmärkning. Den behöver emellertid inte vara en allvarlig kritik mot testen. När man administrerar ett test, är man ju inte i första hand intresserad av att ta reda på, hur väl en person lyckas lösa de konkreta och specifika uppgifter som föreligger. Dessa uppgifter är snarare ett hjälpmedel till att dra slutsatser om individernas kapacitet. Givetvis låter man testet bestå av sådana uppgifter som är praktiskt möjliga att administrera och lätta att utvärdera. På teoretiska och praktiska grunder kan man sedan göra det berättigat att använda sig av testresultaten för prognoser av framgång i t ex olika yrken. Det visar sig också i ett stort antal undersökningar (Ghiselli, 1966) att testen möjliggör en visserligen modest men dock praktiskt användbar grad av prognosförmåga. Vissa andra undersökningar har ifrågasatt detta påstående (Thorndike och Hagen, 1959), och vi får anledning återkomma nedan till deras resultat. En hänvisning till testuppgifternas påstådda specifika natur är väl också att finna bakom den försåtliga formuleringen att kalla IK för "formell" intelligens. Beträffande icke-intellektuella komponenter i anpassning och yrkes framgång skall jag återkomma nedan. 91

Liungman räknar upp ett antal kriterier, som han påstår läggs till grund för konstruktion av intelligenstest. Enligt dessa skall testresultaten vara normalfördelade, det skall inte finnas någon könsskillnad, det skall inte ske någon förbättring i testresultat efter tjugoårsåldern, det skall finnas tydliga skillnader mellan socialgrupper och det skall finnas ett högt samband med skolbetyg. Samtliga dessa kriterier gör ett bisarrt intryck. Skulle t ex ett test upphöra att vara ett intelligenstest, om en population individer genom träning erhåller en sned fördelning? Skulle ett test, som t ex ett spatialt test, inte vara ett intelligenstest, därför att män presterar bättre än kvinnor? Eller är ett verbalt test inte ett intelligenstest, för att kvinnor presterar bättre än män? Om vi skulle konstatera en förbättring som följd av träning under åldern 40 till 50 år, har vi då anledning att förkasta testinstrurnentet? Det är också absurt att påstå, att ett test upphör att vara ett intelligenstest, om t ex en social ut jämningspolitik skulle medföra att testresultaten blev desamma för olika socialgrupper. Vad slutligen korrelationen med skolbetyg beträffar, så var ju detta ursprungligen ett kriterium som användes a v Binet och hans medarbetare. Det var på denna grund som han ansåg sig ha en praktisk användbarhet av testresultaten. Med hjälp av testet kunde man ju få en snabb och tidig utvärdering av vilka studieresultat som var att förvänta för en viss individ. Detta är emellertid en validering av ett test för ett specifikt syfte och inte ett kriterium på om testet kan betecknas som ett intelligenstest eller ej. Frågan om vad som är och vad som inte är ett intelligenstest förefaller på det hela taget futil. Det är också intressant att notera, att inget av de kriterier som Liungman nämner på ett intelligenstest säger någonting om innehållet i testet. Man skulle mycket väl kunna tänka sig att icke-intellektuella funktioner anslöt sig till de av Liungman nämnda kriterierna. Det är t ex inte alls otroligt att vissa rena attitydmått uppför sig just på det sätt som Liungman kräver av intelligenstesten. Liungmans kriterier på intelligenstest är därför varken nödvändiga eller tillräckliga. Det har givetvis i psykologins historia spekulerats myc- 92

ket om bakgrunden till de faktiska skillnaderna i intellektuell prestationsförmåga. Många gånger har man velat återföra dessa skillnader på vissa grundläggande kognitiva funktioner. Så försöker också Liungman göra. Han talar sålunda om att minnesspann och hastighet i mentala processer skulle kunna vara de avgörande faktorerna. På något sätt tycks han mena, att detta gör de iakttagna skillnaderna i prestationer mindre betydelsefulla. Resonemanget är emellertid endast en förklaring, och dessutom inte en särskilt väl underbyggd sådan, till de faktiskt iakttagna skillnaderna. Samma invändning kan riktas mot det kapitel, där Liungman spekulerar om tänkbara skillnader mellan två individer med stor skillnad i IK. En intressant problematik utgör frågan om träningseffekternas inverkan på testresultatens värde. Många gånger hävdar man, att testuppgifter måste hemlighållas. Om dessa lämnas ut, så att personer tillåts träna in svaren, blir testresultaten värdelösa. I ett extremt fall får alla personer alla rätt, och vi har då ingen individuell variation att bygga en prediktion på. I andra fall får somliga personer genom träning mera förkunskaper än andra. Variationen i testresultat blir då att återföra på detta förhållande snarare än på några kapacitetsskillnader mellan individerna. Det är troligt att testets prognosförmåga under sådana omständigheter försämras. Man kan emellertid fråga sig, om träning på uppgifter som liknar dem som förekommer i testet verkligen alltid behöver vara försämrande för dess prognosförmåga. Svaret beror på hur specifika begåvningskomponenterna är. Antag emellertid, att testuppgifterna mäter vissa begåvningskomponenter, som återkommer på ett avgörande sätt även i kriteriesituationerna. En träning i sådana komponenter skulle då rimligen inte behöva försämra testets prognos förmåga, även om givetvis de individer som fått del av träningen får en förändrad prognos - och detta alltså fullt korrekt. Det är alltså viktigt att skilja mellan träning på de faktiska konkreta uppgifterna och på uppgifter liknande dem som förekommer i testet. Det är också viktigt att skilja mellan olika typer av uppgifter, som har olika generell genomslagskraft. 93

Man pastar numera ofta att all kunskap bygger på värderingar. Det är emellertid viktigt att skilja mellan värderingar i bemärkelsen uttalanden om vad som är önskvärt eller icke önskvärt och värderingar i bemärkelsen bedömning av sakförhållanden. Man kan naturligtvis som Liungman gör ta fram vissa uppgifter i den nu helt föråldrade svenska versionen av Stanford-Binet-testet och hänvisa till att dessa förefaller mäta rent subjektiva värdeutsagor. Vissa av de uppgifter som Liungman pekar på förefaller också höra bättre hemma i en attitydskala än i ett begåvningstest. Man kan emellertid inte från dessa exempel generalisera till alla typer av gängse begåvningstest. Om en person klarar en plåtvikningsuppgift eller en hävstångsuppgift eller ett aritmetiskt problem förefaller inte vara en fråga om att han skall ge uttryck för t ex socialgrupp 1's politiska värderingar. Det är i stället en fråga om intellektuell kapacitet. Liungman låter sin iver att kritisera intelligenstesten gå så långt, att han gör nästan genanta misstag. Vad tycks t ex om följande resonemang? Liungman citerar en uppgift ur Stanford-Binet-testet avsedd för 13-årsåldern: "En person som var ute och promenerade i skogen i närheten aven stad stannade plötsligt förfärad, sprang därpå till närmaste poliskonstapel och sade, att han nyss sett hängande från en trädgren en... Vad? Ett barn som svarar en apa på denna uppgift får ingen poäng. Det svar som avses är en människa som blivit hängd. Enligt Liungman visar detta "den höga värderingen av misstänksamheten". "Det är mer intelligent att tro det värsta än att tro det bästa". Liungman missar, att uppgiften innehåller vissa ledtrådar, som tyder på att svaret "en apa" inte är adekvat. Varför blir man t ex förfärad över att se en apa hängande från en trädgren? Liungrnan missar också, att vissa test använder sig av implicita definitioner och ledtrådar för vad som är ett riktigt svar. Detta gäller t ex vissa uppgifter, där man skall ange en motsats. Det behöver alls inte vara något fel, att poängen på sådana test i viss mån eller kanske till stor del avspeglar den testades förmåga att förstå den implicita och icke helt uttalade instruktionen. Liungmans diskussion av orddefinitionsuppgifter är också den gan- 94

ska ensidig. Det är uppenbart, att testkonstruktören velat ge en bättre poäng till mer exakta och bättre avgränsade definitioner. Detta behöver inte vara godtyckligt eller något som enbart avspeglar konventionella värderingar. Sammanfattning av testkritiken Jensen (1980) ger en sammanfattning av kritiken mot psykologiska test under följande punkter. (1) Beroende av kulturella faktorer. Denna kritik hävdar att testen är missvisande därför att de på ett orättvist sätt gynnar vissa grupper och missgynnar andra, t ex rasgrupper eller socioekonomiska grupper. (2) Kritik av specifika testuppgifter. Denna kritik, som för övrigt Liungman ger många exempel på, använder sig av tekniken att man väljer ut någon specifik uppgift som förefaller egendomlig eller vilseledande. Genom att kritisera den anser man sig kritisera hela testet eller psykologiska test i allmänhet. Man bortser i sådana sammanhang helt från vilka psykometriska egenskaper testuppgifterna har. (3) Det omöjliga i att definiera intelligens. Psykologer har olika uppfattningar om vad intelligens är och därför kan man avfärda hela begreppet. Detta argument förutsätter att psykologer är intresserade av att behålla ett enhetligt intelligensbegrepp. För övrigt är alla vetenskaper fulla av kontroverser kring betydelsefulla centrala begrepp utan att man för den skull avfärdar hela diskussionen som meningslös. Det förhållandet att enskilda personer kan vara framgångsrika trots att de haft låga poäng på intelligenstest betyder naturligtvis bara att korrelationen mellan test och framgång inte är fullständig. (4) Testen mäter mycket begränsade typer av förmåga. Denna kritik säger vanligtvis att testen är "formella" eller att de endast mäter någon form av språkliga kunskaper. (5) Testen mäter inte den medfödda intelligensen. (6) Olämpliga testnormer. Testpoäng sätts i allmänhet i relation till en normgrupp och denna normgrupp måste 95

naturligtvis vara adekvat. Detta är en mera teknisk form av kritik. (7) Testen mäter endast det man lärt sig. Antagandet bakom denna kritik är tydligen att testen bör mäta någon form av oföränderlig eller medfödd intelligens. Vad man faktiskt lärt sig vid en viss tidpunkt skulle alltså vara mera en tillfällighet och bero på miljön och inte ha något prognosvärde för individen. (8) Testpoängen förändras över tid. (9) Testen påverkas av yttre faktorer. Här brukar man vanligtvis tänka på yttre faktorer i själva testsituationen som t ex den testades emotionella eller motivationella tillstånd. Man har t ex funnit att testoro påverkar resultaten men endast i ganska ringa grad. Det finns ingenting som tyder på att t ex minoritetsgrupper missgynnas aven sådan komponent. (10) Missbruk av test. Jensens diskussion är ganska klargörande och vi skall följa den här. Mycket av vad han säger passar bra in på Liungman, 'den svenske kritiker som vi detaljerat diskuterat. Att man ser intelligensen som ett nästan mystiskt och fördolt begrepp är påtagligt. Intelligensen ses som en inre egenskap hos personen som inte kan mätas. Man vänder sig mot mätningar av mänskliga egenskaper över huvud taget. Många frågor som är av empirisk art diskuterats utan att man tar hänsyn till vilka resultat forskningen kommit fram till. När det t ex gäller kulturskillnader har det visat sig att testen inte diskriminerar mot minoritetsgrupper, åtminstone inte i USA (Schmidt, Berner & Hunter, 1973). Alternativen till användning av test behandlas också på ett mycket ytligt sätt. Särskilt de etiska problemen vid lottning och kvoturval tenderar man att bortse från. Jag kommer att behandla den frågeställningen mera utförligt i ett senare avsnitt om testningens etik. Att man sätter likhetstecken mellan verbala test och test i allmänhet är också en allmänt utbredd tendens som Liungman ger goda exempel på. På det sättet kan man lyckas ge läsaren ett intryck av att testen helt enkelt mäter skillnader i språkvanor, något som man anser sig kunna härleda till skillnader i uppväxtmiljö. 96

Missbruk av test har naturligtvis förekommit och kan förklara en del av oppositionen mot dem. Man kan ha underlåtit att informera om resultaten på ett riktigt sätt. Den som testats är också angelägen om att resultaten inte sprids utan hans kunskap och medgivande. Testen har ibland använts för att fatta oåterkalleliga beslut på ett tidigt stadium, t ex vid urval inom skolsystemet. Testen har också uppfattats som alltför intellektuella och som orättvisa mot vissa grupper. Jensen (1980) påpekar också att skillnaden mellan grupper eller raser "i amerikanska data är ganska liten jämförd med skillnaden mellan individer. Testen ger visserligen sådana ras- och socialgruppsskillnader. men de är alltså små. Användning av test medför ofta i jämförelse med andra metoder för urval, att man får minskade effekter av bakgrundsdata på urvalet. Subjektiva omdömen är :tyvärr ofta färgade av personliga relationer och rent av nepotism. Det kan man undvika med hjälp av mera objektiva mått på prestationer. Engelska data på detta har publicerats av Wieseman (1964) och citeras a v Jensen. Andra data tyder på att social rörlighet gynnas mera av test än av skolbetyg. Systematiska mätmetoder testfel: och undersökningsresultat Kritikerna av test hävdar alltså att dessa är missvisande, att de är behäftade med systematiska fel som missgynnar vissa grupper. Detta kan vara ett riktigt eller ett felaktigt påstående. Det är önskvärt att kunna avgöra dess giltighet genom att göra empiriska undersökningar, men för att det skall vara möjligt måste vi först ge en noggrann definition av vad systematiska testfel egentligen är. Den första tanken är då att ett test innehåller systematiska fel om testresultaten är olika för olika grupper, t ex olika socialgrupper. Denna tanke bygger naturligtvis på antagandet att det inte finns några socialgruppsskillnader i intelligens. Alla skillnader skulle alltså röra individernas variation inom grupper. Konstruktionen av det svenska högskoleprovet tycktes bygga på föreställningar 97

av denna typ. Antagandet är naturligtvis nära anknutet till uppfattningen att intelligensen helt saknar genetiska komponenter. Om det nämligen finns någon genetisk komponent i den mänskliga intelligensen och med kunskap om att man tenderar att gifta sig med personer ur samma socialgrupp som en själv, är det högst rimligt att tro att det finns vissa genetiska skillnader i intelligens mellan socialgrupperna. Om dessa är stora eller små vill jag inte tvista om här, men att bara utan vidare anta att alla gruppskillnader som testen uppvisar beror på systematiska mätfel är orimligt. Ett annat sätt att definiera mätfel är att utgå från intuitiva bedömningar av i vilken mån testuppgifter tycks förutsätta vissa specifika erfarenheter som man bara får i vissa miljöer. Man har emellertid funnit att subjektiva bedömningar av mätfel sällan stämmer med data på hur olika grupper presterar på testuppgifterna. En tredje ansats bygger på att man påpekar att ett test är standardiserat och konstruerat för en viss grupp. Därav skulle det följa att testet på ett orättvist sätt diskriminerar andra grupper. Detta är emellertid en empirisk fråga som måste undersökas i varje fall för sig. Man kan inte utan vidare utgå från att det alltid förhåller sig på det sättet. När man konstruerar test kan man om man vill vara mycket noggrann och se till att man väljer ut testuppgifter som är sådana att de har likvärdiga egenskaper för de olika grupperna. Detta betyder naturligtvis inte att man konstruerar testen för att få samma medelvärden för grupperna utan att man eftersträvar likvärdighet i andra psykometriska egenskaper, framför allt testuppgifternas intekorrelationer och faktorstruktur. När vi diskuterar frågan om praktiska beslut grundade på information om individer måste vi ta upp frågan om denna information används på ett rättvist eller orättvist sätt. Detta behandlas i avsnittet om moraliska aspekter på urval. Här tar vi emellertid upp frågan om systematiska fel i själva testen. Märk att om ett test visar sig innehålla systematiska mätfel för någon grupp kan detta bero på olika faktorers inverkan. Det är möjligt att det beror på uppväxtmiljö men det kan också ha mera specifika orsa- 98

ker i själva testsituationen, t ex relationen till testledaren eller oro hos de testade. Senare kommer jag att diskutera just dessa situationsfaktorers eventuella inverkan. Systematiska mätfel i förhållande till ett visst kriterium föreligger för en grupp personer vars regressionsekvation för att predieera kriteriet från testpoängen skiljer sig från jämförelsepopulationen (denna definition förutsätter att testet saknar slumpfel, vilket vi skall återkomma till). Om de två regressionsekvationerna är olika, bör man nämligen göra olika prognoser utifrån en och samma testpoäng beroende på vilken grupp den testade tillhör. Märk att denna definition mycket väl kan medföra att man får olika genomsnittliga värden i testet trots att systematiska mätfel inte enligt definitionen föreligger. En något mera krävande definition av systematiska testfel säger att även variationen i prediktionsfel skall vara lika för att inga systematiska testfel skall sägas föreligga. Om villkoret är uppfyllt kan kunskap om grupptillhörighet på intet sätt bidra till att öka prognoseffektiviteten. Denna definition av systematiska mätfel bygger på testets användning för ett praktiskt ändamål. Onekligen är den fullt adekvat för många av diskussionerna av ofullkomligheten hos test. Man brukar emellertid också diskutera test ur synpunkten begreppsvaliditet. Pediktiva testfel är en aspekt som är helt oberoende av testens begreppsvaliditet. Ett test kan helt sakna fel ur prediktiorissynpunkt men ändå vara av tveksamt värde därför att man inte alls vet vad det mäter. Det är möjligt att man i vissa situationer ändå kan vara nöjd med att använda testet om det har en god prognos förmåga, men i allmänhet torde det vara otillfredsställande att göra så. I definitionen nämndes kravet att testet skulle vara helt fritt från slumpfel. Om vi ett ögonblick tänker oss att ett test är fritt från slumpfel och helt saknar systematiskt prognosfel kommer introduktionen av slumpfel hos testet att medföra att vi får ett systematiskt fel som alltid gynnar den grupp som har det lägsta medelvärdet. Om man känner testets reliabilitet (alltså grad av frihet från slumpfel) kan man relativt enkelt korrigera för denna effekt och erhålla en prognos som är fri från systematiska 99

fel. För de flesta välkonstruerade intelligenstest som har reliabilitetskoefficienter över 0.9 är denna effekt liten. Om man upptäcker att systematiska mätfel föreligger är frågan hur betydelsefulla de är. Detta beror i sin tur på vilken beslutssituation man står inför. Definitionen av mät fel bygger på att man har ett kriterium som är i sig fritt från fel. Detta är inte alltid fallet. Mera informellt kan man alltid utvärdera testet när det gäller dess begreppsvaliditet, men man kan ställas inför svåra avgöranden när det gäller att ta ställning till om kriteriet är eller inte är felbemängt. Om testet är bemängt med slumpfel, och detta är alltid fallet i praktiken, kommer som ovan påpekades, den grupp som har det lägsta medelvärdet att systematiskt gynnas. Om man jämför svarta och vita i USA finner man också att de svarta, som i allmänhet har det lägsta medelvärdet i testet, systematiskt gynnas av att man använder samma regressionsekvation för båda grupperna. Hunter och Schmidt (1976) menar att cirka hälften av den "överprognos" som de svarta erhåller är att återföra på brister i tillförlitlighet hos testen. (Märk alltså att prediktionerna gjorts utan hänsynstagande till den bristande tillförlitligheten hos testen: man kan om man så vill korrigera för bristande tillförlitlighet. Ett problem med en sådan korrektion är dock att man då i själva prognosproceduren utnyttjar kunskap om vilken subgrupp en person tillhör. Detta kan anses vara oetiskt.) Om man finner att ett test har systematiska fel i enlighet med definitionen, kan man vidta olika åtgärder för att korrigera för felen. De flesta fel är relativt enkla att korrigera för men det är svårt om det visar sig att testet har olika hög grad av korrelation med kriteriet i de två grupperna när dessa korrelationer är korrigerade för bristande tillförlitlighet i testet. I ett sådant fall är det troligt att man har olika faktorstruktur i testet. Om faktorstrukturerna emellertid är lika är det troligast att kriteriet självt innehåller systematiska fel och det kan då inte användas för att studera testens eventuella fel. Om man upptäcker att ett test har systematiska mätfel kan man alltså ibland korrigera för dessa om man 100

nämligen vid urvals proceduren tillåter SIg att använda kunskap om gruppmedlemskap. Begreppsvaliditeten hos test är mera komplicerad att undersöka än den prognostiska validiteten. Man studerar om testen i de olika grupperna har samma reliabilitet, stabilitet över tid och jämförbara relationer till andra variabler som ålder. Man kan också studera sambandet mellan testpoäng för personer med olika grad av släktskap, hur testuppgifterna ordnar sig i svårighet och samvarierar med varandra, hur testuppgifternas faktorstruktur ser ut m m. Empiriska studier av systematiska testfel finns huvudsakligen i amerikanska undersökningar och har då i allmänhet rört relationer mellan svarta och vita. Man har studerat om testen i dessa grupper har olika prognostisk validitet men finner praktiskt taget aldrig att så är fallet. När man studerar regressionsekvationen mot kriterier finner man ofta inga skillnader. När man finner skillnader brukar det gälla intercepten hos regressionsekvationerna och de går i. den riktningen att de svarta får en alltför gynnsam prognos. När det gäller begreppsvaliditeten och psykometriska egenskaper hos testen finner man i allmänhet inga skillnader i tillförlitlighet hos testen mellan olika grupper. Bedömningen av i vilken mån uppgifterna är kulturellt laddade har sällan något samband med faktiska prestationsskillnader mellan t ex rasgrupper. Faktoranalyser ger samma strukturer för svarta och vita. Skillnaden mellan svarta och vita tycks vara särskilt stor i test som mäter Spearmans G-faktor, dvs den allmänintellektuella faktor som Spearman en gång postulerade och som särskilt är utpräglad i test som mäter en ren förmåga till problemlösning snarare än mera specifika erferenhetsfaktorer. 'A ven detta resultat går naturligtvis emot hypotesen att testen skulle vara kulturberoende och missgynna minor i- tetsgru pper. Om man rangordnar testuppgifter i svårighetsgrad får man praktiskt taget samma rangordning hos svarta och vita. Detta talar mot att de svarta skulle vara missgynnade genom brist på information. Brist på information 101

borde slå så att man får olika rangordningar i de två grupperna eftersom det förefaller mindre sannolikt att informationsbrist skulle slå generellt över hela gruppen av innehållstyper (Gordon & Rudert, 1979). Det är också så att de uppgifter som skiljer individer inom grupperna svarta och vita, även är effektiva för att skilja mellan grupperna. När man tar ställning till frågan om testen är orättvisa mot minoritetsgrupper är det viktigt att utreda om de har olika validitet i olika grupper. Hunter, Schmidt och Hunter (1979) har sammanfattat en stor mängd undersökningar där man framför allt jämför svarta och vita beträffande testens validitet. Deras slutsats är att inget säkert stöd finns för antagandet att testen i allmänhet skulle ha olika validitet i de två grupperna. Test och kriterier Man hävdar ofta i debatten, att psykologiska test inte har något pediktionsvarde avseende sådana betydelsefulla sociala kriterier som anpassning och yrkes framgång. Det är emellertid väl belagt (Ghiselli, 1966) att man kan vänta sig en viss korrelation, kanske omkring 0.4, för sambandet mellan psykologiska test och kriterier i ett flertal representativa sammanhang. Det är självklart, att även vid en sådan korrelation blir felspridningen för prognosen för en enskild individ mycket stor. 84 % av variansen i kriteriet förblir oförklarad vid en korrelation på 0.4. Inga kriterier är emellertid felfria. Kriterierna själva kan bestå av psykologiska mätningar eller bedömningar utförda av arbetsledare. Sådana bedömningar är alltid bemängda med fel, både systematiska och slumpmässiga. De slumpmässiga felen är i allmänhet större för subjektiva bedömningar än för väl konstruerade begåvningstest. Om man vill ha en rättvisande bild av testens prediktensvärde, bör man därför försöka relatera dem till de sanna kriterievärdena snarare än till de observerade. Detta kan man göra med hjälp av begrepp utvecklade inom den 102