Personlighetstestning vid antagning till officersutbildning Seminarium vid FM HR-Centrum 2012-08-21 Lennart Sjöberg Handelshögskolan i Stockholm och Psykologisk Metod AB
Syften Replikera tidigare resultat, denna gång med deltagare som tog testet i varierande grader av skarpt läge Studera de psykometriska egenskaperna hos UPP-testet under starkt skilda omständigheter (olika grader av skarpt läge) Undersöka vilka effekterna av skarpt läge blir på skönmålning, datakvalitet och mobilisering av psykiska resurser, jämfört med en situation där testresultaten inte hade viktiga konsekvenser för deltagarna Jämföra validiteterna hos UPP och CTI; studera sambanden UPP-CTI Studera sambanden mellan testen och bedömningar efter intervjuer, samt beslut om antagning Studera sambanden mellan personlighetstesten och begåvningstest Närmare utreda vissa metodologiska frågor, bl a avseende mätning av skönmålning och datakvalitet
Grundläggande ansats Besvara frågorna utifrån analyser av empiriska data Använda de bästa tillgängliga psykometriska och statistiska metoderna Utgå från att forskningen ska kunna läggas till grund för evidensbaserad testmetodik
Teman CTI och UPP Några statistiska grundbegrepp Data för presentationen, betingelser för testningen Attityd till testet Stämningsläge vid testningen Datakvalitet Skönmålning UPP-testets struktur under olika betingelser Proxyvalidering Validering mot bedömningar efter intervjuer Personlighet begåvning Slutsatser
CTI och UPP
CTI - UPP CTI bygger på Jungs typteori och mäter kognitiva stilar Dessutom mäts psykopati och etnocentrism UPP är empiriskt orienterat och mäter en serie smala personlighetsbegrepp, som har visat sig fungera bättre än Big Five och ge validiteter omkring 0.5+
CTI Commander Trait Inventory Sensationsorientering Intuitivt beslutsfattande Konkret tänkande Abstrakt tänkande Ytlig värdeorientering Ideologisk värdeorientering Empati Chefsmotivation Egocentricitet Impulsivitet Etnocentrism
UPP Understanding Personal Potential Utåtvändhet Följsamhet Emotionell stabilitet Öppenhet Noggrannhet Uthållighet Samarbetsvilja Positiv grundhållning Självförtroende Social förmåga Emotionell intelligens Kreativitet Perfektionism Narcissism Social säkerhet Arbetstillfreds-ställelse Arbetsvilja Resultatorientering Förändringsvilja Arbetsintresse Balans arbete övrigt liv Skönmålning 1 (kovert) Skönmålning 2 (overt) Hedonisk ton Aktivitet Spänning Attityd till testet
Statistiska begrepp
Signifikans (p<0.05 eller 0.01) ger en indikation på om en effekt eller korrelation troligen inte är rent slumpmässig, men säger inget om betydelsen eller storleken av effekten Standardiserade skalor: data transformerade (linjärt) för att få medelvärde = 0 och standardavvikelse = 1. Syftet är att ge jämförbara skalor för olika datakällor. Effektstorlek: t ex skillnader mellan gruppers medelvärden i standardiserad metrik 0,2 - liten effekt 0, 5 - moderat effekt 0,8 och större - stor effekt Korrelation: styrka på samband, går från -1 till +1. 0.10 till 0.29 anses som en svag korrelation, r = 0.30 til 0.49 som en moderat, och r 0.50 som en stark korrelation. Förklarad varians : Korrelationen i kvadrat.
Svaga resultat? Förklarad varians och effektstorlek ofta moderat eller t o m svag i psykologiska data Men samma sak gäller oftast även biologiska eller medicinska data
Analyserade data från testningar 2010-12
Testdata, UPP och CTI Normgrupp (endast UPP), N=1269 Antagna 2010, N=160 Sökande 2010, N=56 Sökande 2011, N=218 Sökande 2012, N=130
Betingelser Norm: tydligt oskarpt läge Antagna 2010: oskarpt Sökande 2010: Frivilligt, testresultat påverkar inte (ganska oskarpt) Sökande 2012: UPP-resultat påverkar inte, forskningssyfte (ej skarpt, men frivilligheten betonades inte: halvskarpt ) Sökande 2011: Inget sades om vilken betydelse UPPresultat skulle få (skarpt)
Tabell 1. Betingelser för testning, varierande grad av hur "skarp" testningen var Grupp Det uppfattades troligen som att resultaten kunde påverka antagnings beslutet Det var klart utsagt att testningen var frivillig Testningen var anonym Testningen gjordes inom försvaret Grad av hur "skarp" testningen var, samt förväntad nivå i skönmålning Norm Nej Ja Ja Nej Mycket låg Redan antagna Sökande 2010 Sökande 2012 Sökande 2011 Förväntad mobilisering av psykiska resurser Ganska låg Nej Ja Nej Ja Låg Mycket låg Möjligen Ja Nej Ja Ganska låg Ganska hög Möjligen Ja Nej Ja Ganska hög Hög Ja Nej Seminarium Nej 2012-08-21 Ja Hög Mycket hög
Attityd till testet
Attityd till testet ( face validity ) Attityd till testet kallas ibland för face validity och är en viktig aspekt på ett rekryteringssystem, som måste vara och upplevas som seriöst och välgrundat. Däremot är "face validity" givetvis inget trovärdigt mått på testets faktiska validitet. Attityden till testet beräknades som ett medelvärde av 8 frågor som efterfrågade den testades inställning till testet som han eller hon just tagit.
Attityd, sökande 2011 Nästan alla Var positiva
Tabell 6. Fördelning av de testades bedömningar av UPPtestet, procent. Bedömning Sökande 2012 Sökande 2011 Klart bättre 16.2 21.9 Något bättre 30.0 26.0 Varken bättre eller 41.5 38.1 sämre Något sämre 3.1 3.3 Klart sämre 0.8 0.0 Har ej tagit annat test 8.4 10.7
Stämningsläge
Stämningsläge (mood) Stämningsläge är en generell känsla, t ex av att vara spänd eller nedstämd Det är en aspekt som sällan eller aldrig beaktas vid användning av psykologiska test för att tolka resultaten Avvikande stämningsläge kan medföra felaktiga slutsatser, bl a om personlighet Stämningsläge mäter mobilisering av psykiska resurser inför en uppgift
Hur vi mäter stämningsläge Tre grundläggande dimensioner: Glad-ledsen Pigg trött Lugn spänd Varje dimension mäts med 4 frågor i testningens inledande fas De tre dimensionerna kan slås ihop för att mäta humör
Emotionell stabilitet, data från sökande 2011 (skarpt läge) 0,8 0,6 0,4 0,2 0,0 Mycket starkt samband -0,2-0,4-0,6-0,8 1 2 3 4 5 Humör, 20 %-grupper
Korrelationer mellan stämningsläge och Big Five-dimensionerna. Glad - ledsen Pigg - trött Lugn - spänd Humör, sammanslaget Följsamhet 0.09 0.11 0.08 0.11 Emotionell stabilitet 0.50** 0.35** 0.38** 0.50** Öppenhet 0.38** 0.50** 0.21** 0.41** Utåtvändhet 0.43** 0.37** 0.22** 0.39** Noggrannhet 0.01 0.30** 0.03 0.11
Fallstudie En person testades för kvalificerat jobb, fick lämplighet 4 och genomgående låga värden Testet utlöste varning, stämningsläget låg på 2 Kontakt med kunden visade att den testade mått dåligt vid tidpunkten för testet Omtestning gav mycket mera positiv bild, med normalt stämningsläge och lämplighet 7
Slutsatser Stämningsläge har försummats av testpsykologer Data visar att stora effekter kan förekomma Det är angeläget att testa på nytt om stämningsläget ligger på 1 eller 2 vid första testningen
Sökande 2011 Glad-ledsen Antagna 2010 Sökande 2010 Sökande 2012 Norm 0,4 0,2 0,0-0,2-0,4-0,6 Medelvärde
Pigg-trött Antagna 2010 Sökande 2010 Sökande 2012 Sökande 2011 Norm 0,4 0,2 0,0-0,2-0,4-0,6 Medelvärde
Lugn-spänd Antagna 2010 Sökande 2010 Sökande 2012 Sökande 2011 Norm 0,4 0,2 0,0-0,2-0,4-0,6 Medelvärde
Kommentar Märk hur lägets skärpa påverkar mobiliseringen av psykiska resurser!
Datakvalitet
Datakvalitet Syfte: att mäta motivation för och förståelse av testuppgiften Tre mått: Strukturlikhet Intra-individuell spridning av svaren Tendens att ge innehållsneutrala svar Dessa tre mått samvarierar De tenderar också att vara stabila över tid; vissa personer är mer eller mindre otestbara
Strukturlikhet Mäts som korrelationen, separat för varje testad individ, mellan hennes svar i testet och normgruppens medelvärden. Räknas över item i testet och brukar i snitt ligga på ca 0.85. Låg motivation, slarv, dålig förståelse eller ovanlig tolkning av testuppgifterna ger låga värden
Intra-individuell spridning Mäts som tendens ett ge olika svar på olika testuppgifter Avspeglar om den testade brytt sig om att tänka efter och vara noggrann
Innehållsneutrala svar Mäts som genomsnittet av alla svar. Om detta genomsnitt avviker från normen tyder det på att den testade svarat utan att bry sig om testfrågornas innehåll. Detta begrepp påminner om ja-sägande men är mera generellt, kan lika gärna vara nej-sägande
Datakvalitet, medelvärde i standardiserade skalor 1,0 0,8 0,6 Strukturlikhet Differentiering Innehållsneutrala svar 0,4 0,2 0,0-0,2-0,4-0,6-0,8 Norm Antagna 2010 Sökande 2010 Sökande 2012 Sökande 2011
Kommentar Datakvalitet samvarierade som väntat med hur skarp läget var Observera de mycket stora effekterna av läget!
Skönmålning
Skönmålning personlighetstestens gissel Det är lätt att bluffa på sådana test och beskriva sig själv på ett orealistiskt positivt sätt Detta gör de testade, särskilt i skarpa lägen, i olika hög grad Konsekvensen av detta blir att somliga hamnar alldeles för högt i testskalorna Forskning visar övertygande att bluffande är vanligt Varians i testskalorna (median) förklarad av skönmålning: 0.211 bland sökande, 0.135 bland antagna Vill vi verkligen anställa (anta) dem som bluffar mest? Man behöver ingen utbildning i testpsykologi för att inse att detta är fallet
Vanligt sätt att försöka lösa problemet: ipsativa svarsformat I ipsativa format ska den testade välja mellan svarsalternativ som man försökt matcha i social önskvärdhet Detta görs i OPQ, Master och Thomas för att nämna vanliga exempel Mätningen ger resultat som är meningsfulla INOM en individ men inte MELLAN Det är ett stort problem vid urval där ju syftet är att jämföra individer
Flera problem med ipsativa format De tar längre tid och är inte populära hos dem som testas, jämföra äpplen och päron, testet upplevs som oseriöst Man kan inte säga något om en individ utifrån jämförelser INOM henne
Gumminsnoddseffekt vid ipsativ testning Om en person ligger högt i många dimensioner, men lite mindre högt i t ex emotionell stabilitet, kommer testet inte att upptäcka detta, utan han eller hon får ett lågt värde i emotionell stabilitet, helt enkelt för att alla värden är relativa till individen själv. Den emotionella stabiliteten kan vara utmärkt, men andra egenskaper ligger ännu högre och därför hamnar den långt ner på skalan kan vara mycket vilseledande. Det här är inte en teoretisk spekulation utan något jag sett i praktiken. Man kan bara spekulera i hur många felaktiga beslut som har fattats under årens gång på grundval av dessa ipsativa test. Det handlar om test som tillmäts mycket stor betydelse i många sammanhang
Fallstudie: Gummisnoddseffekten X var kandidat till ett viktigt chefsjobb vid en stor bank Han hade goda resultat vad gällde referenser, i ett flertal intervjuer och även en medarbetarundersökning vid sitt tidigare chefsjobb Han OPQ-testades och fick lågt värde i extraversion HRavdelningen avrådde starkt från anställning enbart på den grunden X visade sig ligga högt i många av UPP-skalorna, men relativt sett lägre i extraversion (6 på skalan 1-9) OPQ:s gummisnoddmätning hade gett honom ett lågt värde helt enkelt därför att han var bättre i andra avseenden Det slutade med att han trots allt blev anställd Search-konsulten, som vi samarbetar med, bad mig ordna en testning med UPP och intervju
Pedagogisk metafor Antag att en 10-kampare vinner 9 av 10 grenar men kommer 2:a i höjdhopp Ipsativt sett är han en dålig höjdhoppare!
Overta och koverta skalor Den overta skalan mäter tendensen att inte medge mycket vanliga normbrott den kan eventuellt vara lite för transparent: Jag har aldrig ljugit om något av betydelse Inget tyder på problem med en overt skala men ändå har vi utvecklat en kovert skala som inte kan genomskådas av en sofistikerad testperson Korrektion enbart med den koverta skalan gav resultat som korrelerade 0.95 0.99 med data som korrigerats både med overt och kovert skala Det finns alltså stöd för att enbart använda den koverta skalan, något som för närvarande sker bl a i vissa tillämpningar av screeningmodulen Den koverta skalan innehåller vanliga självrapportuppgifter som är utvalda för att de hade starka samband med en overt skala 45
Mätning av skönmålning: exempel Skönmålning 1 (kovert) Skönmålning 2 (overt) Om jag tagit på mig en uppgift så fullgör jag den också Jag är avundsjuk på dem som tjänar mera pengar än jag
Tabell 8.1. Korrelationer mellan de tre skönmålningsskalorna (N=159), data från Studie 1. Crowne- Marlowes skala Overt skönmålningsskala Kovert skönmålningsskala Crowne-Marlowes skala Overt skönmålningsskala Kovert skönmålningsskala 1.00 0.76 0.73 0.76 1.00 0.56 0.73 0.56 1.00
Korrektion för skönmålning Samarbetsvilja (omvändningen av passiv aggression) 5,5 5,0 r = 0,56 4,5 4,0 3,5 3,0 Regressionslinje 2,5 2,0 1,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 Skala för mätning av tendensen att svara socialt önskvärt Korrigerade värden mäts som residualer
Testvariabel Viktigt: SPECIFIK korrektion Andel av variansen som förklaras av skönmålning (två skalor) Extraversion 0.139 Följsamhet 0.258 Emotionell stabilitet 0.276 Öppenhet 0.104 Noggrannhet 0.098 Uthållighet 0.112 Samarbetsvilja 0.243 Positiv grundattityd 0.338 Självförtroende 0.273 Social förmåga 0.153 Emotionell intelligens 0.207 Kreativitet 0.023 Perfektionism 0.042
Fungerar det verkligen? Modellen antar att de två skalorna fångar upp en stor del av tendensen att skönmåla Genom en statistisk korrektion kan vi rensa data från effekter av skönmålning, mera ju starkare skalorna samvarierar med måtten på skönmålning Detta är ett mycket effektivare sätt än att sålla bort testade personer som ligger högt på en lögnskala Även om man sållar bort t ex de 25 % som ligger högst visar det sig att det mesta av effekten av skönmålning finns kvar
Tidigare forskning som gett stöd till metodiken
Experimentell studie av faking Personlighetsskalor Standardiserade testpoäng 0,2 0,1 Taktiska svar Uppriktiga svar 0,0 Ca 90 % av effekten av skönmålning eliminerades -0,1-0,2-0,3 Råvärden Korrigerade värden
Standardiserad testskala 1,2 1,0 Skarpt läge vs normdata, screeningtestet UPP/Screen Extraversion Skarpt läge Normdata 0,8 0,6 0,4 0,2 0,0-0,2 Före korrektion Efter korrektion Före korrektion skillnaden p<0,00005, efter korrektion ej signifikant
Validitet hos okorrigerade och korrigerade testskalor, medarbetares bedömningar som kriterium. Varje punkt motsvarar en testskala och en kriterieskala Validitet efter korrektion 0,40 0,30 0,20 0,10 0,00-0,10-0,20-0,20-0,10 0,00 0,10 0,20 0,30 0,40 Validitet före korrektion
Jag inbjöd på Internet till en sorts tävling mot testet. Så här såg inbjudningen ut: Stresstestning av UPP-testet: kan du lura testet? Personlighetstest brukar vara lätta att lura. Vill man framstå som mycket bättre än man egentligen är så kan det ordnas lätt, eftersom få test korrigerar för skönmålning och dessutom är pinsamt lätta att genomskåda. Det gäller emellertid inte UPP. Vi har många skäl att tro att korrigeringen fungerar bra i UPP-testet men vill nu se om den fungerar också när den testade personen går in för att lura oss så mycket som möjligt. Detta blir ett stresstest av UPP! Tror du att du kan lura UPP? Vi utmanar dig! Skicka ett mail till henrik.nilheim@gmail.com så får du inloggnngsuppgifter för att ta testet. Du får sedan en fullständig testrapport varav bl a framgår dina okorrigerade och korrigerade värden. Till den som lyckas få samma värden i dessa två fall skickar vi en skön morgonrock och två kaffemuggar, och ett diplom varav framgår att du är smartare än UPPtestet! Det är bråttom! Erbjudandet gäller bara fram till 1 september. Lycka till!
Fördelning av värdena i overt och kovert skönmålning framgår av Tabell 1. Tabell 1. Frekvenser (procent) av värdena i skönmålning, stanineskala Stanine Overt Kovert 1 6,7 6,7 2 6,7 0 3 6,7 0 4 6,7 20,0 5 13,3 16,7 6 6,7 10,0 7 10,0 10,0 8 26,7 26,7 9 16,7 10,0 I normgruppen ligger 11 % på värdena 8 och 9, här alltså 3-4 gånger fler, särskilt i overt skönmålning.
Slutsats De som aktivt försökte lura testet fastnade i skönmålningsfällan, precis som förväntades
Kommentar Tidigare forskning har alltså gett starkt stöd till modellen som användes för att rensa bort effekterna av skönmålning: Effekterna försvann till mer än 90 % Ingen lyckades lura testet Testets validitet ökade efter korrektion för skönmålning
Hur var det med skönmålningen under de olika betingelserna i den aktuella studien? Mäts alltså på två sätt: Overt (traditionell social önskvärdhet ) Kovert (vanliga personlighetsfrågor, utvalda för att vara speciellt starkt laddade i overt skönmålning)
Sökande 2012 Sökande 2011 Sökande 2011 Norm Antagna 2010 Sökande 2010 Sökande 2012 Overt skönmålning Norm Antagna 2010 Sökande 2010 1,0 0,8 0,6 0,4 0,2 0,0-0,2-0,4 Kovert skönmålning 1,0 0,8 0,6 0,4 0,2 0,0-0,2-0,4
Kommentar Observera den mycket stora effekten, ca 1 standardavvikelse
Norm Antagna 2010 Sökande 2010 Sökande 2012 Sökande 2011 Emotionell stabilitet, före korrektion Norm Antagna 2010 Sökande 2010 Sökande 2012 Sökande 2011 0,8 0,6 0,4 0,2 0,0-0,2-0,4 0,8 Emotionell stabilitet, efter korrektion 0,6 0,4 0,2 0,0-0,2-0,4
Sökande 2011 Norm Antagna 2010 Sökande 2010 Sökande 2012 Sökande 2011 Positiv attityd, före korrektion Norm Antagna 2010 Sökande 2010 Sökande 2012 0,8 0,6 0,4 0,2 0,0-0,2-0,4 Positiv attityd, efter korrektion 0,8 0,6 0,4 0,2 0,0-0,2-0,4
Slutsatser Skönmålning varierade som väntat, i enlighet med hur skarpt läget var I skalorna för emotionell stabilitet och positiv attityd fick vi också de förväntade skillnaderna Dessa skillnader försvann till ca 95 % efter korrektion för skönmålning
Konsekvens av att inte korrigera Alltför stort antal mycket höga värden i positiva dimensioner som emotionell stabilitet. I 2011 års data fick 19% 8 eller 9, mot förväntade 11 %. I individuella fall rangplacering som kan bli mycket vilseledande. Exempel från 2011: En sökande (av 218) fick en delad 1:a plats före korrektion, rang 66 efter.
Är strukturen hos UPP robust under starkt skilda betingelser?
Korrelationer mellan samtliga testskalor för gruppen av sökande (2011) plottade mot motsvarande värden för gruppen av antagna. 1,00 0,80 0,60 Sökande 0,40 0,20 0,00-0,20-0,20 0,00 0,20 0,40 Antagna 0,60 0,80 1,00
Tabell 5. Kongruenskoefficienter mellan de två faktoranalyserna efter rotation till maximal likhet (Procrustesrotation). Faktor 1 sökande Faktor 2 sökande Faktor 3 sökande Faktor 4 sökande Faktor 1 antagna Faktor 2 antagna Faktor 3 antagna Faktor 4 antagna 0.97 0.48 0.45 0.56 0.52 0.94 0.46 0.50 0.47 0.44 0.96 0.39 0.54 0.45 0.36 0.81
Slutsats Faktorstrukturen hos UPP var invariant över starkt skilda betingelser för testningen
Proxyvalidering vad är det? Testvalidering enligt klassisk metod görs mot externa kriterier, dvs. relevanta variabler eller resultat av typ faktiska arbetsprestationer Sådana data måste då samlas in för varje testad person det tar tid och blir ofta ganska dyrt I UPP samlas rutinmässigt in data på t ex arbetsvilja och arbetsintresse, som vi vet samvarierar med arbetsresultat Dessa används som ställföreträdande kriterier eller proxykriterier En snabbare och enklare metodik är att samla in data på proxykriterier, dvs. data som på goda grunder kan tänkas samvariera med arbetsresultat
Vilket vetenskapligt stöd finns för proxyvalidering?
Stöd nr 1:Korrelationer mellan proxykriterier och ett objektivt mått på arbetsresultat (polisstudie, antal genomförda förhör, Dåderman och de Colli) Arbetstillfredsställelse 0.37 Arbetsvilja 0.44 Arbetsintresse 0.37
Stöd nr 2: samstämmighet mellan extern validering och proxyvalidering i 4 studier
0,80 0,60 Korrelation med proxy-kriterier 0,40 0,20 0,00 R Sq Linear = 0,416-0,20-0,20 0,00 0,20 0,40 0,60 Korrelation med Värde för företaget (chefsbedömning) 0,80
0,80 r = 0.64 0,60 0,40 Proxyvaliditet 0,20 0,00-0,20-0,40-0,20 0,00 0,20 0,40 Validitet mot förändringsarbete 0,60
r = 0.54, p = 0.046
Validitet mot ekonomisk framgång
Jämförande proxyvalidering CTI-UPP (2011 års data) Proxykriterium beräknades för alla testade på grundval av: Arbetsvilja Arbetstillfredsställelse Arbetsintresse Resultatorientering Förändringsvilja UPP- och CTI-data användes för att skapa aggregerade data Både för proxykriteriet och aggregerade personlighetsskalor i CTI och UPP användes lika vikter
Resultat UPP-testets proxyvaliditet, korrigerad för mätfel i kriteriet, var 0.69. Detta värde stämmer bra med tidigare forskning om UPP-testet. För CTI:s del var motsvarande värde 0.56 I detta avseende framstod UPP som ca 50 % mera effektivt än CTI.
Jämförelse med tidigare studie I en tidigare studie, som enbart använde data från 2010, var skillnaden betydligt större mellan UPP och CTI Detta berodde troligen på att CTI-data kom från skarpt läge medan proxykriteriet byggde på UPP, som huvudsakligen samlades in i oskarpt I en mindre grupp från skarpt läge blev resultaten ganska lika dem från den större gruppen (2011) i skarpt läge Alltså en mindre skillnad UPP-CTI
UPP och CTI i relation till bedömningar
Kommentar Data visar en genomgående trend för lägre bedömningar av dem som låg i gruppen av de 10% som "lyckades" sämst på UPP. En liknande trend finns för CTI, men svagare.
Tabell 14. Genomsnittliga bedömningar i relation till testvärden utvärderade i två grupper för varje test. Bedömning Befälslämplighet (Pliktverkets/TRM psykologbedömning, skala 1-9) Psykologisk funktionsförmåga (Pliktverkets/TRM psykologbedömning, skala 1-9) Lämplighetsbedömning (skala 0-3, där 0 är ej godkänt) Psykologskattning (skala 1-9, där 3 och under uppfyller ej kravprofil) Professionsintervjuarskattning (skala 1-9, där 3 och under uppfyller ej kravprofil) UPP, lägsta 10% UPP övriga CTI, lägsta 10 % CTI övriga 6.70 6.83 6.72 6.83 6.95 7.14 7.08 7.13 1.10 1.50 1.36 1.46 5.45 5.59 5.56 5.57 5.37 5.80 5.76 5.75
0,4 Bedömning av de sökande efter intervju 0,3 0,2 TRM, psykologbed. HR-centrum, psykologbed. HR-centrum, professionsbed. 0,1 0,0-0,1-0,2-0,3-0,4 1 2 3 4 5 Overt skönmålning, 20%-grupper Y-axeln återger z-transformerade värden av bedömningarna
Vilka antogs? Av 218 sökande 2011 var det 82 som antogs till officersutbildning. Vilket samband fanns mellan antagning och personlighetstestningen resultat? De sammanslagna testvärdena standardiserades till z-poäng och medelvärden beräknades för antagna, respektive ej antagna. I båda fallen fanns en skillnad i förväntad riktning, men svag: 0.11. Den var signifikant för CTI men inte för UPP.
Personlighet och begåvning Data förelåg i "provgrupp", som är en kombination av resultaten av TRM:s begåvningstestning. Korrelationen med de sammanslagna värdena av UPP och CTI var -0.15 och -0.06. Personlighetstesten gav alltså ny information utöver begåvningstesten, ett väntat resultat och ett stöd för personlighetstest i detta sammanhang
Slutsatser (1) Skönmålning visade sig vara en mycket viktig faktor i en anställningssituation Skönmålning kunde effektivt mätas med den metodik som används i UPP Om måtten på skönmålning användes för att korrigera data på det sätt som används i UPP försvann effekterna av varierande grad av skarpt läge, vilket är ett starkt stöd för att de korrigerade data gav ett sannare mått på personlighetsvariablerna än de okorrigerade data
Slutsatser (2) Skönmålning hade mycket starkare genomslag i data vid ansökan än i en mera neutral situation. Genomslagets styrka varierade efter hur "skarp" situationen var Stämningsläget inför testningen visade på stora variationer i graden av mobilisering av psykiska resurser, relaterade till hur skarpt läget var UPP-testet hade en robust psykometrisk struktur som var likartad i skarpt och oskarpt läge
Slutsatser (3) Mätningen av datakvalitet hos UPP vidareutvecklades med en skala som mäter innehållsneutrala svar, alltså tendens att hålla med eller avvisa item oavsett deras innehåll. Denna och tidigare använda kvalitetsmått samvarierade som väntat med hur skarp testsituationen var: ju skarpare läge, desto högre datakvalitet UPP-testet hade högre proxyvaliditet än CTI, men skillnaden var mindre än i den tidigare studien
Slutsatser (4) Båda testen var endast svagt relaterade till bedömningar efter intervjuer, UPP något starkare än CTI; detta trots att endast CTI-resultaten var kända för intervjuarna. CTIskalorna hade också svaga samband med skönmålning vilket kan vara ett uttryck för att de testade inte insåg vad som var taktiskt lämpliga svar i dessa skalor. Overt skönmålning i UPP hade tendens till en positiv relation till bedömningar efter intervjuer Både UPP och CTI hade mycket svaga samband med begåvning, vilket stämmer bra med tidigare forskning och stödjer att personlighetstest ger god komplettering till begåvningstest
Tack för er uppmärksamhet!