Friday 21 july, 2017 Plenary Session: Case study

 

Samma material – Rorschach och TAT ifrån en ung man med Aspergers, som Justine McCarthey, Tavistock London, träffat för bedömning inför psykoterapi, och sedan fortsatt att träffa en gång i veckan under tre år – behandlades av tre personer ifrån tre rorschach-skolor; CS (Noriko Nakamura Japan), R-PAS (Greg Meyer USA) och Parisskolan (Catherine Azoulay Frankrike).
http://www.rorschachparis2017.org/Programme/Vendredi_21_juillet_2017/en

Väldigt intressant, och berörde indirekt ett underliggande tema för konferensens – ett försök att åter överbrygga splittringen mellan R-PAS och CS som uppstått efter John Exners död.

Fallet handlade dock om en man med Aspergers och tyvärr kom frågor upp mot slutet om diagnosen verkligen kunde stämma, baserat på personens svar i Rorschach. Både frågor och svar tyckte jag visade hur lång väg det är kvar till att få en mer koherent förståelse av vad kognitiva ”funktionsutmaningar” inom AST är, och hur de är en del av grunden i en persons interagerande med världen och kan vara – inte synonyma med utan – en bidragande orsak till en persons psykiatriska symtom och negativa föreställningar om sig själva och omvärlden.

Om personen via en psykoterapi kan få hjälp att överbrygga de svårigheter som uppstår i de utmaningar som alla möter under utvecklingen – som t ex formandet av en sammanhängande identitet och självbild eller förståelse av andra som realistiska och sammanhängande personer med ett eget tänkande, kan personen mogna och må bättre psykiskt.

Det är fantastiskt om performancebaserade personlighetstest kan hjälpa oss att överbrygga den klyfta som ofta uppstår i själva kommunikationen – den svårighet personer med AST har att kommunicera sin inre värld på direkt fråga, och även de svårigheter vi kan ha att förstå dem när de försöker göra det – the double empathy problem. Rorschach och andra performancebaserade test innebär möjligheter som behöver utforskas vidare, och vi kanske kan utveckla extended inquiries som passar personer med npf bättre. Inte för diagnostik av ett tillstånd utan för att bättre förstå personen och kunna göra rekommendationer för behandling.

Facebooktwittergoogle_plusredditpinterestlinkedinmail

Debatt om klinisk vs mekanisk personbedömning i psykologtidningen

2013-08-15

Malin Holm och Björn Sahlberg:
”Statistik är inte mer tillförlitlig
än professionellt omdöme”

När det gäller tester och chefsurval finns i samtiden en tilltagande och alltmer högljudd argumentation som menar att statistik är tillförlitligare än det professionella omdömet, att en matematisk formel som beslutsgrund är att föredra. Tonfallet är självsäkert.

Man talar om evidensbaserat urval och alternativet beskrivs ofta i termer av ett mer eller mindre kvalificerat beslutsfattande med magen. Grundläggande i denna statistiska linje – eller Big Data som den också benämnts – är att:
1) kandidater i en rekryteringsprocess bör rangordnas med hjälp av kvoten från ett traditionellt intelligenstest och vissa delskalor i ett självskattningsinventorium, och
2) erfarenhet hos en professionell yrkesperson kan – tillsammans med intervjuer, referenstagning eller försök att använda omdömesgillt tänkande – bara störa bedömningen.

Big Data-ideologin har en fördel i att den minskar utrymmet för godtycke i bedömningar, men vi menar att flera fakta manar till ödmjukhet:
• Metoden anger inte om personen även tillhör någon oönskad grupp, till exempel gruppen patologiska lögnare eller rasister
• Det som gäller för en grupp i allmänhet gäller inte med nödvändighet för alla individer i gruppen. I det enskilda fallet kan ovanliga men kritiska faktorer göra att den renodlade statistiska bedömningen blir gravt missvisande.

Hur fel det kan gå belyses till exempel av en kvinna som kontaktade en av oss och berättade att hon blev nekad ett chefsjobb i en svensk kommun eftersom hennes resultat på BASIQ ”enbart” var stanine 5 jämfört med normalpopulationen. Det hade varit okej om resultatet hade varit 5 jämfört med akademikergruppen.

Vi menar inte att begåvning är oviktigt, men man kan och bör tänka längre än en kvot eller siffra. Man bör relatera detta till annat som omdöme, strategisk förmåga, tolerans för osäkerhet och komplexitet, typen av försvarsmönster och reaktioner på stress, personlig och känslomässig mognad. Sedan – och detta är avgörande – bör man som professionell bedömare kunna väga samman intryck, ställa sig nya frågor och till sist med hjälp av sitt omdöme ta ställning. Man överlåter inte avgörandet till metoden utan tar ansvar för en egen bedömning.

Inom rättspsykiatrin, där kostnaderna för felaktiga beslut pressar på metodutvecklingen, brukar Big Data hänföras till den andra generationens bedömningar; ett redan lämnat steg på vägen mot mer användbarara system. I stället har en tredje generationens metod utvecklats; En syntes av klinisk bedömning och Big Data, ofta kallad strukturerad klinisk bedömning. Där ska bedömaren låta sig styras av checklistor med empiriskt välstuderade faktorer, men utifrån klinisk erfarenhet och även sunt förnuft kunna lägga till och dra ifrån specifika faktorer av betydelse.

Vi oroas också av den kulturella påverkan som Big Data innebär. Om tänkande och berättande helt ersätts av empiri och statistik blir det svårt att skapa begrepp kring personligt ansvar och moral. Att alla sidor hittar stöd i forskning visar bara att ämnet är komplext, och vi skulle önska att vi psykologer kunde göra gemensam sak i en verkligt vetenskaplig ansats – att ackumulera kunskap med de landvinningar vi gör i stället för att på ett arrogant sätt påstå att någon har det enda rätta synsättet.

Anders Sjöberg, Maria Åkerlund och Sara Henrysson Eidvall om tester:
”Alla metoder bör utvärderas i förhållande till målet”

Evidensbaserat urval handlar inte bara om ett intelligenstest och ett självskattnings-inventorium. Den beräkningsgrund som används har ingen begränsning hur många faktorer som vägs in, dock ska det som vägs in bygga på en rational och på belägg för att det fungerat i andra sammanhang. Det som vägs in ska naturligtvis också vara reliabelt. Det skriver psykologerna Anders Sjöberg, Maria Åkerlund och Sara Henrysson Eidvall.

När det gäller tester och chefsurval finns i samtiden en tilltagande och alltmer högljudd argumentation som menar att statistik är tillförlitligare än det professionella omdömet, skriver psykologerna Björn Sahlberg och Malin Holm. Tonfallet är självsäkert, man talar om evidensbaserat urval och alternativet beskrivs ofta i termer av ett mer eller mindre kvalificerat beslutsfattande med magen fortsätter Sahlberg och Holm, som också menar att båda sidor i denna fråga finner stöd i forskning. Vi uppfattar att huvuddragen i insändaren är att det inte är bra att rangordna kandidater i en rekryteringsprocess med hjälp av formler som väger ihop flera olika testpoäng och att erfarenhet hos en professionell yrkesperson intar en central plats i personbedömningen.

Inom arbetspsykologin har under ett antal decennier funnits två skolor inom bedömning och urval. Den ena traditionen har kallats klinisk, holistisk eller individuell bedömning och den andra mekanisk, statistisk eller psykometrisk bedömning. Det är riktigt att båda traditionerna vidhåller att data ska samlas in på ett strukturerat sätt. Det som skiljer de båda traditionerna åt är hur informationen sedan omvandlas till en rekommendation som i sin tur leder till ett urvalsbeslut.

Kliniska bedömningar kan definieras som bedömningar av olika aspekter som en expert anser vara av betydelse i ett visst sammanhang. Bedömningen är intuitiv eller åtminstone inte en standardiserad sammanvägning av dessa olika aspekter. Mekaniska bedömningar kan definieras som standardiserade sätt att mäta och sedan statistiskt sammanväga de aspekter som forskningen visat är av betydelse för urvalsbeslut. Dessa två skolor har alltså funnits parallellt under väldigt lång tid (de första artiklarna publicerade på 20-talet) och den mekaniska ansatsen är inte något som uppstått i ”samtiden”.

Det är helt rätt att evidensbaserat urval handlar om en siffra som ska ligga till grund för beslut och att denna siffra beräknas genom att man väger ihop den information om kandidaten som i forskning visat sig fungera i urval. EBU handlar emellertid inte om att begränsa detta till ett intelligenstest och ett självskattnings-inventorium. Den beräkningsgrund som används har ingen som helst begränsning hur många faktorer som vägs in, dock ska det som vägs in bygga på en rational och på belägg för att det fungerat i andra sammanhang. Det som vägs in ska naturligtvis också vara reliabelt, alltså fritt från mätfel. Således kan även intervjuer, referenstagning och omdömesgillt tänkande läggas in i samma formel tillsammans med poäng från intelligenstest och personlighetstest så länge även dessa mått är reliabla och valida. På detta sätt bildar samtliga informationskällor beslutsunderlag vid urval, i en s k kompensatorisk modell där vissa faktorer kan viktas tyngre än andra eller kompensera varandra.

Författarna argumenterar för att den mekaniska metoden inte kan upptäcka patologiska lögnare eller rasister och att det som gäller för en grupp i allmänhet inte med nödvändighet gäller för alla individer i gruppen. De ger också ett exempel på vad de anser är ett felaktigt grundat urvalsbeslut där en kvinna blev nekad ett jobb pga av att hon var normalbegåvad.

Ett urvalsunderlag som endast innehåller en intelligenspoäng och fem personlighetspoäng (av Big 5-karaktär) kan naturligtvis inte upptäcka patologiska lögnare eller rasister. Om det finns information som predicerar lögnaktighet och rasism som är reliabel kan denna emellertid vägas in i EBU. Vad gäller argumentet att det som gäller gruppen inte säkert gäller för individen är detta förvisso korrekt, men vi kan aldrig förutsäga enskilda beteenden hos en individ till 100 procent. Det är därför all bedömning handlar om sannolikhet. Det är den professionella personbedömarens (leverantörens) ansvar att redogöra för uppdragsgivaren med vilken grad av säkerhet hon eller han kan säga att det är rätt person som föreslås till anställningen. Idag upplever vi att alltför mycket tid ägnas åt oändliga beskrivningar av kandidater och att dessa beskrivningar endast är diffust kopplade till sannolikheten att lyckas i det arbete som söks.

Kvinnan som nekades anställning på grund av normalbegåvning är inte nödvändigtvis ett exempel på evidensbaserat urval. EBU förordar inte att endast en informationskälla ska användas vid urvalsbeslut.

Vi menar, till skillnad från författarna, att båda sidor inte alls får stöd i forskningen. Redan på 40-talet gjordes utvärderingar av stora urvalsprojekt i USA där det visade sig att de samlade bedömningar av testresultat och andra data som gjordes i slutet av urvalsprocessen hade lägre validitet än de enskilda testerna var för sig. Under de 70 år som följt därefter har man varje gång man jämfört kliniska/holistiska och mekaniska/psykometriska bedömningar kommit fram till samma resultat. Forskningen ger tydligt besked, mekanisk sammanvägning vinner överlägset när samma information bedöms.

När det undersökts hur bedömningsexperter inom olika områden kommer fram till beslut har man funnit att de förlitar sig på begränsad information, är oklara över och inte kan redovisa hur de har kommit fram till sina bedömningar, att interbedömar-reliabiliteten är låg samt att de blir mer säkra på sina ursprungliga slutsatser när irrelevant information tillförs. Det finns alltså inget stöd i forskningen för att den professionella bedömaren har en unik förmåga att väga samman intryck, ställa relevanta frågor och till sist med hjälp av sitt omdöme fatta bättre urvalsbeslut. Snarare visar forskningen att professionella bedömare överskattar sin förmåga.

Ett av psykologins stora bidrag till samhället är forskningen och kunskapen om människans omdöme och beslutsfattande. Genom detta bidrag har vi lärt oss mer om hur vårt omdöme påverkas av ovidkommande faktorer, hur svårt vi har att uppskatta sannolikhet och hur vi föredrar och låter oss påverkas mer av berättelser än av enstaka fakta hur relevanta de än är. Denna psykologiska kunskap förklarar varför validiteten sjunker när vi försöker ”tolka” testresultat och annan data som insamlats.

Vi menar att alla metoder bör utvärderas i förhållande till det mål man har med dem. Om målet när man gör ett urval är att exempelvis bemanna en roll med den person som med så stor sannolikhet som möjligt kommer att göra det bästa jobbet, till fromma för alla intressenter såsom medarbetare, kolleger, brukare/kunder, skattebetalare/ägare och samhället i stort, bör man välja den säkraste metoden för detta.

Den som använder metoden bör kunna göras ansvarsskyldig, det vill säga kunna redogöra för hur och med vilket stöd hon eller han kommit fram till sin slutsats. Det bör gå att spåra processen fram till beslut och om flera bedömare använder samma metod på samma data ska de komma till samma slutsats. Personligt ansvar och moral är i detta sammanhang förknippat med att vara tydlig med vad som bedöms, hur det vägs ihop och till slut ligger till grund för ett beslut baserat på empiri. Vi har alla arbetat inom urvalsområdet i ett 20-tal år. Vår erfarenhet är att urvalsbedömare sällan görs ansvarsskyldiga och i princip aldrig avkrävs en redovisning av rationalen och forskningsstödet för sina metoder. Vi uppmanar kunder och andra intressenter att avkräva oss detta och göra oss ansvarsskyldiga!

2014-01-08

Malin Holm och Björn Sahlberg:
”Finns ingen bra ursäkt att inte använda sitt professionella omdöme”

Vi skrev ett debattinlägg i Psykologtidningen nr 6/2013 samt på psykologtidningen.se med kritisk udd mot den så kallade evidensbaserade urvalsmetoden. Nu har Sara Henrysson Eidvall, Anders Sjöberg och Maria Åkerlund gått i svaromål och överskriften är: ”Alla metoder bör utvärderas i förhållande till målen”, vilket vi givetvis inte motsäger. Snarare belyser det kanske grunden i vårt resonemang – vilket värde tillför egentligen de olika metoderna?

Författarna skriver också att de slagits av att de genom åren sällan behövt ställas till svars för sina bedömningar. Vi anser också det som självklart att man ska kunna ställas till svars för sin bedömning, och är vana att ha denna diskussion med uppdragsgivare, och vi vill betona att detta inte är en diskussion om att ha en sund metodologi, robusta tester eller grunda sina metoder i forskning. Där är vi helt eniga. Vad vi vill diskutera är vad personbedömning är och vad en kvalificerad yrkesperson kan tillföra utöver själva testen.

Vi argumenterar för att psykologens/konsultens eget omdöme måste användas när vi drar slutsatser och att vi inte ska förlita oss enbart på en siffra från en formel. På detta svarar författarna att forskning entydigt visat att mekanisk/psykometrisk bedömning är bättre än klinisk/holistisk. Den senare beskrivs som intuitiv och som att konsulten inte kan redogöra för hur han/hon kommit fram till sina resultat. Hur är den forskningen genomförd? Tar den hänsyn till exempel till metodologin och skickligheten hos bedömaren?

I Psykologtidningen nr 1/2013 skriver Sara Henrysson Eidvall i en recension av Kahnemans bok Att tänka snabbt eller långsamt om vådan av hastigt vanetänkande. Vi är överens med författarna om att det är ett långsamt, analytiskt tänkande som behövs. Poängen med boken, och recensionen, är att detta inte sker bara på basis av en persons begåvning, utan mer är en fråga om insikt, professionalism och självdisciplin. Vi skulle kunna kalla det snabba tänkandet intuitivt och i vissa fall omedvetet, medan det långsamma strävar efter att vara medvetet och rationellt. Vi skulle också kunna säga att detta berör faktorn omdöme.

Vi tolkar att författarna vill bygga bort den riskfaktor som finns i den starka frestelsen att luta sig mot intuitivt tänkande, och att man därför inte ska tänka alls när man väl fastställt sin formel. Vi förstår poängerna med en sådan basnivå eftersom den rensar bort osunda metoder, men tycker att det är otillfredsställande att inte sträva vidare utifrån det kunnande som finns. Detta kräver dock specialisering, expertis och professionalism vilket berör en annan kritik vi har mot resonemanget, att frågan om olika bedömares olika skicklighet helt faller bort. Genom att kategoriskt onödiggöra bedömaren, oavsett dennes skicklighet, så tror vi man gör testbolagen en större tjänst, än kunderna.

Testresultaten är inte i sig bedömningen, utan indikationer på ett fungerande som behöver analyseras till en större helhet. För det behövs en kvalificerad personbedömare, som tar det yttersta ansvaret för att integrera relevanta testdata mot bakgrund av en personlighetsteori. En förståelse behövs av individens relativt stabila fungerande, som vi kallar personlighet, och en matchning av denna mot befattningen. En förståelse av de specifika förhållandena i organisationen, som relationer, tyst kunskap med mera ökar ytterligare träffsäkerheten. Ibland är det enkelt – alla resultat går i samma riktning/har hög konvergens – och talar ett tydligt språk. Ibland är det svårt. Testresultaten överensstämmer inte utan kräver en fördjupad analys, eller de kandidater som ska bedömas har olika styrkor och riskområden, men ingen är 100 procent matchad till kontexten. Men detta är något som är ytterst svårt att skapa en formel omkring.

En optimal formel har minst en variabel för kontext, och en för faktorn personlighetsorganisation, eller mognad. Dit känns det långt. Vi menar att det inte finns någon bra ursäkt att inte använda sitt professionella omdöme även om detta inte är hundraprocentigt.

Oavkortad version Endast på Psykologtidningen.se 2013-10-13

Anders Sjöberg, Maria Åkerlund och Sara Henrysson Eidvall om tester:
”Alla metoder bör utvärderas i förhållande till målet”

Evidensbaserat urval handlar inte bara om ett intelligenstest och ett självskattnings-inventorium. Den beräkningsgrund som används har ingen begränsning hur många faktorer som vägs in, dock ska det som vägs in bygga på en rational och på belägg för att det fungerat i andra sammanhang. Det som vägs in ska naturligtvis också vara reliabelt. Det skriver psykologerna Anders Sjöberg, Maria Åkerlund och Sara Henrysson Eidvall.

När det gäller tester och chefsurval finns i samtiden en tilltagande och alltmer högljudd argumentation som menar att statistik är tillförlitligare än det professionella omdömet, skriver psykologerna Björn Sahlberg och Malin Holm. Tonfallet är självsäkert, man talar om evidensbaserat urval och alternativet beskrivs ofta i termer av ett mer eller mindre kvalificerat beslutsfattande med magen fortsätter Sahlberg och Holm, som också menar att båda sidor i denna fråga finner stöd i forskning. Vi uppfattar att huvuddragen i insändaren är att det inte är bra att rangordna kandidater i en rekryteringsprocess med hjälp av formler som väger ihop flera olika testpoäng och att erfarenhet hos en professionell yrkesperson intar en central plats i personbedömningen.

Inom arbetspsykologin har under ett antal decennier funnits två skolor inom bedömning och urval. Den ena traditionen har kallats klinisk, holistisk eller individuell bedömning och den andra mekanisk, statistisk eller psykometrisk bedömning. Det är riktigt att båda traditionerna vidhåller att data ska samlas in på ett strukturerat sätt. Det som skiljer de båda traditionerna åt är hur informationen sedan omvandlas till en rekommendation som i sin tur leder till ett urvalsbeslut.

Kliniska bedömningar kan definieras som bedömningar av olika aspekter som en expert anser vara av betydelse i ett visst sammanhang. Bedömningen är intuitiv eller åtminstone inte en standardiserad sammanvägning av dessa olika aspekter. Mekaniska bedömningar kan definieras som standardiserade sätt att mäta och sedan statistiskt sammanväga de aspekter som forskningen visat är av betydelse för urvalsbeslut. Dessa två skolor har alltså funnits parallellt under väldigt lång tid (de första artiklarna publicerade på 20-talet) och den mekaniska ansatsen är inte något som uppstått i ”samtiden”.

Det är helt rätt att evidensbaserat urval handlar om en siffra som ska ligga till grund för beslut och att denna siffra beräknas genom att man väger ihop den information om kandidaten som i forskning visat sig fungera i urval. EBU handlar emellertid inte om att begränsa detta till ett intelligenstest och ett självskattnings-inventorium. Den beräkningsgrund som används har ingen som helst begränsning hur många faktorer som vägs in, dock ska det som vägs in bygga på en rational och på belägg för att det fungerat i andra sammanhang. Det som vägs in ska naturligtvis också vara reliabelt, alltså fritt från mätfel. Således kan även intervjuer, referenstagning och omdömesgillt tänkande läggas in i samma formel tillsammans med poäng från intelligenstest och personlighetstest så länge även dessa mått är reliabla och valida. På detta sätt bildar samtliga informationskällor beslutsunderlag vid urval, i en s k kompensatorisk modell där vissa faktorer kan viktas tyngre än andra eller kompensera varandra.

Författarna argumenterar för att den mekaniska metoden inte kan upptäcka patologiska lögnare eller rasister och att det som gäller för en grupp i allmänhet inte med nödvändighet gäller för alla individer i gruppen. De ger också ett exempel på vad de anser är ett felaktigt grundat urvalsbeslut där en kvinna blev nekad ett jobb pga av att hon var normalbegåvad.

Ett urvalsunderlag som endast innehåller en intelligenspoäng och fem personlighetspoäng (av Big 5-karaktär) kan naturligtvis inte upptäcka patologiska lögnare eller rasister. Om det finns information som predicerar lögnaktighet och rasism som är reliabel kan denna emellertid vägas in i EBU. Vad gäller argumentet att det som gäller gruppen inte säkert gäller för individen är detta förvisso korrekt, men vi kan aldrig förutsäga enskilda beteenden hos en individ till 100 procent. Det är därför all bedömning handlar om sannolikhet. Det är den professionella personbedömarens (leverantörens) ansvar att redogöra för uppdragsgivaren med vilken grad av säkerhet hon eller han kan säga att det är rätt person som föreslås till anställningen. Idag upplever vi att alltför mycket tid ägnas åt oändliga beskrivningar av kandidater och att dessa beskrivningar endast är diffust kopplade till sannolikheten att lyckas i det arbete som söks.

Kvinnan som nekades anställning på grund av normalbegåvning är inte nödvändigtvis ett exempel på evidensbaserat urval. EBU förordar inte att endast en informationskälla ska användas vid urvalsbeslut.

Vi menar, till skillnad från författarna, att båda sidor inte alls får stöd i forskningen. Redan på 40-talet gjordes utvärderingar av stora urvalsprojekt i USA där det visade sig att de samlade bedömningar av testresultat och andra data som gjordes i slutet av urvalsprocessen hade lägre validitet än de enskilda testerna var för sig. Under de 70 år som följt därefter har man varje gång man jämfört kliniska/holistiska och mekaniska/psykometriska bedömningar kommit fram till samma resultat. Forskningen ger tydligt besked, mekanisk sammanvägning vinner överlägset när samma information bedöms.

När det undersökts hur bedömningsexperter inom olika områden kommer fram till beslut har man funnit att de förlitar sig på begränsad information, är oklara över och inte kan redovisa hur de har kommit fram till sina bedömningar, att interbedömar-reliabiliteten är låg samt att de blir mer säkra på sina ursprungliga slutsatser när irrelevant information tillförs. Det finns alltså inget stöd i forskningen för att den professionella bedömaren har en unik förmåga att väga samman intryck, ställa relevanta frågor och till sist med hjälp av sitt omdöme fatta bättre urvalsbeslut. Snarare visar forskningen att professionella bedömare överskattar sin förmåga.

Ett av psykologins stora bidrag till samhället är forskningen och kunskapen om människans omdöme och beslutsfattande. Genom detta bidrag har vi lärt oss mer om hur vårt omdöme påverkas av ovidkommande faktorer, hur svårt vi har att uppskatta sannolikhet och hur vi föredrar och låter oss påverkas mer av berättelser än av enstaka fakta hur relevanta de än är. Denna psykologiska kunskap förklarar varför validiteten sjunker när vi försöker ”tolka” testresultat och annan data som insamlats.

Vi menar att alla metoder bör utvärderas i förhållande till det mål man har med dem. Om målet när man gör ett urval är att exempelvis bemanna en roll med den person som med så stor sannolikhet som möjligt kommer att göra det bästa jobbet, till fromma för alla intressenter såsom medarbetare, kolleger, brukare/kunder, skattebetalare/ägare och samhället i stort, bör man välja den säkraste metoden för detta.

Den som använder metoden bör kunna göras ansvarsskyldig, det vill säga kunna redogöra för hur och med vilket stöd hon eller han kommit fram till sin slutsats. Det bör gå att spåra processen fram till beslut och om flera bedömare använder samma metod på samma data ska de komma till samma slutsats. Personligt ansvar och moral är i detta sammanhang förknippat med att vara tydlig med vad som bedöms, hur det vägs ihop och till slut ligger till grund för ett beslut baserat på empiri. Vi har alla arbetat inom urvalsområdet i ett 20-tal år. Vår erfarenhet är att urvalsbedömare sällan görs ansvarsskyldiga och i princip aldrig avkrävs en redovisning av rationalen och forskningsstödet för sina metoder. Vi uppmanar kunder och andra intressenter att avkräva oss detta och göra oss ansvarsskyldiga!

2014-02-26

Malin Holm och Björn Sahlberg
Den kliniska bedömningen är central

Vi startade en debatt i Psykologtidningen mot den så kallade evidensbaserade urvalsmetoden för att vi utifrån lång erfarenhet av personbedömningar fann det svårsmält att bli betraktade som felkällor. Att hävda att den rent mekaniska urvalsmetoden är den mest vetenskapliga och bästa metoden för urval som psykologer kan erbjuda är i vår mening en extremt förenklad syn på vad som driver lönsamhet och framgång i organisationer, som ju består av människor. Det medför en stor risk för att urholka respekten för både psykologisk forskning och för den kompetens psykologer med en specialiserad kunskap och skicklighet i strukturerad personbedömning kan tillföra i både urval och utveckling.

För att lugna våra opponenter Sara Eidvall, Anders Sjögren och Maria Åkerlund vill vi först säga att det naturligtvis är viktigt att vissa faktorer på metanivå visat sig relaterade till framgång och lönsamhet hos individen. En strukturerad klinisk bedömning står inte i motsats till den typen av fakta, utan allt relevant integreras i bedömningen. Personlighet förstås som ett dynamiskt system av förmågor, drivkrafter, motivation och eventuella urspårningstendenser. Intervju, självskattningar och performancebaserade test av begåvning och personlighet ger alla relevanta data som är indikationer på ett fungerande. Målet är att inte bara beskriva gränserna för personens förmåga, utan även personens motivation att utföra uppgiften.

Ibland är det enkelt – alla resultat går i samma riktning/har hög konvergens. Beroende på skillnader i testers förmåga att mäta olika fenomen, varierar dock graden av konvergens i resultaten bland annat med grad av insikt och förmåga hos en person att beskriva sig själv. Det i sin tur är relaterat till grad av struktur och mognad i personligheten, vilket i sig är en högst önskvärd faktor att fånga i en personbedömning av lämplighet.

Även den forskare som väljer att studera människan utifrån vissa konstanta faktorer torde erkänna att människor kan beskrivas som dynamiska system som påverkar och påverkas av sin omgivning i interaktion, det vill säga något mycket mer komplext som kan behöva förstås och förklaras. I författarnas synsätt verkar förståelse ha liten eller ingen relevans. Härmed tappar man hela det humanistiska perspektivet och synen på människan blir minst sagt endimensionell.
Det intressanta ligger också ofta i det man inte förstår – i den okända variansen, relaterat till förmågan att uppfatta och märka det som avviker från det man trodde. Att undantagen är irrelevanta eftersom det enligt författarna inte finns ”anledning att inte vara nöjd med … ” deras egen mekaniska metod, är ett i vår mening knappast bevisat antagande.

Vad skapar mer lönsamhet för en organisation – att de flesta sannolikt är framgångsrika som individer eller att man inte gör allvarliga felrekryteringar? Det är en relevant fråga eftersom klinisk strukturerad bedömning är bättre på att identifiera de individer som är definitivt olämpliga, på grund av olika typer av underliggande problematik som oftast inte visar sig förrän under en tid eller under ökad press. Hogan och Kaiser (2005) anser att misslyckande snarare beror på oönskade kvalitéer än brist på önskade sådana. Jackson och Parry (2008) hävdar att studier av misslyckande i ledarskapet visat att emotionella aspekter av ledarskapet varit mer avgörande än kognitiva. En chef eller medarbetare med personlighetsstörning orsakar ofta med tiden organisationen stora kostnader och lidanden till exempel på grund av oförmåga att ta ansvar för sina brister och tillkortakommanden. Som en kund uttryckte det – ”It’s 1 % (av rekryterad personal) but it’s 50 % of our costs”.

Att enbart luta sig mot korrelationer i stora metastudier räcker inte heller som perspektiv. Kunskapen om det allmänna räcker inte för att ge ledning i det enskilda chefsurvalet. Inte minst tenderar kandidaterna på högre nivåer att samtliga scora ganska högt på den nu kända formeln som, vad än författarna säger är hypotetiskt möjligt, fortfarande inskränker sig till olika kombinationer av generell begåvning, samt C och E, och kanske lite av N-faktorn i 5-faktor modellen. Generellt vilar deras mekanik mycket tungt mot faktorn begåvning, men det är inte nödvändigtvis så att den högsta begåvningen gör en person lämpligast för alla typer av jobb. Till exempel har framgångsrika ledare en god allmän intelligens, dominans, självförtroende, känslomässig balans och kontroll, självständighet, kreativitet, ansvarskänsla, prestationsbehov och god social kompetens, och det är framför allt kombinationen av dessa egenskaper man har sett ha samband med framgång, inte varje enskild egenskap för sig (Thylefors, 2007).

Våra kunder förstår att det är många olika faktorer som driver framgång och lönsamhet i en organisation. Deras rekryteringar strävar efter att inte bara selektera, utan också integrera och påverka medarbetare in i organisationen som system, där individen skall tillföra ett värde men också interagera med organisationen till ett generera ett gemensamt högre värde. Vidare finns ambitioner med rekryteringarna att vara en del i en övergripande HR-strategi och en möjlighet till utveckling hos både den som får, och den som inte får tjänsten, och i den processen menar vi att psykologisk kunskap kan tillföra värde. Det behovs inga psykologer i den typ av urvalsbedömningar som Eidvall, Sjögren och Åkerlund förespråkar eftersom bedömningen görs helt mekaniskt. För dem är den enda meningsfulla psykologen i sammanhanget forskaren. Vi menar tvärt om att psykologer inte bör abdikera ifrån uppgiften att försöka förstå och förklara mänskliga system.

2014-04-08

Om testning och personlighetsbedömningar:
Mekanisk sammanvägning har högre validitet

I sitt senaste debattinlägg skriver Holm och Sahlberg att de ”fann det svårsmält att bli betraktade som felkällor”. Det är lätt att identifiera sig och sympatisera med den reflektionen. Icke desto mindre har vi att förhålla oss till den forskning som faktiskt finns och som vi i våra inlägg refererat till.

Kuncel et al. (2013) visar i sin metaanalys att mekanisk sammanvägning har högre prediktiv validitet än klinisk och att validiteten sjunker med 25 procent när vi gör kliniska sammanvägningar jämfört med när vi gör mekaniska. Om det stämmer går stora mänskliga värden förlorade med dessa 25 procent. Vi menar att om man inte tror att det stämmer behöver man visa var felen i forskningen finns. Det räcker inte att bara bortse ifrån den.

Detsamma gäller Nobelpristagaren Daniel Kahnemans och andras forskning om bedömning och beslutsfattande som förklarar varför och hur vi alla, även urvalsexperter, faktiskt är felkällor. Det räcker inte att hävda att psykologisk forskning har fel utan att precisera vari felen ligger om vi vill bidra till områdets utveckling.

Med detta vill vi för denna gång avsluta vår medverkan i debatten med Holm och Sahlberg. Vi skulle gärna se inlägg också från andra psykologer och ser fram emot att fortsätta diskussionen vid andra tillfällen och i andra fora. Vi tackar Holm och Sahlberg för deras engagerande inlägg och för att de genom att starta debatten skapade detta tillfälle till fördjupning i en angelägen fråga.

Facebooktwittergoogle_plusredditpinterestlinkedinmail

Performancebaserade personlighetstest – vad är det?

Den uppmärksamme har noterat att Rorschachföreningen lagt till taggen: Personlighetsdiagnostik med performancebaserad testmetod.

Föreningens syfte är att främja intresset inte bara för Rorschachtestet utan har en bredare ansats mot personlighetsdiagnostik med performancebaserade testmetoder; bland annat att anordna utbildning till exempel genom anordnande av seminarier och studiedagar, med mera.

Vad är då performancebaserad testmetod och hur skiljer sig dessa metoder från andra personlighetstest?

Den största skillnaden mellan självskattningstest och performancebaserade personlighetstest, är att de senare strävar efter att få en uppfattning om drivkrafterna bakom en persons overta beteende.

Samma beteende kan ha olika drivkrafter. Det kan vara relativt okomplicerade uttryck för lust och strävan. Det kan vara ambivalent. Det kan vara reaktivt och ett uttryck för försvar, eller en blandning.

Denna testtradition förhåller sig inte primärt till det som är gemensamt hos de flesta, utan har ifrån början haft som målsättning att förstå det specifika hos en viss individ. Det handlar om att få en bild av personens inre dynamik. Vilka olika inre processer pågår i termer av drivkrafter och mål, rädslor och hinder, i relation till eventuella brister och trauman, föreställningar, förväntningar och förhoppningar och även kognitiva förutsättningar?

Hur stabil är personligheten, hur integrerade är beteenden och typiska sätt att lösa situationer och hur håller de för ökade påfrestningar? Är personens förmågor ansträngda till det yttersta eller finns det flexibilitet och utrymme för att möta större utmaningar och snabb förändring? Skulle personens sätt att beskriva sig själv och tillvaron bekräftas av andra, eller pågår det olika typer av försvar mot att se tillvaron som den är, och så vidare beroende på frågeställning.

Testen fungerar så, att en person presenteras för uppgiften att ge svar på halvstrukturerade stimuli, med den mening och form som hen kan skapa utifrån sig själv. På så vis kommer typiska mönster att uppfatta, tolka, reagera på och hantera situationer till uttryck. Teststimuli är utprövade under lång tid och på stora grupper för att kunna relatera personens svar till andras genom normer. Graden av struktur för att bedöma svaren på ett reliabelt sätt, liksom de teoretiska grunderna för att tolka svaren valitt, har förfinats under de hundra år som testen har använts.

Det ursprungliga namnet projektiva test speglar en tidig föreställning under psykoanalysens framväxt, om att personer projicerar sitt inre på testen. Projektion av inre mer eller mindre outhärdligt material på omgivningen är ett sätt som människor kan hantera inre spänning och räknas som ett psykologiskt försvar, och är därför något som kan uppträda i ett performancebaserat testprotokoll eller inte, beroende på personlighet. Typiskt för ett svar som bygger på projektion, är hög subjektivitet och en ansträngd logik, långt ifrån de flestas uppfattning, som antyder hur den inre världen pressas på den yttre utan att det finns så mycket grund.

Namnet projektiva test får allt mer ge vika för benämningen performancebaserade personlighetstest som alltså betonar det faktum att personligheten kommer till uttryck i beteendet som svar på uppgiften, snarare än att en person skattar sitt beteende och sin personlighet.

Rorschachföreningen är alltså en förening inte bara för Rorschachtestet, utan för alla med intresse för psykodiagnostik och personlighetsbedömning med performancebaserade testmetoder. Dit räknas till exempel Warteggs teckningstest, Adult Attachment Projective Picture System, Object Relations Technique och Thematic Apperception Test.

Utbildningar i R-PAS (Rorschach – Performance Assessment System) och CWS (Crisi Wartegg System) är specialistackrediterade grundkurser, liksom TA (Therapeutic Assessment) utvecklad av den amerikanske psykologen Stephen E Finn, där utredning och psykoterapi förenas i en process som kan kallas utredning som djuplodande korttidsterapi. TA ställer krav på kunskap om olika typer av test och utredningsinstrument, bland andra performancebaserade.

Facebooktwittergoogle_plusredditpinterestlinkedinmail