Af Svend Erik Olsen, Mag.art.(psyk.), seniorkonsulent

 

”Evaluering” er forbundet med både positive og negative følelser. Faktisk bruges ”evaluering” i mange forskelligartede sammenhænge og med flere forskellige betydninger. ”Evalueringsbehovet” er således (også) betegnelsen for menneskers personlige trang til at foretage vurderinger. ”Evaluering” synes at være en meget væsentlig og uomgængelig (?) menneskelig aktivitet.

Kritik af ”anmelderiet”
Der har kørt en debat om relevansen af anmeldelser af kunstværker. Denne debat er relevant her, fordi ”anmeldelser” også er ”evalueringer”. Daniel Dencik fremførte i august 2017 (Politiken d. 27/8): ”Hobbyanmeldere vokser i antal dag for dag – og hersker nu i en skinger støj af nethad og udskamning”. Dencik medgiver, at anmeldelser af madsteder og toiletter kan tjene ”forbrugervenlige funktioner”, men han tvivler på, at det bibringer noget som helst konstruktivt at udsætte et kunstværk for forbrugeranmeldelse.

Dagbladet Information bragte senere en hel sektion om ”En verden uden anmeldelser” (6/10 2017), hvor forskellige skribenter udtalte sig for og imod ”anmelderiet”. En opgørelse viste i øvrigt, at antallet af anmeldelser er gået tilbage i samtlige aviser i 2017 i forhold til 2007. Der ses et fald på samlet 34 %, og faldet er fordelt på de forskellige kunstformer. Dette fald er dog ikke nødvendigvis en helt generel tendens (men er måske snarere noget specifikt for dagbladene?). Ligeledes er det for nyligt (Politiken 24/1 2019) blevet nævnt, at de fleste (?) litterære udgivelser slet ikke bliver anmeldt.

Anmeldelser tjener mange forskellige formål, og ligesom alle andre vurderinger/bedømmelser placerer anmeldelser det anmeldte på en positiv-negativ-dimension. Selvom ”dårlige anmeldelser” kan genere de personer eller institutioner, der rammes, er det vel kun ”nethad” og ”udskamning”, der helt kan undværes? Eller skal vi helt holde op med at bedømme andre (og deres handlinger, præstationer og produkter)?

Opgør med evalueringssystemerne
I december 2017 har Dahler-Larsen & Tanggaard (Information 18/12) slået til lyd for et mere omfattende opgør med evalueringssystemerne i det offentlige (herunder på uddannelsesområdet) under overskriften ”Høj kvalitet i det offentlige kræver et opgør med evalueringssystemerne”.

Forfatterne mener, at der kan spores en vis træthed over for de mange evalueringer. Og de mener, at ”der er brug for at tage dømmekraften tilbage”. Der skal genskabes en ”ny balance mellem evaluering og dømmekraft”. Forfatterne er meget negative overfor evalueringssystemerne, men indrømmer dog, at en vis mængde dokumentation er nødvendig af forskellige grunde.

I Forsvaret har man i mange år benyttet formaliserede ”bedømmelsessystemer”. Der har løbende været (kritiske) diskussioner af systemerne (for tungt, for tidkrævende, for bureaukratisk), og der er sket tilpasninger og forandringer (smidiggørelser, beskæringer). Man har forsøgt at gøre bedømmelsessystemerne med ”udviklingsorienterede”, og man har begrænset og målrettet anvendelsen. Man har således forsøgt at gøre bedømmelsessystemerne og deres anvendelse mere fleksibel. Men man har fastholdt en antagelse om, at bedømmelsessystemer kan modvirke den ustrukturerede (subjektive, individuelle) ”dømmekrafts” tendenser til at lade vilkårlighed, uretfærdighed og fordomsfyldt modvilje få for stor en indflydelse på bedømmelserne.

Det er vigtigt, at ”dømmekraften” ikke kan opfattes som noget væsensforskelligt fra alle andre ”metoder” til at foretage vurderinger, selvom måden, hvorpå informationer indsamles, forarbejdes og præsenteres kan være ret forskellige. Der er fordele og ulemper både ved de mere formelle bedømmelsessystemer og ved den mindre formaliserede anvendelse af ”dømmekraften”.

Det er muligt, at kvaliteten her og nu kan højnes (visse steder i det ”offentlige”), hvis vi tager et opgør med evalueringssystemerne og opprioriterer dømmekraften, således som Dahler-Larsen & Tanggaard foreslår. Men et sådan opgør er nok ikke et universalmiddel, der gør alle evalueringssystemer overflødige til alle tider og på alle steder.

Og hvis alternativet er at opprioritere ”dømmekraften”, er det under alle omstændigheder vigtigt at få drøftet, hvad ”dømmekraften” egentlig er, og hvordan ”dømmekraften” kan holdes på et tilstrækkeligt kvalificeret niveau.

Evaluering er en essentiel aktivitet
”Anmeldelser” i dagspressen og ”evalueringer” i det offentlige er blot en lille del af det enorme felt af vurderinger, bedømmelser, karaktergivninger, evalueringer, som indgår menneskers tilværelse.

I det efterfølgende bliver ”evaluering” brugt som en samlende betegnelse for de forskellige andre betegnelser, der hver især måske anvendes i ret forskellige situationer (fx er betegnelsen ”evaluering” vel i almindelighed mest knyttet til ret formelle undersøgelser i organisatoriske rammer).

Der er, som nævnt, forskellige meninger om eller holdninger til evalueringer (altså forskellige evalueringer af evaluering eller forskellige vurderinger af vurdering). Der er jævnligt diskussioner om/af bedømmelser af personale og ledere i organisationer, ligesom karaktergivning i skolen og til eksaminer jævnligt fremkalder kritik. Og bedømmere beklager sig af og til over den simplificering som anvendelsen af tal- og karakterskalaer kan medføre.

Her i begyndelsen af 2019 lægges der op til indførelse af en ny karakterskala. Forhåbentlig vil man nå frem til en anvendelig, forståelig, konstruktiv og holdbar skala. En sådan karakterskala behøver naturligvis ikke at blive indført overalt (- der vil være områder som er bedst tjent med andre fremgangsmåder), men det vil være forkert (og naivt) at tro, at menneskers bedømmelser forsvinder, hvis karakterskalaer forsvinder.

Dencik fremhæver, at hans modstand mod anmeldelser skyldes, at anmeldelser kommer i mellem læseren og kunstværket, således at den særlige og unikke kunst-oplevelse kan gå tabt. Dette argument er på linje med, at bedømmelsesprocesser kan kritiseres for at forvrænge den dybere, indfølende forståelse af et andet menneske. Dette bør selvfølgelig tages alvorligt, men det må ligeledes tages alvorligt, at ”bedømmelser” kan have vigtige funktioner – både for den bedømte, for bedømmeren og for en bredere kreds.

Man kan og bør forsøge at reducere de negative virkninger af de forskellige evalueringsformer, men evalueringer – i en eller anden form – er alt for vigtige (som ”styrings- og forandringsredskaber”, som ”retningsgivere” og ”stopsignaler”) til, at man kan forestille sig, at de helt kan afskaffes.

I det helt store perspektiv kan man fremhæve, at menneskeheden ikke ville have overlevet, hvis mennesker ikke løbende vurderede, hvad der er godt og skidt. Vi kan ikke forestille os, at de tidligste mennesker kunne have overlevet uden, at de foretog evalueringer af, om noget var farligt eller ufarligt (– men faktisk må alle levende væsner kunne reagere ”evaluerende” (i en eller anden forstand) for at kunne overleve).

I en klassisk undersøgelse lod Osgood et al. (1957) en række personer tage stilling (ved afkrydsning) til, hvorledes forskellige begreber/ord (far, hus, symfoni m.fl.) kunne placeres på 76 skalaer med bipolære adjektiver (hurtig-langsom, lys-mørk, glat-ru, aktiv-passiv, glad-trist, behagelig-ubehagelig osv.). Denne slags afkrydsning faldt i øvrigt ikke deltagerne svært.

Ved efterfølgende ”faktoranalyse” var Osgood i stand til at reducere de 76 skalaer til tre hovedfaktorer, som fik betegnelserne ”evaluering”, ”kraft” og ”aktivitet”. Den ”evaluative” faktor var den, der trådte først og mest markant frem i faktoranalysen.

Andre har fundet, at ”automatisk aktivering af holdninger”, der er uafhængig af bevidst kontrol (jf. Fazio et al. 1986), peger på, at evalueringer meget let foretages eller måske endda er en fast del af menneskers forarbejdning af informationer.

Man kan således finde belæg for, at evaluering er en essentiel menneskelig aktivitet – hvad enten man kan lide det eller ej.

Behovet for evaluering
Man taler ofte om et ”behov for evaluering”, når et eller andet (organisatorisk) tiltag gennemføres med henblik på at forbedre eller udvikle noget. ”Behovet” henviser da til et ønske om at få undersøgt, om tiltaget faktisk medførte den ønskede forbedring eller udvikling (- man kan naturligvis altid diskutere, om der egentlig foreligger et behov for at foretage en evaluering).

Men ”behov for evaluering” kan også referere til, at mennesker har et vist (måske medfødt?) behov for at evaluere på linje med menneskers behov for andre ting (fx føde og socialt samvær). Selvom man kan sige, at evaluering er en essentiel menneskelig aktivitet, er det muligt, at forskellige mennesker kan have forskellige grader af behov for at evaluere. Med andre ord: Nogen mennesker vil have større (eller mindre) trang til at evaluere end andre!

Om ”behov” er den bedste betegnelse kan vel diskuteres. Man kunne vel ligeså godt tale om et personlighedstræk eller en ”disposition”, en ”tendens” – eller en trang til at evaluere. Men en sådan diskussion er mindre relevant her.

Det individuelle behov for evaluering er jævnligt blevet undersøgt i de sidste 20-30 år. Jarvis & Petty (1996) har udviklet en ”Need to Evaluate Scale” (NES), der skulle kunne måle graden af behovet for at evaluere, og som har fået en vis udbredelse.

Denne skala, NES, indeholder 16 udsagn, som man skal tage stilling til ved at afkrydse, om udsagnet er mere eller mindre karakteristisk for en selv. Fx ”Jeg kan lide at have klare holdninger selv når jeg ikke er personligt involveret”, ”Jeg er meget opmærksom på om noget er godt eller skidt”, ”Jeg undgår helst ekstreme holdninger” og ”Jeg foretrækker at være neutral omkring komplicerede forhold”. Alle udsagnene angår altså personens forhold til evaluering.

Det første krav, man vil stille til denne type spørgeskema, er, at forskellige mennesker skal (kunne) fremkomme med forskellige besvarelser. Hvis alle svarer det samme, får vi meget lidt individuelt at vide om personerne. Personer, der krydser ind på ”Need to Evaluate”-skalaen, svarer faktisk ikke ens – nogle ligger højere end andre på skalaen. Jarvis & Petty antager så, at disse personer har et større behov for at evaluere.

Et andet krav, man kan stille, er, at en ny skala skal måle noget andet end de mange andre skalaer, der findes. Jarvis & Petty viste, at ”Need to Evaluate”-skalaen målte noget andet end en række andre skalaer, som man måske ellers ville mene målte noget af det samme. Fx hang en selvmoniteringsskala, en skala om behov for struktur og en skala til måling af følelsesmæssig intensitet ikke sammen med NES, mens en meget svag sammenhæng viste sig ved en skala vedrørende behov for gennemtænkning (for at tænke over tingene) og ved behov for kontrol. Alt i alt skilte NES sig ud fra andre skalaer.

Et tredje krav, man kan stille, er, at en relevant skala faktisk måler det, den påstår at måle (altså en egentlig validering). Dette er jo slet ikke så let at afgøre, men Jarvis & Petty har holdt besvarelserne på spørgeskemaet op imod tre forudsigelser: 1) Hvis man ligger højt på ”behov for at evaluere”, vil man også have udformet flere/markante holdninger til sociale og politiske emner. Dette var da også, hvad Jarvis & Petty fandt ved hjælp af et spørgeskema om holdninger i forhold til en national valgprocedure (hvor man i øvrigt også kunne svare ”ingen holdning”). 2) Hvis man ligger højt på ”behov for at evaluere”, vil man indflette flere evalueringer, hvor man kan. Dette blev bekræftet, da man bad personer om at sige noget om nogle kunstværker (- lå man højt på NES, anvendte man flere positive/negative udsagn). 3) Hvis man ligger højt på ”behov for at evaluere”, vil man evaluere mere, selvom det ikke ligger i opgaven. Også dette viste sig at være rigtigt, da man bad personerne om at fortælle kort om en almindelig dag – jo højere på NES, jo flere evalueringer indgik i fortællingen.

Konklusionen må være, at der er al mulig grund til antage, at mennesker er forskellige, når det angår deres individuelle behov for at evaluere, og der vil være en tendens til, at et større behov for at evaluere giver sig udslag i flere evalueringer på flere områder.

Refleksion
De fleste af os har formodentlig truffet mennesker, som har alt for let ved at afgive negative bedømmelser og som hovedsagelig ser det negative ved en given situation. Ligeledes har vi truffet personer, der ser alt i et positiv lys og næsten ikke kan se noget negativt. Det vil sige, at vi i vores almindelige dagligdag er stødt på evalueringsforskelle mennesker imellem.

Selvom jeg har beskæftiget mig med evaluering af menneskers væremåde, præstationer og muligheder i en lang årrække, har jeg ikke tænkt meget over mit eget behov for at evaluere. Jeg har tænkt over, hvordan jeg selv evaluerer, hvad jeg kan forbedre, og jeg har sammenlignet mig med andre. Men jeg har ikke spekuleret på, om forskelle i mit og andres behov for at evaluere spiller nogen rolle. Da jeg besvarede spørgeskemaet NES, blev jeg overrasket over, at jeg lå så lavt på ”behov for evaluering”. På linje med de fleste andre mennesker falder det mig let at foretage evalueringer, men jeg har åbenbart ikke nogen stærk trang til at evaluere – bevidst i hvert fald.

For professionelle bedømmere vil jeg tro, at det vil være nyttigt at reflektere over ens eget behov for at evaluere.

Evaluering er en essentiel aktivitet, som både er vigtig og nødvendig i mange sammenhænge – meget evalueres og mange evalueringer kommer hurtigt i stand. Der er (heller) ingen grund til at benægte, at i en eller anden forstand har mennesker behov for at evaluere. Men det er nødvendigt at gennemføre og formidle evalueringer på en sådan måde, at de kan have en konstruktiv virkning.

I den psykologiske forskning om evalueringer findes mange relevante spørgeskemaundersøgelser, eksperimenter og studier af fremgangsmåder. Det vil fortsat være vigtigt at få mere viden, om menneskers forskelligartede evalueringer (herunder om ”dømmekraften” er et alternativ), om situationernes betydning og om evalueringernes placering i menneskers tilværelse – samt om hvordan de negative sider af evalueringer kan minimeres.

Konklusionen her må nok være, at evalueringer hverken kan afskaffes eller undværes!

 

Noter og referencer

Udforskningen af ”behovet for evaluering” foregår stadig, hvilket en litteratursøgning på ”need to evaluate” viser (- her finder man fx undersøgelser, der tyder på en sammenhæng mellem stort behov for at evaluere og mere ekstreme holdninger).

Hvis man er interesseret i at undersøge sine egne ”fordomsfulde” evalueringer og holdninger, kan man med fordel tage en test, der ligger under ”Harvard Implicit Association Test”.

Jarvis, W. B. G. & Petty, R. E. (1996): The Need to Evaluate. Journal of Personality and Social Psychology, 70, 172-194.

Osgood, C. E., Suci, G. J. & Tannenbaum, P. H. (1957): The Measurement of Meaning. Urbana: Uni. Illin. Press.

P_DEBAT

Debatstoffet er inddelt i to kategorier:

Læserindlæg
Her kan læserne komme til orde med kommentarer og holdninger til artikler og/eller udtalelser, der har været publiceret i det trykte fagmagasin og på hjemmesiden – hvad enten det er ris, ros, anbefalinger, supplerende bemærkninger eller andet.

Faglig debat
Den faglige debatartikel hviler på fagrelevant stof – lige fra psykologvidenskabelige problemstillinger til fagetiske betragtninger og alt derimellem.

Omfang: Max 3.000 anslag inkl. mellemrum.

Skriv og bliv læst

Har du læst en artikel i magasinet, du gerne vil kommentere på?

Eller har du noget på hjerte – noget, du gerne vil smide ud til debat blandt kollegaer?

Læs mere om, hvordan du kan bidrage med tekster til P – Psykologernes fagmagasin – på siden Skriv og bliv læst

Husk den gode tone

Skarpe synspunkter og debat er velkomne her, men skal følge sidens retningslinjer for god takt og tone.

Kommentarer, der er injurierende, diskriminerende eller krænkende i indhold eller ordlyd eller har karakter af at være chikane mod andre, tolereres ikke og vil blive slettet.

Kommentarer må heller ikke indeholde reklame eller kommercielle indlæg.

Kommentarer
  • Edith Kahlke
    Svar

    hvor er det godt med et indlæg med så stor faglig tyngde. Giver stof til eftertanke og først og fremmest peger det for mig også på, hvor vigtig psykologers viden er, så vi flytter en debat fra udelukkende holdninger og moral (jeg kan lide/ikke lide, dette bør/bør ikke foregå) og så hen til et fagligt felt, hvor vi undersøger, hvad fordele og ulemper er ved forskellige fremgangsmåder. Stor tak til Svend Erik Olsen

Skriv en kommentar

Start med at skrive, og tryk Enter for at søge