Illustrasjon: Øivind Hovland

En eller to sensorer?

Våren 1988 avla jeg grunnfagseksamen i sosiologi ved Universitetet i Oslo. Slik systemet var den gangen, kunne vi velge mellom en hjemmeeksamen med ti dagers varighet, eller to dager med skoleeksamen. Uavhengig av hva man valgte, ble prosedyren avsluttet med en halvtimes muntlig eksamen.

Det var den eneste form for prøving jeg ble gjenstand for i tiden som hadde gått fra jeg startet på grunnfaget i august året før. Men da eksamen først kom, var det ikke mindre enn tre sensorer som vurderte både den skriftlige og muntlige prestasjonen min. Det innga unektelig en følelse av at her skulle det skje noe viktig.

Én av sensorene var såkalt intern, det vil si tilknyttet instituttet, mens de to andre var eksterne og knyttet til andre forsknings- eller utdanningsinstitusjoner i Oslo. Jeg tror vel ikke de tre var spesielt imponert hverken over mine skriftlige eller muntlige utlegninger, men det var i hvert fall tilstrekkelig til at jeg kunne fortsette studiene. Og ikke minst: Jeg følte meg nokså trygg på at prestasjonen min var blitt vurdert på en tillitvekkende måte. Hvis to hoder tenker bedre enn ett, må jo tre tenke aldeles fremragende, tenkte jeg.

Siden den gang er mye skjedd. For grunnfaget i Oslos del ble tre sensorer til to kort tid etterpå, og med den såkalte kvalitetsreformen ble kravet om to sensorer og ekstern sensur av enkeltbesvarelser fjernet.

Det betyr imidlertid ikke at omfanget av summative vurderinger er redusert, for man tar som kjent ikke hele grunnfag (tilsvarende 60 studiepoeng etter dagens system) i én eksamen lenger. Ett studieår kan bestå av for eksempel fire, seks eller åtte deleksamener, som alle skal ha sin vurdering. Ofte er bare faglærer eller andre interne sensorer involvert, men mer eller mindre regelmessig skal også eksterne sensorer kikke institusjonene i kortene. Det hender også at emner i sin helhet vurderes av eksterne sensorer, uten at faglærer er involvert i annet enn utarbeidelsen av en sensorveiledning. Institusjonene har løst det på litt ulikt vis.

Våren 2021 behandlet Stortinget den nye UH-loven. En av endringene som ble vedtatt, var å gjeninnføre kravet om to sensorer på alle vurderinger med bokstavkarakter. I tillegg ble det fastslått at en av sensorene i tillegg skal være ekstern. Nylig besluttet imidlertid regjeringen å utsette denne ordningen, utvilsomt som følge av kraftig motstand fra sektoren.

Forslaget er da også et nokså typisk eksempel på politiske vedtak som er altfor rigide til at de er gjennomførbare på fornuftig vis i praksis. For det første finnes det utvilsomt eksempler på emner hvor to sensorer neppe har noen tydelig eller konstruktiv funksjon. Et enda større problem var det, for det andre, at det ikke fulgte noen form for finansiering med vedtaket. For et hvilket som helst institutt ville ekstrakostnadene vært svært store. For det tredje mener nok mange at vedtaket også legger seg på tvers av arbeidet som gjøres med å forskyve ressursbruken fra summativ til formativ vurdering.

Det er derfor ingen tvil om at departementet gjorde rett i å trekke i bremsen. Uten at et slikt vedtak ble ledsaget av ressurser til å iverksette det, ville vi fått et skred av strategiske tilpasninger fra instituttenes side. Slike tilpasninger ville ikke vært begrunnet i faglige hensyn, men i å unngå altfor store kostnader.

For eksempel ville mange ha økt omfanget av bestått/ikke bestått som vurderingsuttrykk, for da ville det ikke vært nødvendig med to sensorer. En annen mulig tilpasning ville være å slå sammen emner for å redusere antall eksamener som skulle vurderes. Som jeg skal komme tilbake til, kan det være gode grunner til å slå sammen emner, men hastetiltak for å skjerme seg mot lite gjennomtenkte politiske beslutninger er ingen slik grunn.

Her har vi dermed et eksempel på en politisk prosess hvor myndighetene – i hvert fall inntil videre – har lyttet til velbegrunnede protester fra sektoren og justert kursen. Det er jo ikke alltid det skjer, så sånn sett er det for så vidt en oppbyggelig historie.

Men at forslaget var lite gjennomtenkt, betyr ikke at det ikke var uttrykk for et reelt problem. Jeg er enig med Vidar Gynnild, som i et innlegg i Universitetsavisa peker på at mange undervurderer utfordringene med bare én sensor. Alle slags (billigere) tiltak som er innført for å bøte på de åpenbare problemene med at bare én sensor vurderer en skriftlig besvarelse – sensorveiledning, programsensorordninger, stikkprøvelesning eller annet – kan ikke kompensere for fordelene som ligger i å la to fagfolk vurdere samme prestasjon.

De siste årene har særlig sensorveiledninger vært trukket fram som løsningen på slike problemer. Jeg har tidligere argumentert for at sensorveiledninger utvilsomt er nyttige, både for kandidatene (når resultatene publiseres) og for sensorer, men troen på at de skal erstatte to sensorer er naiv. Jeg skal ikke gjenta disse argumentene her. Som Gynnild sier, karaktersetting skjer i praksis med utgangspunkt i profesjonelt skjønn med støtte i taus kunnskap. Slik kunnskap lar seg ikke artikulere i en sensorveiledning. Det er en praksis hvor det tvert imot er viktig å samarbeide på tvers av fagmiljøer og institusjoner. Det er et åpenbart rettssikkerhetsproblem at eksamensbesvarelser ofte bare har én sensor, og ordningen med såkalt blind klagesensur har bidratt til å øke problemet.

Samtidig må naturligvis både universiteter, høgskoler og myndigheter også tenke pragmatisk. Selv om to sensorer er bedre enn én, kan vi ikke gjøre det beste til det godes fiende. Det er som nevnt store ekstra ressurser vi i så fall snakker om. Så lenge det ikke fulgte penger med en obligatorisk tosensorordning, var det riktig å ikke innføre den. Og hvis en slik ordning skulle bli ledsaget av ekstra ressurser, er det jo likevel et spørsmål hvorvidt summative vurderinger er den beste måte å bruke friske midler på.

Jeg tror likevel veien videre er å anerkjenne at to sensorer, hvorav én er ekstern, bør brukes mer enn i dag. Hvordan det kan gjøres uten at det skal resultere i et altfor stort ressurssluk, er selvsagt ikke noe enkelt spørsmål. Én mulighet er å redusere antall eksamener. Det kan som nevnt skje gjennom å slå sammen emner, slik at f.eks. to emner på 7,5 studiepoeng omgjøres til ett emne på 15 studiepoeng.

Men om man er villig til å tenke nytt, kan det også skje gjennom at flere emner har en større, felles eksamen, hvor læringselementer fra ulike emner er koblet sammen. Det ville dessuten oppmuntre til å se helhet og sammenhenger mellom ulike emner, noe studentene med god grunn ofte etterlyser. I hvert fall i mange samfunnsvitenskapelige fag tror jeg dette er fullt mulig. På den måten kan altså andelen eksamensbesvarelser som sensureres eksternt øke kraftig, uten at antall besvarelser øker tilsvarende.

Det er neppe noen vei tilbake til å oppsummere et helt studieår i én avsluttende eksamen, slik jeg gjorde på sosiologi grunnfag. Men det er all grunn til å gjøre eksamen mindre fragmentert – og å innse at to sensorer er bedre enn én.

–> Jeanette Varpen Unhjem, Arve Hjelseth og Synnøve Stokke Fidje skriver fast i Panorama.