Til min tilfredsstillelse ser jeg at debatten om bruk av KI på eksamen har fått vind i seilene, som innebærer at målet med mitt opprinnelige innlegg om dette temaet på mange måter er nådd.
Av LISE LILLEBRYGFJELD HALSE, professor ved HiMolde
Student Rune Grødem på årsstudiet i logistikk har besvart mitt siste innlegg, som jeg vil kommentere i det følgende:
Debatten om bruk av generative språkmodeller i akademia er viktig, og bruken av slike språkmodeller på eksamen er en del av denne debatten. Jeg har forståelse for at ansatte som underviser på nettbaserte utdanninger, og studenter som har valgt slike utdanninger kan oppleve dette som problematisk. Det er imidlertid ikke en god grunn til at vi skal la være å diskutere dette temaet. Med en slik logikk ville det være mange tema i samfunnet som vi ikke kunne debattere. Dette står i strid med viktige prinsipper i et demokratisk samfunn.
Jeg ønsker likevel å presisere at mitt anliggende har ikke vært å «mistenkeliggjøre» personer som er tilknyttet en utdanning eller gjøre noen til «annenrangs» studenter, som dette siste innlegget i debatten mer enn antyder. Det er svært problematisk at en retter slike anklager mot en fagansatt hvis ønske er å bidra til en debatt om et viktig tema for akademia og for samfunnet for øvrig.
Når det er sagt, så er Grødem her inne på et viktig poeng som handler om omdømme. Hvordan vil våre omgivelser kunne betrakte nettbaserte utdanninger med utstrakt bruk av hjemmeeksamen med tilgang på generative språkmodeller? En ting er at akademikere som har god innsikt i vårt utdanningssystem debatterer dette temaet. Vi står overfor langt større utfordringer om dem som skal ta imot våre kandidater etter endt utdanning ikke har tillit til betydningen av et vitnemål fra våre institusjoner. På lang sikt vil dette potensielt kunne påvirke omdømmet også til andre og beslektede studieprogram.
Grødem bruker en betydelig del av sitt innlegg til å forklare hvor god jobb Bård-Inge Pettersen og Per Kristian Rekdal gjør som faglærere. Det er fint, men det er ikke dette mine innlegg handlet om. De handlet ikke om undervisningsopplegg underveis i studiene og om «pedagogisk innovasjon», ei heller om utviklingsavtaler og tildelingsbrev som Grødem viser til i sitt innlegg. Mitt poeng er at eksamen representerer den formelle dokumentasjonen på at våre studenter har tilegnet den kunnskapen som kreves.
Tallene som jeg viste til i mitt første innlegg indikerer at det kan foreligge utfordringer knyttet til å ha tilgang til generative språkmodeller på eksamen. Disse tallene viste en kraftig nedgang i strykprosent etter innføring av en slik tilgang innenfor et bestemt fagområde, og stor variasjon i strykprosent på tvers av campusene i samme fagområde med ulik eksamensform.
Et inntrykk jeg sitter med etter å ha lest mine motdebattanters innlegg er at det pedagogiske opplegget utenom eksamen er så bra at eksamen dermed får en mindre betydning. Med lang undervisningserfaring er det ikke vanskelig å være enig i at det er det som skjer gjennom et helt semester som har størst betydning for studentenes læring. Det er også her vi legger ned mest arbeid som fagansatte. Samtidig har jeg ofte opplevd at det er først i tiden før eksamen at flere studenter virkelig jobber med pensum med et mål om å gjøre det bra på eksamen. Det er menneskelig, og det er ikke vanskelig å kjenne seg igjen.
Eksamen oppleves også av studentene som det endelige målet i et langt semester hvor de skal vise hva de har lært. Enn så lenge har vi et system hvor eksamen representerer dokumentasjon på hva studentene har tilegnet seg av kunnskap, og som potensielle arbeidsgivere skal forholde seg til i ansettelsesprosesser. En eksamen hvor studentene har tilgang til en språkmodell som besvarer eksamensoppgavene, mener jeg ikke representerer et godt mål for dette.
Første del av overskriften i innlegget til Grødem, «Fra frykt til fremtid», indikerer at det fra min side skulle foreligge en frykt for KI og fremtiden. Det jeg frykter mest er at vi som institusjon ikke tør å diskutere åpent hvordan vi bruker ny teknologi, slik som KI. Det er nok eksempler på at teknologier og konsepter er hypet og ikke holder de de lover. Mine innlegg representerer en faglig forankret kritisk refleksjon av bruken av KI på eksamen. Det er en nødvendig debatt som en bør ønske velkommen.
Det er gode grunner til å føle uro, spesielt når det handler om ukritisk bruk av generative språkmodeller. Denne uroen deler jeg med flere forskere som jobber med kunstig intelligens. Inga Strümke som er en synlig forsker innenfor dette fagområdet, har uttrykt seg kritisk ved flere anledninger. I Aftenposten-artikkelen «Hvorfor jeg får fnatt av språkmodeller» reiser hun en rekke kritiske spørsmål til den ukritiske bruken av generative språkmodeller som nå brer om seg.
I den senere tid har det foregått debatt om bruk av generative språkmodeller knyttet til politiske utredninger, illustrasjoner og i media, og det skulle bare mangle at vi ikke skulle debattere dette i akademia som skal representere kunnskapens høyborg. Det er en rekke utfordringer som språkmodellene fører med seg, og som stiller krav til kompetanse om kritisk og etisk bruk av disse. Dette har jeg adressert i mine innlegg, og jeg registrerer at student Grødem er enig med meg her. I mitt foregående innlegg påpekte jeg at denne kompetansen er mulig å bygge uten at en har tilgang til generative språkmodeller på eksamen.
Mine motdebattanter viser til et innlegg skrevet av Morten Goodwin i Khrono, for å argumentere mot mitt syn på tilgang til generative språkmodeller på eksamen. Kan hende vi leser innlegget til Goodwin totalt forskjellig, men jeg opplever at mitt syn langt på vei er på linje med hans når han skriver: «Ett svar, innen noen fagområder, kan være færre hjemmeeksamener og flere tradisjonelle skoleeksamener, uten internett og kanskje til og med penn og papir».
Inspirert av Goodwin foreslår Grødem å innføre muntlig eksamen på de nettbaserte emner i tillegg til hjemmeeksamen, om jeg forstår ham rett. Med riktige krav til gjennomføring, kan dette delvis kompensere for de åpenbare utfordringer med tilgang til generative språkmodeller på hjemmeeksamen.
Avslutningsvis registrerer jeg at Grødem er bekymret for at jeg med mine debattinnlegg «undergraver tilliten til nettstudier og hjemmeeksamen generelt» og dermed risikerer «å ramme» initiativet med å få opp et nettbasert bachelorstudie i logistikk. Igjen vil jeg påpeke at mitt mål har vært å løfte opp et viktig tema og skape debatt. Debatter med ulike stemmer og perspektiver er nødvendig for å sikre kvaliteten på vårt arbeide. Hvis ikke undergraver vi tilliten til høyere utdanning. Det er verre.