På hvilken måte er ChatGPT intelligent?

Det er sagt mye om AI de siste månedene, både klokt og rart. Jeg har tenkt og sagt en del om det, men ikke skrevet noe på bloggen om det. Det er skummelt å skrive om det, fordi det er så mange som er aktive og mener ting – inkludert meg selv. En av de store utfordringene er å forklare hva AI er på en slik måte at folk skjønner hva det faktisk er, og at vi ikke luller det bort i antropomorfismer som gjør at en misforstår hvorfor den gjør det den gjør bra og dårlig. Det er det jeg skal forsøke nå…

ChatGPT er en kunstig intelligens i form av en stor språkmodell – large language model (LLM). Det er sagt mye forskjellig om hva ChatGPT kan og ikke kan. Noe av det er riktig observert, men blir forklart feil eller uklart. For å forstå hva en LLM er og hva den kan (og ikke kan) er viktig for å kunne vite hvordan vi skal forholde oss godt til bruken av ChatGPT i skolen.

Den 30. november 2022 gjorde firmaet OpenAI chatboten ChatGPT gratis tilgjengelig på nett. Du kunne registrere deg på chat.openai.com og så hadde du til full tilgang til den mest avanserte LLM-en som var tilgjengelig på markedet. ChatGPT ble den raskest voksende tjenesten noensinne på Internett og den vokser stadig. Det opprettes stadig nye tjenester som bruker ChatGPT-motoren i bakgrunnen og lar den jobbe med tekst på en rekke originale måter.

Det pussige er at ulike kunstige intelligenser har eksistert i mange år og vi bruker dem hver dag uten at vi har tenkt på mye på det. Hva er det som gjør at akkurat ChatGPT har skapt det oppstusset som den har? For å forstå det må vi begynne med hva en kunstig intelligens er.

Hva er kunstig intelligens?

En kunstig intelligens er en form for datateknologi som gir maskiner evnen til å utføre oppgaver som normalt krever menneskelig intelligens, som å lære, å resonere og å forstå. Det kan være alt fra å gjenkjenne tale og bilder, til å løse komplekse problemer og å utføre oppgaver som krever aktiv læring. AI er delt inn i to hovedkategorier – kunstig generell intelligens (AGI) og kunstig spesialisert intelligens (ASI). AGI er det at maskiner har evnen til å løse et bredt spekter av oppgaver som oss mennesker, mens ASI referer til en AI som en spesialisert til å utføre én bestemt oppgave. Det er ulike ASI-er vi møter i dag, mens AGI enda er langt frem (om overhode mulig).

En av de vanligste måtene en AI lærer på er ved å la den trene, eller analysere, en enorm mengde data og gjennom det utvikle en modell for å gjenkjenne mønstre, og så ut fra det kunne forutsi resultater. Det er dette ChatGPT har gjort, og den har trent på tekst og kan forutsi fortsettelsen av en tekst.

Hvordan er ChatGPT trent og hva er det den gjør?

ChatGPT v3.5 er en LLM vi vet mye om, siden OpenAI har offentliggjort mye av arbeidet med den. GPT er trent på rundt 500 milliarder stavelser(!), hentet fra ulike filtrerte kilder. På samme måte som en kalkulator ikke har lagret alle tall den kan vise har heller ikke GPT (eller andre maskinlærte AI-er) lagret noe av informasjonen den er trent på, i dette tilfelle teksten. Det «eneste» GPT kjenner til er rundt 55 000 stavelser som den har koblet sammen på 175 milliarder forskjellige måter. Det er det den «kan». På samme måten som kalkulatoren har algoritmer for hva den skal vise, alt etter hvilke knapper vi trykker på, har GPT en modell (algoritme) for hvilke stavelser den skal vise, alt etter hvilke stavelser vi gir den til å begynne med.

Her kommer en overforenklet forklaring på hva GPT gjør når den svarer deg. Alle AI-er har et «operativsystem», et system som snakker med omverden og modellen til AI-en. Til venstre er treningsgrunnlaget for GPT, i midten er operativsystemet og til høyre er den kommende språkmodellen.

En tom AI-modell

Treningen begynner og det bygges opp vektede forbindelser mellom de 55 000 stavelsene som er i GPT-modellen, og det er som nevnt 175 milliarder av dem. Det danner seg «områder» hvor GPT er flink til vite hvordan stavelser henger sammen ut fra hva den er trent på, som for eksempel samtaler, eventyr, oppskrifter og oversettelser.

En AI-modell som trenes opp.

Når treningen er ferdig kan du gi GPT ledetekster (som er den norske oversettelsen av begrepet prompt), som er det startpunktet du ønsker at modellen skal begynne å jobbe med. Hvis du gir GPT ledeteksten «Once upon a time» vil disse stavelsene sendes inn i modellen og bli fraktet inn og ut av modellen med en ekstra stavelse lagt til i hver runde. Vi kan nesten si at ledeteksten «Once upon a time» er et slag program som startes i modellen, og modellen vet hvordan programmet skal kjøres og produserer teksten til et helt eventyr som en naturlig forlengelse av ledeteksten.

En AI-modell i bruk.

Det OpenAI ønsker å prøve ut med GPT v3 var å se hva som skjedde når de trente den mye – når det ble milliarder av koblinger. Det viste seg at GPT da hadde trent seg opp til å lage koblinger mellom områdene som den var trent på, altså at den koblet sammen ting den ikke direkte var trent på. Den ble også rågod på å vite hva en ledetekst burde føre til uten å få et eksempel først. GPT v3 kunne plutselig oversette en samtale om hvordan en oppskrift på et eventyr skulle skrives, uten at du viser den hvordan den skal gjøre det.

Dette er som sagt en grov overforenkling, som alle forenklinger er, og de som vil lese mer kan ta for seg denne PDFen fra de som har laget GPT-modellen.

For å forstå hvordan GPT virker er viktig å huske at den ikke har lagret noe av teksten den er trent på. Den vet ikke en gang hva den er trent på, fordi den «vet» ingenting om verden. Det betyr at uansett hva den skriver, så vet den ikke om kilder, den har ingen meninger, ingen faktabase den henter noe fra, kan ikke endre mening eller rette feil. Det eneste den kan gjøre er å fortsette neste stavelse på de stavelsene som kjøres inn i modellen. Det er likevel lett å tro at GPT mener noe, fordi den er så god til å skrive tekst vi leser som meningsfull og derfor skrevet av en aktør.

Så hvis du leser at ChatGPT søker gjennom millioner av nettsider eller kan vurdere og sette karakter på elevtekster, så kan den ikke det. Den vil likevel forsøke å komme opp med hva som er naturlig å skrive videre som svar på det du legger inn som ledetekst. Hvis du skriver inn «Vurder denne teksten med en karakter.» vil GPT finne noe den vet er naturlig å skrive som respons på ledeteksten. Men den mener ikke noe om oppgaven som en aktør av den grunn. Den sammenlikner teksten ikke opp mot noe. Den har ingen erfaring eller minne om hva som er en dårlig tekst eller hva som er en god tekst. Den vil likevel skrive et svar som setter en karakter på teksten, fordi det er det som er det naturlige å skrive som svar på ledeteksten du ga den.

Sagt på en enkel måte – ChatGPT er en vanvittig flink utgave av den eleven læreplanen ikke vil ha! Den kan ingenting annet enn å skrive det den forventer at vi forventer at den skal skrive når vi gir den et utgangspunkt / en ledetekst.

ChatGPT (og andre LLMer) i skolen

Det vanskelige først

GDPR og personvern

Bruk av kunstig intelligens kommer med mange personvernutfordringer. De fleste er knyttet til at LLMer trenger enorme datamengder å trene på, og de som lager LLMene vil prøve å skaffe seg mest og best mulig data å trene LLMen videre med. For ChatGPT sin del er det utfordring hvis skoler tar i bruk gratistjenesten som ble tilgjengelig 30. november 2023. chat.openai.com er en brukertjeneste hvor brukeren må registrere seg med en gyldig epostadresse og logge på med denne for å kunne bruke tjenesten. Alt du legger inn, og får som svar, vil bli brukt av OpenAI til å trene GPT videre. Alt er tydelig beskrevet i Terms of Use og Privacy Policy. Du kan derfor ikke legge inn elevarbeider/andres personopplysninger eller kreve at elevene bruker tjenesten.

Det er også viktig å være klar over at alle AI-tjenester bruker store mengder datakraft, så det finnes ingen gratis tjenester. Du betaler enten med penger, informasjon eller lojalitet. Hvis en skole velger å kjøpe tilgang til OpenAI sine tjenester via API (ikke via nettstedet ChatGPT) er det andre regler som gjelder, og OpenAI vil verken samle inn eller bruker noen av opplysningene som sendes til dem. Skolen må betale da for hver stavelse som blir produsert, fordi det er som sagt ikke gratis. Fordelen er at så godt som alle GDPR-utfordringer er løst.

En liten kommentar om læringsanalyse, AI og GDPR. Hovedutfordringen er ikke GPT i seg selv. Det handler mer om hvordan tjenester som bruker GPT bruker de andre opplysningene de har, sammen med GPT. Automatiserte avgjørelser/vurderinger gjort av slike tjenester som har betydning for eleven er i praksis umulig ut fra GDPR. En problemstilling jeg ikke sier mer om her er at det er i dag er umulig å si noe om hvorfor en AI ender opp med det svaret den ender opp med. Dermed har svaret ingen forklarende kraft, og kan ikke brukes i formelle juridiske vurderinger. En AI er ingen aktør som kan begrunne synspunktet sitt.

Fusk og fanteri

Det er fusk-diskusjonen som har tatt mest plass i forbindelse med ChatGPT og utdanning. Fusk er bare fusk ut fra et gitt utgangspunkt. At ChatGPT alene kan gjøre det ok på en vurdering forteller en del om hvilket syn skolen har på kompetanse og læring. Kort fortalt har vi opp gjennom årene, også i barneskolen, gang på gang vist eleven at det å få til testen er viktigere enn å ha lært noe. Selv om vi sier til dem at det er viktig at de lærer ting, så er det først når de får til testen at vi «belønner» dem. Derfor fusker eleven. Test-/vurderingsregimet vi har må tilpasses, og det må tilpasses nå. Det er allerede for sent. En god forståelse av hva underveisvurdering er, slik Udir har beskrevet det, vil løse mange utfordringer i møte med ChatGPT.

Sammenlikningen med kalkulatoren fungerer godt. Når kalkulatoren kom var det et hjelpemiddel som lot elever enkelt regne mattestykker uten å måtte sette opp algoritmer eller «forstå» hva de gjorde. De bare trykket inn noe, ut kom svaret og de tenkte ikke mer over det. Det var ikke sikkert at det var det rette svaret på oppgaven, fordi elevene måtte lære å forstå hva kalkulatoren skulle regne ut før de kunne være sikker på at det var det riktige svaret som kom ut. Kalkulatoren var et sjokk for realfaglærerne. Den gangen. Nå lever de fint med både kalkulatoren, regnearket, GeoGebra og CAS med mer. Digital teknologi er blitt en del av faget, hvordan vi må forstår det og hvordan vi lærer det.

Det som er nytt med ChatGPT er at dette er første gang humaniora har fått et digitalt verktøy som utfordrer måten de jobber med kunnskap på, eller mer nøyaktig – språk. På denne måten er det en fin sammenlikning med kalkulatoren. Kalkulatoren tok vekk en del av prosessene i matematikken, men ikke kunnskapen om hva matematikk er og hvordan den brukes. Det gjør GPT også. Det er et helt annet verktøy som er mer omfattende og komplisert, men det har mye av den samme effekten på undervisning i humaniora som kalkulatoren i realfagene.

Språk er vanligvis forstått som tenkningens verktøy. Den underliggende antakelsen er at tankeprosessene våre bearbeider våre erfaringer med verden gjennom en samling sammenhengende ord. Det er denne koblingen mellom språk og tenkning som nå rokkes ved, og som lager så mye støy i skolen og offentligheten. Utfordringen er at språk ikke er en god indikator for tenkning. Tenkning foregår på svært mange andre måter enn bare gjennom språk.

De av oss som forstår at ChatGPT generelt sett kan bestå et fag har også identifisert grunnen til at den kan det. Vi måler måloppnåelse gjennom ytre tegn for for det vi egentlig vil måle. Å gjengi isolerte fakta er et ytre tegn for kunnskap. En god uttrykksevne er et ytre tegn for sofistikert forståelse. En godt organisert tematisk tekst er et ytre tegn for dybdeforståelse. Utfordringen er at disse ytre tegnene for indre kompetanse virker ikke lengre. Det var kanskje gode grunner til å gjøre dette tidligere, men alle disse tre erstatningene virker ikke lengre, eller rettere sagt, de ordnes enkelt av en lett tilgjengelig gratis algoritme. De ytre tegnene har mistet verdien sin.

Uansett må vi gå videre fra å tenke i dystopiske eller utopiske termer. ChatGPT gir både nye muligheter og ny kompleksitet. Så langt har det stort sett blitt fremstilt som et verktøy for produksjon av innhold. Faktisk er generering av innhold sannsynligvis den svakeste funksjonen den har. Der den utmerker seg er når den manipulerer struktur og form, og i den forbindelse også gjør vurderinger om hva en eksisterende tekst inneholder. GPT får virkelig vise hva den kan når den endrer struktur og form på en tekst, samtidig som den opprettholder og stabiliserer meningen i teksten. Lærere må være oppmerksomme på dette, og også informere elevene om begrensningene ChatGPT har som en kilde til kunnskap – og hvorfor.

Konfabulering

Grunnen til at ChatGPT ikke er god på informasjon og faktaopplysninger, er rett og slett fordi den er en kunstig intelligens for språk og ikke for å finne frem korrekte opplysninger. Den vet ikke noe om det den skriver, annet enn at det er den mest korrekte rekken av stavelser ut fra det du ga den i ledeteksten. Derfor vet den ikke om det du leser stemmer med virkeligheten eller ikke. Wikipedia ligger ikke lagret noe sted, selv om den har trent på alt som står der. Er GPT trent nok på et tema vil den produsere noe som stemmer med virkeligheten, men den produserer like selvsikkert noe som ikke stemmer med virkeligheten om ting den ikke har trent nok på.

Hvis du gir den ledeteksten «Hva heter hovedstaden i Frankrike?» så vet ikke GPT at Paris er hovedstaden i Frankrike. Det den vet er at ordet «Paris» er den naturlige teksten å skrive, fordi det har den sett mange ganger mens den trente. Hvis du skriver et spørsmål GPT den ikke er trent godt på men hvor den gjenkjenner teksten som helsesjargong vil den svare i helsesjargong. Da risikerer du at svaret fra GPT høres riktig ut, selv om det faktisk kan være helt feil. Det finnes mange gode eksempler på dette. Du må gjerne prøve å få GPT til å gjengi tekster til kjente norske barnesanger eller liste opp romaner av André Bjerke.

Mange sier at GPT hallusinerer når den skråsikkert skriver ting som ikke stemmer med virkeligheten, men den gjør ikke det. Det er bedre å si at den konfabulerer sammen med deg og ledeteksten du gir den. GPT gjør det den vet er rett ut fra at den er en språkmodell og kan ikke vite om det den skriver stemmer med virkeligheten eller ikke.

Vi må bruke ChatGPT til det den er god på, som er språk – ikke fakta. Det er like galt å klage på at ChatGPT ikke kan regne, som det er å klage på at en kalkulator ikke kan skrive.

Hva er ChatGPT (og andre LLMer) gode til?

En personlig ressurs for elever (og lærere)

ChatGPT gir elever (og lærere) enkel tilgang til fagstoff og skriving/språk som en ferdighet. Dette til tross for at det nettopp ble skrevet at ChatGPT ikke er til å stole på i forhold til korrekte beskrivelser av verden. Poenget er at elever gjennom ChatGPT når som helst får tilgang til kompetanse de selv (eller hjemmet) ikke besitter. De kan hente fram godt formulert tekst og god nok allmennkunnskap, som de ellers ikke ville hatt tilgang til. De får også hjelp til å formulere seg godt når de trenger det.

Vi som jobber i skolen må aldri glemme hva ressurssterke foreldre gir barna sine i skolen. Når det oppstår en situasjon hjemme hvor barnet har behov for det, kan de gi riktig tilpassede fragmenter av kunnskap og språk til barna sine, og som barnet vil bli preget av. Denne typen mikroundervisning har mange barn ikke tilgang til, og her kan ChatGPT spille en positiv rolle.

Det er i debattene etter 30. november 2023 ofte sagt at elever «tenker» med skriftspråket, og det er nesten riktig. Vi tenker med språk (og mange andre kognisjoner), men vi må ikke skrive det ned for å kunne gjøre det. Dette er en svært akademisk måte å tilnærme seg virkeligheten på, og det er ofte akademikere som sier dette i leserinnlegg. På samme måte som noen trenger en kalkulator for å regne ut enkle regnestykker, trenger andre også hjelp til å formulere gode tekster.

Ikke mulig å unngå

LLMer allerede er en del av hverdagen og de kommer ikke til å forsvinne. Det dukker opp flere nye AI-tjenester hver eneste uke. Om en kommune sperrer tilgangen hjelper det i beste fall bare på skolen. Den eneste måten å sperre tilgangen til AI på skolen er å sperre tilgangen til Internett og om ikke så lenge vil det heller ikke være nok. Da må all tilgang til digitale enheter forbys eller strengt kontrolleres. Å late som om LLMer ikke eksisterer i skolen gir bare en fordel til de som trenger det minst. Ressurssterke elever vil skaffe seg tilgang uansett, mens elever som ikke henger med i skolehverdagen vil ikke være i stand til å bruke mer enn det de har på Chromebooken eller iPaden. De ressurssterke elevene har, som nevnt over, også ofte ressurssterke foreldre.

Derfor er det vår jobb i skolen å sørge for at lærere og elever både får tilgang til, og blir kjent med, hva AI og LLM er og ikke er, hva de gjør bra og hva de ikke gjør bra, hvordan de kan bruke det til å berike undervisningen og læringen, og hvordan de skal forholde seg til det i samfunnet.

ChatGPT er bare begynnelsen. Det dukker opp flere nye tjenester hver eneste uke og der de fleste benytter seg av GPT i bunnen. ChatGPT er for underveisvurdering det COVID var for digitalisering av skolen. Et direkte møte med en ny virkelighet vi ikke kan unngå.

Og så dette med å omforme tekst

Siden ChatGPT er god til å arbeide med eksisterende tekst og ikke alltid så god på produsere faktainnhold, er det dette som bør være fokuset for god bruk i skolen.

Bruk ChatGPT som samtalepartner til et tema eller noe du lurer på, men der du må gi den opplysninger om hva den skal være med å snakke om.

ChatGPT er god til å forstå innholdet i en tekst. La den hjelpe deg med å forstå innhold i teksten. Derfor er den også flink til å forenkle og forkorte tekster, og den bytter enkelt sjanger på en tekst – mange ganger. I tillegg oversetter den godt, og i alle fall om du også ber den om en idiomatisk oversettelse.

Og siden ChatGPT kan oversette er den også rå til å kode! Rettere sagt, den er god til å oversette fra språk til koding (som er en type språk), og omvendt. ChatGPT kan forklare hva et program gjør ved å se på koden til det.

Konfabuleringen kan du bruke som en positiv og konstant utfordring til kildekritikk for elevene, og noen ganger er det riktig morsomt å lese hva den produserer.

Mange elever har gode ideer og mye de vil si, men de vet ikke alltid hvordan de skal uttrykke det på riktig måte. ChatGPT kan hjelpe elever med å presentere ideer på en klar og organisert måte og i riktig form, slik at læreren kan fokusere på ideene i seg selv. I prosessen kan vi endre fokuset i utdanning mot mer kritisk tenkning og store spørsmål. Siden ChatGPT også kan oppsummere et argument, kunnskap og konsepter, har den et reelt potensial til å hjelpe med formativ vurdering, spesielt i situasjoner der lærere har begrenset tid.

Tenk nytt! De ytre tegnene for indre kompetanse gjennom skriftspråk har ikke samme verdi lengre.

Så hva gjør vi nå?

Skoler kan ikke vente på at myndighetene skal fortelle dem hvordan de skal håndtere disse nye digitale verktøyene. Lærere må sammen diskutere hvordan ChatGPT (og liknende tjenester) best kan brukes i skolen, og skoleledere må skape tid og rom til disse samtalene. Det er også viktig å erkjenne at elever har en mer nyansert forståelse av teknologien enn vi av og til gir dem kreditt for. De har allerede begynt å tulle med disse tjenestene og bruker dem til det de synes de er nyttige til. Noen fusker, noen tuller, noen herjer og noen prøver å bruke det så godt de kan, og flere har oppdaget at snarveiene til ferdige besvarelser ikke alltid gir den tilfredsstillelsen de håpet på. Elevene merker selv at det er mer med skolen enn det ChatGPT kan gjøre for dem, og den følelsen må vi forvalte vel. Det er viktig at elever er en del av denne samtalen.

Men først må ChatGPT og andre LLMer bli tilgjengelige for lærere og elever på en ordnet og lovlig måte. Det er dette vi i Randabergskolen nå forsøker å ordne gjennom nettstedet AI i Randabergskolen. Der får lærere og elever tilgang til ChatGPT v3.5, og tjenesten er satt opp med OpenAIs API-løsning, hvor ingenting blir lagret eller brukt av OpenAI. Ingen trenger å logge på ChatGPT, fordi alt går gjennom Randabergskolens API-konto. Det betyr at all trafikk til OpenAI kommer fra én IP-adresse / én bruker og det er denne brukeren som må betale for bruken – med penger. Så lenge vi bruker GPT v3.5 koster det rundt kr 10 for 300 000 ord, og det er ikke så dyrt.

Og så gjør vi som alle som vil lære noe nytt… Vi leker med det!

PS! Kanskje åpner vi opp for ChatGPT v4 også. Det er markert bedre enn v3.5, men også over 10 ganger dyrere.

Kommentarer

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

Dette nettstedet bruker Akismet for å redusere spam. Lær om hvordan dine kommentar-data prosesseres.