Er de store språkmodellens tid allerede forbi?

Jeg tror AI blir en del av den hverdagen sammen med resten av informasjons- og kommunikasjnsteknologien vi bruker i skolen, og at det kommer til å endre ting – men ikke revolusjonere det. AI, eller maskinlæring, har allerede eksistert lenge, og uroen ChatGPT har laget er noe ut av proporsjoner. Det er sagt av flere enn meg at kunstig intelligens ikke er et godt begrep. Maskinlæring, avanserte algoritmer, eller spesifikt store språkmodeller er bedre, fordi det er mer konkret og sier mer om hva det faktisk er. Det som uansett er sikkert er at frislippet av den store språkmodellen ChatGPT har betydd og kommer til å betyr mye for skole fremover. Nå skal jeg gjøre noe som ofte går galt – jeg skal spå noe om fremtiden og hva som kommer til å skje med de store språkmodellene og skole.

Det har vært en livlig tid etter OpenAI slapp ChatGPT i slutten av november i fjor. Det har også vært rimelig livlig etter at jeg slapp nettsiden https://ai.randabergskolen.no som mitt bidrag til hvordan skolen på pedagogisk og lovlig vis kan bruke store språkmodeller (som det ChatGPT er) i skolehverdagen, både for lærere og elever. Det har vært mange e-poster og telefoner fra store og små kommuner, kjente og ikke fullt så kjente skoleforskere og ulike direktorater og departementer. Og det er jo litt stas. Jeg synes jo det. Hvis du ikke har tatt turen innom https://ai.randabergskolen.no, så synes jeg du skal det først.

Når jeg har snakket med folk om hva vi kommer til å gjøre videre med ChatGPT og hvordan fremtiden blir, har jeg sagt to og halv ting. Den halve tingen er at språkmodeller er kommet for å bli og det er en nyttig digital læringsressurs, på lik linje med en rekke andre ressurser vi bruker i skolen. Jeg vil ikke påstå at den kommer til å revolusjonere noe i skolen, men den kommer til å endre en del praksiser i skolen til det bedre. Helst seriøst – til det bedre.

Det første store tingen der fremmer er at jeg tror er at skolebokforlagene kommer til å slite, om de ikke omstiller seg. ChatGPT er allerede så godt trent på allmennkunnskap at den ikke skriver så mye feil i en oppsummering eller dialog om et fagfelt i grunnskolen. Det er så enkelt for en lærere eller en elev å be ChatGPT produsere korte og tilpassede fagtekster om bestemte tema ut fra en gitt vinkel. Den er også fullt i stand til å være tverrfaglig ut fra de fagene en ønsker at den skal trekke inn, eller et tema som er tverrfaglig i utgangspunktet. En mer dynamisk læringsressurs skal du lete lenge etter. Selvfølgelig er det en fare for at ChatGPT skriver noe som ikke stemmer med virkeligheten, og her har forlagene et fortrinn – om de unytter muligheten de har.

De kan få dette tipset gratis. Forlagene har et omfattende tekstkorpus, i alle fag og for alle aldersgrupper. ChatGPT beste egenskap er ikke å lage tekst, det er å forstå hva som er viktig i en ledetekst og så lage tekst som svarer på det som er viktig i ledeteksten. Hvis du lar en fagtekst være en del av ledeteksten og så legger til tekst om hva du vil at ChatGPT skal gjøre med denne teksten har du et ufattelig kraftig verktøy, som kommer til å forholde seg til fagteksten i ledeteksten. Det finnes flere ulike tekniske løsninger for hvordan dette er rimelig enkelt å få integrert i ChatGPT. På en side i f.eks. CDU Skolen kunne det være hurtigknapper for å forenkle, oversette eller tilpasse teksten til ulike aldre, språk og nivå. Det er også enkelt å legge til en chatbot på siden hvor eleven (eller læreren) kan gå i en dialog med ChatGPT om teksten på siden – og det som ellers kan hentes fra nettstedet og automatisk legges inn i ledeteksten ut fra hva som står i ledeteksten. Dette er teknisk så enkelt og har en så liten kostnad i drift at det burde bli en del av standardløsningen. Jeg vet at det selvfølgelig er utfordringer knyttet til tekstrettigheter til de som har produsert tekstene til forlaget, men det må de klare å løse. Det er ikke snakk om at tekstkorpuset blir en del av språkmodellen, men at deler av teksten automatisk følger med en ledetekst en bruker legger inn (eller knyttet til en av hurtigknappene). Hvis forlagene ikke løser dette er jeg redd de taper kampen mot språkmodellene, fordi det er vanskelig å slå en modell som har trent massivt på dialog, wikipedia, SNL o.l. og som samtidig kan levere granulert tilpasset tekst til enhver anledning.

Her er et eksempel på hvordan dette kunne blitt automatisert, og da tar jeg utgangspunkt i siden om «Hva er muntlig kommunikasjon?» fra ndla.no. Her er resultatet om jeg kopierer all tekst fra siden inn i ChatGPT med ledeteksten «Gjør teksten mer lesbar og tilpasset et barn på 12 år.» (eller i det åpne tekstverktøyet på https://cc.tenkemotoren.no):

Hva betyr muntlig kommunikasjon?
Muntlig kommunikasjon handler om å snakke og lytte til hva andre sier. Det er en viktig ferdighet som du vil lære mer om i norskfaget på skolen. Du kan øve deg på å diskutere, presentere, argumentere og fortelle ved å delta i samtaler.

Hva er fordelene med muntlig kommunikasjon?
En av fordelene med å kommunisere muntlig er at det er enkelt å ha en samtale med andre, der dere kan samhandle og gi tilbakemeldinger med en gang. Du kan også bruke kroppsspråk og tonefall for å støtte opp under budskapet ditt.

Hva er en ulempe med muntlig kommunikasjon?
En ulempe med muntlig kommunikasjon er at lydene forsvinner og ikke kan leses igjen, slik man kan med skrift. Derfor må man være nøye med å presentere ett poeng om gangen, gjenta viktig informasjon og oppsummere på slutten.

Hvordan kan man bli en god muntlig kommunikator?
For å bli en god muntlig kommunikator, må man også være flink til å lytte til hva andre sier. Man bør tilpasse språket sitt til den man snakker med og situasjonen man er i, slik at man blir forstått. Samtidig bør man være oppmerksom på kroppsspråk og ansiktsuttrykk for å vise at man lytter og forstår.

Eller du kan be om å få oversatt denne teksten igjen til ukrainsk eller tilpasset en bestemt situasjonen i klassen, i et bestemt tema i et bestemt fag og så videre.

Og dette blir ikke enklere for forlagene ut fra det andre jeg er sikker på kommer til å skje – og som jeg har sagt en stund. Jeg tror de store språkmodellene er for dyre og for avhengige av store leverandører. Allerede skjer det en uhyre rask utvikling av små språkmodeller som begynner å nærme seg kvaliteten til ChatGPT, uten at de trenger svære datahaller for å fungere. De små modellene fungerer på vanlige datamaskiner og kan allerede fungere på mobiltelefoner i begrensede utgaver.

Dette har jeg sagt og tenkt en stund, og jeg har prøvd ut noen av dem på egen maskin hjemme. Og for ikke så mange dager sider kom det enda mer og viktig informasjon. Et lekket internt dokument fra Google dukket opp på verdensveven – «We Have No Moat, And Neither Does OpenAI».

Du bør lese hele dokumentet, det er ikke så langt. Oppsummert sier Google at…

Åpne kildekodemodeller for språk utvikler seg raskt og overgår proprietære modeller som de fra Google og OpenAI, og tilbyr raskere, mer tilpassbare og mer private alternativer som lukker gapet i kvalitet.
Teknikker som LoRA (low rank adaptation) har gjort det mulig for alle å finjustere modeller raskt og billig, noe som gir rask innovasjon og iterasjon fra enkeltpersoner og institusjoner over hele verden.
Suksessen til åpne kildekodemodeller har alvorlige konsekvenser for forretningsstrategi, ettersom det er vanskelig å konkurrere med gratis, høykvalitetsalternativer. For å opprettholde relevans bør selskaper som Google vurdere å samarbeide med det åpne kildekode-samfunnet og bli ledere i økosystemet i stedet for å prøve å kontrollere det.

Det betyr i praksis at om ett år er gode språkmodeller (ikke store) lokalt tilgjengelig på enhver digital enhet, og ikke via Internett. Det blir spennende å se hva som skjer!

Det er mulig å prøve ut disse små modellene, og den beste testen så langt er https://chat.lmsys.org. Der kan du prøve ut en rekke forskjellige modeller og sammenlikne den. Husk at de er ikke så gode som ChatGPT er nå, og heller ikke så gode på norsk. Men… det er enkelt og ikke dyrt å trene dem videre på det du selv mener at modellen trenger. Noen kommer til å trene dem videre og koble sammen modeller via LoRA og til slutt ende opp med det Google mener er billigere og bedre enn det de klarer å få til. Vil du prøve å gjøre ting selv kan du lese deg opp på siden https://github.com/lm-sys/FastChat.

Dette er nok ting jeg kommer til å kikke på når jeg har tid, fordi det er denne veien det kommer til å gå.

Er de store språkmodellens tid allerede forbi?

Kommentarer

Legg igjen en kommentar Avbryt svar