En masse roboter i en dør.

En oppdatering av priser og modeller

For over et år siden hadde jeg et innlegg om utvalget av språkmodeller som er tilgjengelig når vi setter opp en egen løsning for prateroboter, som for eksempel KI i Randabergskolen. På nyåret 2023 var det OpenAI med gpt-3.5-turbo og gpt-4 som rådde grunnen, og i mars 2024 var det flere konkurrenter, og nå er det helt villt.

Jeg tenkte derfor at det var på tide med en liten oppdatering av hva som finnes der ute, hva de koster og hva som er lurt å gjøre. Per 6. august 2025 er de vanligste modellen tilgjengelig via API for egne prateroboter følgende:

SpråkmodellPris lesing/skriving
(1M tokens)
Tokens buffer (L/S)TPM/RPM (max)
OpenAI
gpt-4o-mini (visual) (okt-23)
gpt-4o (multimodal) (okt-23)
gpt-4.1-mini (multimodal) (jun-24)
gpt-4.1 (multimodal) (jun-24)
gpt-5-mini (multimodal) (mai-24)
gpt-5 (multimodal) (okt-24)

$0.15 / $0.60
$2.50 / $10.00
$0.40 / $1.60
$2.00 / $8.00
$0.25 / $2.00
$1.15 / $10.00

128K / 16 384
128K / 16 384
1M / 32 768
1M / 32 768
400K / 128K
400K / 128K

150M TPM / 30K RPM
30M TPM / 10K RPM
150M TPM / 30K RPM
30M TPM / 10K RPM
40M TPM / 15K RPM
40M TPM / 15K RPM
Google
Gemini 2.5 Flash (multimodal)
Gemini 2.5 Pro (multimodal)

$0.30 / $2.50
$1.25* / $10.00*

1M / 65 536
1M / 65 536

8M TPM / 10K RPM
8M TPM / 2K RPM
Anthropic
Claude Haiku 3.5 (visual) (juli-24)
Claude Sonnet 4 (visual) (mar-25)
Claude Opus 4.1 (visual) (mar-25)

$0.80 / $4.00
$3 / $15
$15 / $75

200K / 8 192
200K / 64 000
200K / 32 000

400K TPM / 4K RPM
400K TPM / 4K RPM
400K TPM / 4K RPM
* Hvis ledeteksten har mer enn 200k tokens blir prisen $2.50 / $15.00

I tabellen over ser du at OpenAI kommer godt ut av det, både i forhold til pris og tilgjengelighet. «Tokens buffer» forteller noe om hvor stor tekst du kan legge inn og hvor mye den kan skrive i en omgang. TPM/RPM er to måleenheter for hvor mye KI du får bruke, og hvor TPM er tokens per minute og RPM er requests per minute. Den forteller hvor mye tekst du kan lese/skrive i minuttet og den andre hvor mange jobber du kan sende i minuttet. Det skal sies at Anthropic har en egen avtale for de som trenger mer tilgjengelighet, men da må du opprette en helt egen avtale med dem. OpenAI og Google nevner også at du kan inngå egne avtaler, men er ikke veldig presise på hvordan.

Legg merke til et par ting i tabellen. gpt-5 er i praksis priset likt gpt-4.1, inkludert mini-utgaven. Du sender alltid mer tokens enn du mottar, så prisreduksjonen på lesing i gpt-5 i forhold til gpt-4.1 betyr mye. Det er altså ingen grunn til å bruke gpt-4.1 lengre. gpt-5-mini er en del dyrere enn gpt-4o-mini, men den er til gjengjeld utrolig mye bedre (og det gjelder gpt-4.1-mini også). gpt-4o-mini er til nøds en grei modell for spørsmål og svar, men gpt-5-mini kan jobbe med svært kompliserte ledetekster uten å bli forvirret. Dette er spesielt viktig i ledetekster hvor du ber modeller først gjøre X, så gjøre Y, og så gjør Z hvis K osv. Jeg vil anbefale alle skolen som har laget en kopi av KI i Randabergskolen å bruke gpt-5-mini i stedet for gpt-4o-mini.

En kommentar til nano-modellene, som finnes til gpt-4.1 og gpt-5. Ikke bruk dem til de vanlige praterobotene. Disse modellene er veldig billige, men de er ikke laget med tanke på å være prateroboter. De er språkmodeller du bruker til oppsummering og klassifisering av tekster. I praksis fungerer de ikke som prateroboter.

Det eneste som gjør gpt-4.1 bedre enn gpt-5 er kontekstvinduet. gpt-4.1 kan «lese» mye større mengder tekst på en gang enn gpt-5. Det er veldig nyttig i noen spesielle tilfeller, og da bør du gå for gpt-4.1 fremfor gpt-5.

Eller du kan gå for Gemini, både Flash og Pro. De har sine styrker i forhold til gpt-5, men er i praksis litt dyrere. Claude er litt på siden av gpt og Gemini. Claude Sonnet er enda veldig bra, og jeg mener at den fremdeles er en av de bedre praterobotene til rollespill, tekstforståelse og skriving. Samtidig har Gemini 2.5 Pro imponert meg i det siste på disse samme områdene.

Det er fremdeles slik at det er forskjell på bokmål og nynorsk, og det er ikke til fordel for nynorsken. Det virker også som om bokmål ikke blir prioritert like mye som en del andre språk, og siden mange språkmodeller nå kjører Mixture of Experts (MoE) betyr det at de kan virke mer unøyaktige på bokmål enn før.

Forrige gang skrev jeg litt om at modellene virker å ha ulike grenser for hva de er villige til å skrive om (og hvordan de skriver ting). Nå er Anthopic sine modeller de mest restriktive, fulgt av OpenAI og så har faktisk Google de mest villige modellene til å skrive om ting mange kan oppleve at er på kanten. For et drøyt år siden var Google den pripne modellen. Gemini skriver fantastiske falske nyheter, bare prøv, mens gpt sine falske nyheter er tamme og Claude nekter.

Forrige gang var Llama fra Meta hjertelig til stede. Meta har ikke hengt like godt med i løpet, og de siste modellene er ikke så gode som de bør – og de er heller ikke gode på bokmål (eller nynorsk).

Men… for dere som har KI i Randaberg er det kommet en mulighet for å koble på tjenesten OpenRouter, hvor du kan bruke alle språkmodeller som finnes. Da holder det at du lager en konto hos OpenRouter og så kan du hente inn hvilken språkmodell du vil i praterobotene du bruker. Det er vel 300+ ulike språkmodeller tilgjengelig per dags dato.

Og helt til slutt. OpenAI har laget en ny API til språkmodellene sine, som AI Engine i WordPress støtter. Da kan du enkelt få gpt-modellene til å lage bilder i den vanlige prateroboten, akkurat slik du kan i ChatGPT. Men… ett bilde koster kr 0,50 å lage! Det er nok greit hvis det er bare er du som bruker prateroboten, men tenk grundig over hva du gjør om du slipper dette fritt for tusenvis av elever.


Publisert

i

av

Kommentarer

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

This site uses Akismet to reduce spam. Learn how your comment data is processed.