En oppdatering av priser og modeller

For over et år siden hadde jeg et innlegg om utvalget av språkmodeller som er tilgjengelig når vi setter opp en egen løsning for prateroboter, som for eksempel KI i Randabergskolen. På nyåret 2023 var det OpenAI med gpt-3.5-turbo og gpt-4 som rådde grunnen, og i mars 2024 var det flere konkurrenter, og nå er det helt villt.

Jeg tenkte derfor at det var på tide med en liten oppdatering av hva som finnes der ute, hva de koster og hva som er lurt å gjøre. Per 17. februar 2026 er de vanligste modellen tilgjengelig via API for egne prateroboter følgende:

Språkmodell	Pris lesing/skriving (1M tokens)	Tokens buffer (L/S)	TPM/RPM (max)
OpenAI gpt-4.1-mini (jun-24) gpt-4.1 (multimodal) (jun-24) gpt-5.1-mini (multimodal) (mai-24) gpt-5.1 (multimodal) (okt-24) gpt-5.1-pro (visual) (sep-24) gpt-5.2 (multimodal) (aug-25) gpt-5-realtime gpt-5-realtime-mini	$0.40 / $1.60 $2.00 / $8.00 $0.25 / $2.00 $1.15 / $10.00 $15.00 / $120.00 $1.75 / $14.00 $4.00 / $18.00 $0.60 / $2.40	1M / 32 768 1M / 32 768 400K / 128K 400K / 128K 400K / 128K 400K / 128K	150M TPM / 30K RPM 30M TPM / 10K RPM 40M TPM / 15K RPM 40M TPM / 15K RPM 30M TPM / 10K RPM 40M TPM / 15K RPM
Google Gemini 2.5 Live Gemini 3 Flash (jan-25) Gemini 3.1 Flash-Lite (jan-25) Gemini 3.1 Pro (jan-25)	$3.00 / $12.00 $0.50 / $3.00 $0.25 / $1.50 $2.00* / $12.00*	1M / 65 536 1M / 65 536 1M / 65 536	8M TPM / 10K RPM 8M TPM / 10K RPM 8M TPM / 2K RPM
Anthropic Claude Haiku 4.5 (jul-25) Claude Sonnet 4.6 (jan-26) Claude Opus 4.6 (aug-25)	$1.00 / $5.00 $3.00 / $15.00 $5.00 / $25.00	200K / 64 000 1M / 64 000 1M / 128 000	400K TPM / 4K RPM 400K TPM / 4K RPM 400K TPM / 4K RPM

* Hvis ledeteksten er >200k tokens blir prisen $4.00 / $18.00
** Hvis ledeteksten er >200k tokens blir prisen $6.00 / $22.50

I tabellen over ser du at OpenAI kommer godt ut av det, både i forhold til pris og tilgjengelighet. «Tokens buffer» forteller noe om hvor stor tekst du kan legge inn og hvor mye den kan skrive i en omgang. TPM/RPM er to måleenheter for hvor mye KI du får bruke, og hvor TPM er tokens per minute og RPM er requests per minute. Den forteller hvor mye tekst du kan lese/skrive i minuttet og den andre hvor mange jobber du kan sende i minuttet. Det skal sies at Anthropic har en egen avtale for de som trenger mer tilgjengelighet, men da må du opprette en helt egen avtale med dem. OpenAI og Google nevner også at du kan inngå egne avtaler, men er ikke veldig presise på hvordan.

En kommentar til nano-modellene, som finnes til gpt-4.1 og gpt-5.1. Ikke bruk dem til de vanlige praterobotene. Disse modellene er veldig billige, men de er ikke laget med tanke på å være prateroboter. De er språkmodeller du bruker til oppsummering og klassifisering av tekster. I praksis fungerer de ikke som prateroboter.

Det eneste som gjør gpt-4.1 bedre enn gpt-5.1 er kontekstvinduet. gpt-4.1 kan «lese» mye større mengder tekst på en gang enn gpt-5.1. Det er veldig nyttig i noen spesielle tilfeller, og da bør du gå for gpt-4.1 fremfor gpt-5.1.

Eller du kan gå for Gemini, både Flash og Pro. De har sine styrker i forhold til gpt-5.1, men er i praksis litt dyrere. Claude er litt på siden av gpt og Gemini. Claude Sonnet er enda veldig bra, og jeg mener at den fremdeles er en av de bedre praterobotene til rollespill, tekstforståelse og skriving. Og Opus til Anthropic er enda bedre. Samtidig har Gemini 3 Pro imponert meg i det siste på disse samme områdene.

Det er fremdeles slik at det er forskjell på bokmål og nynorsk, men… Gemini 3 Pro begynner å bli bra på nynorsk. Jeg har ikke fått testet Opus 4.6 godt enda, men det virker også svært kapabel på norsk.

Forrige gang skrev jeg litt om at modellene virker å ha ulike grenser for hva de er villige til å skrive om (og hvordan de skriver ting). Nå er Anthopic sine modeller de mest restriktive, fulgt av OpenAI og så har faktisk Google de mest villige modellene til å skrive om ting mange kan oppleve at er på kanten. For et drøyt år siden var Google den pripne modellen. Gemini skriver fantastiske falske nyheter, bare prøv, mens gpt sine falske nyheter er tamme og Claude nekter.

Forrige gang var Llama fra Meta hjertelig til stede. Meta har ikke hengt like godt med i løpet, og de siste modellene er ikke så gode som de bør – og de er heller ikke gode på bokmål (eller nynorsk).

Men… for dere som har KI i Randaberg er det kommet en mulighet for å koble på tjenesten OpenRouter, hvor du kan bruke alle språkmodeller som finnes. Da holder det at du lager en konto hos OpenRouter og så kan du hente inn hvilken språkmodell du vil i praterobotene du bruker. Det er vel 300+ ulike språkmodeller tilgjengelig per dags dato.

Og helt til slutt. OpenAI har laget en ny API til språkmodellene sine, som AI Engine i WordPress støtter. Da kan du enkelt få gpt-modellene til å lage bilder i den vanlige prateroboten, akkurat slik du kan i ChatGPT. Men… ett bilde koster kr 0,50 å lage! Det er nok greit hvis det er bare er du som bruker prateroboten, men tenk grundig over hva du gjør om du slipper dette fritt for tusenvis av elever.

En oppdatering av priser og modeller

Kommentarer

Legg igjen en kommentar Avbryt svar