Anthropic gjør Claude Opus 4.8 mer forsiktig og mindre skråsikker når den tar feil

Forfatter auto.pub | Publisert: 01.06.2026

Anthropic har lansert Claude Opus 4.8, en ny toppmodell der det viktigste salgsargumentet ikke bare er bedre kodegenerering eller lengre hukommelse, men atferd. Modellen skal oftere erkjenne usikkerhet og sjeldnere la egne feil passere ubemerket. Ifølge Anthropic er Opus 4.8 omtrent fire ganger mindre tilbøyelig enn forgjengeren til å overse feil i koden den skriver.

«Ærlig AI» betyr mindre bløffing, ikke moralsk samvittighet

Anthropic bruker et sterkt ord om Claude Opus 4.8: ærlighet. Teknisk sett handler ikke dette om en moralsk beslutningstaker, men om en modell som skal komme med færre udokumenterte påstander, oftere oppdage svakheter i eget arbeid og tydeligere markere usikkerhet.

Det er en vesentlig dreining. Store språkmodeller er ofte farligst nettopp når de høres mest sikre ut. De sier ikke «jeg vet ikke». I stedet bygger de et overbevisende svar på et tynt bevisgrunnlag. Anthropic sier nå at Opus 4.8 tar tak i dette problemet mer direkte enn Opus 4.7.

Det mest konkrete målepunktet gjelder kode. Anthropic hevder i egne evalueringer at Opus 4.8 lar feil i egen kode passere uoppdaget omtrent fire ganger sjeldnere enn forgjengeren. Det bør ikke automatisk overføres til alle områder, som jus, medisin eller finansiell analyse, men for utviklere er det et tydelig signal.

Opus 4.8 er bygget for lange oppgaver, ikke bare raske svar

Anthropic beskriver Claude Opus 4.8 som den mest kapable allment tilgjengelige Claude-modellen for kompleks resonnering, utvidet agentbasert arbeid og mer autonome arbeidsflyter. Modell-ID-en er claude-opus-4-8, og kontekstvinduet er på opptil 1 million tokens via Claude API, Amazon Bedrock og Vertex AI, med maksimal utdata på 128 000 tokens. I Microsoft Foundry er kontekstvinduet begrenset til 200 000 tokens.

På pris velger ikke Anthropic en billigere linje. Opus 4.8 koster 5 dollar per million inndata-tokens og 25 dollar per million utdata-tokens. Det er fortsatt dyrere enn Sonnet 4.6, som koster 3 og 15 dollar, men Opus retter seg mot vanskeligere oppgaver der én feil beslutning kan koste mer enn selve modellbruken.

Det er her den praktiske verdien i Opus 4.8 ligger. En modell som bedre vet når den bør stoppe opp, bruke et verktøy, sjekke en tvil eller utfordre brukerens input, blir en mer pålitelig partner i et utviklingsmiljø. Ikke nødvendigvis smartere, men mindre farlig skråsikker.

Dynamic Workflows gjør Claude til et team av agenter

Sammen med Opus 4.8 introduserte Anthropic Dynamic Workflows for Claude Code. Funksjonen lar Claude dele en stor oppgave opp i titalls eller hundrevis av parallelle delagent-jobber, kontrollere resultatene deres og gi brukeren ett samlet svar. Den er tilgjengelig som research preview via Claude Code CLI, skrivebordsappen, VS Code-utvidelsen, samt gjennom API-et, Amazon Bedrock, Vertex AI og Microsoft Foundry.

Dette er ikke en liten bekvemmelighetsfunksjon. I programvareutvikling flytter det Claude fra ett enkelt chatvindu til en motor for agentbaserte arbeidsflyter. Anthropic viser til feiljakt på tvers av kodebaser, sikkerhetsrevisjoner, migreringer i stor skala og kritiske oppgaver der uavhengige agenter også forsøker å motbevise resultater.

Den samme retningen forklarer vektleggingen av modellens «ærlighet». Når én enkelt chatbot gjør en feil, oppdager brukeren det ofte raskt. Men når hundrevis av delagenter arbeider på tvers av en stor kodebase, kan feilplassert selvtillit bygge seg opp til en svært kostbar feil. Opus 4.8 må derfor ikke bare løse oppgaver. Den må også vite når den skal stoppe.

Innsatskontroll gir brukerne styring over kostnad og kvalitet

Opus 4.8 er som standard satt til et høyt innsatsnivå, som Anthropic beskriver som den beste balansen mellom kvalitet og brukervennlighet. Den nye innsatskontrollen lar brukerne velge hvor mye modellen skal «tenke» før den svarer. En høyere innstilling gir bedre resultater på vanskeligere oppgaver, mens en lavere innstilling sparer tid og token-kvote.

To andre detaljer er viktige for utviklere. For det første støtter Opus 4.8 injisering av systemprompt midt i en samtale, slik at instruksjoner kan oppdateres under lange agentbaserte kjøringer uten at hele systemprompten må sendes på nytt. For det andre åpner fast mode, som foreløpig er i research preview, for opptil 2,5 ganger raskere generering av utdata-tokens, men til premiumpris.

For europeiske selskaper er dette særlig viktig på grunn av kostnadsmodellen. Når AI går fra å være en tekstgenerator til å bli en arbeidsflytstyrer, får hver token økonomisk betydning. Opus 4.8 forsøker å tilby resonnering på toppmodellnivå, samtidig som brukerne kan avgjøre når de vil betale for dypere analyse og når de vil velge det raskere svaret.

Mythos ligger i bakgrunnen som et større signal

Ifølge Reuters kommer Opus 4.8 samtidig som Anthropic forbereder en bredere lansering av den kraftigere Claude Mythos. Mythos knyttes til avanserte cybersikkerhetsfunksjoner og er tilgjengelig for utvalgte partnere, blant dem Amazon, Microsoft og Apple, gjennom Project Glasswing.

Det plasserer Opus 4.8 i en interessant posisjon. Den er ikke Anthropics kraftigste modell, men den er selskapets mest kapable allment tilgjengelige Claude-modell. API-dokumentasjonen bekrefter at Claude Mythos Preview fortsatt er en egen research preview for defensive cybersikkerhetsarbeidsflyter, uten selvbetjent tilgang.

Anthropic selger derfor Opus 4.8 på kontrollerbar pålitelighet snarere enn ubegrenset kraft. For bedriftsbrukere kan det bety mer enn én enkelt seier i en ytelsestest. I jus, finansiell analyse, programvareutvikling og sikkerhetsrevisjon er det som til slutt teller, hvor ofte en modell forstår at den ennå ikke har godt nok grunnlag til å trekke en sikker konklusjon.