AI-generated
Fullscreen Image

Anthropic gør Claude Opus 4.8 mere forsigtig og mindre skråsikker, når den tager fejl

Forfatter auto.pub | Udgivet: 01.06.2026

Anthropic har lanceret Claude Opus 4.8, en ny topmodel, hvor det vigtigste salgsargument ikke kun er bedre kodegenerering eller længere hukommelse, men adfærd. Modellen er udviklet til oftere at erkende usikkerhed og sjældnere lade egne fejl passere ubemærket. Ifølge Anthropic overser Opus 4.8 fejl i den kode, den selv skriver, omtrent fire gange sjældnere end forgængeren.

"Ærlig AI" betyder mindre bluff, ikke en moralsk samvittighed

Anthropic bruger et stærkt ord om Claude Opus 4.8: ærlighed. Teknisk betyder det ikke en moralsk beslutningstager, men en model, der skal fremsætte færre udokumenterede påstande, oftere opdage svagheder i sit eget arbejde og tydeligere markere usikkerhed.

Det er et væsentligt skifte. Store sprogmodeller er ofte farligst netop, når de lyder mest sikre. De siger ikke "det ved jeg ikke". De konstruerer et overbevisende svar på et spinkelt evidensgrundlag. Anthropic siger nu, at Opus 4.8 angriber problemet mere direkte end Opus 4.7.

Den mest konkrete måling handler om kode. Anthropic hævder i sine egne evalueringer, at Opus 4.8 lader fejl i sin egen kode passere uopdaget omtrent fire gange sjældnere end forgængeren. Det bør ikke automatisk overføres til alle områder, eksempelvis jura, medicin eller finansiel analyse, men for udviklere er det et markant signal.

Opus 4.8 er bygget til lange opgaver, ikke kun hurtige svar

Anthropic beskriver Claude Opus 4.8 som sin mest kapable bredt tilgængelige Claude til kompleks ræsonnering, længere agentbaseret arbejde og mere autonome arbejdsgange. Model-id'et er claude-opus-4-8, og kontekstvinduet når 1 million tokens via Claude API, Amazon Bedrock og Vertex AI med et maksimalt output på 128.000 tokens. I Microsoft Foundry er kontekstvinduet begrænset til 200.000 tokens.

På prisen vælger Anthropic ikke den billigere vej. Opus 4.8 koster 5 dollar pr. million input-tokens og 25 dollar pr. million output-tokens. Det er fortsat dyrere end Sonnet 4.6 til henholdsvis 3 og 15 dollar, men Opus retter sig mod sværere opgaver, hvor én forkert beslutning kan koste mere end selve brugen af modellen.

Her ligger den praktiske værdi i Opus 4.8. En model, der bedre ved, hvornår den skal stoppe op, kalde et værktøj, kontrollere en tvivl eller sige imod brugerens input, bliver en mere pålidelig makker i et udviklingsmiljø. Ikke nødvendigvis klogere, men mindre farligt overmodig.

Dynamic Workflows gør Claude til et hold af agenter

Sammen med Opus 4.8 introducerede Anthropic Dynamic Workflows til Claude Code. Funktionen lader Claude dele en stor opgave op i titusinder eller hundredvis af parallelle delagent-job, kontrollere deres resultater og returnere et samlet svar til brugeren. Den er tilgængelig som research preview via Claude Code CLI, desktop-appen, VS Code-udvidelsen og gennem API'et, Amazon Bedrock, Vertex AI og Microsoft Foundry.

Det er ikke blot en mindre bekvemmelighedsfunktion. I softwareudvikling flytter det Claude fra et enkelt chatvindue til en agentbaseret arbejdsgangsmotor. Anthropic nævner jagt på fejl på tværs af kodebaser, sikkerhedsaudits, migrationer i stor skala og kritiske opgaver, hvor uafhængige agenter også forsøger at modbevise resultater.

Samme retning forklarer vægten på modellens "ærlighed". Når en enkelt chatbot laver en fejl, opdager brugeren den ofte hurtigt. Men når hundredvis af delagenter arbejder på tværs af en stor kodebase, kan misplaced sikkerhed vokse til en meget dyr fejl. Opus 4.8 skal derfor ikke kun løse opgaver. Den skal også vide, hvornår den skal stoppe.

Effort control giver brugerne greb om omkostning og kvalitet

Opus 4.8 bruger som standard et højt effort-niveau, som Anthropic beskriver som den bedste balance mellem kvalitet og anvendelighed. Den nye effort control lader brugerne vælge, hvor meget modellen "tænker", før den svarer. En højere indstilling giver bedre resultater på sværere opgaver, mens en lavere indstilling sparer tid og token-kvote.

To yderligere detaljer er vigtige for udviklere. For det første understøtter Opus 4.8 system prompt injection midt i en samtale, så instruktioner kan opdateres under lange agentbaserede kørsler uden at sende hele system-prompten igen. For det andet giver fast mode, som aktuelt er i research preview, op til 2,5 gange hurtigere generering af output-tokens, dog til premium-pris.

For europæiske virksomheder har det særlig betydning på grund af omkostningsmodellen. Efterhånden som AI bevæger sig fra tekstgenerator til arbejdsgangsstyring, får hver token økonomisk vægt. Opus 4.8 forsøger at tilbyde ræsonnering på topmodelniveau, samtidig med at brugerne kan afgøre, hvornår de vil betale for dybere analyse, og hvornår de vil vælge det hurtigere svar.

Mythos tegner sig i baggrunden som et større signal

Ifølge Reuters kommer Opus 4.8, mens Anthropic forbereder en bredere lancering af den mere kraftfulde Claude Mythos. Mythos knyttes til avancerede cybersikkerhedskapaciteter og er tilgængelig for udvalgte partnere, herunder Amazon, Microsoft og Apple, gennem Project Glasswing.

Det placerer Opus 4.8 i en interessant position. Den er ikke Anthropics mest kraftfulde model, men den er selskabets mest kapable bredt tilgængelige Claude. API-dokumentationen bekræfter, at Claude Mythos Preview fortsat er en separat research preview til defensive cybersikkerhedsarbejdsgange uden self-service-adgang.

Anthropic sælger derfor Opus 4.8 på kontrollerbar pålidelighed snarere end uhæmmet styrke. For erhvervsbrugere kan det betyde mere end en enkelt benchmark-sejr. I jura, finansiel analyse, softwareudvikling og sikkerhedsaudits er det afgørende i sidste ende, hvor ofte en model erkender, at den endnu ikke har tilstrækkeligt grundlag til at drage en fast konklusion.