auto.pub logo
Hermes-4

Hermes 4: Åpen kildekode-AI som sier «ja» i stedet for «beklager»

Forfatter auto.pub | Publisert: 01.09.2025

Hermes 4-familien kommer i tre størrelser—14, 70 og flaggskipet med 405 milliarder parametre—alle trent på en blanding av syntetiske data og forsterkende læringssløyfer for å skjerpe resonnering, koding og logikk. Resultatene er slående: hele 96,3 prosent på den beryktede MATH-500-testen og 61,3 prosent på LiveCodeBench, noe som plasserer modellen på nivå med de sterkeste kommersielle alternativene.

Det mest radikale med Nous er filosofien. Hermes 4 unnskylder seg ikke, viker ikke unna og nekter sjelden å svare. På RefusalBench, en ny test som måler hvor ofte en AI avslår å svare, oppnådde 405B-modellen 57,1 prosent, mot GPT-4os beskjedne 17,7 prosent. For utviklerne er dette bevis på «brukersuverenitet». Kritikerne kaller det en Pandoras eske.

Teknologien er like ambisiøs som tankegangen. En ny datapipeline, kalt DataForge, genererer varierte syntetiske treningsdata fra store grafstrukturer, mens Atropos-miljøet for forsterkende læring tvinger modellene til å løse problemer hundretusener av ganger, og kun verifiserte løsninger får plass i datasettet. For å unngå at modellen blir for ordrik, er Hermes bevisst trent til å avslutte resonnementer rundt 30 000 tokens, en balanse mellom åpenhet og brukervennlighet.

Åpenheten vises i det hybride resonnementssystemet: brukeren kan velge mellom et kjapt svar eller en fullstendig, trinnvis forklaring, synliggjort i …-tagger. I teorien betyr det at du ikke bare får svaret, men også kan følge maskinens tankegang—en idé som både fascinerer og uroer.

På forum som Reddit og Hacker News har Hermes 4 blitt hyllet som «det mest åpne slippet hittil», og noen mener de dristige systempromptene kunne vært hentet rett fra en anime fra 90-tallet. Andre ser fare i mangelen på innebygde sikkerhetsmekanismer. Uansett har Nous sørget for at Hermes 4 ikke blir oversett.

I en AI-verden preget av sikkerhetsadvarsler og høflig kuratering, fremstår Hermes 4 som noe rått, direkte og kompromissløst åpent. Om det blir starten på en friere fremtid eller et varsko om for mye, for tidlig, kan avgjøre hvordan neste generasjon kunstig intelligens formes—og hvem som får kontrollen.