Hermes 4: Open-source AI die altijd 'ja' zegt

Auteur auto.pub | Gepubliceerd op: 01.09.2025

De Hermes 4-familie bestaat uit drie modellen—14, 70 en een vlaggenschip met 405 miljard parameters—elk getraind op een mix van synthetische data en versterkend leren om redeneervermogen, codering en logica te verfijnen. De resultaten zijn indrukwekkend: een score van 96,3% op de beruchte MATH-500 benchmark en 61,3% op LiveCodeBench, waarmee Hermes 4 zich kan meten met de sterkste commerciële modellen.

Waar Nous het meest afwijkt van de gevestigde orde, is in de filosofie. Hermes 4 biedt geen excuses, ontwijkt geen vragen en weigert zelden. Op RefusalBench, een nieuwe test die meet hoe vaak een AI een antwoord weigert, scoorde het 405B-model 57,1%, tegenover slechts 17,7% voor GPT-4o. Voor de makers is dit het bewijs van 'gebruikerssoevereiniteit'. Critici zien er juist een Pandora's doos in.

De techniek is minstens zo ambitieus als de visie. Een nieuwe datastroom, DataForge genaamd, genereert uiteenlopende synthetische trainingsvoorbeelden uit enorme grafiekstructuren. Tegelijkertijd dwingt de Atropos-omgeving modellen om problemen honderdduizenden keren te oefenen, waarbij alleen geverifieerde oplossingen in de dataset belanden. Om eindeloos doorredeneren te voorkomen, is Hermes bewust getraind om het denkproces na ongeveer 30.000 tokens af te breken, wat transparantie en bruikbaarheid in balans houdt.

Die transparantie komt tot uiting in het hybride redeneersysteem: gebruikers kunnen kiezen tussen een snel antwoord of een volledig uitgeschreven stapsgewijze uitleg, zichtbaar in ...-tags. In theorie krijg je dus niet alleen het antwoord, maar kun je ook het denkproces van de machine volgen—een idee dat zowel fascineert als ongemakkelijk maakt.

Op fora als Reddit en Hacker News wordt Hermes 4 geprezen als 'de meest open release tot nu toe', waarbij sommigen de gewaagde systeemaanwijzingen vergelijken met 'een anime uit de jaren 90'. Anderen waarschuwen juist voor het ontbreken van ingebouwde veiligheidsmaatregelen. Hoe dan ook, Nous zorgt ervoor dat Hermes 4 niet over het hoofd wordt gezien.

In een AI-landschap vol veiligheidswaarschuwingen en gecureerde beleefdheid valt Hermes 4 op als brutaal, ongefilterd en compromisloos open. Of het nu de voorbode is van een vrijere toekomst of een waarschuwing voor te veel, te snel, zal bepalen hoe de volgende generatie kunstmatige intelligentie wordt gebouwd—en wie daar de controle over heeft.