auto.pub logo
Hermes-4

Hermes 4: Open-Source-KI, die zustimmt statt sich zu entschuldigen

Autor auto.pub | Veröffentlicht am: 01.09.2025

Die Hermes-4-Familie umfasst drei Größen – 14, 70 und ein Flaggschiff mit 405 Milliarden Parametern. Jedes Modell wurde mit einer Mischung aus synthetischen Daten und Verstärkungslern-Schleifen trainiert, die gezielt das logische Denken, Programmieren und Schlussfolgern schärfen. Die Resultate sind beeindruckend: 96,3 Prozent im berüchtigten MATH-500-Benchmark und 61,3 Prozent bei LiveCodeBench, womit Hermes 4 mit den stärksten kommerziellen Modellen gleichzieht.

Am deutlichsten hebt sich Nous jedoch in der Grundhaltung ab. Hermes 4 entschuldigt sich nicht, weicht nicht aus und lehnt Antworten nicht ab. Im neuen RefusalBench-Test, der misst, wie oft eine KI eine Antwort verweigert, erreichte das 405B-Modell 57,1 Prozent – im Vergleich zu mageren 17,7 Prozent bei GPT-4o. Für die Entwickler ist das ein Beweis für „Nutzersouveränität“, Kritiker sehen darin jedoch eine Büchse der Pandora.

Auch technisch ist Hermes 4 ambitioniert. Die neue Datenpipeline DataForge erzeugt vielfältige synthetische Trainingsbeispiele aus riesigen Graphstrukturen, während die Atropos-Umgebung die Modelle zwingt, Aufgaben hunderttausendfach zu üben und nur verifizierte Lösungen ins Datenset aufzunehmen. Um endlose Gedankenschleifen zu vermeiden, wurde Hermes gezielt darauf trainiert, das Schlussfolgern nach etwa 30.000 Tokens zu beenden – ein Kompromiss zwischen Transparenz und Nutzbarkeit.

Diese Transparenz zeigt sich im hybriden Reasoning-System: Nutzer können zwischen einer schnellen Antwort oder einem vollständig annotierten Schritt-für-Schritt-Prozess wählen, der in …-Tags dargestellt wird. Theoretisch lässt sich so nicht nur das Ergebnis, sondern auch der Denkprozess der Maschine nachvollziehen – ein Konzept, das gleichermaßen fasziniert und verunsichert.

In Foren von Reddit bis Hacker News wird Hermes 4 als „offenste Veröffentlichung bisher“ gefeiert, manche bezeichnen die provokanten System-Prompts als „wie aus einem 90er-Anime“. Andere warnen vor den fehlenden Schutzmechanismen. Fest steht: Nous sorgt dafür, dass Hermes 4 nicht übersehen wird.

In einer KI-Welt voller Sicherheitshinweise und höflicher Zurückhaltung wirkt Hermes 4 roh, direkt und kompromisslos offen. Ob es als Vorreiter einer freieren Zukunft oder als warnendes Beispiel für zu viel, zu früh in die Geschichte eingeht, könnte entscheidend prägen, wie die nächste Generation künstlicher Intelligenz entsteht – und wer sie kontrolliert.