
Hermes 4: Nyílt forráskódú MI, amely nem kér bocsánatot
A Hermes 4 család három méretben érhető el: 14, 70 és a zászlóshajó 405 milliárd paraméterrel. Mindegyiket szintetikus adatok és megerősítéses tanulási ciklusok keverékével képezték, hogy fejlesszék a logikai, programozási és érvelési képességeket. Az eredmények magukért beszélnek: a hírhedten nehéz MATH-500 teszten 96,3 százalékot, a LiveCodeBench-en 61,3 százalékot ért el, ezzel a legerősebb kereskedelmi modellekkel került egy szintre.
A Nous filozófiája radikálisan eltér a megszokottól. A Hermes 4 nem kér elnézést, nem tér ki a válasz elől, és nem utasít vissza kérdéseket. Az új RefusalBench teszten, amely azt méri, milyen gyakran tagadja meg a választ egy MI, a 405B modell 57,1 százalékot ért el, míg a GPT-4o csupán 17,7 százalékot. A fejlesztők szerint ez a „felhasználói szuverenitás” bizonyítéka, a kritikusok viszont Pandora szelencéjét látják benne.
A technológia legalább annyira ambiciózus, mint az elvek. Az új DataForge adatcsatorna hatalmas gráfstruktúrákból generál változatos szintetikus tanulási mintákat, míg az Atropos megerősítéses környezetben a modellek százezres nagyságrendben gyakorolják a feladatokat, és csak a hitelesített megoldások kerülhetnek az adathalmazba. Hogy elkerüljék a végtelen szócséplést, a Hermes-t szándékosan úgy tanították, hogy körülbelül 30 000 token után leállítsa az érvelést, így egyensúlyt teremtve az átláthatóság és a használhatóság között.
Az átláthatóságot a hibrid érvelési rendszer is tükrözi: a felhasználó választhat gyors felelet vagy részletes, lépésről lépésre bemutatott folyamat között, amelyet ... tagekben jelenít meg a rendszer. Elméletben így nemcsak a választ kapjuk meg, hanem azt is végigkövethetjük, hogyan gondolkodik a gép – ez egyszerre lenyűgöző és kissé nyugtalanító.
A Reddittől a Hacker Newsig sokan „a valaha volt legnyitottabb kiadásként” üdvözölték a Hermes 4-et, egyesek szerint a rendszer provokatív promptjai akár egy ’90-es évekbeli anime-ből is származhatnának. Mások veszélyt látnak a beépített korlátok hiányában. Akárhogy is, a Nous gondoskodott róla, hogy a Hermes 4 ne maradjon észrevétlen.
Egy olyan MI-világban, ahol minden a biztonsági figyelmeztetésekről és a gondosan szerkesztett udvariasságról szól, a Hermes 4 nyers, szókimondó és kompromisszummentesen nyitott. Hogy a szabadabb jövő előfutára lesz-e, vagy túl gyorsan túl sokat enged meg magának, az meghatározhatja, hogyan épül a következő generációs mesterséges intelligencia – és ki irányítja majd.