
Hermes 4: Otvoreni AI koji kaže „da“, a ne „žao mi je“
Obitelj Hermes 4 dolazi u tri veličine—14, 70 i vodeći model s čak 405 milijardi parametara—svaki treniran na kombinaciji sintetičkih podataka i petlji pojačanog učenja koje izoštravaju sposobnosti zaključivanja, programiranja i logike. Rezultati su impresivni: nevjerojatnih 96,3% na zloglasno zahtjevnom MATH-500 testu i 61,3% na LiveCodeBench ljestvici, što ga svrstava uz bok najjačim komercijalnim modelima.
Najveći odmak od ustaljenih pravila tvrtka Nous čini u filozofiji. Hermes 4 ne ispričava se, ne izbjegava odgovore i ne odbija pitanja. Na novom testu RefusalBench, koji mjeri koliko često AI odbija odgovoriti, model s 405 milijardi parametara postigao je 57,1%, dok je GPT-4o ostao na skromnih 17,7%. Za tvorce to dokazuje „suverenitet korisnika“. Kritičari pak upozoravaju na Pandorinu kutiju.
Tehnička rješenja jednako su ambiciozna kao i pristup. Novi podatkovni sustav DataForge generira raznolike sintetičke uzorke iz golemih grafova, dok okruženje za pojačano učenje Atropos tjera modele da rješavaju zadatke stotine tisuća puta, a u skup podataka ulaze samo provjerena rješenja. Kako bi se spriječilo bespotrebno razvlačenje odgovora, Hermes je namjerno treniran da prekine zaključivanje nakon otprilike 30.000 tokena, čime se postiže ravnoteža između transparentnosti i upotrebljivosti.
Ta transparentnost ogleda se u hibridnom sustavu zaključivanja: korisnici mogu birati između brzog odgovora ili detaljno objašnjenog postupka, prikazanog u … oznakama. Teoretski, to znači da ne dobivate samo rješenje, već i uvid u način na koji stroj razmišlja—što je istovremeno fascinantno i pomalo uznemirujuće.
Na forumima od Reddita do Hacker Newsa Hermes 4 slavi se kao „najotvorenije izdanje dosad“, a neki njegove provokativne sistemske upute uspoređuju s „animeom iz devedesetih“. Drugi pak upozoravaju na opasnosti zbog izostanka ugrađenih ograničenja. U svakom slučaju, Nous je osigurao da Hermes 4 ne prođe nezapaženo.
U svijetu umjetne inteligencije opsjednutom sigurnosnim upozorenjima i uglađenom pristojnošću, Hermes 4 izdvaja se kao nešto drsko, sirovo i beskompromisno otvoreno. Hoće li postati predvodnik slobodnije budućnosti ili upozorenje o prevelikoj brzini, moglo bi odrediti kako će se razvijati sljedeća generacija umjetne inteligencije—i tko će je kontrolirati.