Hermes 4: Avoin tekoäly, joka ei pyydä anteeksi

Tekijä auto.pub | Julkaistu: 01.09.2025

Hermes 4 -malliperhe kattaa kolme kokoluokkaa: 14, 70 ja lippulaivana 405 miljardia parametria. Jokainen niistä on koulutettu synteettisen datan ja vahvistusoppimisen yhdistelmällä, jonka tavoitteena on hioa päättelykykyä, ohjelmointitaitoja ja loogista ajattelua. Tulokset puhuvat puolestaan: mallin suorituskyky MATH-500-testissä on huimat 96,3 prosenttia ja LiveCodeBenchissä 61,3 prosenttia, mikä nostaa sen samalle viivalle vahvimpien kaupallisten mallien kanssa.

Nousin lähestymistapa poikkeaa perinteestä erityisesti filosofiassaan. Hermes 4 ei pyydä anteeksi, väistele eikä kieltäydy vastaamasta. Uudella RefusalBench-testillä, joka mittaa tekoälyn halukkuutta kieltäytyä vastauksista, 405B-malli ylsi 57,1 prosenttiin, kun GPT-4o jäi 17,7 prosenttiin. Kehittäjien mukaan tämä osoittaa käyttäjän täyden vallan. Kritiikin mukaan kyseessä voi olla vaarallinen ennakkotapaus.

Tekninen toteutus on yhtä kunnianhimoinen kuin periaatteet. Uusi DataForge-dataketju tuottaa monipuolisia synteettisiä harjoitusaineistoja laajoista graafirakenteista, ja Atropos-vahvistusympäristö pakottaa mallit ratkomaan ongelmia satoja tuhansia kertoja, hyväksyen aineistoon vain todennetut ratkaisut. Jotta malli ei eksyisi loputtomaan pohdintaan, Hermes on opetettu katkaisemaan päättely noin 30 000 tokenin kohdalla, mikä tasapainottaa läpinäkyvyyden ja käytettävyyden.

Läpinäkyvyys näkyy myös hybridipäättelyssä: käyttäjä voi valita nopean vastauksen tai yksityiskohtaisen vaiheittaisen selityksen, joka esitetään ...-tageissa. Näin käyttäjä ei saa pelkkää vastausta, vaan voi seurata koneen ajatteluprosessia – ajatus, joka on yhtä aikaa kiehtova ja hämmentävä.

Redditistä Hacker Newsiin Hermes 4:ää on ylistetty avoimimmaksi julkaisuksi tähän mennessä, ja sen rohkeita järjestelmäkehotteita on verrattu 90-luvun animeen. Toiset taas näkevät vaaran siinä, ettei mallissa ole sisäänrakennettuja turvarajoja. Joka tapauksessa Nous on varmistanut, ettei Hermes 4 jää huomaamatta.

Tekoälymaailmassa, jossa korostetaan turvallisuusvaroituksia ja siloteltua kohteliaisuutta, Hermes 4 erottuu räväkkänä, suorasukaisena ja tinkimättömän avoimena. Onko se tulevaisuuden vapauden airut vai varoittava esimerkki liiasta vauhdista, jää nähtäväksi – ja samalla määrittää, millaiseksi seuraavan sukupolven tekoäly rakentuu ja kuka sitä hallitsee.