auto.pub logo
Hermes-4

Hermes 4: AI Foinse Oscailte a Deir “Tá,” Ní “Tá Brón Orm”

Údar auto.pub | Foilsithe ar: 01.09.2025

Tá trí mhéid sa teaghlach Hermes 4—14, 70 agus príomhshamhail le 405 billiún paraiméadar—gach ceann acu oilte ar mheascán sonraí sintéiseacha agus lúba athneartaithe a fheabhsaíonn réasúnaíocht, códú agus loighic. Tá na torthaí dochreidte: 96.3% ar an mbainistíocht chrua MATH-500 agus 61.3% ar LiveCodeBench, rud a chuireann ar chomhchéim é leis na samhlacha tráchtála is láidre.

Is é an áit a n-imíonn Nous ó na gnáthrialacha ná sa fhealsúnacht. Ní dhéanann Hermes 4 leithscéal, ní sheachnaíonn sé ceisteanna, agus ní dhiúltaíonn sé freagra. Ar RefusalBench, tástáil nua a thomhaiseann cé chomh minic a dhiúltaíonn AI freagra, bhain an tsamhail 405B 57.1% amach, i gcomparáid le 17.7% ag GPT-4o. Dar le lucht a chruthaithe, is cruthúnas é seo ar “flaithiúlacht an úsáideora.” Dar le lucht cáinte, is bosca Pandora é.

Tá na meicníochtaí chomh dána leis an gcur chuige. Cruthaíonn DataForge, píblíne sonraí úrnua, samplaí oiliúna sintéiseacha éagsúla ó struchtúir mhóra graf, agus cuireann an timpeallacht athneartaithe Atropos iallach ar na samhlacha fadhbanna a chleachtadh na céadta mílte uair, ag glacadh ach le réitigh fhíoraithe. Chun cosc a chur ar fhadaíocht gan teorainn, cuireadh oiliúint ar Hermes chun réasúnaíocht a stopadh thart ar 30,000 comhartha, ag cothromú trédhearcachta le húsáid.

Léirítear an trédhearcacht sin sa chóras réasúnaíochta hibrideach: is féidir le húsáideoirí rogha a dhéanamh idir freagra gasta nó próiseas céim ar chéim le nótaí, le gach céim le feiceáil i … clibeanna. I bpáipéar, ciallaíonn sé sin nach bhfaigheann tú an freagra amháin ach is féidir leat féachaint ar an meaisín ag smaoineamh—smaoineamh a bhfuil idir mhealltacht agus imní ann.

Ar fhóraim ó Reddit go Hacker News, moladh Hermes 4 mar an “scaoileadh is oscailte go dtí seo,” agus dúirt cuid acu go bhfuil na leideanna córais “díreach as anime na 90idí.” Feiceann daoine eile baol i ndíothacht cosaintí ionsuite. Pé scéal é, tá sé cinnte ag Nous nach mbeidh neamhaird déanta ar Hermes 4.

I saol AI atá gafa le rabhaidh sábháilteachta agus béasaíocht chúramach, seasann Hermes 4 amach mar rud dána, lom agus oscailte gan leithscéal. Cibé acu a bheidh sé ina thús le saoirse níos mó nó ina rabhadh faoi iomarca róluath, d’fhéadfadh sé a shainiú conas a thógtar an chéad ghlúin eile d’intleacht shaorga—agus cé a bheidh i gceannas uirthi.