Hermes 4: Відкрите ШІ, яке відповідає «так», а не вибачається

Автор auto.pub | Опубліковано: 01.09.2025

Лінійка Hermes 4 охоплює три моделі — на 14, 70 і флагманські 405 мільярдів параметрів. Кожна з них навчалася на суміші синтетичних даних і циклів навчання з підкріпленням, що вдосконалюють логіку, програмування та аналітичне мислення. Результати вражають: 96,3% на складному тесті MATH-500 і 61,3% на LiveCodeBench, що ставить Hermes 4 в один ряд із найсильнішими комерційними моделями.

Головна відмінність підходу Nous — у філософії. Hermes 4 не вибачається, не уникає відповідей і не відмовляє користувачеві. На новому тесті RefusalBench, який вимірює частоту відмов, модель на 405 мільярдів параметрів показала 57,1%, тоді як GPT-4o — лише 17,7%. Для розробників це доказ «суверенітету користувача», а для критиків — потенційна скринька Пандори.

Технічна сторона не менш амбітна. Нова система DataForge генерує різноманітні синтетичні навчальні приклади на основі складних графових структур, а середовище підкріплення Atropos змушує моделі розв’язувати задачі сотні тисяч разів, допускаючи до датасету лише перевірені рішення. Щоб уникнути зайвих міркувань, Hermes навмисно обмежили довжину міркувань до 30 000 токенів — баланс між прозорістю та зручністю.

Прозорість підкреслює гібридна система міркувань: користувач може обрати швидку відповідь або детальний покроковий розбір, позначений спеціальними тегами. Теоретично це дозволяє не лише отримати результат, а й простежити хід думок машини — ідея водночас захоплива й тривожна.

На форумах Reddit і Hacker News Hermes 4 називають «найвідкритішим релізом», а його провокаційні системні підказки порівнюють із стилістикою аніме 90-х. Дехто бачить ризики у відсутності вбудованих обмежень. У будь-якому разі, Nous подбав, щоб Hermes 4 не залишився непоміченим.

У світі ШІ, де панують обережність і ввічливість, Hermes 4 вирізняється сміливістю, відкритістю та відсутністю вибачень. Чи стане він провісником вільнішого майбутнього, чи застереженням про надмірну свободу — саме це може визначити, як і ким буде створюватися наступне покоління штучного інтелекту.