auto.pub logo
Screenshot from the video

DeepMind прагне навчити роботів «думати вголос»

Author: auto.pub | Published on: 08.07.2025

Коли DeepMind, провідний підрозділ штучного інтелекту компанії Google, береться за новий проєкт, це рідко лишається просто ідеєю. Їхня свіжа амбіція — «внутрішній монолог»: самостійний потік думок, який дозволяє роботам міркувати подібно до людини. Уявіть собі: під кожним металевим корпусом — мовчазний Гамлет, який розповідає собі, що бачить, і вирішує, що робити далі. Це не фантастика, а вже патентна заявка.

У своєму останньому документі DeepMind описує систему, що дозволяє роботам створювати внутрішню мову природною мовою на основі зображень або відео. Наприклад, якщо робот бачить, як хтось підіймає чашку, у його свідомості лунає: «людина підіймає чашку». Це геніально? Можливо. Або ж стара ідея у новій упаковці для чергової хвилі хайпу.

Попри романтичність такого внутрішнього діалогу, його завдання цілком прикладні: пришвидшити навчання, зменшити потреби в пам’яті та покращити роботу в незнайомих ситуаціях. Внутрішній голос стає невтомним коментатором, який допомагає машині не лише бачити, а й тлумачити навколишній світ.

За словами DeepMind, саме така внутрішня розповідь дозволяє агентам штучного інтелекту краще пристосовуватися і поводитися менш непередбачувано, особливо в складних умовах. Це ключовий виклик для появи розумної робототехніки у реальному світі. DeepMind, звісно, не єдина у цій гонитві. Nvidia, Intel та інші також працюють над впровадженням внутрішнього наратора у свої пристрої.

Щоб зробити цю дивовижну еволюцію максимально приватною, DeepMind розробляє Gemini Robotics On-Device: компактну модель бачення і мови, яка працює без підключення до хмари чи інтернету. Бо якщо у вас удома з’явиться робот, що розмірковує вголос, ви напевно захочете, щоб його роздуми не потрапили на сервери Google.

Якщо роботи зрештою почнуть «думати» самостійно, ми можемо опинитися на порозі нової епохи. Залишається лише питання: чи є це справжнім розумінням, чи лише талановитою імітацією? Час покаже. А можливо, й сам робот — щойно сформує власну думку.