
DeepMind хочет, чтобы роботы разговаривали сами с собой — буквально
Когда DeepMind, входящая в состав Google, берётся за новую задачу, это редко бывает просто теорией. Последняя цель компании — «внутренний монолог»: поток мыслей, позволяющий роботам размышлять по-человечески. Представьте себе, что у каждого металлического корпуса скрывается маленький Гамлет, который тихо комментирует происходящее и решает, что делать дальше. Это не фантастика, а патентная заявка. В последней публикации DeepMind описывает систему, позволяющую роботам создавать внутреннюю речь на естественном языке на основе того, что они видят на изображениях или в видео. Покажите роботу, как кто-то поднимает чашку, и в его цифровом разуме прозвучит: «человек поднимает чашку». Гениально? Возможно. Или просто хорошо забытая идея, вновь получившая популярность. Как бы мечтательно ни звучал этот внутренний диалог, его цель вполне практична: ускорить обучение, снизить требования к памяти и повысить эффективность в незнакомых условиях. Внутренний голос превращается в неутомимого комментатора, помогая машине не просто воспринимать, но и интерпретировать окружающий мир. По словам DeepMind, такой внутренний рассказ позволяет ИИ-агентам лучше адаптироваться и вести себя более предсказуемо в неожиданных ситуациях — а это одна из главных проблем на пути к появлению действительно умных роботов. Конечно, DeepMind не единственная компания, идущая по этому пути. Nvidia, Intel и другие также пытаются внедрить в свои устройства внутреннего рассказчика. Чтобы этот необычный прогресс оставался приватным, DeepMind разрабатывает Gemini Robotics On-Device — компактную модель, сочетающую зрение и язык, и работающую полностью автономно, без облака и интернета. Ведь если ваш робот вдруг начнёт разговаривать сам с собой на кухне, вы наверняка предпочтёте, чтобы его мысли не уходили на серверы Google. Если роботы действительно начнут размышлять вслух, мы можем оказаться на пороге новой эпохи. Останется лишь выяснить, станет ли это настоящим мышлением — или лишь искусной имитацией. Время покажет. Или, возможно, сам робот, когда сформирует своё мнение.