Обзор Технология
05 марта 2026

Технология Physical Intelligence внедряет архитектуру MEM, чтобы обеспечить роботов памятью, необходимой для решения задач в реальном мире.

Коротко

Исследователи разработали систему Multi-Scale Embodied Memory, которая наделяет роботов кратковременной и долговременной памятью, позволяя им отслеживать прогресс и выполнять сложные задачи, а не просто совершать отдельные действия. 

Технология Physical Intelligence внедряет архитектуру MEM, чтобы обеспечить роботов памятью, необходимой для решения задач в реальном мире.

На протяжении многих лет мечта о действительно полезном бытовом роботе была обманчиво близка. Роботы уже умеют выполнять команды, такие как «вымыть сковороду», «сложить белье» или «сделать бутерброд». В лабораторных условиях эти системы демонстрируют впечатляющую ловкость и точность. Однако, несмотря на быстрый прогресс в разработке базовых моделей роботов, чего-то принципиально не хватало: памяти.

Робот, способный выполнить одну задачу, — это не то же самое, что робот, способный завершить работу. Уборка всей кухни, приготовление еды или подготовка ингредиентов для рецепта требуют не только отдельных навыков. Необходима целостность — способность запоминать, что уже сделано, что еще нужно сделать и где что находится. Без этой связной линии даже самый способный робот становится на удивление некомпетентным.

Именно эту задачу сейчас пытаются решить исследователи из Physical Intelligence с помощью новой архитектуры, называемой Multi-Scale Embodied Memory (MEM) — системы, разработанной для того, чтобы обеспечить роботов как кратковременной, так и долговременной памятью, позволяя им выполнять задачи, которые занимают минуты, а не секунды.

Результаты указывают на важный момент: будущее робототехники может зависеть не столько от более совершенных механических манипуляторов, сколько от более совершенной когнитивной архитектуры.

Современные роботизированные модели уже обладают впечатляющим набором двигательных навыков. Они могут захватывать хрупкие предметы, манипулировать инструментами и перемещаться в захламленных помещениях. Но попросите робота убрать всю кухню — протереть столешницы, расставить продукты, помыть посуду и расставить столовые приборы — и ограничения быстро станут очевидны.

Проблема не в самих навыках. Проблема в том, как эти навыки координируются. Сложные задачи требуют постоянного внимания. Робот должен помнить, какие шкафы он уже открыл, куда положил крышку от кастрюли или вымыл ли он уже посуду. Он также должен отслеживать объекты, которые уходят из поля зрения, и поддерживать в уме карту окружающей среды, выполняя новые действия.

Человеческий познание справляется с этим без усилий. Машины до недавнего времени этого не могли. Хранение каждого наблюдения, которое робот видит в течение минут или часов, вычислительно нецелесообразно. Но отбрасывание этой информации приводит к хаотичному поведению — повторяющимся ошибкам, забытым шагам или действиям, противоречащим ранее принятым решениям. В исследованиях в области робототехники эта проблема иногда описывается как «причинно-следственная путаница», когда системы неправильно интерпретируют прошлые события и подкрепляют неправильное поведение.

В результате: роботы, которые впечатляюще выглядят в коротких демонстрациях, но с трудом справляются с задачами в реальном мире.

Система памяти для физического интеллекта

Архитектура MEM решает эту проблему, вводя многоуровневую структуру памяти. Вместо того чтобы хранить все данные равномерно, система разделяет память на две взаимодополняющие формы:

Кратковременная визуальная память фиксирует недавние наблюдения с помощью эффективной архитектуры видеокодирования. Это позволяет роботу понимать движение, отслеживать объекты в разных кадрах и запоминать события, произошедшие несколько секунд назад, что крайне важно для точных действий, таких как переворачивание бутерброда с сыром или мытье посуды.

Между тем, долговременная концептуальная память хранит информацию о ходе выполнения задачи на естественном языке. Вместо того чтобы запоминать необработанные визуальные данные вdefiКаждую ночь робот записывает короткие текстовые «заметки», описывающие произошедшее — например, «Я поставил кастрюлю в раковину» или «Я достал молоко из холодильника».

Эти сводки становятся частью процесса рассуждений робота. По сути, машина сама строит повествование о задаче. Затем механизм рассуждений системы одновременно принимает два решения: какое действие выполнить дальше и какую информацию стоит запомнить. Такое сочетание позволяет модели отслеживать задачи, длящиеся до пятнадцати минут — гораздо дольше, чем большинство предыдущих демонстраций роботов.

Одна из самых интересных возможностей, обеспечиваемых технологией MEM, — это адаптация в контексте. Роботы совершают ошибки. Это неизбежно. Но большинство роботизированных систем бесконечно повторяют эти ошибки, потому что у них нет памяти о сбоях.

Разница становится очевидной на простых экспериментах. В одном из тестов робот пытается поднять плоскую палочку для еды. Без памяти машина многократно пытается сделать один и тот же неудачный захват. С включенной памятью робот запоминает неудачную попытку и пробует другой подход — в конечном итоге добиваясь успеха.

Другой пример — открывание холодильника. На основе одних только визуальных данных робот не может сразу определить, в каком направлении открывается дверца. Система без памяти просто повторяет одно и то же действие снова и снова. Робот с памятью пробует одно направление, запоминает ошибку, а затем пытается открыть противоположную сторону.

Эти небольшие корректировки демонстрируют нечто глубокое: способность к обучению в процессе выполнения задачи. Вместо того чтобы полагаться исключительно на обучающие данные, робот адаптируется на ходу.

Исследователи оценили работу системы, использующей память, на задачах все большей сложности. Сначала была относительно простая задача: приготовление сэндвича с сыром на гриле. Для этого требовалась кратковременная память, чтобы контролировать время выполнения таких деликатных физических действий, как переворачивание хлеба и выкладывание сэндвича на тарелку.

Далее последовала логистическая задача: поиск ингредиентов для рецепта. Робот должен был запомнить, какие предметы он уже собрал, где они находятся и закрыты ли ящики и шкафы. Наконец, настала самая сложная задача: уборка всей кухни.

Это означало расстановку предметов на свои места, мытье посуды, протирку столешниц и отслеживание того, какие части комнаты уже были убраны.

Модель с расширенной памятью значительно превзошла версии без структурированной памяти, продемонстрировав более высокую надежность и показатели выполнения задач.

Эта разница иллюстрирует ключевой сдвиг в робототехнике. Вместо оптимизации отдельных действий исследователи теперь создают системы, способные к выполнению длительных рабочих процессов.

Почему память — следующий рубеж в робототехнике

Более широкое значение MEM заключается в том, что робототехника вступает в новую фазу. На протяжении десятилетий эта область фокусировалась на восприятии и управлении: помогая машинам видеть мир и манипулировать объектами. В последнее время большие мультимодальные модели значительно улучшили способность роботов интерпретировать инструкции и выполнять сложные двигательные действия.

Но по мере развития этих возможностей узкое место смещается. Следующая задача — когнитивная непрерывность, то есть обеспечение возможности роботам работать в течение длительных периодов времени, не теряя из виду свои цели. Системы памяти, такие как MEM, обеспечивают основу для этой непрерывности. Вместо того чтобы реагировать в каждый конкретный момент, роботы могут поддерживать внутреннюю историю своих действий, решений и окружающей среды. Именно эта история позволяет возникать сложному поведению.

Если этот подход продолжит развиваться, последствия выйдут далеко за рамки уборки кухни. Роботам будущего, возможно, придётся выполнять инструкции, которые будут разворачиваться в течение нескольких часов или даже дней. Представьте, что вы говорите домашнему помощнику:

«Я прихожу домой в 6 вечера — пожалуйста, приготовьте ужин и уберитесь в доме по средам».

Выполнение подобного запроса потребовало бы анализа длинных инструкций, планирования подзадач, отслеживания прогресса и адаптации в случае возникновения проблем.

Хранить необработанную видеозапись каждого действия в течение такого длительного времени было бы невозможно. Вместо этого роботы, скорее всего, будут полагаться на иерархические системы памяти, где опыт сжимается во все более абстрактные представления.

MEM — это первый шаг к созданию такой архитектуры. Он предполагает, что ключом к созданию более совершенных роботов могут быть не более мощные двигатели или более точные датчики, а улучшенная память — и способность рассуждать на её основе. Если роботы наконец смогут запоминать, что они делают, они, наконец, смогут и завершить работу.

Условия использования

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Алиса, преданный журналист MPostспециализируется на криптовалютах, искусственном интеллекте, инвестициях и обширной сфере... Web3. Внимательно следя за новыми тенденциями и технологиями, она всесторонне освещает события, информируя и вовлекая читателей в постоянно развивающуюся среду цифровых финансов.

Другие статьи
Алиса Дэвидсон
Алиса Дэвидсон

Алиса, преданный журналист MPostспециализируется на криптовалютах, искусственном интеллекте, инвестициях и обширной сфере... Web3. Внимательно следя за новыми тенденциями и технологиями, она всесторонне освещает события, информируя и вовлекая читателей в постоянно развивающуюся среду цифровых финансов.

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Затишье перед штормом Солана: что сейчас говорят графики, киты и сигналы в цепочке

Solana продемонстрировала высокие результаты, обусловленные растущим принятием, институциональным интересом и ключевыми партнерствами, несмотря на потенциальные...

Узнать больше

Криптовалюта в апреле 2025 года: основные тенденции, сдвиги и что будет дальше

В апреле 2025 года криптопространство сосредоточилось на укреплении базовой инфраструктуры, а Ethereum готовился к Pectra ...

Узнать больше
Читать
Читать далее
Уолл-стрит усиливает давление на криптовалюты на фоне столкновения заявки Goldman Sachs на регистрацию ETF и дебатов о квантовой механике с стагнацией цены биткоина.
Области применения: Новостной репортаж Технология
Уолл-стрит усиливает давление на криптовалюты на фоне столкновения заявки Goldman Sachs на регистрацию ETF и дебатов о квантовой механике с стагнацией цены биткоина.
17 апреля 2026
Помимо сторонних мостов: Ramp Network запускает интегрированный кошелек для упрощения доступа к криптовалютам в различных блокчейнах.
Новостной репортаж Технология
Помимо сторонних мостов: Ramp Network запускает интегрированный кошелек для упрощения доступа к криптовалютам в различных блокчейнах.
17 апреля 2026
Компания Perplexity выпустила приложение для Mac под названием «Персональный компьютер», обеспечивающее постоянную работу агентов искусственного интеллекта в локальных системах и облачных рабочих процессах.
Новостной репортаж Технология
Компания Perplexity выпустила приложение для Mac под названием «Персональный компьютер», обеспечивающее постоянную работу агентов искусственного интеллекта в локальных системах и облачных рабочих процессах.
17 апреля 2026
Биткоин оказался в эпицентре макроэкономического конфликта: Артур Хейз предупреждает о дефляции, вызванной искусственным интеллектом, и неопределенности ликвидности.
Области применения: Новостной репортаж Технология
Биткоин оказался в эпицентре макроэкономического конфликта: Артур Хейз предупреждает о дефляции, вызванной искусственным интеллектом, и неопределенности ликвидности.
17 апреля 2026
CRYPTOMERIA LABS PTE. ООО