Мнение Технологии
Март 05, 2026

Физическият интелект въвежда MEM архитектура, за да осигури на роботите паметта, необходима за реални задачи

Накратко

Изследователите разработиха Multi-Scale Embodied Memory, система, която дава на роботите краткосрочна и дългосрочна памет, така че те да могат да проследяват напредъка си и да изпълняват сложни задачи, вместо просто да изпълняват изолирани действия. 

Физическият интелект въвежда MEM архитектура, за да осигури на роботите паметта, необходима за реални задачи

В продължение на години мечтата за наистина полезен домашен робот беше измамно близо. Роботите вече могат да следват команди като „измий тигана“, „сгъни прането“ или „направи сандвич“. В лабораторни условия тези системи демонстрират впечатляваща сръчност и прецизност. И все пак, въпреки бързия напредък в моделите на роботизирани основи, нещо фундаментално липсва: паметта.

Робот, който може да изпълни само една задача, не е същото като робот, който може да завърши работа. Почистването на цяла кухня, готвенето на храна или приготвянето на съставки за рецепта изисква повече от изолирани умения. Изисква се приемственост - способността да се помни какво вече е направено, какво все още трябва да се случи и къде се намира всичко. Без тази наративна нишка, дори най-способният робот става изненадващо некомпетентен.

Това е предизвикателството, което изследователите от Physical Intelligence сега се опитват да решат с нова архитектура, наречена Multi-Scale Embodied Memory (MEM) - система, предназначена да даде на роботите както краткосрочна, така и дългосрочна памет, така че те да могат да изпълняват задачи, които се разгръщат за минути, вместо за секунди.

Резултатите намекват за нещо важно: бъдещето на роботиката може да зависи по-малко от по-добри механични ръце и повече от по-добра когнитивна архитектура.

Съвременните роботизирани модели вече притежават забележителна библиотека от двигателни умения. Те могат да хващат крехки предмети, да манипулират инструменти и да се ориентират в претрупана среда. Но ако помолите робот да почисти пълна кухня – да избърше плотове, да прибере хранителни стоки, да измие чинии и да организира прибори – ограниченията бързо стават очевидни.

Проблемът не е в самите умения. Проблемът е в това как тези умения са координирани. Сложните задачи изискват постоянна осъзнатост. Роботът трябва да помни кои шкафове вече е отварял, къде е поставил капак на тенджера или дали вече е измил чиния. Той също така трябва да следи обекти, които излизат от полезрението, и да поддържа ментална карта на околната среда, докато извършва нови действия.

Човешкото познание прави това без усилие. Машините доскоро не го правеха. Съхраняването на всяко наблюдение, което роботът вижда, за минути или часове е изчислително невъзможно. Но изхвърлянето на тази информация води до хаотично поведение - повтарящи се грешки, забравени стъпки или действия, които противоречат на по-ранни решения. В изследванията на роботиката това предизвикателство понякога се описва като „причинно-следствено объркване“, при което системите погрешно интерпретират минали събития и подсилват грешното поведение.

Резултатът: роботи, които изглеждат впечатляващо в кратки демонстрации, но се затрудняват да изпълняват задачи в реалния свят.

Система за памет за физическа интелигентност

MEM архитектурата решава този проблем чрез въвеждане на многослойна структура на паметта. Вместо да съхранява всичко по равно, системата разделя паметта на две допълващи се форми:

Краткосрочната визуална памет улавя скорошни наблюдения, използвайки ефикасна архитектура за видеокодиране. Това позволява на робота да разбира движението, да проследява обекти в кадрите и да запомня събития, случили се преди секунди – което е от решаващо значение за прецизни действия като обръщане на сандвич със сирене на скара или миене на чиния.

Дългосрочната концептуална памет, от друга страна, съхранява напредъка на задачата на естествен език. Вместо да запомня сурови визуални данни наdefiВ крайна сметка роботът пише кратки текстови „бележки“, описващи какво се е случило – твърдения като „Поставих тенджерата в мивката“ или „Извадих млякото от хладилника“.

Тези обобщения стават част от процеса на разсъждение на робота. Всъщност машината изгражда свой собствен разказ за задачата. След това системата за разсъждение решава две неща едновременно: какво действие да извърши следващо и каква информация си струва да се запомни. Тази комбинация позволява на модела да проследява задачи с продължителност до петнадесет минути - много по-дълго от повечето предишни роботизирани демонстрации.

Една от най-интригуващите възможности, предоставени от MEM, е адаптацията в контекст. Роботите правят грешки. Това е неизбежно. Но повечето роботизирани системи повтарят тези грешки безкрайно, защото нямат памет за грешки.

Разликата става очевидна при прости експерименти. В един тест робот се опитва да вземе плоска клечка за хранене. Без памет машината многократно опитва един и същ неуспешен захват. С активирана памет роботът запомня неуспешния опит и опитва различен подход – в крайна сметка успявайки.

Друг пример е отварянето на хладилник. Само от визуални данни роботът не може веднага да определи в коя посока се отваря вратата. Система без памет просто повтаря едно и също действие отново и отново. Робот с памет опитва в едната посока, запомня неуспеха и след това опитва в противоположната посока.

Тези малки корекции представляват нещо дълбоко: способността за учене в рамките на самата задача. Вместо да разчита изцяло на данни от обучението, роботът се адаптира в движение.

Изследователите са оценили системата, работеща с памет, при все по-сложни задачи. Първо се появи сравнително просто предизвикателство: приготвяне на сандвич с грилован кашкавал. Това изискваше краткосрочна памет, за да се управлява времето, докато се извършват деликатни физически стъпки като обръщане на хляба и подреждане на сандвича.

След това дойде логистична задача: извличане на съставки за рецепта. Роботът трябваше да запомни кои артикули вече е събрал, къде се намират и дали чекмеджетата и шкафовете са били затворени. Накрая дойде най-взискателният сценарий: почистване на цяла кухня.

Това означаваше прибиране на предмети, миене на чинии, избърсване на плотове и проследяване кои части от стаята вече са почистени.

Моделът с добавена памет значително превъзхожда версиите без структурирана памет, демонстрирайки по-голяма надеждност и процент на изпълнение на задачи.

Разликата илюстрира ключова промяна в роботиката. Вместо да оптимизират изолирани действия, изследователите сега изграждат системи, способни на устойчиви работни процеси.

Защо паметта е следващата граница в роботиката

По-широкото значение на MEM е, че роботиката навлиза в нова фаза. В продължение на десетилетия областта се фокусираше върху възприятието и контрола: подпомагане на машините да виждат света и да манипулират обекти. Съвсем наскоро големите мултимодални модели драстично подобриха способността на роботите да интерпретират инструкции и да изпълняват сложни двигателни поведения.

Но с развитието на тези възможности, пречката се е преместила. Следващото предизвикателство е когнитивната непрекъснатост - да се даде възможност на роботите да работят за продължителни периоди, без да губят представа за целите си. Системи за памет като MEM осигуряват основата за тази непрекъснатост. Вместо да реагират момент по момент, роботите могат да поддържат вътрешен разказ за своите действия, решения и среда. Този разказ е това, което позволява появата на сложно поведение.

Ако този подход продължи да се развива, последиците ще се простират далеч отвъд почистването на кухни. Бъдещите роботи може да се нуждаят от следване на инструкции, които се развиват в продължение на часове или дори дни. Представете си, че казвате на домашен асистент:

„Прибирам се вкъщи в 18:00 часа — моля, пригответе вечерята и почистете къщата в сряда.“

Изпълнението на такава заявка би изисквало синтактичен анализ на дълги инструкции, планиране на подзадачи, запомняне на напредъка и адаптиране, когато нещата се объркат.

Поддържането на сурова видео история на всяко действие за толкова дълго време би било невъзможно. Вместо това, роботите вероятно ще разчитат на йерархични системи с памет, където преживяванията се компресират във все по-абстрактни представяния.

MEM е ранна стъпка към тази архитектура. Това предполага, че ключът към по-способните роботи може да не са по-мощните двигатели или по-острите сензори, а по-добрата памет – и способността да разсъждават за нея. Ако роботите най-накрая могат да запомнят какво правят, те може би най-накрая ще могат да завършат работата.

Отказ от отговорност

В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.

За автора

Алиса, всеотдаен журналист в MPost, специализира в криптовалути, изкуствен интелект, инвестиции и обширната сфера на Web3. С остър поглед към нововъзникващите тенденции и технологии, тя предоставя изчерпателно покритие, за да информира и ангажира читателите в непрекъснато развиващия се пейзаж на дигиталните финанси.

Още статии
Алиса Дейвидсън
Алиса Дейвидсън

Алиса, всеотдаен журналист в MPost, специализира в криптовалути, изкуствен интелект, инвестиции и обширната сфера на Web3. С остър поглед към нововъзникващите тенденции и технологии, тя предоставя изчерпателно покритие, за да информира и ангажира читателите в непрекъснато развиващия се пейзаж на дигиталните финанси.

Hot Stories
Присъединете се към нашия бюлетин.
Последни новини

Спокойствието преди бурята Солана: Какво казват графиките, китовете и сигналите на веригата сега

Солана демонстрира силно представяне, обусловено от нарастващото приемане, институционалния интерес и ключовите партньорства, като същевременно е изправена пред потенциални...

Научете още

Крипто през април 2025 г.: Ключови тенденции, промени и какво предстои

През април 2025 г. крипто пространството се фокусира върху укрепването на основната инфраструктура, като Ethereum се подготвяше за Pectra ...

Научете още
Прочетете повече
Прочетете повече
Aptos и NETSTARS си партнират за напредък Web3 Плащания и инфраструктура за разплащания, базирана на стейбълкойни
Новини Технологии
Aptos и NETSTARS си партнират за напредък Web3 Плащания и инфраструктура за разплащания, базирана на стейбълкойни
Май 8, 2026
Google стартира здравна платформа, задвижвана от изкуствен интелект, с Gemini Coach и новия Fitbit Air Wearable
Новини Технологии
Google стартира здравна платформа, задвижвана от изкуствен интелект, с Gemini Coach и новия Fitbit Air Wearable
Май 8, 2026
HSC Asset Management Хонконг: Вътрешното рестартиране на инвестициите в Азия, тъй като капиталовите, крипто и частните пазари се сливат
Хакване на сезони Интервю Бизнес Lifestyle Технологии
HSC Asset Management Хонконг: Вътрешното рестартиране на инвестициите в Азия, тъй като капиталовите, крипто и частните пазари се сливат
Май 8, 2026
НОВ OpenAI Аудио моделите захранват гласови асистенти в реално време с многоезичен превод и стрийминг интелигентност
Новини Технологии
НОВ OpenAI Аудио моделите захранват гласови асистенти в реално време с многоезичен превод и стрийминг интелигентност
Май 8, 2026
CRYPTOMERIA LABS PTE. LTD.