Vélemény Technológia
Március 05, 2026

A fizikai intelligencia bevezeti a MEM architektúrát, hogy a robotok megkapják a valós feladatokhoz szükséges memóriát

Röviden

A kutatók kifejlesztették a Multi-Scale Embodied Memory (Multi-Scale Embodied Memory) nevű rendszert, amely rövid és hosszú távú memóriát biztosít a robotoknak, így nyomon követhetik a haladást és összetett feladatokat végezhetnek el ahelyett, hogy csak elszigetelt műveleteket hajtanának végre. 

A fizikai intelligencia bevezeti a MEM architektúrát, hogy a robotok megkapják a valós feladatokhoz szükséges memóriát

Évekig megtévesztően közel volt az álom egy igazán hasznos háztartási robotról. A robotok már képesek olyan parancsokat követni, mint a „mosd el a serpenyőt”, „hajtogasd össze a ruhát” vagy „készíts szendvicset”. Laboratóriumi környezetben ezek a rendszerek lenyűgöző ügyességet és pontosságot mutatnak. A robotikai alapmodellek gyors fejlődése ellenére azonban valami alapvető hiányzik: a memória.

Egy robot, amely egyetlen feladatot képes elvégezni, nem ugyanaz, mint egy robot, amelyik egy egész munkát el tud végezni. Egy egész konyha kitakarítása, egy étel elkészítése vagy egy recepthez tartozó hozzávalók előkészítése többet igényel, mint elszigetelt készségeket. Folytonosságot igényel – a képességet, hogy emlékezzünk arra, mi lett már megcsinálva, mi kell még megtörténnie, és hol van minden. E narratív szál nélkül még a legképzettebb robot is meglepően alkalmatlanná válik.

Ezt a kihívást próbálják megoldani a Physical Intelligence kutatói egy új architektúrával, a Multi-Scale Embodied Memory (MEM) névre keresztelt rendszerrel – ez egy olyan rendszer, amely rövid és hosszú távú memóriát is biztosít a robotoknak, így olyan feladatokat tudnak végrehajtani, amelyek percek alatt, nem pedig másodpercek alatt bontakoznak ki.

Az eredmények valami fontosra utalnak: a robotika jövője kevésbé függhet a jobb mechanikus kezektől, és inkább a jobb kognitív architektúrától.

A modern robotmodellek már figyelemre méltó motoros készségtárral rendelkeznek. Képesek megfogni a törékeny tárgyakat, kezelni az eszközöket és eligazodni a zsúfolt környezetben. De ha megkérünk egy robotot, hogy takarítson ki egy teljes konyhát – törölje le a pultokat, pakolja el a bevásárlást, mosogasson el és rendszerezze az eszközöket –, a korlátok gyorsan nyilvánvalóvá válnak.

A probléma nem magukkal a készségekkel van, hanem azzal, hogyan koordinálódnak ezek a készségek. Az összetett feladatok kitartó figyelmet igényelnek. Egy robotnak emlékeznie kell arra, hogy mely szekrényeket nyitotta már ki, hová tette az edény fedelét, vagy hogy elmosogatott-e már egy edényt. Követnie kell a látóteréből kikerülő tárgyakat is, és mentális térképet kell fenntartania a környezetről, miközben új műveleteket hajt végre.

Az emberi kogníció ezt könnyedén végzi. A gépek egészen a közelmúltig nem tették. Számítási szempontból kivitelezhetetlen, hogy egy robot minden egyes megfigyelését percekig vagy órákig tárolja. Az információk elvetése azonban kaotikus viselkedéshez vezet – ismétlődő hibákhoz, elfelejtett lépésekhez vagy olyan cselekedetekhez, amelyek ellentmondanak a korábbi döntéseknek. A robotikai kutatásokban ezt a kihívást néha „oksági zavarként” írják le, ahol a rendszerek félreértelmezik a múltbeli eseményeket, és megerősítik a helytelen viselkedést.

Az eredmény: olyan robotok, amelyek rövid demókon lenyűgözőnek tűnnek, de a valós feladatok elvégzésével nehezen boldogulnak.

Fizikai intelligencia memóriarendszere

A MEM architektúra ezt a problémát egy többrétegű memória-struktúra bevezetésével oldja meg. Ahelyett, hogy mindent egyformán tárolna, a rendszer két egymást kiegészítő formára osztja a memóriát:

A rövid távú vizuális memória egy hatékony videokódoló architektúra segítségével rögzíti a legutóbbi megfigyeléseket. Ez lehetővé teszi a robot számára, hogy megértse a mozgást, kövesse az objektumokat a képkockákon keresztül, és emlékezzen a másodpercekkel ezelőtt történt eseményekre – ami kulcsfontosságú a precíz műveletekhez, például egy grillezett sajtos szendvics megfordításához vagy egy edény súrolásához.

A hosszú távú fogalmi memória eközben természetes nyelven tárolja a feladatok előrehaladását. A nyers vizuális adatok megjegyzése helyettdefiA robot végül rövid szöveges „jegyzeteket” ír, amelyekben leírja a történteket – például: „Betettem a kannát a mosogatóba” vagy „Kivettem a tejet a hűtőből”.

Ezek az összefoglalások a robot érvelési folyamatának részévé válnak. Lényegében a gép felépíti a feladat saját narratíváját. A rendszer gondolkodó motorja ezután két dolgot dönt egyszerre: milyen műveletet hajtson végre legközelebb, és milyen információkat érdemes megjegyezni. Ez a kombináció lehetővé teszi a modell számára, hogy akár tizenöt percig tartó feladatokat is nyomon kövessen – ez jóval hosszabb, mint a legtöbb korábbi robotikai bemutató.

Az MEM által lehetővé tett egyik legérdekesebb képesség a kontextushoz való alkalmazkodás. A robotok hibáznak. Ez elkerülhetetlen. De a legtöbb robotrendszer ezeket a hibákat a végtelenségig megismétli, mert nincsenek emlékeik a hibákra.

A különbség egyszerű kísérletekben nyilvánvalóvá válik. Az egyik tesztben egy robot megpróbál felvenni egy lapos evőpálcikát. Memória nélkül a gép ismételten ugyanazzal a sikertelen fogási kísérlettel próbálkozik. Ha a memória engedélyezve van, a robot emlékszik a sikertelen kísérletre, és egy másik megközelítést próbál ki – végül sikerrel.

Egy másik példa egy hűtőszekrény kinyitása. A vizuális adatok alapján a robot nem tudja azonnal meghatározni, hogy melyik irányba nyílik az ajtó. Egy memória nélküli rendszer egyszerűen ugyanazt a műveletet ismétli újra és újra. Egy memóriával rendelkező robot megpróbálkozik az egyik irányba, megjegyzi a hibát, majd az ellenkező oldallal próbálkozik.

Ezek az apró módosítások valami mélyrehatót képviselnek: a feladaton belüli tanulás képességét. Ahelyett, hogy teljes mértékben a betanítási adatokra hagyatkozna, a robot menet közben alkalmazkodik.

A kutatók egyre összetettebb feladatokon értékelték a memóriával működő rendszert. Először egy viszonylag egyszerű kihívás következett: egy grillezett sajtos szendvics elkészítése. Ehhez rövid távú memóriára volt szükség az időzítés kezeléséhez olyan finom fizikai lépések végrehajtása közben, mint a kenyér megfordítása és a szendvics tálalása.

Ezután egy logisztikai feladat következett: hozzávalók begyűjtése egy recepthez. A robotnak emlékeznie kellett arra, hogy mely hozzávalókat gyűjtötte már össze, hol találhatók azok, és hogy a fiókok és szekrények be vannak-e zárva. Végül jött a legnehezebb forgatókönyv: egy egész konyha kitakarítása.

Ez azt jelentette, hogy el kellett pakolni a tárgyakat, elmosogatni, feltörölni a konyhapultot, és nyomon kellett követni, hogy a szoba mely részeit takarították már ki.

A memóriával bővített modell jelentősen felülmúlta a strukturált memória nélküli verziókat, nagyobb megbízhatóságot és feladatvégzési arányt mutatva.

A különbség a robotika egyik kulcsfontosságú változását illusztrálja. Az elszigetelt műveletek optimalizálása helyett a kutatók most olyan rendszereket építenek, amelyek képesek fenntartható munkafolyamatokra.

Miért a memória a robotika következő határterülete?

A MEM tágabb értelemben vett következménye, hogy a robotika új szakaszba lép. Évtizedekig a terület az érzékelésre és az irányításra összpontosított: a gépek segítésére a világ látásában és a tárgyak manipulálásában. Újabban a nagyméretű multimodális modellek drámaian javították a robotok azon képességét, hogy utasításokat értelmezzenek és összetett motoros viselkedéseket hajtsanak végre.

De ahogy ezek a képességek fejlődnek, a szűk keresztmetszet eltűnik. A következő kihívás a kognitív folytonosság – lehetővé tenni a robotok számára, hogy hosszabb ideig működjenek anélkül, hogy elveszítenék céljaik szem elől a figyelmet. Az olyan memóriarendszerek, mint a MEM, biztosítják ennek a folytonosságnak az állványzatát. Ahelyett, hogy pillanatról pillanatra reagálnának, a robotok belső narratívát tudnak fenntartani tetteikről, döntéseikről és környezetükről. Ez a narratíva teszi lehetővé az összetett viselkedés kialakulását.

Ha ez a megközelítés tovább fejlődik, a következmények messze túlmutatnak a konyhák takarításán. A jövő robotjainak olyan utasításokat kell majd követniük, amelyek órákig, vagy akár napokig is eltelnek. Képzeljük el, hogy ezt mondjuk egy otthoni asszisztensnek:

„Este 6-kor érek haza – kérlek, szerdánként készítsd el a vacsorát és takarítsd ki a házat.”

Egy ilyen kérés végrehajtása hosszú utasítások elemzését, részfeladatok megtervezését, a haladás megjegyzését és az alkalmazkodást igényelné, ha a dolgok rosszul mennek.

Lehetetlen lenne ilyen hosszú ideig nyers videóelőzményeket tárolni minden egyes műveletről. Ehelyett a robotok valószínűleg hierarchikus memóriarendszerekre fognak támaszkodni, ahol a tapasztalatokat egyre absztraktabb reprezentációkká sűrítik.

A MEM egy korai lépés e architektúra felé. Azt sugallja, hogy a hatékonyabb robotok kulcsa nem az erősebb motorokban vagy az élesebb érzékelőkben rejlik, hanem a jobb memóriában – és abban, hogy képesek legyenek gondolkodni rajta. Ha a robotok végre emlékezni tudnak arra, hogy mit csinálnak, akkor végre be is tudják fejezni a munkát.

Jogi nyilatkozat

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Alisa, a The MPost, kriptovalutákra, mesterséges intelligenciára, befektetésekre és a világ kiterjedt területére specializálódott Web3. Élénk szemmel figyeli a feltörekvő trendeket és technológiákat, ezért átfogó tájékoztatást nyújt, hogy tájékoztassa és bevonja olvasóit a digitális pénzügyek folyamatosan fejlődő világába.

További cikkek
Alisa Davidson
Alisa Davidson

Alisa, a The MPost, kriptovalutákra, mesterséges intelligenciára, befektetésekre és a világ kiterjedt területére specializálódott Web3. Élénk szemmel figyeli a feltörekvő trendeket és technológiákat, ezért átfogó tájékoztatást nyújt, hogy tájékoztassa és bevonja olvasóit a digitális pénzügyek folyamatosan fejlődő világába.

Hot Stories
Csatlakozzon hírlevelünkhöz.
Legfrissebb hírek

A Solana-vihar előtti csend: Mit mondanak most a grafikonok, a bálnák és a láncon lévő jelek?

A Solana erős teljesítményt mutatott, amelyet a növekvő elfogadás, az intézményi érdeklődés és a kulcsfontosságú partnerségek vezéreltek, miközben potenciális ...

Tudjon meg többet

Kriptovaluták 2025 áprilisában: Főbb trendek, változások és mi következik?

2025 áprilisában a kriptovilág az alapvető infrastruktúra megerősítésére összpontosított, az Ethereum pedig a Pectra ...

Tudjon meg többet
További információk
Részletek
Az Oxford mesterséges intelligenciája 86%-os pontossággal mutatja ki a korai szívelégtelenség kockázatát rutin CT-vizsgálatok alapján 72 000 beteg bevonásával.
Vélemény Technológia
Az Oxford mesterséges intelligenciája 86%-os pontossággal mutatja ki a korai szívelégtelenség kockázatát rutin CT-vizsgálatok alapján 72 000 beteg bevonásával.
April 10, 2026
A Perplexity elindítja a Plaid Integrationt, mesterséges intelligenciával működő „számítógépes” ügynökét személyes pénzügyi központtá alakítva
Tudósítást Technológia
A Perplexity elindítja a Plaid Integrationt, mesterséges intelligenciával működő „számítógépes” ügynökét személyes pénzügyi központtá alakítva
April 10, 2026
Inside Hack Seasons konferencia Cannes-ban: Szakértők feltárják a teszthálózattól a mainnetig tartó működési tanulságokat
Hack Seasons Interjú üzleti Életmód
Inside Hack Seasons konferencia Cannes-ban: Szakértők feltárják a teszthálózattól a mainnetig tartó működési tanulságokat
April 10, 2026
A DISCO áttöri az enzimtervezési akadályt, olyan fehérjéket hozva létre, amelyeknek nincs megfelelője a természetben
Vélemény Technológia
A DISCO áttöri az enzimtervezési akadályt, olyan fehérjéket hozva létre, amelyeknek nincs megfelelője a természetben
April 10, 2026
CRYPTOMERIA LABS PTE. KFT.