Mišljenje Tehnologija
05. ožujka 2026.

Fizička inteligencija uvodi MEM arhitekturu kako bi robotima pružila memoriju potrebnu za zadatke iz stvarnog svijeta

Ukratko

Istraživači su razvili Multi-Scale Embodied Memory, sustav koji robotima daje kratkoročno i dugoročno pamćenje kako bi mogli pratiti napredak i dovršavati složene zadatke umjesto da samo izvršavaju izolirane radnje. 

Fizička inteligencija uvodi MEM arhitekturu kako bi robotima pružila memoriju potrebnu za zadatke iz stvarnog svijeta

Godinama je san o uistinu korisnom kućnom robotu bio varljivo blizu. Roboti već mogu slijediti naredbe poput "operi tavu", "složi rublje" ili "napravi sendvič". U laboratorijskim okruženjima ovi sustavi pokazuju impresivnu spretnost i preciznost. No, unatoč brzom napretku u modelima robotskih temelja, nešto temeljno nedostaje: pamćenje.

Robot koji može izvršiti jedan zadatak nije isto što i robot koji može dovršiti cijeli posao. Čišćenje cijele kuhinje, kuhanje obroka ili priprema sastojaka za recept zahtijeva više od izoliranih vještina. Potreban je kontinuitet - sposobnost pamćenja što je već učinjeno, što se još treba dogoditi i gdje se što nalazi. Bez te narativne niti, čak i najsposobniji robot postaje iznenađujuće nesposoban.

To je izazov koji istraživači u tvrtki Physical Intelligence sada pokušavaju riješiti novom arhitekturom nazvanom Multi-Scale Embodied Memory (MEM) - sustavom dizajniranim da robotima pruži i kratkoročno i dugoročno pamćenje kako bi mogli obavljati zadatke koji se odvijaju u roku od nekoliko minuta umjesto sekundi.

Rezultati ukazuju na nešto važno: budućnost robotike mogla bi manje ovisiti o boljim mehaničkim rukama, a više o boljoj kognitivnoj arhitekturi.

Moderni robotski modeli već posjeduju izvanrednu biblioteku motoričkih vještina. Mogu hvatati krhke predmete, manipulirati alatima i snalaziti se u pretrpanom okruženju. Ali zamolite robota da očisti cijelu kuhinju - obriše radne ploče, pospremi namirnice, opere posuđe i organizira pribor - i ograničenja brzo postaju očita.

Problem nisu same vještine. Problem je u tome kako su te vještine koordinirane. Složeni zadaci zahtijevaju stalnu svjesnost. Robot mora pamtiti koje je ormariće već otvorio, gdje je stavio poklopac od lonca ili je li već oprao suđe. Također mora pratiti objekte koji nestaju iz vidokruga i održavati mentalnu mapu okoline dok izvodi nove radnje.

Ljudska spoznaja to čini bez napora. Strojevi, do nedavno, nisu. Pohranjivanje svakog opažanja koje robot vidi na nekoliko minuta ili sati računalno je neizvedivo. Ali odbacivanje tih informacija dovodi do kaotičnog ponašanja - ponovljenih pogrešaka, zaboravljenih koraka ili radnji koje su u suprotnosti s ranijim odlukama. U istraživanjima robotike, ovaj se izazov ponekad opisuje kao "uzročna zbrka", gdje sustavi pogrešno tumače prošle događaje i pojačavaju pogrešna ponašanja.

Rezultat: roboti koji izgledaju impresivno u kratkim demonstracijama, ali se muče s izvršavanjem zadataka u stvarnom svijetu.

Memorijski sustav za fizičku inteligenciju

MEM arhitektura rješava ovaj problem uvođenjem višeslojne memorijske strukture. Umjesto da sve pohranjuje jednako, sustav dijeli memoriju u dva komplementarna oblika:

Kratkoročno vizualno pamćenje bilježi nedavna zapažanja pomoću učinkovite arhitekture video kodiranja. To robotu omogućuje razumijevanje kretanja, praćenje objekata kroz kadrove i pamćenje događaja koji su se dogodili prije nekoliko sekundi - što je ključno za precizne radnje poput okretanja sendviča sa sirom ili ribanja posuđa.

Dugoročno konceptualno pamćenje, s druge strane, pohranjuje napredak zadatka na prirodnom jeziku. Umjesto pamćenja sirovih vizualnih podataka nadefiKonačno, robot piše kratke tekstualne „bilješke“ opisujući što se dogodilo - izjave poput „Stavio sam lonac u sudoper“ ili „Izvadio sam mlijeko iz hladnjaka“.

Ovi sažeci postaju dio robotskog procesa zaključivanja. U stvari, stroj gradi vlastitu priču o zadatku. Sustavski mehanizam zaključivanja zatim istovremeno odlučuje o dvije stvari: koju radnju treba izvesti sljedeću i koje informacije vrijedi zapamtiti. Ova kombinacija omogućuje modelu praćenje zadataka koji traju do petnaest minuta - daleko dulje od većine prethodnih robotskih demonstracija.

Jedna od najzanimljivijih sposobnosti koje omogućuje MEM je prilagodba kontekstu. Roboti griješe. To je neizbježno. Ali većina robotskih sustava beskrajno ponavlja te pogreške jer nemaju pamćenje na kvar.

Razlika postaje očita u jednostavnim eksperimentima. U jednom testu, robot pokušava podići ravni štapić za jelo. Bez memorije, stroj opetovano pokušava isti neuspješni hvat. S omogućenom memorijom, robot pamti neuspjeli pokušaj i pokušava drugačiji pristup - na kraju uspijevajući.

Drugi primjer uključuje otvaranje hladnjaka. Samo na temelju vizualnih podataka, robot ne može odmah odrediti u kojem se smjeru vrata otvaraju. Sustav bez memorije jednostavno ponavlja istu radnju iznova i iznova. Robot s memorijom pokušava u jednom smjeru, pamti neuspjeh, a zatim pokušava u suprotnom smjeru.

Ove male prilagodbe predstavljaju nešto duboko: sposobnost učenja unutar samog zadatka. Umjesto da se u potpunosti oslanja na podatke o obuci, robot se prilagođava u hodu.

Istraživači su procjenjivali sustav omogućen pamćenjem na sve složenijim zadacima. Prvo se pojavio relativno jednostavan izazov: izrada sendviča s pečenim sirom. To je zahtijevalo kratkoročno pamćenje za upravljanje vremenom tijekom izvođenja delikatnih fizičkih koraka poput okretanja kruha i stavljanja sendviča na tanjur.

Sljedeći je bio logistički zadatak: prikupljanje sastojaka za recept. Robot se morao sjetiti koje je artikle već prikupio, gdje se nalaze i jesu li ladice i ormarići bili zatvoreni. Konačno je došao najzahtjevniji scenarij: čišćenje cijele kuhinje.

To je značilo pospremanje predmeta, pranje posuđa, brisanje radnih ploča i praćenje koji su dijelovi sobe već očišćeni.

Model s proširenom memorijom značajno je nadmašio verzije bez strukturirane memorije, pokazujući veću pouzdanost i stopu dovršetka zadataka.

Razlika ilustrira ključni pomak u robotici. Umjesto optimizacije izoliranih radnji, istraživači sada grade sustave sposobne za održive tijekove rada.

Zašto je pamćenje sljedeća granica u robotici

Šira implikacija MEM-a je da robotika ulazi u novu fazu. Desetljećima se područje usredotočivalo na percepciju i kontrolu: pomaganje strojevima da vide svijet i manipuliraju objektima. U novije vrijeme, veliki multimodalni modeli dramatično su poboljšali sposobnost robota da interpretiraju upute i izvršavaju složena motorička ponašanja.

No kako te sposobnosti sazrijevaju, usko grlo se pomiče. Sljedeći izazov je kognitivni kontinuitet - omogućavanje robotima da djeluju dulje vrijeme bez gubitka traga o svojim ciljevima. Memorijski sustavi poput MEM-a pružaju osnovu za taj kontinuitet. Umjesto da reagiraju iz trenutka u trenutak, roboti mogu održavati unutarnju priču o svojim radnjama, odlukama i okruženju. Ta priča omogućuje pojavu složenog ponašanja.

Ako se ovaj pristup nastavi razvijati, implikacije sežu daleko izvan čišćenja kuhinja. Budući roboti možda će morati slijediti upute koje se odvijaju satima ili čak danima. Zamislite da kućnom asistentu kažete:

„Dolazim kući u 6 sati - molim te, pripremi večeru i očisti kuću srijedom.“

Izvršavanje takvog zahtjeva zahtijevalo bi parsiranje dugih instrukcija, planiranje podzadataka, pamćenje napretka i prilagođavanje kada stvari krenu po zlu.

Održavanje sirove video povijesti svake radnje toliko dugo bilo bi nemoguće. Umjesto toga, roboti će se vjerojatno oslanjati na hijerarhijske memorijske sustave, gdje se iskustva komprimiraju u sve apstraktnije prikaze.

MEM je rani korak prema toj arhitekturi. To sugerira da ključ za sposobnije robote možda nisu jači motori ili oštriji senzori, već bolje pamćenje - i sposobnost rasuđivanja o tome. Ako se roboti konačno mogu sjetiti što rade, možda će konačno moći i dovršiti posao.

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Alisa, predana novinarka u MPost, specijaliziran za kriptovalute, umjetnu inteligenciju, ulaganja i široko područje Web3. S oštrim okom za nove trendove i tehnologije, ona pruža sveobuhvatnu pokrivenost kako bi informirala i uključila čitatelje u krajolik digitalnih financija koji se neprestano razvija.

Više članaka
Alisa Davidson
Alisa Davidson

Alisa, predana novinarka u MPost, specijaliziran za kriptovalute, umjetnu inteligenciju, ulaganja i široko područje Web3. S oštrim okom za nove trendove i tehnologije, ona pruža sveobuhvatnu pokrivenost kako bi informirala i uključila čitatelje u krajolik digitalnih financija koji se neprestano razvija.

Hot Stories
Pridružite se našem biltenu.
Najnovije vijesti

Zatišje prije oluje Solana: Što sada govore grafikoni, kitovi i signali na lancu

Solana je pokazala snažne rezultate, potaknute sve većim usvajanjem, institucionalnim interesom i ključnim partnerstvima, dok se istovremeno suočava s potencijalnim ...

Znati više

Kriptovalute u travnju 2025.: Ključni trendovi, promjene i što slijedi

U travnju 2025. kripto prostor se usredotočio na jačanje osnovne infrastrukture, a Ethereum se pripremao za Pectru ...

Znati više
Pročitaj više
Pročitaj više
Oxford AI otkriva rani rizik od zatajenja srca iz rutinskih CT skeniranja s točnošću od 86% kod 72 000 pacijenata
Mišljenje Tehnologija
Oxford AI otkriva rani rizik od zatajenja srca iz rutinskih CT skeniranja s točnošću od 86% kod 72 000 pacijenata
Travnja 10, 2026
Perplexity pokreće integraciju s Plaidom, transformirajući svog AI 'računalnog' agenta u središte za osobne financije
Vijesti Tehnologija
Perplexity pokreće integraciju s Plaidom, transformirajući svog AI 'računalnog' agenta u središte za osobne financije
Travnja 10, 2026
Konferencija Inside Hack Seasons u Cannesu: Stručnjaci otkrivaju operativne lekcije od testneta do glavne mreže
Hack Seasons Intervju posao Lifestyle
Konferencija Inside Hack Seasons u Cannesu: Stručnjaci otkrivaju operativne lekcije od testneta do glavne mreže
Travnja 10, 2026
DISCO ruši barijeru dizajna enzima, stvarajući proteine ​​bez ekvivalenta u prirodi
Mišljenje Tehnologija
DISCO ruši barijeru dizajna enzima, stvarajući proteine ​​bez ekvivalenta u prirodi
Travnja 10, 2026
CRYPTOMERIA LABS PTE. LTD.