Mnenje Tehnologija
Marec 05, 2026

Fizična inteligenca uvaja arhitekturo MEM, ki robotom zagotavlja pomnilnik, potreben za naloge v resničnem svetu

Na kratko

Raziskovalci so razvili večstopenjski utelešeni pomnilnik, sistem, ki robotom omogoča kratkoročni in dolgoročni spomin, da lahko spremljajo napredek in opravljajo kompleksne naloge, namesto da bi izvajali le posamezna dejanja. 

Fizična inteligenca uvaja arhitekturo MEM, ki robotom zagotavlja pomnilnik, potreben za naloge v resničnem svetu

Že leta so bile sanje o resnično uporabnem gospodinjskem robotu varljivo blizu. Roboti že lahko sledijo ukazom, kot so »pomij ponev«, »zloži perilo« ali »naredi sendvič«. V laboratorijskih okoljih ti sistemi kažejo impresivno spretnost in natančnost. Kljub hitremu napredku v modelih robotskih temeljev pa nekaj bistvenega manjka: spomin.

Robot, ki lahko izvede eno samo nalogo, ni enak robotu, ki lahko dokonča delo. Čiščenje celotne kuhinje, kuhanje obroka ali priprava sestavin za recept zahteva več kot le izolirane spretnosti. Zahteva kontinuiteto – sposobnost zapomniti si, kaj je že bilo storjeno, kaj se mora še zgoditi in kje se kaj nahaja. Brez te pripovedne niti postane tudi najbolj sposoben robot presenetljivo nesposoben.

To je izziv, ki ga raziskovalci pri Physical Intelligence zdaj poskušajo rešiti z novo arhitekturo, imenovano Multi-Scale Embodied Memory (MEM) – sistemom, zasnovanim tako, da robotom zagotavlja tako kratkoročni kot dolgoročni spomin, da lahko opravljajo naloge, ki se odvijajo v nekaj minutah namesto v nekaj sekundah.

Rezultati namigujejo na nekaj pomembnega: prihodnost robotike je morda manj odvisna od boljših mehanskih rok in bolj od boljše kognitivne arhitekture.

Sodobni robotski modeli že imajo izjemno zbirko motoričnih spretnosti. Lahko prijemajo krhke predmete, manipulirajo z orodjem in se premikajo po natrpanem okolju. Če pa robota prosite, naj očisti polno kuhinjo – obriše pulte, pospravi živila, pomije posodo in organizira pribor –, omejitve hitro postanejo očitne.

Problem niso same spretnosti. Problem je v tem, kako so te spretnosti usklajene. Kompleksne naloge zahtevajo vztrajno pozornost. Robot si mora zapomniti, katere omarice je že odprl, kam je postavil pokrov lonca ali ali je že pomil posodo. Prav tako mora slediti predmetom, ki izginejo iz vidnega polja, in vzdrževati miselni zemljevid okolja med izvajanjem novih dejanj.

Človeško kognicijo to počne brez napora. Stroji do nedavnega niso. Shranjevanje vsakega opazovanja, ki ga robot vidi, za nekaj minut ali ur je računsko neizvedljivo. Toda zavrženje teh informacij vodi do kaotičnega vedenja – ponavljajočih se napak, pozabljenih korakov ali dejanj, ki so v nasprotju s prejšnjimi odločitvami. V raziskavah robotike se ta izziv včasih opisuje kot »vzročna zmeda«, kjer sistemi napačno interpretirajo pretekle dogodke in krepijo napačna vedenja.

Rezultat: roboti, ki so v kratkih demonstracijah videti impresivno, vendar se težko spopadajo z nalogami v resničnem svetu.

Spominski sistem za fizično inteligenco

Arhitektura MEM rešuje to težavo z uvedbo večplastne pomnilniške strukture. Namesto da bi vse shranjeval enakomerno, sistem loči pomnilnik v dve komplementarni obliki:

Kratkoročni vizualni spomin zajame nedavna opažanja z uporabo učinkovite arhitekture za kodiranje videa. To robotu omogoča razumevanje gibanja, sledenje predmetom po sličicah in pomnjenje dogodkov, ki so se zgodili pred nekaj sekundami – kar je ključnega pomena za natančna dejanja, kot sta obračanje sendviča s sirom na žaru ali drgnjenje posode.

Dolgoročni konceptualni spomin pa shranjuje napredek naloge v naravnem jeziku. Namesto da bi si surove vizualne podatke zapomnil vdefiKončno robot napiše kratke besedilne »zapiske«, v katerih opiše, kaj se je zgodilo – izjave, kot so »Postavil sem lonec v pomivalno korito« ali »Vzel sem mleko iz hladilnika«.

Ti povzetki postanejo del robotovega procesa sklepanja. Stroj dejansko gradi svojo lastno pripoved o nalogi. Sistemski mehanizem sklepanja nato hkrati odloči o dveh stvareh: katero dejanje izvesti in katere informacije si je vredno zapomniti. Ta kombinacija omogoča modelu sledenje nalogam, ki trajajo do petnajst minut – veliko dlje kot večina prejšnjih robotskih demonstracij.

Ena najbolj zanimivih zmogljivosti, ki jih omogoča MEM, je prilagajanje kontekstu. Roboti delajo napake. To je neizogibno. Toda večina robotskih sistemov te napake ponavlja v nedogled, ker se ne spominjajo napak.

Razlika postane očitna že v preprostih poskusih. V enem od preizkusov robot poskuša dvigniti ravno palčko. Brez spomina stroj vedno znova poskuša z istim neuspešnim prijemom. Z omogočenim spominom si robot zapomni neuspešen poskus in poskusi z drugačnim pristopom – na koncu mu uspe.

Drug primer vključuje odpiranje hladilnika. Samo na podlagi vizualnih podatkov robot ne more takoj ugotoviti, v katero smer se vrata odpirajo. Sistem brez pomnilnika preprosto ponavlja isto dejanje znova in znova. Robot s pomnilnikom poskusi v eno smer, si zapomni napako in nato poskusi v nasprotno smer.

Te majhne prilagoditve predstavljajo nekaj globokega: sposobnost učenja znotraj same naloge. Namesto da bi se robot v celoti zanašal na podatke o učenju, se prilagaja sproti.

Raziskovalci so sistem, ki ga omogoča spomin, ocenjevali pri vse bolj kompleksnih nalogah. Najprej je prišel relativno preprost izziv: priprava sendviča s sirom na žaru. To je zahtevalo kratkoročni spomin za upravljanje časa med izvajanjem občutljivih fizičnih korakov, kot sta obračanje kruha in polaganje sendviča na krožnik.

Sledila je logistična naloga: pridobivanje sestavin za recept. Robot si je moral zapomniti, katere izdelke je že zbral, kje so se nahajali in ali so bili predali in omarice zaprti. Na koncu je prišel še najzahtevnejši scenarij: čiščenje celotne kuhinje.

To je pomenilo pospravljanje predmetov, pomivanje posode, brisanje pultov in spremljanje, kateri deli prostora so že bili očiščeni.

Model z razširjenim pomnilnikom je znatno presegel različice brez strukturiranega pomnilnika, saj je pokazal večjo zanesljivost in stopnje dokončanja nalog.

Razlika ponazarja ključni premik v robotiki. Namesto optimizacije izoliranih dejanj raziskovalci zdaj gradijo sisteme, ki so sposobni trajnostnih delovnih procesov.

Zakaj je spomin naslednja meja v robotiki

Širša posledica MEM je, da robotika vstopa v novo fazo. Desetletja se je področje osredotočalo na zaznavanje in nadzor: pomoč strojem pri videnju sveta in manipuliranju s predmeti. V zadnjem času so veliki multimodalni modeli dramatično izboljšali sposobnost robotov za interpretiranje navodil in izvajanje kompleksnih motoričnih vedenj.

Toda ko te zmogljivosti dozorevajo, se je ozko grlo premaknilo. Naslednji izziv je kognitivna kontinuiteta – omogočanje robotom, da delujejo dlje časa, ne da bi pri tem izgubili izvid za svoje cilje. Spominski sistemi, kot je MEM, zagotavljajo ogrodje za to kontinuiteto. Namesto da bi se odzivali iz trenutka v trenutek, lahko roboti vzdržujejo notranjo pripoved o svojih dejanjih, odločitvah in okolju. Ta pripoved omogoča nastanek kompleksnega vedenja.

Če se bo ta pristop še naprej razvijal, bodo posledice šle daleč preko čiščenja kuhinj. Prihodnji roboti bodo morda morali slediti navodilom, ki se odvijajo več ur ali celo dni. Predstavljajte si, da bi gospodinjskemu pomočniku rekli:

"Domov pridem ob 6. uri – prosim, pripravi večerjo in ob sredah pospravi hišo."

Izvajanje takšne zahteve bi zahtevalo razčlenjevanje dolgih navodil, načrtovanje podnalog, pomnjenje napredka in prilagajanje, ko gre kaj narobe.

Vzdrževanje surove video zgodovine vsakega dejanja tako dolgo bi bilo nemogoče. Namesto tega se bodo roboti verjetno zanašali na hierarhične pomnilniške sisteme, kjer so izkušnje stisnjene v vse bolj abstraktne predstavitve.

MEM je zgodnji korak k tej arhitekturi. Nakazuje, da ključ do zmogljivejših robotov morda niso močnejši motorji ali ostrejši senzorji, temveč boljši spomin – in sposobnost razmišljanja o tem. Če si roboti končno lahko zapomnijo, kaj počnejo, bodo morda končno lahko tudi dokončali delo.

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Alisa, predana novinarka pri MPost, specializiran za kriptovalute, umetno inteligenco, naložbe in široko področje Web3. Z ostrim očesom za nastajajoče trende in tehnologije zagotavlja celovito pokritost za informiranje in vključevanje bralcev v nenehno razvijajočo se pokrajino digitalnih financ.

več člankov
Alisa Davidson
Alisa Davidson

Alisa, predana novinarka pri MPost, specializiran za kriptovalute, umetno inteligenco, naložbe in široko področje Web3. Z ostrim očesom za nastajajoče trende in tehnologije zagotavlja celovito pokritost za informiranje in vključevanje bralcev v nenehno razvijajočo se pokrajino digitalnih financ.

Hot Stories
Pridružite se našemu glasilu.
Zadnje novice

Zatišje pred nevihto Solana: Kaj zdaj sporočajo grafikoni, kiti in signali na verigi

Solana je pokazala močno uspešnost, ki jo je spodbudilo vse večje sprejemanje, institucionalno zanimanje in ključna partnerstva, hkrati pa se sooča s potencialnimi ...

Več o tem

Kriptovalute aprila 2025: ključni trendi, premiki in kaj sledi

Aprila 2025 se je kripto prostor osredotočil na krepitev osrednje infrastrukture, Ethereum pa se je pripravljal na Pectro ...

Več o tem
Preberi več
Preberi več
Oxfordska umetna inteligenca zazna zgodnje tveganje za srčno popuščanje z rutinskimi CT pregledi z 86-odstotno natančnostjo pri 72,000 bolnikih
Mnenje Tehnologija
Oxfordska umetna inteligenca zazna zgodnje tveganje za srčno popuščanje z rutinskimi CT pregledi z 86-odstotno natančnostjo pri 72,000 bolnikih
April 10, 2026
Perplexity začenja integracijo Plaid in svojega računalniškega agenta z umetno inteligenco preoblikuje v središče za osebne finance
Novice Tehnologija
Perplexity začenja integracijo Plaid in svojega računalniškega agenta z umetno inteligenco preoblikuje v središče za osebne finance
April 10, 2026
Konferenca Inside Hack Seasons v Cannesu: Strokovnjaki razkrivajo operativne lekcije od testnega do glavnega omrežja
Hack Seasons Intervju ŽELITE POSTATI PARTNER Življenjski slog
Konferenca Inside Hack Seasons v Cannesu: Strokovnjaki razkrivajo operativne lekcije od testnega do glavnega omrežja
April 10, 2026
DISCO prebija oviro zasnove encimov in ustvarja beljakovine, ki v naravi nimajo ekvivalenta
Mnenje Tehnologija
DISCO prebija oviro zasnove encimov in ustvarja beljakovine, ki v naravi nimajo ekvivalenta
April 10, 2026
CRYPTOMERIA LABS PTE. LTD.