Fysisk intelligens introducerer MEM-arkitektur for at give robotter den hukommelse, der er nødvendig for opgaver i den virkelige verden
Kort sagt
Forskere udviklede Multi-Scale Embodied Memory, et system, der giver robotter kort- og langtidshukommelse, så de kan spore fremskridt og udføre komplekse opgaver i stedet for blot at udføre isolerede handlinger.
I årevis har drømmen om en virkelig hjælpsom husholdningsrobot været bedragerisk tæt på. Robotter kan allerede følge kommandoer som "vask stegepanden", "fold tøjet" eller "lav en sandwich". I laboratoriemiljøer udviser disse systemer imponerende fingerfærdighed og præcision. Men på trods af hurtige fremskridt inden for robotfundamentsmodeller har noget fundamentalt manglet: hukommelse.
En robot, der kan udføre en enkelt opgave, er ikke det samme som en robot, der kan fuldføre et job. At rengøre et helt køkken, lave et måltid eller forberede ingredienser til en opskrift kræver mere end isolerede færdigheder. Det kræver kontinuitet – evnen til at huske, hvad der allerede er gjort, hvad der stadig skal ske, og hvor alting er placeret. Uden den narrative tråd bliver selv den mest kapable robot overraskende inkompetent.
Det er den udfordring, som forskere ved Physical Intelligence nu forsøger at løse med en ny arkitektur kaldet Multi-Scale Embodied Memory (MEM) – et system designet til at give robotter både korttids- og langtidshukommelse, så de kan udføre opgaver, der udfolder sig over minutter i stedet for sekunder.
Resultaterne antyder noget vigtigt: robotteknologiens fremtid afhænger muligvis mindre af bedre mekaniske hænder og mere af bedre kognitiv arkitektur.
Moderne robotmodeller besidder allerede et bemærkelsesværdigt bibliotek af motoriske færdigheder. De kan gribe skrøbelige genstande, manipulere værktøj og navigere i rodede miljøer. Men bed en robot om at rengøre et fuldt køkken – tørre bordplader af, lægge dagligvarer væk, vaske op og organisere redskaber – og begrænsningerne bliver hurtigt tydelige.
Problemet er ikke færdighederne i sig selv. Problemet er, hvordan disse færdigheder koordineres. Komplekse opgaver kræver vedvarende opmærksomhed. En robot skal huske, hvilke skabe den allerede har åbnet, hvor den har lagt et grydelåg, eller om den allerede har vasket op. Den skal også spore objekter, der bevæger sig ud af syne, og opretholde et mentalt kort over miljøet, mens den udfører nye handlinger.
Menneskelig kognition gør dette ubesværet. Maskiner har indtil for nylig ikke gjort det. Det er beregningsmæssigt umuligt at gemme alle observationer, en robot ser, i minutter eller timer. Men at kassere disse oplysninger fører til kaotisk adfærd - gentagne fejl, glemte trin eller handlinger, der modsiger tidligere beslutninger. Inden for robotforskning beskrives denne udfordring undertiden som "kausal forvirring", hvor systemer misfortolker tidligere begivenheder og forstærker den forkerte adfærd.
Resultatet: robotter, der ser imponerende ud i korte demonstrationer, men som har svært ved at udføre opgaver i den virkelige verden.
Et hukommelsessystem til fysisk intelligens
MEM-arkitekturen løser dette problem ved at introducere en flerlags hukommelsesstruktur. I stedet for at lagre alt lige, opdeler systemet hukommelsen i to komplementære former:
Korttids visuel hukommelse indfanger nylige observationer ved hjælp af en effektiv videokodningsarkitektur. Dette gør det muligt for robotten at forstå bevægelse, spore objekter på tværs af billeder og huske begivenheder, der skete for få sekunder siden – afgørende for præcise handlinger som at vende en grillet ostesandwich eller skrubbe en tallerken.
Langtidskonceptuel hukommelse lagrer derimod opgavefremskridt i naturligt sprog. I stedet for at huske rå visuelle data idefiHver aften skriver robotten korte tekstuelle "noter", der beskriver, hvad der er sket - udsagn som "Jeg satte kanden i vasken" eller "Jeg hentede mælken fra køleskabet".
Disse opsummeringer bliver en del af robottens ræsonnementsproces. I realiteten opbygger maskinen sin egen fortælling om opgaven. Systemets ræsonnementsmotor beslutter derefter to ting samtidigt: hvilken handling der skal udføres næste gang, og hvilke oplysninger der er værd at huske. Denne kombination gør det muligt for modellen at spore opgaver, der varer op til femten minutter – langt længere end de fleste tidligere robotdemonstrationer.
En af de mest spændende muligheder, som MEM muliggør, er tilpasning i kontekst. Robotter begår fejl. Det er uundgåeligt. Men de fleste robotsystemer gentager disse fejl uendeligt, fordi de ikke har nogen hukommelse om fejl.
Forskellen bliver tydelig i simple eksperimenter. I en test forsøger en robot at samle en flad spisepind op. Uden hukommelse forsøger maskinen gentagne gange det samme mislykkede greb. Med hukommelsen aktiveret husker robotten det mislykkede forsøg og prøver en anden fremgangsmåde – og til sidst lykkes det.
Et andet eksempel involverer åbning af et køleskab. Alene ud fra visuelle data kan robotten ikke umiddelbart bestemme, hvilken retning døren åbner. Et hukommelsesløst system gentager blot den samme handling igen og igen. En hukommelsesaktiveret robot prøver én retning, husker fejlen og forsøger derefter den modsatte side.
Disse små justeringer repræsenterer noget dybtgående: evnen til at lære i selve opgaven. I stedet for udelukkende at stole på træningsdata, tilpasser robotten sig undervejs.
Forskerne evaluerede det hukommelsesaktiverede system på stadig mere komplekse opgaver. Først kom en relativt simpel udfordring: at lave en grillet ostesandwich. Dette krævede korttidshukommelse for at styre timingen, mens man udførte fine fysiske trin som at vende brød og anrette sandwichen.
Dernæst kom en logistisk opgave: at finde ingredienser til en opskrift. Robotten skulle huske, hvilke varer den allerede havde samlet, hvor de var placeret, og om skuffer og skabe var blevet lukket. Endelig kom det mest krævende scenarie: rengøring af et helt køkken.
Det betød at lægge genstande væk, vaske op, tørre bordplader af og holde styr på, hvilke dele af rummet der allerede var blevet rengjort.
Den hukommelsesforøgede model klarede sig betydeligt bedre end versioner uden struktureret hukommelse og viste større pålidelighed og opgavefuldførelsesrater.
Forskellen illustrerer et centralt skift inden for robotteknologi. I stedet for at optimere isolerede handlinger bygger forskere nu systemer, der er i stand til at håndtere vedvarende arbejdsgange.
Hvorfor hukommelse er den næste grænse inden for robotteknologi
Den bredere implikation af MEM er, at robotteknologi går ind i en ny fase. I årtier har feltet fokuseret på perception og kontrol: at hjælpe maskiner med at se verden og manipulere objekter. For nylig har store multimodale modeller dramatisk forbedret robotters evne til at fortolke instruktioner og udføre kompleks motorisk adfærd.
Men efterhånden som disse evner modnes, har flaskehalsen flyttet sig. Den næste udfordring er kognitiv kontinuitet – at gøre det muligt for robotter at operere over længere perioder uden at miste overblikket over deres mål. Hukommelsessystemer som MEM danner grundlaget for denne kontinuitet. I stedet for at reagere øjeblik for øjeblik kan robotter opretholde en intern fortælling om deres handlinger, beslutninger og omgivelser. Denne fortælling er det, der gør det muligt for kompleks adfærd at opstå.
Hvis denne tilgang fortsætter med at udvikle sig, rækker implikationerne langt ud over rengøring af køkkener. Fremtidige robotter skal muligvis følge instruktioner, der udfolder sig over timer eller endda dage. Forestil dig at fortælle en hjemmeassistent:
"Jeg kommer hjem klokken 6 — hav venligst aftensmaden klar og gør rent i huset om onsdagen."
At udføre en sådan anmodning ville kræve parsing af lange instruktioner, planlægning af underopgaver, huskning af fremskridt og tilpasning, når tingene går galt.
Det ville være umuligt at opretholde en rå videohistorik over hver handling i så lang tid. I stedet vil robotter sandsynligvis være afhængige af hierarkiske hukommelsessystemer, hvor oplevelser komprimeres til stadig mere abstrakte repræsentationer.
MEM er et tidligt skridt i retning af den arkitektur. Det antyder, at nøglen til mere kapable robotter måske ikke er stærkere motorer eller skarpere sensorer, men bedre hukommelse – og evnen til at ræsonnere om den. Hvis robotter endelig kan huske, hvad de laver, kan de måske også endelig være i stand til at afslutte arbejdet.
Ansvarsfraskrivelse
I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.
Om forfatteren
Alisa, en dedikeret journalist ved MPost, specialiserer sig i krypto, AI, investeringer og det omfattende område af Web3. Med et skarpt øje for nye trends og teknologier leverer hun omfattende dækning for at informere og engagere læserne i det stadigt udviklende landskab af digital finans.
Flere artikler
Alisa, en dedikeret journalist ved MPost, specialiserer sig i krypto, AI, investeringer og det omfattende område af Web3. Med et skarpt øje for nye trends og teknologier leverer hun omfattende dækning for at informere og engagere læserne i det stadigt udviklende landskab af digital finans.



