Editoriali Tecnologia
05 Marzo 2026

Physical Intelligence introduce l'architettura MEM per fornire ai robot la memoria necessaria per le attività del mondo reale

In Breve

I ricercatori hanno sviluppato Multi-Scale Embodied Memory, un sistema che fornisce ai robot una memoria a breve e lungo termine, consentendo loro di monitorare i progressi e completare compiti complessi anziché limitarsi a eseguire azioni isolate. 

Physical Intelligence introduce l'architettura MEM per fornire ai robot la memoria necessaria per le attività del mondo reale

Per anni, il sogno di un robot domestico davvero utile è stato ingannevolmente vicino. I robot possono già eseguire comandi come "lava la padella", "piega il bucato" o "fai un panino". In laboratorio, questi sistemi dimostrano una destrezza e una precisione impressionanti. Eppure, nonostante i rapidi progressi nei modelli di base robotici, mancava ancora qualcosa di fondamentale: la memoria.

Un robot in grado di eseguire un singolo compito non è la stessa cosa di un robot in grado di completare un lavoro. Pulire un'intera cucina, cucinare un pasto o preparare gli ingredienti per una ricetta richiede più di semplici competenze isolate. Richiede continuità: la capacità di ricordare cosa è già stato fatto, cosa deve ancora accadere e dove si trova ogni cosa. Senza questo filo narrativo, anche il robot più capace diventa sorprendentemente incompetente.

Questa è la sfida che i ricercatori di Physical Intelligence stanno ora cercando di risolvere con una nuova architettura chiamata Multi-Scale Embodied Memory (MEM), un sistema progettato per fornire ai robot sia una memoria a breve che a lungo termine, in modo che possano svolgere compiti che si svolgono nell'arco di minuti anziché di secondi.

I risultati suggeriscono qualcosa di importante: il futuro della robotica potrebbe dipendere meno da mani meccaniche migliori e più da una migliore architettura cognitiva.

I moderni modelli robotici possiedono già un notevole bagaglio di capacità motorie. Possono afferrare oggetti fragili, manipolare utensili e muoversi in ambienti disordinati. Ma se si chiede a un robot di pulire un'intera cucina – pulendo i ripiani, riponendo la spesa, lavando i piatti e organizzando gli utensili – i limiti diventano subito evidenti.

Il problema non sono le competenze in sé. Il problema è come queste competenze vengono coordinate. Compiti complessi richiedono una consapevolezza costante. Un robot deve ricordare quali mobili ha già aperto, dove ha appoggiato il coperchio di una pentola o se ha già lavato un piatto. Deve anche tenere traccia degli oggetti che si spostano fuori dalla sua visuale e mantenere una mappa mentale dell'ambiente circostante mentre esegue nuove azioni.

La cognizione umana lo fa senza sforzo. Le macchine, fino a poco tempo fa, non lo facevano. Memorizzare ogni osservazione che un robot vede per minuti o ore è computazionalmente impossibile. Ma scartare queste informazioni porta a comportamenti caotici: errori ripetuti, passaggi dimenticati o azioni che contraddicono decisioni precedenti. Nella ricerca robotica, questa sfida è talvolta descritta come "confusione causale", in cui i sistemi interpretano male gli eventi passati e rafforzano i comportamenti sbagliati.

Il risultato: robot che sembrano impressionanti nelle brevi dimostrazioni, ma che fanno fatica a portare a termine compiti nella vita reale.

Un sistema di memoria per l'intelligenza fisica

L'architettura MEM risolve questo problema introducendo una struttura di memoria multistrato. Invece di archiviare tutti i dati in modo uniforme, il sistema separa la memoria in due forme complementari:

La memoria visiva a breve termine cattura le osservazioni recenti utilizzando un'efficiente architettura di codifica video. Ciò consente al robot di comprendere il movimento, tracciare gli oggetti attraverso i fotogrammi e ricordare eventi accaduti pochi secondi prima, un aspetto fondamentale per azioni precise come girare un toast al formaggio o lavare un piatto.

La memoria concettuale a lungo termine, nel frattempo, memorizza i progressi delle attività in linguaggio naturale. Invece di ricordare dati visivi grezzi indefiAlla fine, il robot scrive brevi "note" testuali che descrivono cosa è successo, affermazioni come "Ho messo la pentola nel lavandino" o "Ho preso il latte dal frigorifero".

Questi riassunti diventano parte del processo di ragionamento del robot. Di fatto, la macchina costruisce la propria narrazione del compito. Il motore di ragionamento del sistema decide quindi due cose simultaneamente: quale azione eseguire successivamente e quali informazioni vale la pena ricordare. Questa combinazione consente al modello di tracciare compiti che durano fino a quindici minuti, molto più a lungo rispetto alla maggior parte delle precedenti dimostrazioni robotiche.

Una delle capacità più interessanti offerte dalla MEM è l'adattamento al contesto. I robot commettono errori. È inevitabile. Ma la maggior parte dei sistemi robotici ripete quegli errori all'infinito perché non ha memoria dei guasti.

La differenza diventa evidente in semplici esperimenti. In un test, un robot tenta di afferrare una bacchetta piatta. Senza memoria, la macchina tenta ripetutamente la stessa presa, senza successo. Con la memoria abilitata, il robot ricorda il tentativo fallito e tenta un approccio diverso, riuscendovi infine.

Un altro esempio riguarda l'apertura di un frigorifero. Basandosi solo sui dati visivi, il robot non può determinare immediatamente in quale direzione si apre la porta. Un sistema senza memoria ripete semplicemente la stessa azione più e più volte. Un robot con memoria prova una direzione, ricorda l'errore e poi prova dal lato opposto.

Questi piccoli aggiustamenti rappresentano qualcosa di profondo: la capacità di apprendere durante il compito stesso. Invece di affidarsi esclusivamente ai dati di addestramento, il robot si adatta al volo.

I ricercatori hanno testato il sistema basato sulla memoria in compiti sempre più complessi. Il primo compito era relativamente semplice: preparare un toast al formaggio. Questo richiedeva la memoria a breve termine per gestire i tempi durante l'esecuzione di delicati movimenti fisici come girare il pane e impiattarlo.

Poi è arrivato un compito logistico: recuperare gli ingredienti per una ricetta. Il robot doveva ricordare quali ingredienti aveva già raccolto, dove si trovavano e se cassetti e armadi erano stati chiusi. Infine, è arrivato lo scenario più impegnativo: pulire un'intera cucina.

Ciò significava riporre gli oggetti, lavare i piatti, pulire i ripiani e tenere traccia delle parti della stanza che erano già state pulite.

Il modello con memoria aumentata ha superato significativamente le versioni senza memoria strutturata, dimostrando una maggiore affidabilità e tassi di completamento delle attività maggiori.

La differenza illustra un cambiamento fondamentale nella robotica. Invece di ottimizzare azioni isolate, i ricercatori stanno ora costruendo sistemi in grado di gestire flussi di lavoro sostenibili.

Perché la memoria è la prossima frontiera della robotica

L'implicazione più ampia del MEM è che la robotica sta entrando in una nuova fase. Per decenni, il campo si è concentrato sulla percezione e sul controllo: aiutare le macchine a vedere il mondo e manipolare gli oggetti. Più recentemente, i grandi modelli multimodali hanno migliorato notevolmente la capacità dei robot di interpretare le istruzioni ed eseguire comportamenti motori complessi.

Ma con il maturare di queste capacità, il collo di bottiglia si è spostato. La sfida successiva è la continuità cognitiva: consentire ai robot di operare per periodi prolungati senza perdere di vista i propri obiettivi. Sistemi di memoria come la MEM forniscono l'impalcatura per tale continuità. Invece di reagire momento per momento, i robot possono mantenere una narrazione interna sulle proprie azioni, decisioni e ambiente. Questa narrazione è ciò che permette l'emergere di comportamenti complessi.

Se questo approccio continua a evolversi, le implicazioni vanno ben oltre la pulizia delle cucine. I robot del futuro potrebbero dover seguire istruzioni che si susseguono nell'arco di ore o addirittura giorni. Immaginate di dire a un assistente domestico:

"Torno a casa alle 18:00. Per favore, prepara la cena e pulisci la casa il mercoledì."

Per eseguire una richiesta del genere sarebbe necessario analizzare lunghe istruzioni, pianificare sottoattività, ricordare i progressi e adattarsi quando le cose vanno male.

Mantenere una cronologia video grezza di ogni azione per così tanto tempo sarebbe impossibile. Invece, i robot probabilmente si affideranno a sistemi di memoria gerarchici, in cui le esperienze vengono compresse in rappresentazioni sempre più astratte.

MEM rappresenta un primo passo verso questa architettura. Suggerisce che la chiave per robot più capaci potrebbe non risiedere in motori più potenti o sensori più precisi, ma in una memoria migliore e nella capacità di ragionare su di essa. Se i robot riuscissero finalmente a ricordare cosa stanno facendo, potrebbero anche essere finalmente in grado di portare a termine il lavoro.

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Alisa, una giornalista dedicata al MPost, è specializzato in criptovaluta, prove a conoscenza zero, investimenti e nel vasto regno di Web3. Con un occhio attento alle tendenze e alle tecnologie emergenti, offre una copertura completa per informare e coinvolgere i lettori nel panorama in continua evoluzione della finanza digitale.

Altri articoli
Alice Davidson
Alice Davidson

Alisa, una giornalista dedicata al MPost, è specializzato in criptovaluta, prove a conoscenza zero, investimenti e nel vasto regno di Web3. Con un occhio attento alle tendenze e alle tecnologie emergenti, offre una copertura completa per informare e coinvolgere i lettori nel panorama in continua evoluzione della finanza digitale.

La calma prima della tempesta di Solana: cosa ci dicono ora grafici, balene e segnali on-chain

Solana ha dimostrato ottime performance, trainate dalla crescente adozione, dall'interesse istituzionale e da partnership chiave, affrontando al contempo potenziali ...

Per saperne di più

Criptovalute ad aprile 2025: tendenze chiave, cambiamenti e cosa succederà in futuro

Nell'aprile 2025, il settore delle criptovalute si è concentrato sul rafforzamento dell'infrastruttura principale, con Ethereum che si preparava per Pectra...

Per saperne di più
Scopri di più
Leggi di più
Le 10 migliori app di criptovalute per Android nel 2026
Elenchi migliori Tecnologia
Le 10 migliori app di criptovalute per Android nel 2026
9 aprile 2026
Tether presenta QVAC SDK: un framework universale di intelligenza artificiale per eseguire, addestrare ed evolvere l'intelligenza su tutti i dispositivi.
Notizie Tecnologia
Tether presenta QVAC SDK: un framework universale di intelligenza artificiale per eseguire, addestrare ed evolvere l'intelligenza su tutti i dispositivi.
9 aprile 2026
Canva acquisisce Simtheory e Ortto per creare una piattaforma completa di intelligenza artificiale e marketing.
Affari Notizie Tecnologia
Canva acquisisce Simtheory e Ortto per creare una piattaforma completa di intelligenza artificiale e marketing.
9 aprile 2026
Binance lancia i mercati di previsione che consentono di negoziare in-app i risultati di eventi reali.
Notizie Tecnologia
Binance lancia i mercati di previsione che consentono di negoziare in-app i risultati di eventi reali.
9 aprile 2026
LABORATORI DI CRITTOMERIA PTE. srl.