Meinung schaffen
05. März 2026

Physical Intelligence stellt die MEM-Architektur vor, um Robotern den für reale Aufgaben benötigten Speicher zu geben.

In Kürze

Forscher entwickelten Multi-Scale Embodied Memory, ein System, das Robotern Kurz- und Langzeitgedächtnis verleiht, sodass sie Fortschritte verfolgen und komplexe Aufgaben erledigen können, anstatt nur isolierte Aktionen auszuführen. 

Physical Intelligence stellt die MEM-Architektur vor, um Robotern den für reale Aufgaben benötigten Speicher zu geben.

Seit Jahren ist der Traum vom wirklich hilfreichen Haushaltsroboter zum Greifen nah. Roboter können bereits Befehle wie „Pfanne abwaschen“, „Wäsche zusammenlegen“ oder „Sandwich zubereiten“ ausführen. In Laborumgebungen zeigen diese Systeme beeindruckende Geschicklichkeit und Präzision. Doch trotz rasanter Fortschritte bei den grundlegenden Robotermodellen fehlte bisher etwas Fundamentales: Speicher.

Ein Roboter, der eine einzelne Aufgabe ausführen kann, ist nicht dasselbe wie ein Roboter, der einen ganzen Auftrag erledigen kann. Eine Küche komplett zu reinigen, eine Mahlzeit zuzubereiten oder Zutaten für ein Rezept vorzubereiten, erfordert mehr als nur einzelne Fähigkeiten. Es braucht Kontinuität – die Fähigkeit, sich zu merken, was bereits erledigt ist, was noch zu tun ist und wo sich alles befindet. Ohne diesen roten Faden wirkt selbst der leistungsfähigste Roboter überraschend inkompetent.

Dies ist die Herausforderung, der sich die Forscher von Physical Intelligence nun mit einer neuen Architektur namens Multi-Scale Embodied Memory (MEM) zu stellen versuchen – einem System, das Robotern sowohl Kurzzeit- als auch Langzeitgedächtnis verleihen soll, damit sie Aufgaben ausführen können, die sich über Minuten statt Sekunden erstrecken.

Die Ergebnisse lassen auf etwas Wichtiges schließen: Die Zukunft der Robotik hängt möglicherweise weniger von besseren mechanischen Händen ab, sondern vielmehr von einer besseren kognitiven Architektur.

Moderne Robotermodelle verfügen bereits über ein bemerkenswertes Repertoire an motorischen Fähigkeiten. Sie können zerbrechliche Gegenstände greifen, Werkzeuge handhaben und sich in unübersichtlichen Umgebungen zurechtfinden. Doch wenn man einen Roboter bittet, eine komplette Küche zu reinigen – Arbeitsflächen abzuwischen, Einkäufe wegzuräumen, Geschirr zu spülen und Besteck zu sortieren –, werden die Grenzen schnell deutlich.

Das Problem sind nicht die Fähigkeiten an sich, sondern deren Koordination. Komplexe Aufgaben erfordern ständige Aufmerksamkeit. Ein Roboter muss sich merken, welche Schränke er bereits geöffnet hat, wo er einen Topfdeckel hingelegt hat oder ob er bereits Geschirr gespült hat. Er muss außerdem Objekte verfolgen, die sich aus seinem Sichtfeld bewegen, und sich während der Ausführung neuer Aktionen ein mentales Bild seiner Umgebung machen.

Die menschliche Kognition vollbringt dies mühelos. Maschinen hingegen konnten dies bis vor Kurzem nicht. Jede einzelne Beobachtung eines Roboters über Minuten oder Stunden zu speichern, ist rechnerisch nicht praktikabel. Doch das Verwerfen dieser Informationen führt zu chaotischem Verhalten – wiederholten Fehlern, vergessenen Schritten oder Handlungen, die früheren Entscheidungen widersprechen. In der Robotikforschung wird diese Herausforderung mitunter als „kausale Verwirrung“ bezeichnet, bei der Systeme vergangene Ereignisse falsch interpretieren und falsche Verhaltensweisen verstärken.

Das Ergebnis: Roboter, die in kurzen Demos beeindruckend aussehen, aber Schwierigkeiten haben, Aufgaben in der realen Welt zu bewältigen.

Ein Speichersystem für physische Intelligenz

Die MEM-Architektur löst dieses Problem durch die Einführung einer mehrschichtigen Speicherstruktur. Anstatt alles gleichmäßig zu speichern, teilt das System den Speicher in zwei komplementäre Formen auf:

Das visuelle Kurzzeitgedächtnis erfasst mithilfe einer effizienten Videocodierungsarchitektur aktuelle Beobachtungen. Dadurch kann der Roboter Bewegungen verstehen, Objekte über mehrere Frames hinweg verfolgen und sich an Ereignisse erinnern, die Sekunden zuvor stattgefunden haben – entscheidend für präzise Aktionen wie das Wenden eines Käsetoasts oder das Spülen eines Geschirrs.

Das langfristige konzeptuelle Gedächtnis speichert den Fortschritt einer Aufgabe in natürlicher Sprache. Anstatt sich rohe visuelle Daten zu merken,defiNachts verfasst der Roboter kurze Textnotizen, in denen er beschreibt, was geschehen ist – Aussagen wie „Ich habe den Topf in die Spüle gestellt“ oder „Ich habe die Milch aus dem Kühlschrank geholt“.

Diese Zusammenfassungen fließen in den Denkprozess des Roboters ein. Die Maschine erstellt quasi ihre eigene Beschreibung der Aufgabe. Die Logik des Systems entscheidet dann gleichzeitig, welche Aktion als Nächstes ausgeführt werden soll und welche Informationen relevant sind. Diese Kombination ermöglicht es dem Modell, Aufgaben von bis zu fünfzehn Minuten Dauer zu bewältigen – deutlich länger als die meisten bisherigen Roboterdemonstrationen.

Eine der faszinierendsten Fähigkeiten, die durch MEM ermöglicht werden, ist die kontextbezogene Anpassung. Roboter machen Fehler. Das ist unvermeidlich. Doch die meisten Robotersysteme wiederholen diese Fehler endlos, weil sie kein Gedächtnis für Fehler haben.

Der Unterschied wird in einfachen Experimenten deutlich. In einem Test versucht ein Roboter, einen flachen Essstäbchen aufzuheben. Ohne Speicher versucht die Maschine wiederholt denselben erfolglosen Griff. Mit aktiviertem Speicher merkt sich der Roboter den Fehlversuch und versucht es mit einer anderen Technik – und hat schließlich Erfolg.

Ein weiteres Beispiel ist das Öffnen eines Kühlschranks. Allein anhand visueller Daten kann der Roboter nicht sofort erkennen, in welche Richtung sich die Tür öffnet. Ein System ohne Speicher wiederholt die gleiche Aktion einfach immer wieder. Ein Roboter mit Speicher versucht es in eine Richtung, merkt sich das Fehlschlagen und versucht es dann von der anderen Seite.

Diese kleinen Anpassungen zeugen von etwas Tiefgreifendem: der Fähigkeit, innerhalb der Aufgabe selbst zu lernen. Anstatt sich ausschließlich auf Trainingsdaten zu verlassen, passt sich der Roboter spontan an.

Die Forscher testeten das speicherbasierte System anhand zunehmend komplexerer Aufgaben. Zunächst stand eine relativ einfache Herausforderung auf dem Programm: die Zubereitung eines gegrillten Käsesandwiches. Dies erforderte ein Kurzzeitgedächtnis, um die Zeit zu koordinieren und gleichzeitig feinmotorische Schritte wie das Wenden des Brotes und das Anrichten des Sandwiches auszuführen.

Als Nächstes folgte eine logistische Aufgabe: die Zutaten für ein Rezept zusammenzusuchen. Der Roboter musste sich merken, welche Gegenstände er bereits eingesammelt hatte, wo sie sich befanden und ob Schubladen und Schränke geschlossen waren. Schließlich kam das anspruchsvollste Szenario: die Reinigung einer kompletten Küche.

Das bedeutete, Gegenstände wegzuräumen, Geschirr zu spülen, Arbeitsflächen abzuwischen und zu dokumentieren, welche Teile des Zimmers bereits gereinigt worden waren.

Das mit einem erweiterten Speicher ausgestattete Modell schnitt deutlich besser ab als Versionen ohne strukturierten Speicher und wies eine höhere Zuverlässigkeit und Aufgabenabschlussrate auf.

Der Unterschied verdeutlicht einen wichtigen Wandel in der Robotik. Anstatt einzelne Aktionen zu optimieren, entwickeln Forscher nun Systeme, die zu nachhaltigen Arbeitsabläufen fähig sind.

Warum Speicher die nächste Grenze in der Robotik ist

Die weitergehende Implikation von MEM ist, dass die Robotik in eine neue Phase eintritt. Jahrzehntelang konzentrierte sich das Fachgebiet auf Wahrnehmung und Steuerung: Maschinen dabei zu helfen, die Welt zu sehen und Objekte zu manipulieren. In jüngster Zeit haben große multimodale Modelle die Fähigkeit von Robotern, Anweisungen zu interpretieren und komplexe motorische Verhaltensweisen auszuführen, dramatisch verbessert.

Mit zunehmender Reife dieser Fähigkeiten hat sich der Engpass verlagert. Die nächste Herausforderung ist die kognitive Kontinuität – Roboter müssen in die Lage versetzt werden, über längere Zeiträume zu operieren, ohne ihre Ziele aus den Augen zu verlieren. Speichersysteme wie MEM bilden das Gerüst für diese Kontinuität. Anstatt nur im jeweiligen Moment zu reagieren, können Roboter eine interne Erzählung über ihre Handlungen, Entscheidungen und ihre Umgebung aufrechterhalten. Diese Erzählung ermöglicht das Entstehen komplexen Verhaltens.

Wenn sich dieser Ansatz weiterentwickelt, reichen die Auswirkungen weit über die Küchenreinigung hinaus. Zukünftige Roboter müssen möglicherweise Anweisungen befolgen, die sich über Stunden oder sogar Tage erstrecken. Stellen Sie sich vor, Sie sagen einem Sprachassistenten:

„Ich komme um 6 Uhr nach Hause – bitte bereiten Sie das Abendessen vor und putzen Sie mittwochs das Haus.“

Die Ausführung einer solchen Anfrage würde das Verstehen langer Anweisungen, das Planen von Teilaufgaben, das Erinnern des Fortschritts und die Anpassung bei Problemen erfordern.

Es wäre unmöglich, eine vollständige Videoaufzeichnung jeder einzelnen Aktion über einen so langen Zeitraum zu speichern. Stattdessen werden Roboter wahrscheinlich auf hierarchische Speichersysteme zurückgreifen, in denen Erfahrungen in zunehmend abstrakte Repräsentationen komprimiert werden.

MEM ist ein erster Schritt hin zu dieser Architektur. Es deutet darauf hin, dass der Schlüssel zu leistungsfähigeren Robotern nicht in stärkeren Motoren oder präziseren Sensoren liegt, sondern in einem besseren Speicher – und der Fähigkeit, daraus zu lernen. Wenn Roboter sich endlich merken können, was sie tun, sind sie möglicherweise auch endlich in der Lage, ihre Aufgaben zu erledigen.

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Alisa, eine engagierte Journalistin bei der MPost, ist spezialisiert auf Krypto, KI, Investitionen und das weitreichende Gebiet von Web3. Mit einem scharfen Blick für neue Trends und Technologien liefert sie eine umfassende Berichterstattung, um die Leser über die sich ständig weiterentwickelnde Landschaft des digitalen Finanzwesens zu informieren und einzubeziehen.

Weitere Artikel
Alisa Davidson
Alisa Davidson

Alisa, eine engagierte Journalistin bei der MPost, ist spezialisiert auf Krypto, KI, Investitionen und das weitreichende Gebiet von Web3. Mit einem scharfen Blick für neue Trends und Technologien liefert sie eine umfassende Berichterstattung, um die Leser über die sich ständig weiterentwickelnde Landschaft des digitalen Finanzwesens zu informieren und einzubeziehen.

Hot Stories
Abonnieren Sie unseren Newsletter.
Aktuelle News

Die Ruhe vor dem Solana-Sturm: Was Charts, Wale und On-Chain-Signale jetzt sagen

Solana hat eine starke Leistung gezeigt, die auf die zunehmende Akzeptanz, das institutionelle Interesse und wichtige Partnerschaften zurückzuführen ist, während es gleichzeitig mit potenziellen ... konfrontiert ist.

Mehr Erfahren

Krypto im April 2025: Wichtige Trends, Veränderungen und was als nächstes kommt

Im April 2025 konzentrierte sich der Kryptobereich auf die Stärkung der Kerninfrastruktur, wobei sich Ethereum auf Pectra vorbereitete ...

Mehr Erfahren
MEHR LESEN
Weiterlesen
Der Bankenausschuss des Senats bringt den CLARITY Act voran: Warum dezentrale Netzwerke eine eigene Rechtskategorie verdienen.
Meinung Geschäft schaffen
Der Bankenausschuss des Senats bringt den CLARITY Act voran: Warum dezentrale Netzwerke eine eigene Rechtskategorie verdienen.
May 15, 2026
Die Tokenisierung von währungsbasierten Vermögenswerten (RWA) erreicht 31.4 Milliarden US-Dollar, da sich die regulatorischen und infrastrukturellen Rahmenbedingungen allmählich angleichen, so Analysten.
Geschäft Nachrichtenbericht schaffen
Die Tokenisierung von währungsbasierten Vermögenswerten (RWA) erreicht 31.4 Milliarden US-Dollar, da sich die regulatorischen und infrastrukturellen Rahmenbedingungen allmählich angleichen, so Analysten.
May 15, 2026
Bitget führt einheitliches KI-Handelsökosystem ein, übertrifft 1 Million Nutzer und 1.2 Milliarden US-Dollar an KI-gesteuertem Handelsvolumen.
Geschäft Nachrichtenbericht
Bitget führt einheitliches KI-Handelsökosystem ein, übertrifft 1 Million Nutzer und 1.2 Milliarden US-Dollar an KI-gesteuertem Handelsvolumen.
May 15, 2026
OKX und Korea Investment & Securities streben inmitten der Krypto-Konsolidierungswelle in Südkorea jeweils eine 20%ige Beteiligung an Coinone an.
Geschäft Nachrichtenbericht schaffen
OKX und Korea Investment & Securities streben inmitten der Krypto-Konsolidierungswelle in Südkorea jeweils eine 20%ige Beteiligung an Coinone an.
May 15, 2026
CRYPTOMERIA LABS PTE. GMBH.