オピニオン テクノロジー
2026 年 3 月 05 日

フィジカルインテリジェンスは、ロボットに現実世界のタスクに必要なメモリを提供するMEMアーキテクチャを導入しました。

簡単に言えば

研究者らは、ロボットに短期および長期の記憶を与え、単に孤立した動作を実行するのではなく進捗状況を追跡して複雑なタスクを完了できるようにするシステムである「マルチスケール・エンボディド・メモリ」を開発した。 

フィジカルインテリジェンスは、ロボットに現実世界のタスクに必要なメモリを提供するMEMアーキテクチャを導入しました。

真に役に立つ家庭用ロボットの夢は、何年も前から実現に近づいてきました。ロボットは既に「フライパンを洗う」「洗濯物を畳む」「サンドイッチを作る」といった指示に従うことができます。実験室環境では、これらのシステムは驚くほどの器用さと精度を示しています。しかし、ロボットの基礎モデルが急速に進歩したにもかかわらず、根本的な何かが欠けています。それは記憶です。

単一のタスクを実行できるロボットと、仕事を完了できるロボットは異なります。キッチン全体を掃除したり、料理を作ったり、レシピの材料を準備したりするには、単発のスキル以上のものが求められます。継続性、つまり、すでに何が行われたか、まだ何をする必要があるか、そしてすべてのものがどこにあるのかを記憶する能力が求められます。この物語の筋道がなければ、どんなに有能なロボットでも驚くほど無能になってしまいます。

これは現在、Physical Intelligence の研究者が Multi-Scale Embodied Memory (MEM) と呼ばれる新しいアーキテクチャで解決しようとしている課題です。このシステムは、ロボットに短期記憶と長期記憶の両方を与え、数秒ではなく数分かけて実行されるタスクを実行できるように設計されます。

この研究結果は重要なことを示唆している。ロボット工学の将来は、より優れた機械の手ではなく、より優れた認知アーキテクチャに依存する可能性があるのだ。

現代のロボットモデルは、既に驚くべき運動能力を豊富に備えています。壊れやすい物を掴んだり、道具を操作したり、雑然とした環境を移動したりすることができます。しかし、ロボットにキッチン全体の掃除、つまりカウンターの拭き掃除、食料品の片付け、食器洗い、調理器具の整理を任せようとすると、すぐに限界が露呈します。

問題はスキルそのものではなく、それらのスキルがどのように連携されるかです。複雑なタスクには、継続的な認識が必要です。ロボットは、どのキャビネットを既に開けたか、鍋の蓋をどこに置いたか、あるいは既に皿を洗ったかどうかを記憶しておかなければなりません。また、視界から外れた物体を追跡し、新しい行動を実行しながら周囲の環境のメンタルマップを維持する必要があります。

人間の認知はこれを難なくこなします。しかし、最近まで機械はそうではありませんでした。ロボットが数分、あるいは数時間にわたって観察したすべての情報を記憶しておくことは、計算量的に不可能です。しかし、その情報を捨ててしまうと、無秩序な行動、つまり間違いの繰り返し、手順の忘れ、あるいは以前の判断と矛盾する行動につながります。ロボット工学の研究では、この課題は「因果的混乱」と呼ばれることもあり、システムが過去の出来事を誤って解釈し、誤った行動を強化してしまうのです。

その結果、短いデモでは印象的に見えるものの、現実世界のタスクを完了するのに苦労するロボットが生まれました。

身体知能のための記憶システム

MEMアーキテクチャは、多層メモリ構造を導入することでこの問題に対処します。すべてのデータを均等に保存するのではなく、システムはメモリを2つの相補的な形式に分割します。

短期視覚記憶は、効率的なビデオエンコーディングアーキテクチャを用いて最近の観察結果を捕捉します。これにより、ロボットは動きを理解し、フレーム間で物体を追跡し、数秒前に起こった出来事を記憶することができます。これは、グリルドチーズサンドイッチをひっくり返したり、皿をこすったりといった正確な動作に不可欠です。

一方、長期概念記憶は、タスクの進行を自然言語で保存します。生の視覚データを記憶するのではなく、defi最後に、ロボットは「鍋をシンクに置いた」や「冷蔵庫から牛乳を取り出しました」など、何が起こったかを説明する短いテキスト「メモ」を書きます。

これらの要約はロボットの推論プロセスの一部となります。実質的に、機械はタスクに関する独自の物語を構築します。システムの推論エンジンは、次に実行するアクションと、記憶する価値のある情報という2つのことを同時に決定します。この組み合わせにより、モデルは最大15分間のタスクを追跡することが可能になります。これは、これまでのほとんどのロボットデモンストレーションよりもはるかに長い時間です。

MEMによって可能になる最も興味深い機能の一つは、状況に応じた適応です。ロボットは間違いを犯します。それは避けられないことです。しかし、ほとんどのロボットシステムは失敗の記憶を持たないため、同じ間違いを際限なく繰り返します。

簡単な実験でその違いは明らかです。あるテストでは、ロボットが平らな箸を拾おうとします。メモリがない場合、ロボットは同じ掴み方を繰り返しますが、結局は失敗します。メモリを有効にすると、ロボットは失敗した試みを記憶し、別の掴み方を試し、最終的に成功します。

冷蔵庫を開ける例をもう一つ挙げましょう。視覚情報だけでは、ロボットはドアがどの方向に開くかを即座に判断できません。記憶を持たないシステムは、同じ動作を何度も繰り返すだけです。記憶を持つロボットは、ある方向を試し、失敗したことを記憶し、次に反対側を試みます。

こうした小さな調整は、タスク自体の中で学習する能力という、非常に重要な意味を持っています。ロボットはトレーニングデータに完全に依存するのではなく、臨機応変に適応します。

研究者たちは、記憶機能を備えたシステムを、徐々に複雑なタスクで評価しました。最初は比較的単純な課題、グリルドチーズサンドイッチを作るというものでした。これは、パンをひっくり返したりサンドイッチに盛り付けたりといった繊細な動作をしながら、タイミングを管理するために短期記憶を必要としました。

次に、レシピに必要な材料を集めるというロジスティクスタスクが課されました。ロボットは、既に集めた材料とその場所、引き出しやキャビネットが閉まっているかどうかを記憶する必要がありました。そして最後に、最も過酷なシナリオ、つまりキッチン全体の掃除に挑みました。

これは、物を片付け、食器を洗い、カウンターを拭き、部屋のどの部分がすでに掃除されたかを記録することを意味しました。

メモリ拡張モデルは、構造化メモリのないバージョンよりも大幅に優れており、信頼性とタスク完了率が向上しました。

この違いは、ロボット工学における重要な変化を示しています。研究者たちは現在、孤立した動作を最適化するのではなく、持続的なワークフローが可能なシステムを構築しています。

ロボット工学におけるメモリの新たなフロンティア

MEMのより広い意味合いは、ロボット工学が新たな段階に入っているということです。数十年にわたり、この分野は知覚と制御、つまり機械が世界を認識し、物体を操作できるようにすることに重点を置いてきました。近年では、大規模なマルチモーダルモデルによって、ロボットの指示解釈能力と複雑な運動行動の実行能力が劇的に向上しています。

しかし、これらの能力が成熟するにつれて、ボトルネックは変化しました。次の課題は認知の継続性、つまりロボットが目標を見失うことなく長期間動作できるようにすることです。MEMのような記憶システムは、その継続性を支える基盤を提供します。ロボットは瞬間瞬間に反応するのではなく、自らの行動、意思決定、そして環境に関する内なる物語を維持することができます。この物語こそが、複雑な行動を生み出すことを可能にするのです。

このアプローチが進化し続ければ、その影響はキッチン掃除だけにとどまりません。将来のロボットは、数時間、あるいは数日かけて展開される指示に従う必要が出てくるかもしれません。ホームアシスタントにこう指示するところを想像してみてください。

「私は午後6時に帰宅します。水曜日は夕食の用意と家の掃除をお願いします。」

このような要求を実行するには、長い指示を解析し、サブタスクを計画し、進行状況を記憶し、問題が発生した場合に適応する必要があります。

あらゆる行動の生のビデオ履歴をこれほど長期間保存することは不可能でしょう。代わりに、ロボットは階層的な記憶システムに依存するようになるでしょう。そこでは、経験はより抽象的な表現へと圧縮されます。

MEMは、まさにそのアーキテクチャに向けた初期段階の一歩です。より高性能なロボットの鍵は、より強力なモーターやより鋭敏なセンサーではなく、より優れた記憶力、そしてそれに基づいて推論する能力にあることを示唆しています。ロボットが自分の行動を記憶できるようになれば、ついに仕事を完了できるようになるかもしれません。

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

アリサ、専属ジャーナリスト MPostは、暗号通貨、AI、投資、そして広範な領域を専門としています。 Web3。彼女は新たなトレンドやテクノロジーに鋭い目を向け、包括的な報道を提供して、読者に情報を提供し、進化し続けるデジタル金融の状況に興味を持ってもらえるようにしています。

より多くの記事
アリサ・デビッドソン
アリサ・デビッドソン

アリサ、専属ジャーナリスト MPostは、暗号通貨、AI、投資、そして広範な領域を専門としています。 Web3。彼女は新たなトレンドやテクノロジーに鋭い目を向け、包括的な報道を提供して、読者に情報を提供し、進化し続けるデジタル金融の状況に興味を持ってもらえるようにしています。

Hot Stories
ニュースレターにご参加ください。
最新ニュース

Solanaの嵐の前の静けさ:チャート、クジラ、オンチェーンシグナルが今何を語っているか

Solana は、採用の増加、機関投資家の関心、主要なパートナーシップに牽引され、強力なパフォーマンスを発揮してきましたが、潜在的なリスクにも直面しています...

詳細を見る

2025年XNUMX月の暗号通貨:主要トレンド、変化、そして今後の展望

2025 年 XNUMX 月、暗号通貨業界ではコア インフラストラクチャの強化に重点が置かれ、イーサリアムは Pectra の準備を進めていました...

詳細を見る
プロフィール
続きを読む
AptosとNETSTARSが提携して前進 Web3 決済およびステーブルコインベースの決済インフラ
ニュースレポート テクノロジー
AptosとNETSTARSが提携して前進 Web3 決済およびステーブルコインベースの決済インフラ
2026 年 5 月 8 日
GoogleがGemini Coachと新型Fitbit Airウェアラブルを搭載したAI搭載ヘルスケアプラットフォームを発表
ニュースレポート テクノロジー
GoogleがGemini Coachと新型Fitbit Airウェアラブルを搭載したAI搭載ヘルスケアプラットフォームを発表
2026 年 5 月 8 日
HSCアセットマネジメント香港:資本市場、暗号資産市場、プライベート市場が融合するアジアの投資再編の内幕
ハックシーズン インタビュー スタ-トアップ ライフスタイル テクノロジー
HSCアセットマネジメント香港:資本市場、暗号資産市場、プライベート市場が融合するアジアの投資再編の内幕
2026 年 5 月 8 日
New OpenAI オーディオモデルが、多言語翻訳とストリーミングインテリジェンスを備えたリアルタイム音声アシスタントを支えます
ニュースレポート テクノロジー
New OpenAI オーディオモデルが、多言語翻訳とストリーミングインテリジェンスを備えたリアルタイム音声アシスタントを支えます
2026 年 5 月 8 日
CRYPTOMERIA LABS PTE。 株式会社。