نظر تکنولوژی
مارس 05، 2026

هوش فیزیکی معماری MEM را معرفی می‌کند تا به ربات‌ها حافظه مورد نیاز برای وظایف دنیای واقعی را بدهد.

به طور خلاصه

محققان حافظه تجسمی چند مقیاسی را توسعه داده‌اند، سیستمی که به ربات‌ها حافظه کوتاه‌مدت و بلندمدت می‌دهد تا بتوانند پیشرفت را پیگیری کرده و وظایف پیچیده را به جای انجام اقدامات جداگانه، انجام دهند. 

هوش فیزیکی معماری MEM را معرفی می‌کند تا به ربات‌ها حافظه مورد نیاز برای وظایف دنیای واقعی را بدهد.

سال‌هاست که رویای یک ربات خانگی واقعاً مفید، به طرز فریبنده‌ای نزدیک بوده است. ربات‌ها همین حالا هم می‌توانند از دستوراتی مانند «شستن ماهیتابه»، «تا کردن لباس‌های شسته شده» یا «درست کردن ساندویچ» پیروی کنند. در محیط‌های آزمایشگاهی، این سیستم‌ها مهارت و دقت چشمگیری از خود نشان می‌دهند. با این حال، علیرغم پیشرفت‌های سریع در مدل‌های پایه رباتیک، چیزی اساسی از قلم افتاده است: حافظه.

رباتی که می‌تواند یک کار واحد را انجام دهد، با رباتی که می‌تواند یک کار را به طور کامل انجام دهد، یکسان نیست. تمیز کردن کل آشپزخانه، پختن غذا یا آماده کردن مواد لازم برای یک دستور غذا به چیزی بیش از مهارت‌های جداگانه نیاز دارد. این کار به پیوستگی نیاز دارد - توانایی به خاطر سپردن آنچه قبلاً انجام شده است، آنچه هنوز باید اتفاق بیفتد و محل قرارگیری هر چیز. بدون آن رشته روایت، حتی توانمندترین ربات‌ها نیز به طرز شگفت‌آوری بی‌کفایت می‌شوند.

این چالشی است که محققان Physical Intelligence اکنون در تلاشند تا با معماری جدیدی به نام حافظه تجسمی چند مقیاسی (MEM) آن را حل کنند - سیستمی که برای ارائه حافظه کوتاه مدت و بلند مدت به ربات‌ها طراحی شده است تا بتوانند وظایفی را انجام دهند که به جای چند ثانیه، در عرض چند دقیقه انجام می‌شوند.

نتایج به نکته‌ی مهمی اشاره دارند: آینده‌ی رباتیک ممکن است کمتر به دست‌های مکانیکی بهتر و بیشتر به معماری شناختی بهتر وابسته باشد.

مدل‌های رباتیک مدرن از قبل مجموعه‌ای قابل توجه از مهارت‌های حرکتی را در اختیار دارند. آن‌ها می‌توانند اشیاء شکننده را در دست بگیرند، ابزارها را دستکاری کنند و در محیط‌های شلوغ و درهم‌ریخته حرکت کنند. اما از یک ربات بخواهید که یک آشپزخانه کامل را تمیز کند - پیشخوان‌ها را پاک کند، مواد غذایی را سر جای خود بگذارد، ظرف‌ها را بشوید و ظروف را مرتب کند - و محدودیت‌ها به سرعت آشکار می‌شوند.

مشکل خود مهارت‌ها نیستند. مشکل این است که چگونه این مهارت‌ها هماهنگ می‌شوند. وظایف پیچیده نیاز به آگاهی مداوم دارند. یک ربات باید به خاطر بسپارد که کدام کابینت‌ها را قبلاً باز کرده است، درب قابلمه را کجا گذاشته است، یا اینکه آیا قبلاً ظرفی را شسته است یا خیر. همچنین باید اشیایی را که از دید خارج می‌شوند، ردیابی کند و هنگام انجام اقدامات جدید، یک نقشه ذهنی از محیط را حفظ کند.

شناخت انسان این کار را به راحتی انجام می‌دهد. ماشین‌ها، تا همین اواخر، این کار را نمی‌کردند. ذخیره هر مشاهده‌ای که یک ربات برای چند دقیقه یا چند ساعت می‌بیند، از نظر محاسباتی غیرممکن است. اما کنار گذاشتن آن اطلاعات منجر به رفتار آشفته می‌شود - اشتباهات مکرر، مراحل فراموش شده یا اقداماتی که با تصمیمات قبلی مغایرت دارند. در تحقیقات رباتیک، این چالش گاهی اوقات به عنوان "سردرگمی علّی" توصیف می‌شود، جایی که سیستم‌ها رویدادهای گذشته را اشتباه تفسیر می‌کنند و رفتارهای اشتباه را تقویت می‌کنند.

نتیجه: ربات‌هایی که در نمایش‌های کوتاه چشمگیر به نظر می‌رسند اما برای انجام وظایف دنیای واقعی تقلا می‌کنند.

یک سیستم حافظه برای هوش فیزیکی

معماری MEM با معرفی یک ساختار حافظه چند لایه، این مشکل را برطرف می‌کند. به جای ذخیره همه چیز به طور مساوی، سیستم حافظه را به دو شکل مکمل تقسیم می‌کند:

حافظه بصری کوتاه‌مدت، مشاهدات اخیر را با استفاده از یک معماری رمزگذاری ویدیویی کارآمد ثبت می‌کند. این به ربات اجازه می‌دهد تا حرکت را درک کند، اشیاء را در فریم‌ها ردیابی کند و رویدادهایی را که چند ثانیه پیش اتفاق افتاده‌اند به خاطر بسپارد - که برای اقدامات دقیق مانند برگرداندن یک ساندویچ پنیر کبابی یا شستن ظرف بسیار مهم است.

در همین حال، حافظه مفهومی بلندمدت، پیشرفت کار را به زبان طبیعی ذخیره می‌کند. به جای به خاطر سپردن داده‌های بصری خام به صورتdefiربات در نهایت «یادداشت‌های» متنی کوتاهی می‌نویسد که آنچه اتفاق افتاده را شرح می‌دهد - جملاتی مانند «من قابلمه را در سینک گذاشتم» یا «من شیر را از یخچال بیرون آوردم».

این خلاصه‌ها بخشی از فرآیند استدلال ربات می‌شوند. در واقع، دستگاه روایت خود را از وظیفه می‌سازد. سپس موتور استدلال سیستم به طور همزمان دو چیز را تصمیم می‌گیرد: چه عملی را باید در مرحله بعد انجام دهد و چه اطلاعاتی ارزش به خاطر سپردن دارد. این ترکیب به مدل اجازه می‌دهد تا وظایفی را که تا پانزده دقیقه طول می‌کشند - بسیار طولانی‌تر از اکثر نمایش‌های رباتیک قبلی - ردیابی کند.

یکی از جذاب‌ترین قابلیت‌هایی که توسط MEM فراهم می‌شود، سازگاری در متن است. ربات‌ها اشتباه می‌کنند. این اجتناب‌ناپذیر است. اما اکثر سیستم‌های رباتیک این اشتباهات را بی‌پایان تکرار می‌کنند زیرا هیچ حافظه‌ای از شکست ندارند.

تفاوت در آزمایش‌های ساده آشکار می‌شود. در یک آزمایش، یک ربات تلاش می‌کند یک چوب غذاخوری صاف را بردارد. بدون حافظه، دستگاه بارها و بارها همان تلاش ناموفق را برای گرفتن چوب غذاخوری امتحان می‌کند. با فعال شدن حافظه، ربات تلاش ناموفق را به خاطر می‌آورد و رویکرد متفاوتی را امتحان می‌کند - در نهایت موفق می‌شود.

مثال دیگر شامل باز کردن یخچال است. ربات نمی‌تواند صرفاً از داده‌های بصری، جهت باز شدن در را تشخیص دهد. یک سیستم بدون حافظه، صرفاً یک عمل را بارها و بارها تکرار می‌کند. یک ربات دارای حافظه، یک جهت را امتحان می‌کند، شکست را به خاطر می‌سپارد و سپس جهت مخالف را امتحان می‌کند.

این تنظیمات کوچک نشان‌دهنده‌ی چیزی عمیق هستند: توانایی یادگیری در حین انجام وظیفه. ربات به جای تکیه‌ی کامل بر داده‌های آموزشی، درجا خود را وفق می‌دهد.

محققان سیستم مبتنی بر حافظه را در وظایف پیچیده‌تر ارزیابی کردند. ابتدا یک چالش نسبتاً ساده مطرح شد: درست کردن ساندویچ پنیر کبابی. این کار نیاز به حافظه کوتاه‌مدت برای مدیریت زمان‌بندی در حین انجام مراحل فیزیکی ظریف مانند برگرداندن نان و سرو کردن ساندویچ داشت.

مرحله‌ی بعدی یک کار لجستیکی بود: بازیابی مواد لازم برای یک دستور غذا. ربات باید به خاطر می‌سپرد که کدام اقلام را قبلاً جمع‌آوری کرده، کجا قرار داشته‌اند و آیا کشوها و کابینت‌ها بسته بوده‌اند یا خیر. در نهایت نوبت به سخت‌ترین سناریو رسید: تمیز کردن کل آشپزخانه.

این به معنای سر جای گذاشتن اشیاء، شستن ظرف‌ها، پاک کردن روی کابینت‌ها و پیگیری قسمت‌هایی از اتاق بود که قبلاً تمیز شده بودند.

مدل تقویت‌شده با حافظه به طور قابل توجهی از نسخه‌های بدون حافظه ساختاریافته بهتر عمل کرد و قابلیت اطمینان و نرخ تکمیل وظیفه بیشتری را نشان داد.

این تفاوت، یک تغییر کلیدی در رباتیک را نشان می‌دهد. محققان اکنون به جای بهینه‌سازی اقدامات مجزا، در حال ساخت سیستم‌هایی هستند که قادر به گردش‌های کاری پایدار هستند.

چرا حافظه مرز بعدی در رباتیک است؟

مفهوم گسترده‌تر MEM این است که رباتیک وارد مرحله جدیدی می‌شود. برای دهه‌ها، این حوزه بر ادراک و کنترل متمرکز بود: کمک به ماشین‌ها برای دیدن جهان و دستکاری اشیاء. اخیراً، مدل‌های چندوجهی بزرگ، توانایی ربات‌ها را در تفسیر دستورالعمل‌ها و اجرای رفتارهای حرکتی پیچیده به طرز چشمگیری بهبود بخشیده‌اند.

اما با بالغ شدن این قابلیت‌ها، تنگنا برطرف شده است. چالش بعدی، تداوم شناختی است - اینکه ربات‌ها بتوانند در دوره‌های طولانی بدون از دست دادن مسیر اهداف خود عمل کنند. سیستم‌های حافظه‌ای مانند MEM داربستی برای این تداوم فراهم می‌کنند. ربات‌ها به جای واکنش لحظه به لحظه، می‌توانند روایتی درونی در مورد اعمال، تصمیمات و محیط خود داشته باشند. این روایت همان چیزی است که امکان ظهور رفتارهای پیچیده را فراهم می‌کند.

اگر این رویکرد به تکامل خود ادامه دهد، پیامدهای آن بسیار فراتر از تمیز کردن آشپزخانه‌ها خواهد بود. ربات‌های آینده ممکن است نیاز داشته باشند از دستورالعمل‌هایی پیروی کنند که طی ساعت‌ها یا حتی روزها ارائه می‌شوند. تصور کنید به یک دستیار خانگی می‌گویید:

«من ساعت ۶ عصر به خانه می‌رسم - لطفاً شام را آماده کنید و چهارشنبه‌ها خانه را تمیز کنید.»

اجرای چنین درخواستی مستلزم تجزیه دستورالعمل‌های طولانی، برنامه‌ریزی زیروظایف، به خاطر سپردن پیشرفت و سازگاری در صورت بروز مشکل است.

نگهداری یک تاریخچه ویدیویی خام از هر عملی برای چنین مدت طولانی غیرممکن خواهد بود. در عوض، ربات‌ها احتمالاً به سیستم‌های حافظه سلسله مراتبی متکی خواهند بود، جایی که تجربیات به طور فزاینده‌ای در قالب بازنمایی‌های انتزاعی فشرده می‌شوند.

MEM گامی اولیه به سوی آن معماری است. این نشان می‌دهد که کلید ربات‌های توانمندتر ممکن است موتورهای قوی‌تر یا حسگرهای تیزتر نباشد، بلکه حافظه بهتر - و توانایی استدلال در مورد آن - باشد. اگر ربات‌ها بالاخره بتوانند آنچه را که انجام می‌دهند به خاطر بسپارند، ممکن است در نهایت بتوانند کار را نیز به پایان برسانند.

رفع مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

آلیسا، یک روزنامه نگار اختصاصی در MPost، متخصص در ارزهای دیجیتال، هوش مصنوعی، سرمایه‌گذاری و حوزه گسترده... Web3. او با نگاهی دقیق به روندها و فناوری‌های نوظهور، پوشش جامعی را برای اطلاع‌رسانی و مشارکت خوانندگان در چشم‌انداز همیشه در حال تحول مالی دیجیتال ارائه می‌کند.

مقالات بیشتر
آلیسا دیویدسون
آلیسا دیویدسون

آلیسا، یک روزنامه نگار اختصاصی در MPost، متخصص در ارزهای دیجیتال، هوش مصنوعی، سرمایه‌گذاری و حوزه گسترده... Web3. او با نگاهی دقیق به روندها و فناوری‌های نوظهور، پوشش جامعی را برای اطلاع‌رسانی و مشارکت خوانندگان در چشم‌انداز همیشه در حال تحول مالی دیجیتال ارائه می‌کند.

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

آرامش قبل از طوفان سولانا: نمودارها، نهنگ‌ها و سیگنال‌های درون زنجیره‌ای اکنون چه می‌گویند؟

سولانا عملکرد قوی‌ای را نشان داده است که ناشی از افزایش پذیرش، علاقه نهادی و مشارکت‌های کلیدی است، در حالی که با پتانسیل ... روبرو است.

بیشتر بدانید

کریپتو در آوریل ۲۰۲۵: روندهای کلیدی، تغییرات و آنچه در آینده رخ خواهد داد

در آوریل ۲۰۲۵، فضای کریپتو بر تقویت زیرساخت‌های اصلی متمرکز شد و اتریوم برای Pectra آماده می‌شد...

بیشتر بدانید
ادامه مطلب
ادامه مطلب
وال استریت با تلاقی ثبت ETF گلدمن ساکس و بحث کوانتوم با رکود قیمت بیت کوین، فشار بر ارزهای دیجیتال را تشدید می‌کند.
بازارها گزارش خبری تکنولوژی
وال استریت با تلاقی ثبت ETF گلدمن ساکس و بحث کوانتوم با رکود قیمت بیت کوین، فشار بر ارزهای دیجیتال را تشدید می‌کند.
آوریل 17، 2026
فراتر از پل‌های شخص ثالث: شبکه رمپ، کیف پول یکپارچه‌ای را برای ساده‌سازی دسترسی بین زنجیره‌ای به ارزهای دیجیتال راه‌اندازی می‌کند
گزارش خبری تکنولوژی
فراتر از پل‌های شخص ثالث: شبکه رمپ، کیف پول یکپارچه‌ای را برای ساده‌سازی دسترسی بین زنجیره‌ای به ارزهای دیجیتال راه‌اندازی می‌کند
آوریل 17، 2026
شرکت Perplexity اپلیکیشن مک «کامپیوتر شخصی» را راه‌اندازی کرد و عامل‌های هوش مصنوعی همیشه فعال را به سیستم‌های محلی و گردش‌های کاری ابری آورد.
گزارش خبری تکنولوژی
شرکت Perplexity اپلیکیشن مک «کامپیوتر شخصی» را راه‌اندازی کرد و عامل‌های هوش مصنوعی همیشه فعال را به سیستم‌های محلی و گردش‌های کاری ابری آورد.
آوریل 17، 2026
بیت کوین در میان اختلافات کلان گرفتار شد: آرتور هیز نسبت به تورم منفی ناشی از هوش مصنوعی و عدم قطعیت نقدینگی هشدار می‌دهد
بازارها گزارش خبری تکنولوژی
بیت کوین در میان اختلافات کلان گرفتار شد: آرتور هیز نسبت به تورم منفی ناشی از هوش مصنوعی و عدم قطعیت نقدینگی هشدار می‌دهد
آوریل 17، 2026
CRYPTOMERIA LABS PTE. محدود