هوش فیزیکی معماری MEM را معرفی میکند تا به رباتها حافظه مورد نیاز برای وظایف دنیای واقعی را بدهد.
به طور خلاصه
محققان حافظه تجسمی چند مقیاسی را توسعه دادهاند، سیستمی که به رباتها حافظه کوتاهمدت و بلندمدت میدهد تا بتوانند پیشرفت را پیگیری کرده و وظایف پیچیده را به جای انجام اقدامات جداگانه، انجام دهند.
سالهاست که رویای یک ربات خانگی واقعاً مفید، به طرز فریبندهای نزدیک بوده است. رباتها همین حالا هم میتوانند از دستوراتی مانند «شستن ماهیتابه»، «تا کردن لباسهای شسته شده» یا «درست کردن ساندویچ» پیروی کنند. در محیطهای آزمایشگاهی، این سیستمها مهارت و دقت چشمگیری از خود نشان میدهند. با این حال، علیرغم پیشرفتهای سریع در مدلهای پایه رباتیک، چیزی اساسی از قلم افتاده است: حافظه.
رباتی که میتواند یک کار واحد را انجام دهد، با رباتی که میتواند یک کار را به طور کامل انجام دهد، یکسان نیست. تمیز کردن کل آشپزخانه، پختن غذا یا آماده کردن مواد لازم برای یک دستور غذا به چیزی بیش از مهارتهای جداگانه نیاز دارد. این کار به پیوستگی نیاز دارد - توانایی به خاطر سپردن آنچه قبلاً انجام شده است، آنچه هنوز باید اتفاق بیفتد و محل قرارگیری هر چیز. بدون آن رشته روایت، حتی توانمندترین رباتها نیز به طرز شگفتآوری بیکفایت میشوند.
این چالشی است که محققان Physical Intelligence اکنون در تلاشند تا با معماری جدیدی به نام حافظه تجسمی چند مقیاسی (MEM) آن را حل کنند - سیستمی که برای ارائه حافظه کوتاه مدت و بلند مدت به رباتها طراحی شده است تا بتوانند وظایفی را انجام دهند که به جای چند ثانیه، در عرض چند دقیقه انجام میشوند.
نتایج به نکتهی مهمی اشاره دارند: آیندهی رباتیک ممکن است کمتر به دستهای مکانیکی بهتر و بیشتر به معماری شناختی بهتر وابسته باشد.
مدلهای رباتیک مدرن از قبل مجموعهای قابل توجه از مهارتهای حرکتی را در اختیار دارند. آنها میتوانند اشیاء شکننده را در دست بگیرند، ابزارها را دستکاری کنند و در محیطهای شلوغ و درهمریخته حرکت کنند. اما از یک ربات بخواهید که یک آشپزخانه کامل را تمیز کند - پیشخوانها را پاک کند، مواد غذایی را سر جای خود بگذارد، ظرفها را بشوید و ظروف را مرتب کند - و محدودیتها به سرعت آشکار میشوند.
مشکل خود مهارتها نیستند. مشکل این است که چگونه این مهارتها هماهنگ میشوند. وظایف پیچیده نیاز به آگاهی مداوم دارند. یک ربات باید به خاطر بسپارد که کدام کابینتها را قبلاً باز کرده است، درب قابلمه را کجا گذاشته است، یا اینکه آیا قبلاً ظرفی را شسته است یا خیر. همچنین باید اشیایی را که از دید خارج میشوند، ردیابی کند و هنگام انجام اقدامات جدید، یک نقشه ذهنی از محیط را حفظ کند.
شناخت انسان این کار را به راحتی انجام میدهد. ماشینها، تا همین اواخر، این کار را نمیکردند. ذخیره هر مشاهدهای که یک ربات برای چند دقیقه یا چند ساعت میبیند، از نظر محاسباتی غیرممکن است. اما کنار گذاشتن آن اطلاعات منجر به رفتار آشفته میشود - اشتباهات مکرر، مراحل فراموش شده یا اقداماتی که با تصمیمات قبلی مغایرت دارند. در تحقیقات رباتیک، این چالش گاهی اوقات به عنوان "سردرگمی علّی" توصیف میشود، جایی که سیستمها رویدادهای گذشته را اشتباه تفسیر میکنند و رفتارهای اشتباه را تقویت میکنند.
نتیجه: رباتهایی که در نمایشهای کوتاه چشمگیر به نظر میرسند اما برای انجام وظایف دنیای واقعی تقلا میکنند.
یک سیستم حافظه برای هوش فیزیکی
معماری MEM با معرفی یک ساختار حافظه چند لایه، این مشکل را برطرف میکند. به جای ذخیره همه چیز به طور مساوی، سیستم حافظه را به دو شکل مکمل تقسیم میکند:
حافظه بصری کوتاهمدت، مشاهدات اخیر را با استفاده از یک معماری رمزگذاری ویدیویی کارآمد ثبت میکند. این به ربات اجازه میدهد تا حرکت را درک کند، اشیاء را در فریمها ردیابی کند و رویدادهایی را که چند ثانیه پیش اتفاق افتادهاند به خاطر بسپارد - که برای اقدامات دقیق مانند برگرداندن یک ساندویچ پنیر کبابی یا شستن ظرف بسیار مهم است.
در همین حال، حافظه مفهومی بلندمدت، پیشرفت کار را به زبان طبیعی ذخیره میکند. به جای به خاطر سپردن دادههای بصری خام به صورتdefiربات در نهایت «یادداشتهای» متنی کوتاهی مینویسد که آنچه اتفاق افتاده را شرح میدهد - جملاتی مانند «من قابلمه را در سینک گذاشتم» یا «من شیر را از یخچال بیرون آوردم».
این خلاصهها بخشی از فرآیند استدلال ربات میشوند. در واقع، دستگاه روایت خود را از وظیفه میسازد. سپس موتور استدلال سیستم به طور همزمان دو چیز را تصمیم میگیرد: چه عملی را باید در مرحله بعد انجام دهد و چه اطلاعاتی ارزش به خاطر سپردن دارد. این ترکیب به مدل اجازه میدهد تا وظایفی را که تا پانزده دقیقه طول میکشند - بسیار طولانیتر از اکثر نمایشهای رباتیک قبلی - ردیابی کند.
یکی از جذابترین قابلیتهایی که توسط MEM فراهم میشود، سازگاری در متن است. رباتها اشتباه میکنند. این اجتنابناپذیر است. اما اکثر سیستمهای رباتیک این اشتباهات را بیپایان تکرار میکنند زیرا هیچ حافظهای از شکست ندارند.
تفاوت در آزمایشهای ساده آشکار میشود. در یک آزمایش، یک ربات تلاش میکند یک چوب غذاخوری صاف را بردارد. بدون حافظه، دستگاه بارها و بارها همان تلاش ناموفق را برای گرفتن چوب غذاخوری امتحان میکند. با فعال شدن حافظه، ربات تلاش ناموفق را به خاطر میآورد و رویکرد متفاوتی را امتحان میکند - در نهایت موفق میشود.
مثال دیگر شامل باز کردن یخچال است. ربات نمیتواند صرفاً از دادههای بصری، جهت باز شدن در را تشخیص دهد. یک سیستم بدون حافظه، صرفاً یک عمل را بارها و بارها تکرار میکند. یک ربات دارای حافظه، یک جهت را امتحان میکند، شکست را به خاطر میسپارد و سپس جهت مخالف را امتحان میکند.
این تنظیمات کوچک نشاندهندهی چیزی عمیق هستند: توانایی یادگیری در حین انجام وظیفه. ربات به جای تکیهی کامل بر دادههای آموزشی، درجا خود را وفق میدهد.
محققان سیستم مبتنی بر حافظه را در وظایف پیچیدهتر ارزیابی کردند. ابتدا یک چالش نسبتاً ساده مطرح شد: درست کردن ساندویچ پنیر کبابی. این کار نیاز به حافظه کوتاهمدت برای مدیریت زمانبندی در حین انجام مراحل فیزیکی ظریف مانند برگرداندن نان و سرو کردن ساندویچ داشت.
مرحلهی بعدی یک کار لجستیکی بود: بازیابی مواد لازم برای یک دستور غذا. ربات باید به خاطر میسپرد که کدام اقلام را قبلاً جمعآوری کرده، کجا قرار داشتهاند و آیا کشوها و کابینتها بسته بودهاند یا خیر. در نهایت نوبت به سختترین سناریو رسید: تمیز کردن کل آشپزخانه.
این به معنای سر جای گذاشتن اشیاء، شستن ظرفها، پاک کردن روی کابینتها و پیگیری قسمتهایی از اتاق بود که قبلاً تمیز شده بودند.
مدل تقویتشده با حافظه به طور قابل توجهی از نسخههای بدون حافظه ساختاریافته بهتر عمل کرد و قابلیت اطمینان و نرخ تکمیل وظیفه بیشتری را نشان داد.
این تفاوت، یک تغییر کلیدی در رباتیک را نشان میدهد. محققان اکنون به جای بهینهسازی اقدامات مجزا، در حال ساخت سیستمهایی هستند که قادر به گردشهای کاری پایدار هستند.
چرا حافظه مرز بعدی در رباتیک است؟
مفهوم گستردهتر MEM این است که رباتیک وارد مرحله جدیدی میشود. برای دههها، این حوزه بر ادراک و کنترل متمرکز بود: کمک به ماشینها برای دیدن جهان و دستکاری اشیاء. اخیراً، مدلهای چندوجهی بزرگ، توانایی رباتها را در تفسیر دستورالعملها و اجرای رفتارهای حرکتی پیچیده به طرز چشمگیری بهبود بخشیدهاند.
اما با بالغ شدن این قابلیتها، تنگنا برطرف شده است. چالش بعدی، تداوم شناختی است - اینکه رباتها بتوانند در دورههای طولانی بدون از دست دادن مسیر اهداف خود عمل کنند. سیستمهای حافظهای مانند MEM داربستی برای این تداوم فراهم میکنند. رباتها به جای واکنش لحظه به لحظه، میتوانند روایتی درونی در مورد اعمال، تصمیمات و محیط خود داشته باشند. این روایت همان چیزی است که امکان ظهور رفتارهای پیچیده را فراهم میکند.
اگر این رویکرد به تکامل خود ادامه دهد، پیامدهای آن بسیار فراتر از تمیز کردن آشپزخانهها خواهد بود. رباتهای آینده ممکن است نیاز داشته باشند از دستورالعملهایی پیروی کنند که طی ساعتها یا حتی روزها ارائه میشوند. تصور کنید به یک دستیار خانگی میگویید:
«من ساعت ۶ عصر به خانه میرسم - لطفاً شام را آماده کنید و چهارشنبهها خانه را تمیز کنید.»
اجرای چنین درخواستی مستلزم تجزیه دستورالعملهای طولانی، برنامهریزی زیروظایف، به خاطر سپردن پیشرفت و سازگاری در صورت بروز مشکل است.
نگهداری یک تاریخچه ویدیویی خام از هر عملی برای چنین مدت طولانی غیرممکن خواهد بود. در عوض، رباتها احتمالاً به سیستمهای حافظه سلسله مراتبی متکی خواهند بود، جایی که تجربیات به طور فزایندهای در قالب بازنماییهای انتزاعی فشرده میشوند.
MEM گامی اولیه به سوی آن معماری است. این نشان میدهد که کلید رباتهای توانمندتر ممکن است موتورهای قویتر یا حسگرهای تیزتر نباشد، بلکه حافظه بهتر - و توانایی استدلال در مورد آن - باشد. اگر رباتها بالاخره بتوانند آنچه را که انجام میدهند به خاطر بسپارند، ممکن است در نهایت بتوانند کار را نیز به پایان برسانند.
رفع مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
آلیسا، یک روزنامه نگار اختصاصی در MPost، متخصص در ارزهای دیجیتال، هوش مصنوعی، سرمایهگذاری و حوزه گسترده... Web3. او با نگاهی دقیق به روندها و فناوریهای نوظهور، پوشش جامعی را برای اطلاعرسانی و مشارکت خوانندگان در چشمانداز همیشه در حال تحول مالی دیجیتال ارائه میکند.
مقالات بیشتر
آلیسا، یک روزنامه نگار اختصاصی در MPost، متخصص در ارزهای دیجیتال، هوش مصنوعی، سرمایهگذاری و حوزه گسترده... Web3. او با نگاهی دقیق به روندها و فناوریهای نوظهور، پوشش جامعی را برای اطلاعرسانی و مشارکت خوانندگان در چشمانداز همیشه در حال تحول مالی دیجیتال ارائه میکند.



