Kecerdasan Fizikal Memperkenalkan Seni Bina MEM untuk Memberi Robot Memori yang Diperlukan untuk Tugas Dunia Nyata
Secara ringkas
Para penyelidik telah membangunkan Memori Terjelma Berbilang Skala, sebuah sistem yang memberikan robot memori jangka pendek dan panjang supaya mereka dapat menjejaki kemajuan dan menyelesaikan tugas yang kompleks dan bukannya hanya melaksanakan tindakan terpencil.
Selama bertahun-tahun, impian robot rumah yang benar-benar membantu hampir mustahil. Robot sudah boleh mengikuti arahan seperti "basuh kuali", "lipat pakaian", atau "buat sandwic". Dalam persekitaran makmal, sistem ini menunjukkan ketangkasan dan ketepatan yang mengagumkan. Namun, meskipun terdapat kemajuan pesat dalam model asas robot, sesuatu yang asas telah hilang: ingatan.
Robot yang boleh melaksanakan satu tugas sahaja tidak sama dengan robot yang boleh menyiapkan satu kerja. Membersihkan seluruh dapur, memasak makanan atau menyediakan bahan-bahan untuk resipi memerlukan lebih daripada sekadar kemahiran yang terpencil. Ia memerlukan kesinambungan — keupayaan untuk mengingati apa yang telah dilakukan, apa yang masih perlu berlaku dan di mana semuanya berada. Tanpa benang naratif itu, robot yang paling berkebolehan pun menjadi tidak cekap.
Inilah cabaran yang kini cuba diselesaikan oleh para penyelidik di Physical Intelligence dengan seni bina baharu yang dipanggil Multi-Scale Embodied Memory (MEM) — sebuah sistem yang direka untuk memberikan robot memori jangka pendek dan jangka panjang supaya mereka boleh melakukan tugas yang terungkap dalam beberapa minit dan bukannya saat.
Hasilnya membayangkan sesuatu yang penting: masa depan robotik mungkin kurang bergantung pada tangan mekanikal yang lebih baik dan lebih banyak bergantung pada seni bina kognitif yang lebih baik.
Model robot moden sudah mempunyai perpustakaan kemahiran motor yang luar biasa. Mereka boleh memegang objek rapuh, memanipulasi alatan dan menavigasi persekitaran yang berselerak. Tetapi minta robot membersihkan dapur yang lengkap — mengelap kaunter, menyimpan barangan runcit, membasuh pinggan mangkuk dan menyusun peralatan — dan batasannya dengan cepat menjadi jelas.
Masalahnya bukanlah kemahiran itu sendiri. Masalahnya ialah bagaimana kemahiran tersebut diselaraskan. Tugas yang kompleks memerlukan kesedaran yang berterusan. Robot mesti mengingati kabinet mana yang telah dibuka, di mana ia meletakkan penutup periuk, atau sama ada ia telah mencuci pinggan mangkuk. Ia juga mesti menjejaki objek yang bergerak di luar pandangan dan mengekalkan peta mental persekitaran sambil melakukan tindakan baharu.
Kognisi manusia melakukan ini dengan mudah. Mesin, sehingga baru-baru ini, tidak berbuat demikian. Menyimpan setiap pemerhatian yang dilihat oleh robot selama beberapa minit atau jam adalah mustahil secara pengiraan. Tetapi membuang maklumat tersebut membawa kepada tingkah laku huru-hara — kesilapan berulang, langkah yang dilupakan atau tindakan yang bercanggah dengan keputusan terdahulu. Dalam penyelidikan robotik, cabaran ini kadangkala digambarkan sebagai "kekeliruan kausal", di mana sistem salah tafsir peristiwa lalu dan mengukuhkan tingkah laku yang salah.
Hasilnya: robot yang kelihatan mengagumkan dalam demo pendek tetapi sukar untuk menyelesaikan tugasan dunia sebenar.
Sistem Memori Untuk Kecerdasan Fizikal
Seni bina MEM menangani masalah ini dengan memperkenalkan struktur memori berbilang lapisan. Daripada menyimpan semuanya secara sama rata, sistem ini mengasingkan memori kepada dua bentuk pelengkap:
Ingatan visual jangka pendek merakam pemerhatian terkini menggunakan seni bina pengekodan video yang cekap. Ini membolehkan robot memahami gerakan, menjejaki objek merentasi bingkai dan mengingati peristiwa yang berlaku beberapa saat yang lalu — penting untuk tindakan tepat seperti membalikkan sandwic keju panggang atau menggosok pinggan.
Sementara itu, ingatan konseptual jangka panjang menyimpan kemajuan tugasan dalam bahasa semula jadi. Daripada mengingati data visual mentah dalamdefiAkhirnya, robot itu menulis "nota" teks ringkas yang menerangkan apa yang telah berlaku — kenyataan seperti "Saya meletakkan periuk di dalam sinki" atau "Saya mengambil susu dari peti sejuk."
Ringkasan ini menjadi sebahagian daripada proses penaakulan robot. Kesannya, mesin membina naratifnya sendiri tentang tugas tersebut. Enjin penaakulan sistem kemudiannya memutuskan dua perkara secara serentak: tindakan yang perlu dilakukan seterusnya dan maklumat yang perlu diingati. Gabungan ini membolehkan model menjejaki tugas yang berlangsung sehingga lima belas minit — jauh lebih lama daripada kebanyakan demonstrasi robot sebelumnya.
Salah satu keupayaan paling menarik yang didayakan oleh MEM ialah penyesuaian dalam konteks. Robot membuat kesilapan. Itu tidak dapat dielakkan. Tetapi kebanyakan sistem robotik mengulangi kesilapan tersebut tanpa henti kerana ia tidak mempunyai ingatan tentang kegagalan.
Perbezaannya menjadi jelas dalam eksperimen mudah. Dalam satu ujian, robot cuba mengambil penyepit yang rata. Tanpa ingatan, mesin berulang kali mencuba cengkaman yang sama tetapi tidak berjaya. Dengan ingatan diaktifkan, robot mengingati percubaan yang gagal dan mencuba pendekatan yang berbeza — akhirnya berjaya.
Satu lagi contoh melibatkan pembukaan peti sejuk. Daripada data visual sahaja, robot tidak dapat menentukan dengan segera arah pintu dibuka. Sistem tanpa memori hanya mengulangi tindakan yang sama berulang kali. Robot yang didayakan memori mencuba satu arah, mengingati kegagalan, dan kemudian mencuba bahagian yang bertentangan.
Pelarasan kecil ini mewakili sesuatu yang mendalam: keupayaan untuk belajar dalam tugasan itu sendiri. Daripada bergantung sepenuhnya pada data latihan, robot ini menyesuaikan diri dengan pantas.
Para penyelidik menilai sistem yang didayakan memori pada tugas yang semakin kompleks. Mula-mula datang cabaran yang agak mudah: membuat sandwic keju panggang. Ini memerlukan ingatan jangka pendek untuk mengurus masa sambil melakukan langkah fizikal yang halus seperti membalikkan roti dan menyadur sandwic.
Seterusnya datang tugas logistik: mendapatkan bahan-bahan untuk resipi. Robot itu perlu mengingati barang-barang yang telah dikumpulkannya, di mana ia berada, dan sama ada laci dan kabinet telah ditutup. Akhirnya datang senario yang paling mencabar: membersihkan seluruh dapur.
Ini bermakna menyimpan barang-barang, membasuh pinggan mangkuk, mengelap kaunter dan menjejaki bahagian bilik yang telah dibersihkan.
Model yang ditambah memori mengatasi versi tanpa memori berstruktur dengan ketara, menunjukkan kebolehpercayaan dan kadar penyiapan tugas yang lebih tinggi.
Perbezaan tersebut menggambarkan perubahan penting dalam robotik. Daripada mengoptimumkan tindakan terpencil, para penyelidik kini sedang membina sistem yang mampu menghasilkan aliran kerja yang mampan.
Mengapa Ingatan Merupakan Sempadan Seterusnya Dalam Robotik
Implikasi MEM yang lebih luas ialah robotik sedang memasuki fasa baharu. Selama beberapa dekad, bidang ini memberi tumpuan kepada persepsi dan kawalan: membantu mesin melihat dunia dan memanipulasi objek. Baru-baru ini, model multimodal yang besar telah meningkatkan keupayaan robot untuk mentafsir arahan dan melaksanakan tingkah laku motor yang kompleks secara dramatik.
Namun, apabila keupayaan tersebut matang, kesesakan telah beralih. Cabaran seterusnya ialah kesinambungan kognitif — membolehkan robot beroperasi dalam tempoh yang lama tanpa kehilangan matlamat mereka. Sistem memori seperti MEM menyediakan perancah untuk kesinambungan tersebut. Daripada bertindak balas dari semasa ke semasa, robot boleh mengekalkan naratif dalaman tentang tindakan, keputusan dan persekitaran mereka. Naratif inilah yang membolehkan tingkah laku yang kompleks muncul.
Jika pendekatan ini terus berkembang, implikasinya melangkaui pembersihan dapur. Robot masa depan mungkin perlu mengikuti arahan yang berlaku selama berjam-jam atau bahkan berhari-hari. Bayangkan memberitahu pembantu rumah:
"Saya pulang ke rumah pada pukul 6 petang — sila sediakan makan malam dan kemas rumah pada hari Rabu."
Melaksanakan permintaan sedemikian memerlukan penghuraian arahan yang panjang, merancang subtugas, mengingati kemajuan dan menyesuaikan diri apabila keadaan menjadi salah.
Mengekalkan sejarah video mentah bagi setiap tindakan untuk tempoh tersebut adalah mustahil. Sebaliknya, robot mungkin akan bergantung pada sistem memori hierarki, di mana pengalaman dimampatkan menjadi perwakilan yang semakin abstrak.
MEM merupakan langkah awal ke arah seni bina tersebut. Ia menunjukkan bahawa kunci kepada robot yang lebih berkemampuan mungkin bukan motor yang lebih kuat atau sensor yang lebih tajam, tetapi ingatan yang lebih baik — dan keupayaan untuk berfikir mengenainya. Jika robot akhirnya dapat mengingati apa yang mereka lakukan, mereka juga mungkin akhirnya dapat menyelesaikan tugas tersebut.
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Alisa, seorang wartawan yang berdedikasi di MPost, pakar dalam kripto, AI, pelaburan dan bidang yang luas Web3. Dengan memerhatikan trend dan teknologi yang sedang muncul, beliau menyampaikan liputan komprehensif untuk memaklumkan dan melibatkan pembaca dalam landskap kewangan digital yang sentiasa berkembang.
lebih banyak artikel
Alisa, seorang wartawan yang berdedikasi di MPost, pakar dalam kripto, AI, pelaburan dan bidang yang luas Web3. Dengan memerhatikan trend dan teknologi yang sedang muncul, beliau menyampaikan liputan komprehensif untuk memaklumkan dan melibatkan pembaca dalam landskap kewangan digital yang sentiasa berkembang.


