Pendapat Teknologi
05 Maret, 2026

Kecerdasan Fisik Memperkenalkan Arsitektur MEM untuk Memberikan Robot Memori yang Dibutuhkan untuk Tugas-Tugas Dunia Nyata

Singkatnya

Para peneliti mengembangkan Multi-Scale Embodied Memory, sebuah sistem yang memberikan robot memori jangka pendek dan jangka panjang sehingga mereka dapat melacak kemajuan dan menyelesaikan tugas-tugas kompleks, bukan hanya mengeksekusi tindakan-tindakan terisolasi. 

Kecerdasan Fisik Memperkenalkan Arsitektur MEM untuk Memberikan Robot Memori yang Dibutuhkan untuk Tugas-Tugas Dunia Nyata

Selama bertahun-tahun, impian akan robot rumah tangga yang benar-benar bermanfaat telah begitu dekat. Robot sudah dapat mengikuti perintah seperti "cuci wajan," "lipat pakaian," atau "buat sandwich." Di lingkungan laboratorium, sistem ini menunjukkan ketangkasan dan presisi yang mengesankan. Namun terlepas dari kemajuan pesat dalam model dasar robotika, sesuatu yang mendasar telah hilang: memori.

Robot yang hanya mampu menjalankan satu tugas tidak sama dengan robot yang mampu menyelesaikan suatu pekerjaan. Membersihkan seluruh dapur, memasak makanan, atau menyiapkan bahan-bahan untuk resep membutuhkan lebih dari sekadar keterampilan yang terisolasi. Hal itu membutuhkan kontinuitas — kemampuan untuk mengingat apa yang telah dilakukan, apa yang masih perlu dilakukan, dan di mana semua hal berada. Tanpa alur cerita tersebut, bahkan robot yang paling mumpuni pun akan menjadi sangat tidak kompeten.

Inilah tantangan yang kini coba dipecahkan oleh para peneliti di Physical Intelligence dengan arsitektur baru yang disebut Multi-Scale Embodied Memory (MEM) — sebuah sistem yang dirancang untuk memberikan robot memori jangka pendek dan jangka panjang sehingga mereka dapat melakukan tugas yang berlangsung selama beberapa menit, bukan detik.

Hasil penelitian ini mengisyaratkan sesuatu yang penting: masa depan robotika mungkin kurang bergantung pada tangan mekanik yang lebih baik dan lebih bergantung pada arsitektur kognitif yang lebih baik.

Model robot modern sudah memiliki beragam kemampuan motorik yang luar biasa. Mereka dapat menggenggam benda-benda rapuh, memanipulasi peralatan, dan menavigasi lingkungan yang berantakan. Tetapi mintalah robot untuk membersihkan dapur sepenuhnya — menyeka meja, menyimpan bahan makanan, mencuci piring, dan mengatur peralatan makan — dan keterbatasannya akan segera terlihat jelas.

Masalahnya bukan pada keterampilan itu sendiri. Masalahnya adalah bagaimana keterampilan tersebut dikoordinasikan. Tugas-tugas kompleks membutuhkan kesadaran yang berkelanjutan. Sebuah robot harus mengingat lemari mana yang sudah dibukanya, di mana ia meletakkan tutup panci, atau apakah ia sudah mencuci piring. Ia juga harus melacak objek yang bergerak keluar dari pandangan dan mempertahankan peta mental lingkungan sambil melakukan tindakan baru.

Kemampuan kognitif manusia melakukan hal ini dengan mudah. ​​Mesin, hingga baru-baru ini, belum mampu melakukannya. Menyimpan setiap pengamatan yang dilihat robot selama beberapa menit atau jam secara komputasi tidak memungkinkan. Tetapi membuang informasi tersebut menyebabkan perilaku kacau — kesalahan berulang, langkah yang terlupakan, atau tindakan yang bertentangan dengan keputusan sebelumnya. Dalam penelitian robotika, tantangan ini terkadang digambarkan sebagai "kebingungan kausal," di mana sistem salah menafsirkan peristiwa masa lalu dan memperkuat perilaku yang salah.

Hasilnya: robot yang tampak mengesankan dalam demonstrasi singkat tetapi kesulitan menyelesaikan tugas di dunia nyata.

Sistem Memori untuk Kecerdasan Fisik

Arsitektur MEM mengatasi masalah ini dengan memperkenalkan struktur memori berlapis-lapis. Alih-alih menyimpan semuanya secara merata, sistem ini memisahkan memori menjadi dua bentuk yang saling melengkapi:

Memori visual jangka pendek menangkap pengamatan terkini menggunakan arsitektur pengkodean video yang efisien. Hal ini memungkinkan robot untuk memahami gerakan, melacak objek di berbagai frame, dan mengingat peristiwa yang terjadi beberapa detik yang lalu — sangat penting untuk tindakan presisi seperti membalik sandwich keju panggang atau mencuci piring.

Sementara itu, memori konseptual jangka panjang menyimpan kemajuan tugas dalam bahasa alami. Alih-alih mengingat data visual mentah dalamdefiSetiap malam, robot tersebut menulis "catatan" tekstual singkat yang menjelaskan apa yang telah terjadi — pernyataan seperti "Saya meletakkan panci di wastafel" atau "Saya mengambil susu dari kulkas."

Ringkasan-ringkasan ini menjadi bagian dari proses penalaran robot. Pada intinya, mesin tersebut membangun narasi tugasnya sendiri. Mesin penalaran sistem kemudian memutuskan dua hal secara bersamaan: tindakan apa yang harus dilakukan selanjutnya dan informasi apa yang layak diingat. Kombinasi ini memungkinkan model untuk melacak tugas yang berlangsung hingga lima belas menit — jauh lebih lama daripada sebagian besar demonstrasi robot sebelumnya.

Salah satu kemampuan paling menarik yang dimungkinkan oleh MEM adalah adaptasi dalam konteks. Robot membuat kesalahan. Itu tak terhindarkan. Tetapi sebagian besar sistem robot mengulangi kesalahan tersebut tanpa henti karena mereka tidak memiliki memori kegagalan.

Perbedaan tersebut menjadi jelas dalam percobaan sederhana. Dalam satu pengujian, sebuah robot mencoba mengambil sumpit pipih. Tanpa memori, mesin tersebut berulang kali mencoba pegangan yang sama namun gagal. Dengan memori yang diaktifkan, robot mengingat upaya yang gagal dan mencoba pendekatan yang berbeda — akhirnya berhasil.

Contoh lain melibatkan membuka lemari es. Hanya dari data visual saja, robot tidak dapat langsung menentukan ke arah mana pintu terbuka. Sistem tanpa memori hanya akan mengulangi tindakan yang sama berulang kali. Robot yang memiliki memori mencoba satu arah, mengingat kegagalan tersebut, dan kemudian mencoba sisi yang berlawanan.

Penyesuaian kecil ini mewakili sesuatu yang mendalam: kemampuan untuk belajar dalam tugas itu sendiri. Alih-alih sepenuhnya bergantung pada data pelatihan, robot beradaptasi secara langsung.

Para peneliti mengevaluasi sistem yang dilengkapi memori tersebut pada tugas-tugas yang semakin kompleks. Pertama, tantangan yang relatif sederhana: membuat sandwich keju panggang. Ini membutuhkan memori jangka pendek untuk mengatur waktu sambil melakukan langkah-langkah fisik yang rumit seperti membalik roti dan menyajikan sandwich.

Selanjutnya, datanglah tugas logistik: mengambil bahan-bahan untuk sebuah resep. Robot harus mengingat barang-barang mana yang sudah dikumpulkannya, di mana letaknya, dan apakah laci dan lemari sudah tertutup. Terakhir, datanglah skenario yang paling menantang: membersihkan seluruh dapur.

Ini berarti menyimpan barang-barang, mencuci piring, membersihkan permukaan meja, dan melacak bagian ruangan mana yang sudah dibersihkan.

Model yang dilengkapi dengan memori terstruktur secara signifikan mengungguli versi tanpa memori terstruktur, menunjukkan keandalan dan tingkat penyelesaian tugas yang lebih tinggi.

Perbedaan ini menggambarkan pergeseran penting dalam bidang robotika. Alih-alih mengoptimalkan tindakan yang terisolasi, para peneliti sekarang membangun sistem yang mampu menjalankan alur kerja berkelanjutan.

Mengapa Memori Adalah Batasan Berikutnya dalam Robotika

Implikasi yang lebih luas dari MEM adalah bahwa robotika memasuki fase baru. Selama beberapa dekade, bidang ini berfokus pada persepsi dan kontrol: membantu mesin melihat dunia dan memanipulasi objek. Baru-baru ini, model multimodal besar telah secara dramatis meningkatkan kemampuan robot untuk menafsirkan instruksi dan mengeksekusi perilaku motorik yang kompleks.

Namun seiring dengan kematangan kemampuan tersebut, hambatan utamanya telah bergeser. Tantangan selanjutnya adalah kontinuitas kognitif — memungkinkan robot untuk beroperasi dalam jangka waktu yang lama tanpa kehilangan jejak tujuan mereka. Sistem memori seperti MEM menyediakan kerangka kerja untuk kontinuitas tersebut. Alih-alih bereaksi dari waktu ke waktu, robot dapat mempertahankan narasi internal tentang tindakan, keputusan, dan lingkungan mereka. Narasi inilah yang memungkinkan perilaku kompleks untuk muncul.

Jika pendekatan ini terus berkembang, implikasinya meluas jauh melampaui sekadar membersihkan dapur. Robot masa depan mungkin perlu mengikuti instruksi yang berlangsung selama berjam-jam atau bahkan berhari-hari. Bayangkan memberi tahu asisten rumah tangga:

“Saya pulang jam 6 sore — tolong siapkan makan malam dan bersihkan rumah pada hari Rabu.”

Mengeksekusi permintaan seperti itu akan membutuhkan penguraian instruksi yang panjang, perencanaan sub-tugas, mengingat kemajuan, dan beradaptasi ketika terjadi kesalahan.

Mempertahankan riwayat video mentah dari setiap tindakan selama itu akan menjadi hal yang mustahil. Sebagai gantinya, robot kemungkinan akan mengandalkan sistem memori hierarkis, di mana pengalaman dikompresi menjadi representasi yang semakin abstrak.

MEM merupakan langkah awal menuju arsitektur tersebut. Hal ini menunjukkan bahwa kunci untuk robot yang lebih mumpuni mungkin bukan terletak pada motor yang lebih kuat atau sensor yang lebih tajam, melainkan pada memori yang lebih baik—dan kemampuan untuk bernalar tentangnya. Jika robot akhirnya dapat mengingat apa yang mereka lakukan, mereka mungkin juga akhirnya dapat menyelesaikan pekerjaan tersebut.

Penolakan tanggung jawab

Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.

Tentang Penulis

Alisa, seorang jurnalis yang berdedikasi di MPost, berspesialisasi dalam kripto, AI, investasi, dan ranah yang luas dari Web3. Dengan ketertarikannya terhadap tren dan teknologi yang sedang berkembang, ia memberikan liputan komprehensif untuk memberikan informasi dan melibatkan pembaca dalam lanskap keuangan digital yang terus berkembang.

lebih artikel
Alisa Davidson
Alisa Davidson

Alisa, seorang jurnalis yang berdedikasi di MPost, berspesialisasi dalam kripto, AI, investasi, dan ranah yang luas dari Web3. Dengan ketertarikannya terhadap tren dan teknologi yang sedang berkembang, ia memberikan liputan komprehensif untuk memberikan informasi dan melibatkan pembaca dalam lanskap keuangan digital yang terus berkembang.

Ketenangan Sebelum Badai Solana: Apa yang Diungkapkan Grafik, Paus, dan Sinyal On-Chain Saat Ini

Solana telah menunjukkan kinerja yang kuat, didorong oleh meningkatnya adopsi, minat kelembagaan, dan kemitraan utama, sambil menghadapi potensi ...

Tahu lebih banyak

Kripto di bulan April 2025: Tren Utama, Perubahan, dan Apa yang Akan Terjadi Selanjutnya

Pada bulan April 2025, ruang kripto berfokus pada penguatan infrastruktur inti, dengan Ethereum mempersiapkan Pectra ...

Tahu lebih banyak
Baca Selengkapnya
Baca lebih lanjut
Aptos dan NETSTARS Bermitra untuk Memajukan Web3 Infrastruktur Pembayaran dan Penyelesaian Berbasis Stablecoin
Laporan berita Teknologi
Aptos dan NETSTARS Bermitra untuk Memajukan Web3 Infrastruktur Pembayaran dan Penyelesaian Berbasis Stablecoin
8 Mei 2026
Google Meluncurkan Platform Kesehatan Bertenaga AI dengan Gemini Coach dan Perangkat Wearable Fitbit Air Terbaru
Laporan berita Teknologi
Google Meluncurkan Platform Kesehatan Bertenaga AI dengan Gemini Coach dan Perangkat Wearable Fitbit Air Terbaru
8 Mei 2026
HSC Asset Management Hong Kong: Mendalami Perubahan Strategi Investasi di Asia Seiring Konvergensi Pasar Modal, Kripto, dan Pasar Swasta
Musim Peretasan Wawancara Bisnis Gaya Hidup Teknologi
HSC Asset Management Hong Kong: Mendalami Perubahan Strategi Investasi di Asia Seiring Konvergensi Pasar Modal, Kripto, dan Pasar Swasta
8 Mei 2026
New OpenAI Model Audio Mendukung Asisten Suara Real-Time dengan Terjemahan Multibahasa dan Kecerdasan Streaming
Laporan berita Teknologi
New OpenAI Model Audio Mendukung Asisten Suara Real-Time dengan Terjemahan Multibahasa dan Kecerdasan Streaming
8 Mei 2026