Avgust 01, 2023

Is GPT-4 Robototexnika quvvatini oshirmoqchimisiz? Nima uchun RT-2 hamma narsani o'zgartiradi

Nashr qilingan: 01 yil 2023-avgust, 3:58 Yangilangan: 01-avgust, 2023-yil, 3:58

Tahrirlangan va faktlar tekshirilgan: 01 yil 2023-avgust, soat 3:58

Qisqacha

Google DeepMind uchun ko'rish tili modeli ilovalarini ishlab chiqdi uchidan uchiga robot boshqaruvi, bilimlarni umumlashtirish va domenlar bo'ylab uzatish qobiliyatiga e'tibor qaratish.

Katta hajmdagi ma'lumotlarni kodlash qobiliyatiga ega ketma-ketlikni yaratish uchun mo'ljallangan RT-2 modeli turli stsenariylarda, jumladan, notanish ob'ektlar, turli fon va turli muhitlarda sinovdan o'tkazildi.

RT-2 modeli yangi sharoitlarga moslashish bo'yicha o'zidan oldingi modellardan ancha ustundir, bu asosan o'zining kengaytirilgan til modeli tufayli.

Google DeepMind ko'rish tili modeli ilovalarini o'rganib chiqdi, ularning potentsialiga e'tiborni oxirigacha robot nazorati uchun qaratish. Ushbu tadqiqot ushbu modellarning keng umumlashtirishga qodirligini aniqlashga harakat qildi. Bundan tashqari, keng tarqalgan til modellari bilan tez-tez bog'langan fikrlash va rejalashtirish kabi ba'zi kognitiv funktsiyalar ushbu kontekstda paydo bo'lishi mumkinmi yoki yo'qligini tekshirdi.

Is GPT-4 Robototexnika quvvatini oshirmoqchimisiz? Nima uchun RT-2 hamma narsani o'zgartiradi — kredit: Metaverse Post / Stable Diffusion

Ushbu tadqiqotning asosiy asosi katta til modellarining (LLM) xususiyatlari bilan uzviy bog'liqdir. Bunday modellar yaratish uchun mo'ljallangan keng doiradagi ma'lumotlarni kodlash qobiliyatiga ega bo'lgan har qanday ketma-ketlik. Bu nafaqat Python kabi umumiy til yoki dasturlash kodini, balki maxsus buyruqlarni ham o'z ichiga oladi robot harakatlarini boshqarishi mumkin.

Buni ko'rib chiqish uchun modelning ma'lum bir qator ketma-ketliklarini tushunish va harakat qilinadigan robot buyruqlariga tarjima qilish qobiliyatini ko'rib chiqing. Misol tariqasida "1 128 91 241 5 101 127 217" kabi yaratilgan qatorni quyidagi tarzda dekodlash mumkin:

Boshlang'ich raqam, bir, vazifa hali ham davom etayotganini va tugallanmaganligini bildiradi.
Keyingi raqamlar triadasi, 128-91-241, fazoning uch o'lchami bo'ylab nisbiy va normallashtirilgan siljishni bildiradi.
Yakuniy to'plam, 101-127-217, robotning funktsional qo'l segmentining aylanish darajasini aniqlaydi.

Bunday konfiguratsiya robotni ishga tushiradi uning holatini oltita erkinlik darajasida o'zgartirish. Xuddi shunday parallel chizish til modellari Internetdagi keng matnli ma'lumotlardan umumiy g'oyalar va tushunchalarni o'zlashtiring, RT-2 modeli robot harakatlariga rahbarlik qilish uchun veb-ga asoslangan ma'lumotlardan bilimlarni chiqaradi.

Buning mumkin bo'lgan oqibatlari sezilarli. Agar model "muayyan natijaga erishish uchun robotning ushlab turish mexanizmi o'ziga xos tarzda harakatlanishi kerak" ni ko'rsatadigan tanlangan traektoriyalar to'plamiga duchor bo'lsa, demak, transformator mos keladigan harakatlarni ishlab chiqishi mumkin. bu kirish.

Baholanayotgan hal qiluvchi jihat bu qobiliyat edi trening davomida yoritilmagan yangi vazifalarni bajaring. Buni bir necha usulda tekshirish mumkin:

1) Notanish ob'ektlar: Model o'rganilmagan ob'ektlar bilan tanishtirilganda topshiriqni takrorlay oladimi? Ushbu jihatdagi muvaffaqiyat kameradan vizual tasmani til modeli izohlashi mumkin bo'lgan vektorga aylantirishga bog'liq. Keyin model uning ma'nosini tushuna olishi, atamani haqiqiy hamkasbi bilan bog'lashi va robot qo'lini shunga mos ravishda harakatga keltirishi kerak.

2) Turli xil kelib chiqishi: Vizual tasmaning aksariyat qismi yangi elementlardan iborat boʻlsa, model qanday javob beradi, chunki vazifa joylashuvi foni butunlay oʻzgartirilgan? Masalan, jadvallarning o'zgarishi yoki hatto yorug'lik sharoitlarining o'zgarishi.

3) Turli muhitlar: Oldingi nuqtani kengaytirish, agar butun joyning o'zi boshqacha bo'lsa-chi?

Odamlar uchun bu stsenariylar oddiy ko'rinadi - tabiiyki, agar kimdir o'z xonasiga qutichani tashlab qo'ysa, ular buni ochiq havoda ham qilishlari kerak, to'g'rimi? (Yana eslatmada, men parklarda bir nechta odamning bu oddiy tuyulgan vazifa bilan kurashayotganini kuzatdim). Biroq, mashinalar uchun bu hal qilinishi kerak bo'lgan muammolar.

Grafik ma'lumotlar shuni ko'rsatadiki, RT-2 modeli ushbu yangi sharoitlarga moslashishda o'zidan oldingilaridan ba'zilarini ortda qoldiradi. Bu ustunlik, asosan, o'quv bosqichida qayta ishlangan matnlarning ko'pligi bilan boyitilgan keng til modelidan foydalanishdan kelib chiqadi.

Tadqiqotchilar ta'kidlagan cheklovlardan biri bu modelning mutlaqo yangi ko'nikmalarga moslasha olmasligi. Misol uchun, agar u mashg'ulotning bir qismi bo'lmagan bo'lsa, u ob'ektni chap yoki o'ng tomonidan ko'tarishni tushunmaydi. Aksincha, til modellari yoqadi ChatGPT bu to'siqni qiyinchiliksiz bosib o'tdilar. Ko'p sonli vazifalar bo'yicha katta hajmdagi ma'lumotlarni qayta ishlash orqali ushbu modellar, hatto ilgari hech qachon duch kelmagan bo'lsa ham, tezda shifrlashi va yangi so'rovlar bo'yicha harakat qilishi mumkin.

An'anaga ko'ra, robotlar murakkab tizimlar kombinatsiyasidan foydalangan holda ishlaydi. Ushbu o'rnatishlarda yuqori darajadagi fikrlash tizimlari va asosiy manipulyatsiya tizimlari ko'pincha samarali aloqasiz o'zaro ta'sir qiladi, o'yin o'ynashga o'xshaydi "buzilgan telefon" haqida. Tasavvur qiling-a, harakatni aqliy ravishda kontseptsiyalash, keyin uni bajarish uchun tanangizga etkazish kerak. Yangi taqdim etilgan RT-2 modeli bu jarayonni soddalashtiradi. Bu robotga to'g'ridan-to'g'ri buyruqlarni jo'natish bilan birga, murakkab fikr yuritish uchun yagona til modeliga imkon beradi. Bu shuni ko'rsatadiki, minimal ta'lim ma'lumotlari bilan robot o'zi aniq o'rganmagan harakatlarni amalga oshirishi mumkin.

Misol uchun, eski tizimlar chiqindilarni tashlab yuborishga imkon berish uchun ular axlatni aniqlash, yig'ish va yo'q qilish bo'yicha maxsus treningni talab qildilar. Bundan farqli o'laroq, RT-2 allaqachon chiqindilar haqida fundamental tushunchaga ega, uni maqsadli tayyorgarliksiz taniy oladi va hatto harakat haqida oldindan ko'rsatma bermasdan ham uni yo'q qilishi mumkin. “Chiqindilar nimadan iborat?” degan nozik savolni ko'rib chiqing. Bu rasmiylashtirish qiyin kontseptsiya. Chip qop yoki banan qobig'i iste'mol qilingandan keyin buyum bo'lib chiqindiga o'tadi. Bunday nozikliklar aniq tushuntirish yoki alohida o'qitishni talab qilmaydi; RT-2 o'ziga xos tushunchadan foydalangan holda ularni shifrlaydi va shunga muvofiq harakat qiladi.

Mana nima uchun bu taraqqiyot muhim ahamiyatga ega va uning kelajakdagi oqibatlari:

Til modellari, RT-2 kabi, hamma narsani qamrab oluvchi kognitiv vosita sifatida ishlaydi. Ularning bilimlarni domenlar bo'ylab umumlashtirish va uzatish qobiliyati ularning turli xil ilovalarga moslashishini anglatadi.
Tadqiqotchilar qasddan o'z tadqiqotlari uchun eng ilg'or modellardan foydalanmadilar, chunki har bir model bir soniya ichida javob berishini ta'minlashga harakat qilishdi (ya'ni robotlarning harakat chastotasi kamida 1 Gerts). Gipotetik tarzda, o'xshash modelni birlashtirish GPT-4 va bir yuqori vizual model yanada jozibali natijalar berishi mumkin.
Keng qamrovli ma'lumotlar hali ham kam. Biroq, hozirgi holatdan zavod ishlab chiqarish liniyalaridan uy ishlariga qadar yaxlit ma'lumotlar to'plamiga o'tish taxminan bir yildan ikki yilgacha davom etishi kutilmoqda. Bu taxminiy taxmin, shuning uchun sohadagi mutaxassislar aniqroq ma'lumot berishlari mumkin. Ushbu ma'lumotlar oqimi muqarrar ravishda sezilarli yutuqlarga olib keladi.
RT-2 ma'lum bir texnikadan foydalangan holda ishlab chiqilgan bo'lsa-da, ko'plab boshqa usullar mavjud. Kelajakda, ehtimol, ushbu metodologiyalarning kombinatsiyasi mavjud robot qobiliyatini oshirish. Istiqbolli yondashuvlardan biri inson faoliyati videolaridan foydalangan holda robotlarni o'qitishni o'z ichiga olishi mumkin. Eksklyuziv yozib olishning hojati yo'q - TikTok va YouTube kabi platformalar bunday kontentning keng omborini taklif qiladi.

AI haqida ko'proq o'qing:

Tags:

Masʼuliyatdan voz kechish

Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.

Muallif haqida

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.

Boshqa maqolalar

Damir Yalolov