August 01, 2023

Is GPT-4 Robotları gücləndirmək haqqında? Niyə RT-2 hər şeyi dəyişir

Dərc olundu: 01 avqust 2023-cü il, saat 3:58-də Yeniləndi: 01 avqust 2023-cü il, saat 3:58-də

Redaktə edilib və fakt yoxlanılıb: 01 avqust 2023-cü il, saat 3:58

Qısaca

Google DeepMind üçün görmə dili modeli proqramları hazırlayıb uçdan uca robot nəzarəti, onların bilikləri domenlər arasında ümumiləşdirmək və ötürmək qabiliyyətinə diqqət yetirir.

Böyük miqdarda məlumatı kodlaşdıra bilən ardıcıllıq yaratmaq üçün nəzərdə tutulmuş RT-2 modeli müxtəlif ssenarilərdə, o cümlədən tanış olmayan obyektlər, müxtəlif fonlar və müxtəlif mühitlərdə sınaqdan keçirilmişdir.

RT-2 modeli, əsasən, geniş dil modelinə görə yeni şərtlərə uyğunlaşmaqda bəzi sələflərini üstələyir.

Google DeepMind görmə dili modeli tətbiqlərini araşdırdı, onların uçdan-uca robot idarəetmə potensialına diqqət yetirir. Bu araşdırma bu modellərin geniş ümumiləşdirməyə qadir olub olmadığını müəyyən etməyə çalışdı. Bundan əlavə, geniş dil modelləri ilə tez-tez əlaqəli olan əsaslandırma və planlaşdırma kimi müəyyən idrak funksiyalarının bu kontekstdə ortaya çıxa biləcəyini araşdırdı.

Is GPT-4 Robotları gücləndirmək haqqında? Niyə RT-2 hər şeyi dəyişir — Kredit: Metaverse Post / Stable Diffusion

Bu kəşfiyyatın arxasında duran əsas müddəa böyük dil modellərinin (LLM) xüsusiyyətləri ilə mahiyyət etibarilə bağlıdır. Bu cür modellər yaratmaq üçün nəzərdə tutulmuşdur geniş məlumat diapazonunu kodlaşdıra bilən istənilən ardıcıllıq. Buraya yalnız ümumi dil və ya Python kimi proqramlaşdırma kodu deyil, həm də xüsusi əmrlər daxildir robot hərəkətlərinə rəhbərlik edə bilər.

Bunu perspektivə çevirmək üçün modelin xüsusi sətir ardıcıllığını başa düşmək və hərəkətə keçə bilən robot əmrlərinə çevirmək qabiliyyətini nəzərdən keçirin. Nümunə olaraq, “1 128 91 241 5 101 127 217” kimi yaradılan sətir aşağıdakı şəkildə deşifrə edilə bilər:

İlkin rəqəm, bir, tapşırığın hələ də davam etdiyini və tamamlanmadığını bildirir.
Sonrakı rəqəmlər triadası, 128-91-241, kosmosun üç ölçüsündə nisbi və normallaşdırılmış sürüşməni təyin edir.
Yekun dəst, 101-127-217, robotun funksional qol seqmentinin fırlanma dərəcəsini dəqiqləşdirir.

Belə bir konfiqurasiya robotu işə salır altı sərbəstlik dərəcəsi boyunca vəziyyətini dəyişdirmək. Eynilə paralel çəkmək dil modelləri İnternetdəki geniş mətn məlumatlarından ümumi ideyaları və konsepsiyaları mənimsəmək, RT-2 modeli robotik hərəkətlərə rəhbərlik etmək üçün veb-əsaslı məlumatlardan bilik çıxarır.

Bunun potensial təsirləri əhəmiyyətlidir. Əgər model “müəyyən bir nəticəyə nail olmaq üçün robotun tutma mexanizmi xüsusi bir şəkildə hərəkət etməlidir” deyən seçilmiş trayektoriyalar toplusuna məruz qalırsa, bu, transformatorun uyğun olaraq ardıcıl hərəkətlər yarada biləcəyini əsaslandırır. bu giriş.

Qiymətləndirilən mühüm aspekt bacarıq idi təlim zamanı əhatə olunmayan yeni tapşırıqları yerinə yetirin. Bu, bir neçə fərqli yolla sınaqdan keçirilə bilər:

1) Tanımadığı obyektlər: Model öyrədilmədiyi obyektlərlə tanış olduqda tapşırığı təkrarlaya bilərmi? Bu aspektdə uğur kameradan vizual lentin dil modelinin şərh edə biləcəyi vektora çevrilməsindən asılıdır. Model daha sonra onun mənasını ayırd etməli, termini real dünyadakı analoqu ilə əlaqələndirməli və sonra robot qoluna müvafiq hərəkət etməyə istiqamət verməlidir.

2) Fərqli arxa planlar: Tapşırığın yerinin fonu tamamilə dəyişdirildiyi üçün vizual lentin əksəriyyəti yeni elementlərdən ibarət olduqda model necə reaksiya verir? Məsələn, cədvəllərdə dəyişiklik və ya hətta işıqlandırma şəraitində dəyişiklik.

3) Müxtəlif Mühitlər: Əvvəlki nöqtəni genişləndirsək, bütün yerin özü fərqlidirsə necə?

İnsanlar üçün bu ssenarilər sadə görünür - təbii ki, kimsə otağında qutu ata bilsə, bunu açıq havada da edə bilməlidir, elə deyilmi? (Bir yan qeyddə, mən parklarda bu sadə görünən işin öhdəsindən gəlmək üçün mübarizə aparan bir neçə şəxsi müşahidə etmişəm). Bununla belə, maşınlar üçün bunlar həll edilməli olan problemlərdir.

Qrafik məlumatlar göstərir ki, RT-2 modeli bu yeni şərtlərə uyğunlaşmağa gəldikdə, bəzi sələflərini üstələyir. Bu üstünlük əsasən təlim mərhələsində işlədiyi mətnlərin bolluğu ilə zənginləşdirilmiş geniş dil modelindən istifadə etməkdən irəli gəlir.

Tədqiqatçılar tərəfindən vurğulanan bir məhdudiyyət modelin tamamilə yeni bacarıqlara uyğunlaşa bilməməsidir. Məsələn, əgər bu onun təliminin bir hissəsi olmasaydı, bir cismi sol və ya sağ tərəfdən qaldırmağı başa düşməzdi. Bunun əksinə olaraq, dil modelləri bəyənir ChatGPT bu maneəni çox səylə keçdik. Saysız-hesabsız tapşırıqlar üzrə böyük həcmdə məlumatı emal etməklə, bu modellər əvvəllər heç vaxt rastlaşmamış olsalar belə, yeni sorğuları tez bir zamanda deşifrə edə və onlara uyğun hərəkət edə bilərlər.

Ənənəvi olaraq robotlar mürəkkəb sistemlərin birləşməsindən istifadə edərək fəaliyyət göstərirdilər. Bu quraşdırmalarda daha yüksək səviyyəli əsaslandırma sistemləri və əsas manipulyasiya sistemləri tez-tez səmərəli ünsiyyət olmadan qarşılıqlı təsir göstərir, oyun oynamağa bənzəyir "sınmış telefon". Təsəvvür edin ki, bir hərəkəti zehni olaraq konseptuallaşdırın, sonra onu yerinə yetirmək üçün bədəninizə çatdırmaq lazımdır. Yeni təqdim edilən RT-2 modeli bu prosesi asanlaşdırır. O, robota birbaşa əmrlər göndərməklə yanaşı, tək dilli modelə mürəkkəb mülahizə yürütmək imkanı verir. Bu, minimum təlim məlumatı ilə robotun açıq şəkildə öyrənmədiyi fəaliyyətləri həyata keçirə biləcəyini nümayiş etdirir.

Məsələn, köhnə sistemlərin tullantıları atmasını təmin etmək üçün onlar zibilləri müəyyən etmək, toplamaq və atmaq üçün xüsusi təlim tələb edirdilər. Bunun əksinə olaraq, RT-2 artıq tullantılar haqqında fundamental anlayışa malikdir, onu məqsədyönlü təlim olmadan tanıya bilər və hətta hərəkətə dair əvvəlcədən təlimat almadan da onu məhv edə bilər. “Tullantı nədən ibarətdir?” sualını nəzərdən keçirin. Bu, rəsmiləşdirilməsi çətin bir konsepsiyadır. Çip torbası və ya banan qabığı bir maddə olmaqdan istehlakdan sonra tullantıya çevrilir. Belə incəliklər açıq izaha və ya ayrıca təlimə ehtiyac duymur; RT-2 özünəməxsus anlayışından istifadə edərək onları deşifrə edir və müvafiq olaraq hərəkət edir.

Bu irəliləyişin əsas əhəmiyyət kəsb etməsinin səbəbi və onun gələcək nəticələri:

RT-2 kimi dil modelləri hər şeyi əhatə edən koqnitiv mühərriklər kimi fəaliyyət göstərir. Onların bilikləri domenlər arasında ümumiləşdirmək və ötürmək qabiliyyəti onların müxtəlif tətbiqlərə uyğunlaşa bilməsi deməkdir.
Tədqiqatçılar qəsdən tədqiqatları üçün ən qabaqcıl modellərdən istifadə etmədilər, hər bir modelin bir saniyə ərzində cavab verməsini təmin etməyi hədəflədilər (ən azı 1 Hertz robotik hərəkət tezliyi deməkdir). Hipotetik olaraq, kimi bir modelin inteqrasiyası GPT-4 və bir üstün vizual model daha cəlbedici nəticələr verə bilərdi.
Hərtərəfli məlumatlar hələ də azdır. Bununla belə, mövcud vəziyyətdən fabrik istehsal xətlərindən tutmuş ev işlərinə qədər hərtərəfli məlumat toplusuna keçidin təxminən bir-iki il çəkəcəyi proqnozlaşdırılır. Bu, ilkin hesablamadır, ona görə də bu sahədə ekspertlər daha dəqiqlik təklif edə bilərlər. Bu məlumat axını qaçılmaz olaraq əhəmiyyətli irəliləyişlərə səbəb olacaqdır.
RT-2 xüsusi bir texnikadan istifadə edilməklə hazırlansa da, bir çox başqa üsullar mövcuddur. Gələcəkdə çox güman ki, bu metodologiyaların birləşməsi var robot bacarıqlarının artırılması. Perspektivli yanaşmalardan biri insan fəaliyyətinin videolarından istifadə edərək robotların təlimini əhatə edə bilər. Eksklüziv çəkilişlərə ehtiyac yoxdur – TikTok və YouTube kimi platformalar bu cür məzmunun geniş anbarını təklif edir.

AI haqqında daha çox oxuyun:

Tags:

Məsuliyyətdən imtina

uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.

Müəllif haqqında

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.

Ətraflı məqalələr

Damir Yalalov

Hot Stories

Kripto Birjası OKX, mayın 16-da NOT-USDT cütü ilə Spot ticarətini təqdim etməyə hazır olan Notcoin-i siyahıya alır.

by Alisa Davidson

10 May 2024

Blast Üçüncü Blast Qızıl Dağıtım Tədbirini Başladı, DApp-lara 15M Bal Ayır

by Alisa Davidson

10 May 2024

Espresso Sistemləri, Rollup Birlikdə İşləkliyini Artırmaq üçün AggLayer hazırlamaq üçün Polyqon Laboratoriyaları ilə əməkdaşlıq edir

by Alisa Davidson

09 May 2024

ZKP ilə işləyən İnfrastruktur Protokolu ZKBase Yol Xəritəsini açıqlayır, Testnetin May ayında işə salınmasını planlaşdırır

by Alisa Davidson

09 May 2024

Son Xəbərlər

Kripto Birjası OKX, mayın 16-da NOT-USDT cütü ilə Spot ticarətini təqdim etməyə hazır olan Notcoin-i siyahıya alır.

by Alisa Davidson

10 May 2024

Blast Üçüncü Blast Qızıl Dağıtım Tədbirini Başladı, DApp-lara 15M Bal Ayır

by Alisa Davidson

10 May 2024

Espresso Sistemləri, Rollup Birlikdə İşləkliyini Artırmaq üçün AggLayer hazırlamaq üçün Polyqon Laboratoriyaları ilə əməkdaşlıq edir

by Alisa Davidson

09 May 2024

ZKP ilə işləyən İnfrastruktur Protokolu ZKBase Yol Xəritəsini açıqlayır, Testnetin May ayında işə salınmasını planlaşdırır

by Alisa Davidson

09 May 2024

İnstitusional iştah dəyişkənlik fonunda Bitcoin ETF-lərə doğru artır

13F sənədləri vasitəsilə edilən açıqlamalar, Bitcoin ETF-ləri ilə məşğul olan görkəmli institusional investorları ortaya qoyur və bu, artan qəbulu vurğulayır ...

Daha çox məlumat