Meta AI, Robotların Görevleri YouTube Videolarından Öğrenmesini Sağlayan Bir Algoritma Geliştiriyor
Kısaca
Araştırmacılar, robotları karmaşık görevleri yerine getirmek üzere eğitmek için insan davranışının internet videolarını kullanarak görsel bir satın alma modeli geliştirdiler.
Bu yaklaşım, statik veri kümeleri ile gerçek dünyadaki robot uygulamaları arasındaki boşluğu doldurur.
Araştırmacılar, bilgisayarla görme tekniklerini robotik manipülasyonla bütünleştirerek, uygunlukları ortaya çıkarmak için Ego4D ve Epic Kitchens gibi büyük ölçekli insan video veri kümelerini kullanıyor.
Vision-Robotics Bridge (VRB) konsepti, robotların insan videolarından öğrenmesine ve karmaşık görevler için gerekli becerileri kazanmasına olanak tanıyarak bu yaklaşımın potansiyelini gözler önüne seriyor.
Meta AI, robotların YouTube videolarını izleyerek insan eylemlerini öğrenmesini ve kopyalamasını sağlayan yeni bir algoritmayı açıkladı. Yakın tarihli bir makalede “Robotik İçin Çok Yönlü Bir Temsil Olarak İnsan Videolarından Elde Edilen KazançlarYazarlar, karmaşık görevleri yerine getirmek üzere robotları eğitmek için insan etkileşimlerinin videolarından nasıl yararlanılabileceğini keşfediyor.
Bu araştırma, statik veri kümeleri ile gerçek dünyadaki robot uygulamaları arasındaki boşluğu kapatmayı amaçlamaktadır. Önceki modeller statik veri kümelerinde başarı göstermiş olsa da, bu modelleri doğrudan robotlara uygulamak bir zorluk olmaya devam etti. Araştırmacılar, insan davranışının internet videolarını kullanarak görsel bir satın alma modeli geliştirmenin bir çözüm olabileceğini önermektedir. Bu model, bir insanın bir sahnede nerede ve nasıl etkileşime girebileceğini tahmin ederek robotlar için değerli bilgiler sağlar.
Bu yaklaşımın merkezinde “müsaade” kavramı yer almaktadır. Karşılıklar, bir nesnenin veya ortamın sunduğu potansiyel eylemleri veya etkileşimleri ifade eder. Robot, insan videoları aracılığıyla sağlanan olanakları anlayarak, çeşitli karmaşık görevleri gerçekleştirmesini sağlayan çok yönlü bir temsil kazanır. Araştırmacılar satın alma modellerini dört farklı robot öğrenme paradigması ile bütünleştiriyor: çevrimdışı taklit öğrenme, keşif, hedefe bağlı öğrenme ve takviye öğrenme.
Uygunlukları elde etmek için araştırmacılar, aşağıdakiler gibi büyük ölçekli insan video veri kümelerini kullanır: Ego4D ve Epik Mutfaklar. Temas bölgesini belirlemek ve temastan sonra bileğin yörüngesini takip etmek için hazır el-nesne etkileşim dedektörleri kullanırlar. Bununla birlikte, insan sahnede hala mevcut olduğunda, dağıtım kaymasına neden olan önemli bir zorluk ortaya çıkar. Bunu ele almak için araştırmacılar, temas noktalarını ve temas sonrası yörüngeyi, modellerine girdi görevi gören insan-agnostik bir çerçeveye yansıtmak için mevcut kamera bilgilerini kullanıyor.
Önceden, robotlar eylemleri taklit edebiliyordu, ancak yetenekleri belirli ortamları kopyalamakla sınırlıydı. En son algoritma ile araştırmacılar, robot eylemlerini "genelleştirme" konusunda önemli ilerleme kaydetti. Robotlar artık edindikleri bilgileri yeni ve alışılmadık ortamlarda uygulayabilirler. Bu başarı, Yapay Genel Zekaya ulaşma vizyonuyla uyumludur (AGI) AI araştırmacısı tarafından savunulduğu gibi Jan LeCun.
Meta AI, kendisini bilgisayarla görme alanında ilerlemeye adamıştır ve projesinin kodunu ve veri kümesini paylaşmayı planlamaktadır. Bu, diğer araştırmacıların ve geliştiricilerin bu teknolojiyi daha fazla keşfetmesini ve geliştirmesini sağlayacaktır. Koda ve veri kümesine artan erişimle, yeni beceriler edinebilen kendi kendine öğrenen robotların geliştirilmesi Youtube videoları ilerlemeye devam edecek.
Çok sayıda çevrimiçi eğitim videosundan yararlanan robotlar, çeşitli ortamlarda daha çok yönlü ve uyarlanabilir hale gelebilir.
AI hakkında daha fazlasını okuyun:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.