OpenFlamingo: Meta AI ve LAION'dan Yeni Bir Açık Kaynaklı Görüntüden Metne Çerçeve
Kısaca
OpenFlamingo, DeepMind'ın Flamingo modelinin açık kaynaklı bir versiyonudur. LLaMA büyük dil modeli.
Geliştiriciler, vizyon-dil zorluklarının üstesinden gelebilecek ve eşit çözümler sunabilecek çok modlu bir sistem yaratmayı umuyorlar GPT-4görsel ve metin girişini işlemedeki gücü ve uyarlanabilirliği.
DeepMind'in Flamingo modelinin açık kaynak versiyonu, AçıkFlamingo, yeni yayınlandı. OpenFlamingo temelde büyük multimodal modellerin (LMM'ler) eğitimine ve değerlendirilmesine izin veren bir çerçevedir. OpenFlamingo bunun üzerine inşa edilmiştir. LLaMA Meta AI tarafından geliştirilen büyük dil modeli.
Geliştiricilerin bu ilk sürüme katkıları şu şekildedir:
- Metin ve görsel dizileri birleştiren oldukça büyük bir çok modlu veri kümesi.
- Vizyon ve dil dahil olmak üzere etkinlikler için bağlam içi öğrenme değerlendirmesi için bir ölçüt.
- Programımızın ön versiyonu LLaMAtabanlı OpenFlamingo-9B modeli.
Geliştiriciler, OpenFlamingo aracılığıyla çeşitli vizyon-dil zorluklarının üstesinden gelebilecek çok modlu bir sistem oluşturmayı umuyor. Nihai hedef eşit olmaktır GPT-4görsel ve metin girişini işlemedeki gücü ve uyarlanabilirliği. Geliştiriciler, bu hedefe ulaşmak için DeepMind'ın Flamingo modelinin, görselleri, videoları ve metinleri işleyebilen ve bunlar hakkında akıl yürütebilen bir LMM olan açık kaynaklı bir versiyonunu geliştiriyorlar. Geliştiriciler kendilerini tamamen açık kaynaklı modeller geliştirmeye adamıştır çünkü şeffaflığın işbirliğini teşvik etmek, gelişimi hızlandırmak ve son teknoloji LMM'lere erişimi demokratikleştirmek için çok önemli olduğunu düşünüyorlar.
OpenFlamingo-9B modelimizin ilk kontrol noktasını sağlıyorlar. Model henüz tamamen optimize edilmemiş olsa da, projenin vaadini gösteriyor. Geliştiriciler işbirliği yaparak ve topluluktan geri bildirim alarak daha iyi LMM'ler yetiştirebilir. Geliştirme sürecinde yer almak için halkı girdi vermeye ve depoya ekleme yapmaya davet ederler.
Uygulama, Flamingo'nunkine çok benziyor. Flamingo modelleri, serpiştirilmiş metin içeren büyük ölçekli web veri kümelerinde eğitilmelidir ve grafik onları bağlam içi birkaç vuruşla öğrenme becerileriyle donatmak. Orijinal Flamingo çalışmasında önerilen mimarinin aynısı (Algılayıcı yeniden örnekleyiciler, çapraz dikkat katmanları) OpenFlamingo'da uygulanmaktadır. Ancak, Flamingo'nun eğitim verilerine genel halk tarafından erişilemediği için geliştiriciler, modelleri eğitmek için açık kaynaklı veri kümelerini kullanır. Yeni yayınlanan OpenFlamingo-9B kontrol noktası, LAION-10B'den 2M numuneler ve yeni Multimodal C5 veri setinden 4M numuneler üzerinde özel olarak eğitildi.
Geliştiriciler ayrıca tamamlanmamış LMM OpenFlamingo-9B'den bir kontrol noktası da ekliyor. LLaMA Sürümün bir parçası olarak 7B ve CLIP ViT/L-14. Bu kavram halen geliştirilme aşamasında olsa da toplum bundan büyük ölçüde faydalanabilir.
Başlamak için şuna bakın: GitHub kaynak ve gösteri.
AI hakkında daha fazlasını okuyun:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.