OpenFlamingo: Meta AI və LAION-dan Yeni Açıq Mənbəli Şəkildən Mətnə Çərçivə
Qısaca
OpenFlamingo, DeepMind-in Flamingo modelinin açıq mənbəli versiyasıdır. LLaMA böyük dil modeli.
Tərtibatçılar görmə-dil problemlərini həll edə bilən və bərabər olan multimodal sistem yaratmağa ümid edirlər GPT-4vizual və mətn daxiletməsini idarə etməkdə gücü və uyğunlaşma qabiliyyəti.
DeepMind-in Flamingo modelinin açıq mənbə versiyası, OpenFlamingo, yenicə buraxılıb. OpenFlamingo əsaslı şəkildə böyük multimodal modellərin (LMM) təliminə və qiymətləndirilməsinə imkan verən bir çərçivədir. OpenFlamingo üzərində qurulmuşdur LLaMA Meta AI tərəfindən hazırlanmış böyük dil modeli.
Daha ətraflı: Nasıl Kullanılır Midjourney Forever pulsuz: 5 sadə addım |
Tərtibatçıların bu ilk buraxılışa verdiyi töhfələr aşağıdakılardır:
- Mətn və vizual ardıcıllığı birləşdirən böyük multimodal verilənlər toplusu.
- Görmə və dil daxil olmaqla fəaliyyətlər üçün kontekstdə öyrənmə qiymətləndirilməsi üçün etalon.
- Bizim ilkin versiya LLaMAəsaslı OpenFlamingo-9B modeli.
OpenFlamingo vasitəsilə tərtibatçılar müxtəlif görmə dili problemlərini həll edə bilən multimodal sistem yaratmağa ümid edirlər. Son məqsəd bərabər olmaqdır GPT-4vizual və mətn daxiletməsini idarə etməkdə gücü və uyğunlaşma qabiliyyəti. Tərtibatçılar bu məqsədə nail olmaq üçün DeepMind-in Flamingo modelinin açıq mənbəli versiyasını, şəkillər, videolar və mətnlər üzərində işləmək və əsaslandırmaq qabiliyyətinə malik LMM-ni inkişaf etdirirlər. Tərtibatçılar tamamilə açıq mənbəli modellərin işlənib hazırlanmasına sadiqdirlər, çünki onlar hesab edirlər ki, şəffaflıq əməkdaşlığın təşviqi, inkişafı sürətləndirmək və qabaqcıl LMM-lərə çıxışı demokratikləşdirmək üçün çox vacibdir.
Onlar OpenFlamingo-9B modelimizin ilkin yoxlama məntəqəsini təmin edirlər. Model hələ tam optimallaşdırılmasa da, layihənin vəd etdiyini göstərir. Tərtibatçılar əməkdaşlıq edərək və icma rəyi əldə etməklə daha yaxşı LMM-ləri öyrədə bilərlər. İnkişaf prosesində iştirak etmək üçün ictimaiyyəti məlumat verməyə və depoya əlavə etməyə dəvət edirlər.
Tətbiq Flamingo-nun tətbiqinə çox bənzəyir. Flamingo modelləri interleaved mətn və geniş miqyaslı veb verilənlər bazası üzərində öyrədilməlidir qrafik onları kontekstdə bir neçə atışlı öyrənmə bacarıqları ilə təchiz etmək. Orijinal Flamingo tədqiqatında təklif edilən eyni arxitektura (Perceiver resamplers, cross-diqqət təbəqələri) OpenFlamingo-da həyata keçirilir. Lakin, Flamingonun təlim məlumatları geniş ictimaiyyət üçün əlçatan olmadığından, tərtibatçılar modelləri öyrətmək üçün açıq mənbə məlumat dəstlərindən istifadə edirlər. Yeni nəşr olunmuş OpenFlamingo-9B yoxlama məntəqəsi xüsusi olaraq LAION-10B-dən 2M nümunə və yeni Multimodal C5 verilənlər bazasından 4M nümunə üzərində təlim keçmişdir.
Tərtibatçılar həmçinin bizim yarımçıq LMM OpenFlamingo-9B-dən yoxlama məntəqəsini də daxil edirlər. LLaMA 7B və CLIP ViT/L-14, buraxılışın bir hissəsi kimi. Bu konsepsiya hələ də inkişaf etdirilsə də, cəmiyyət bundan artıq böyük fayda əldə edə bilər.
Başlamaq üçün baxın Github mənbə və demo.
AI haqqında daha çox oxuyun:
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.