GLIGEN: məhdudlaşdırıcı qutu ilə yeni dondurulmuş mətndən şəkilə generasiya modeli
Qısaca
GLIGEN və ya Yerləşdirilmiş Dildən Şəkil Nəsil, hazırkı əvvəlcədən öyrədilmiş diffuziya modellərinin imkanlarını quran və genişləndirən yeni bir texnikadır.
Başlıq və məhdudlaşdırıcı qutu vəziyyəti daxiletmələri ilə GLIGEN modeli açıq dünyada əsaslandırılmış text2img yaradır.
GLIGEN əvvəlcədən hazırlanmış text2img modelindən biliklərdən istifadə etməklə xüsusi yerlərdə və üslublarda müxtəlif obyektlər yarada bilər.
GLIGEN mətndən-şəkillərə çevirərkən insan əsas nöqtələrini də əsaslandıra bilər.
Böyük miqyaslı mətndən şəkilə diffuziya modelləri uzun bir yol keçmişdir. Bununla belə, mövcud təcrübə yalnız mətn daxiletməsinə etibar etməkdir ki, bu da idarəolunanlığı məhdudlaşdıra bilər. QLIGEN, və ya Grounded-Language-to-Image Generation, hazırkı əvvəlcədən öyrədilmiş mətndən-şəklə diffuziya modellərinin imkanlarını əsaslandıran və onları əsaslandırma girişlərinə şərtləndirməyə imkan verən yeni texnikadır.
Əvvəlcədən öyrədilmiş modelin geniş konseptual biliklərini saxlamaq üçün tərtibatçılar onun bütün çəkilərini dondurur və idarə olunan proses vasitəsilə torpaqlama məlumatını yeni öyrədilə bilən təbəqələrə pompalayır. Başlıq və məhdudlaşdırıcı qutu vəziyyəti daxiletmələri ilə GLIGEN modeli açıq dünyada əsaslandırılmış mətndən-şəklə yaradır və torpaqlama qabiliyyəti yeni məkan konfiqurasiyaları və konsepsiyaları üçün effektiv şəkildə ümumiləşdirir.
Həyata edin demo burada.
- GLIGEN mövcud əvvəlcədən hazırlanmış təlimlərə əsaslanır diffuziya modelləri, ilkin çəkiləri əvvəlcədən hazırlanmış böyük miqdarda bilikləri saxlamaq üçün dondurulmuşdur.
- Hər bir transformator blokunda əlavə torpaqlama girişini qəbul etmək üçün yeni öyrədilə bilən Qapalı Özünə Diqqət təbəqəsi yaradılır.
- Hər bir torpaqlama nişanı iki növ məlumatdan ibarətdir: əsaslanmış şey haqqında semantik məlumat (şifrələnmiş mətn və ya şəkil) və məkan mövqeyi məlumatı (şifrələnmiş sərhəd qutusu və ya əsas nöqtələr).
Əlaqədar məqalə: “Microsoft” şirkəti insanın tək bir fotosundan 3D avatar yarada bilən diffuziya modeli buraxıb |
AI haqqında daha çox oxuyun:
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.