Nvidia eDiff-I elan etdi: üslubların ani transferi ilə mətn və təsvir sintezi üçün yeni generativ süni intellekt
Qısaca
Nvidia bizneslərə yüksək keyfiyyətli, cəlbedici şəkillər yaratmağa kömək etmək üçün eDiff-I-i işə salır
eDiff-I texnikası müntəzəm olaraq DALL-E2 və ilə müqayisədə daha yüksək sintez keyfiyyəti yaradır Stable diffusion
eDiff-I yeni AI məzmun yaratma vasitəsidir təmin edir Bu yaxınlarda elan etdiyi kimi, marketoloqlar və bizneslər üçün görünməmiş mətndən təsvirə sintez imkanları Nvidia. eDiff-I ilə bizneslər bahalı avadanlıq və ya peşəkar yardıma ehtiyac olmadan tez və asanlıqla yüksək keyfiyyətli, cəlbedici vizuallar yarada bilərlər. eDiff-I istifadəçi girişini şərh etmək və müvafiq şəkillər yaratmaq üçün təbii dil emalından (NLP) istifadə edir. Daha sonra AI şəkilləri təhlil edir və kontekstdən asılı olaraq ən uyğun olanı seçir. Nəticə marketinq materialları, sosial media yazıları, e-poçt kampaniyaları və s. kimi müxtəlif məqsədlər üçün istifadə oluna bilən yüksək keyfiyyətli, peşəkar görünüşlü görüntüdür.
eDiff-I a yeni nəsil generativ AI görünməmiş məzmun yaratma vasitəsidir mətndən şəkilə sintez, sürətli üslub transferi və sözlərlə intuitiv rəsm. Mətndən vizual görüntülər yaratmaq üçün diffuziya modeli olaraq, eDiff-I, diffuziya modellərinin davranışının seçmənin müxtəlif mərhələlərində dəyişdiyinə dair empirik tapıntıya cavab olaraq, hər biri müəyyən səs-küy intervalı üçün ixtisaslaşmış ekspert denoising şəbəkələri ansamblının hazırlanmasını təklif edir.
T5 mətn daxiletmələri, CLIP şəkil yerləşdirmələri və CLIP mətn daxiletmələri eDiff-I konsepsiyası üçün əsas yaradır. Bu metodologiya istənilən mətn sorğusuna cavab olaraq fotoreal qrafika yarada bilər.
O, mətndən-şəklə sintezə əlavə olaraq iki əlavə imkan təqdim edir: (1) bizə istinad stili təsvirindən istifadə edərək yaradılan nümunənin üslubunu idarə etməyə imkan verən üslub ötürmə və (2) “Sözlərlə boya” aləti istifadəçilərə seqmentasiya xəritələrini kətan üzərində rəngləməklə şəkillər yaratmağa imkan verir.
Boru kəməri üç diffuziya modelinin kaskadından ibarətdir: 64×64 təsvir ölçülü nümunələr yarada bilən əsas model və şəkilləri tədricən müvafiq olaraq 256×256 və 1024×1024 təsvir ölçüsünə yüksəldə bilən iki super rezolyusiyaya malik yığın. Modellər giriş kimi başlıq aldıqdan sonra T5 XXL və mətnin daxil edilməsini hesablayır. Bu şəkil əlavələri üslub vektoru kimi istifadə edilə bilər. Sonra, bu yerləşdirmələri kaskadımıza qidalandırın diffuziya modelləri, tədricən 1024 x 1024 qətnamə ilə şəkillər istehsal edir.
eDiff-I yanaşması açıq mənbəli mətndən şəkilə alqoritmlərlə müqayisədə ardıcıl olaraq daha yaxşı sintez keyfiyyəti ilə nəticələnir (Stable diffusion) və (DALL-E2).
CLIP şəkil əlavələrindən istifadə edildikdə, eDiff-I yanaşması üslubun ötürülməsini asanlaşdırır. eDiff-I əvvəlcə çıxarır KLIP üslub istinad vektoru kimi istifadə oluna bilən istinad stili təsvirindən şəkil əlavələri. Stilistik istinadı aşağıdakı şəkildən sol paneldə görmək olar. Stil kondisioneri işə salındıqda nəticələr mərkəzi paneldə göstərilir. Stil kondisioneri söndürüldükdə nəticələr sağdakı paneldə göstərilir. Stil kondisioneri tətbiq edildikdə, eDiff-I modeli giriş başlığının üslubuna uyğun olan çıxışlar yaradır. Stil kondisioneri söndürüldükdə təbii görünüşlü fotoşəkillər hazırlanır.
İfadələri seçmək və onları təsvirin üzərinə cızmaqla eDiff-I metodunun istifadəçiləri mətn sorğusunda sadalanan əşyaların yerini dəyişə bilər. Bundan sonra model istifadə edir istək və şəkillər yaratmaq üçün xəritələr həm başlıq, həm də giriş xəritəsi ilə uyğundur.
Əlaqədar məqalələri oxuyun:
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.