Text-to-SVG: Berkeley mücərrəd piksel əsaslı diffuziya modelini elan etdi
Qısaca
Mətn-şəklə sintezi – UC Berkeley tədqiqatçıları mətn şərti ilə vektor qrafikasını nümayiş etdirirlər diffuziya modelləri
Mətn-şəklin sintezində diffuziya modelləri var nümayiş görkəmli nəticələr. Diffuziya modelləri şərhli şəkillərin böyük verilənlər bazasından istifadə edərək son dərəcə müxtəlif obyektlərin və vəziyyətlərin rastr şəkillərini yaratmağı öyrənirlər. Bununla belə, rəqəmsal nişanlar, qrafika və stikerlər üçün dizaynerlər adətən Scalable Vector Graphics (SVGs) kimi şəkillərin vektor təsvirlərindən istifadə edirlər. Vektor qrafikası kiçikdir və istənilən ölçüdə ölçülə bilər.
UC Berkeley, şəkil piksel təsvirləri üzrə öyrədilmiş mətn şərti diffuziya modelindən istifadə edərək SVG kimi ixrac edilə bilən vektor qrafikasının necə hazırlanacağını nümayiş etdirir. O, bunu başlıqlı SVG-lərin geniş kolleksiyalarından istifadə etmədən həyata keçirir. Bunun əvəzinə, Berkeley tədqiqatçıları a mətndən şəkilə diffuziya mətndən 3D-yə sintez üzərində son işlərin motivasiyası əsasında Score Distillation Nümunə alma itkisi ilə nümunə götürün və onu dəqiqləşdirin.
Nümunə yaradılan vektorlar
Təzə yaradılmış SVG qalereyasına baxın burada.
Vektor qrafikası kiçikdir, lakin istənilən ölçüdə miqyaslandıqda öz kəskinliyini saxlayır. Berklidəki tədqiqatçılar vektor qrafikasını optimallaşdırmaq üçün Score Distillation Sampling əsasında təsvir mətn itkisini təkmilləşdirir. VectorFusion tərəfindən istifadə edilən DiffVG diferensial SVG renderer tərs vizualları mümkün edir.
Bundan əlavə, VectorFusion daha effektiv və yüksək keyfiyyətli çoxmərhələli konfiqurasiyaya imkan verir. Bu üsul rastr nümunələri götürməklə başlayır mətndən şəkilə diffuziya modeli adlanan Stable Diffusion. Nümunələr daha sonra LIVE istifadə edərək VectorFusion tərəfindən avtomatik olaraq izlənilir. Bununla belə, bu nümunələrdə çox vaxt təfərrüat yoxdur, darıxdırıcı olur və ya vektor qrafikasına uyğunlaşmaq çətindir. Score Distillation Sampling vasitəsilə canlılığın və mətn uyğunluğunun artırılması.
VectorFusion SVG yollarını şəbəkədəki kvadratlara məhdudlaşdırmaqla köhnə video oyunları üslubunda piksel sənəti yarada bilər.
Bu yanaşma mətndən eskizə generasiyasını dəstəkləmək üçün asanlıqla genişləndirilir. İstifadəçinin təqdim etdiyi mətni dəqiq əks etdirən mücərrəd xətt rəsmini öyrənmək üçün əvvəlcə təsadüfi seçilmiş 16 ştrix çəkirik. Sonra, gizli Hesab Distillə Nümunə alma itkimizi optimallaşdırırıq.
Əlaqədar məqalələri oxuyun:
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.