Würstchen V2 Modeli qalib gəlir Stable Diffusion Yüksək Rezolyusiyada Şəkillər Yaratmaq üçün Təsirli Sürətli XL
Son bir tvit müəllifinin “Würstchen” (almanca “kolbasa”) adlı məqaləsi həm həvəskarların, həm də mütəxəssislərin diqqətini cəlb etmişdir. Tvitdə yeni Würstchen V2 modelindən istifadə edərək şəkillərin yaradılmasının maraqlı nəticələri paylaşılıb.
əlaqədar: Midjourney 5.2 və Stable Diffusion Yaradıcı Mətndən Şəkilə Nəsil üçün SDXL 0.9 Yeniləmələri |
Würstchen sürətli və səmərəlidir, kimi modellərdən daha sürətli şəkillər yaradır Stable Diffusion Daha az yaddaş istifadə edərkən XL. O, həmçinin təlim xərclərini azaldıb, Würstchen v1 ilə 9,000×512 rezolyusiyada cəmi 512 GPU saat məşq tələb olunur. Stable Diffusion 1.4. Xərclərin bu 16 dəfə azalması təkcə yeni təcrübələr aparan tədqiqatçılara fayda vermir, həm də bu cür modelləri öyrətmək üçün daha çox təşkilata qapı açır. Würstchen v2 24,602 GPU saatı istifadə etdi, bu da onu yalnız 6×1.4-də öyrədilmiş SD512-dən 512 dəfə ucuz etdi.
Würstchen V2 a diffuziya modeli Bu, yüksək sıxılmış şəkillərin gizli məkanında işləyir, təlim və nəticə çıxarmaq üçün hesablama xərclərini böyük ölçüdə azaldır. Bu, əvvəllər görülməmiş bir cəsarət olan 42x məkan sıxlığına nail olan yeni dizayndan istifadə edir. Würstchen, sıxılmış şəkilləri yenidən piksel məkanına deşifrə edən iki mərhələli sıxılma, Stage A və Stage B istifadə edir. Üçüncü model, Mərhələ C, yüksək sıxılmış gizli məkanda öyrənilir, daha ucuz və daha sürətli nəticə çıxarmağa imkan verərkən, cari yüksək performanslı modellər üçün istifadə edilən hesablamanın fraksiyalarını tələb edir.
Würstchen V2 iki diffuziya mərhələsindən ibarətdir:
- Mərhələ A: Bu mərhələ mətn şərti diffuziyanı əhatə edir və heyrətamiz 1 milyard parametrə malikdir. Buradakı sürətlənmə ultra yüksək sıxılma üsulları vasitəsilə əldə edilir. Qeyd edək ki, SDXL-də göründüyü kimi 128x128x4 gizli kod ölçüsü əvəzinə, Würstchen V2 əvvəlcə 24x24x16 təsvir ölçüsündə işləyir. Bu, daha az piksel, lakin daha çox kanal deməkdir ki, bu da sürətin əhəmiyyətli dərəcədə artması ilə nəticələnir.
- Mərhələ B: Bu, 600 milyon parametrlə təchiz edilmiş diffuziya modelidir, təsviri 24×24-dən 128×128 təsvir ölçüsünə qədər dekompressiyaya cavabdehdir.
Prosesi tamamlamaq, gizli kodu göstərilən görüntüyə çevirən 20 milyon parametrli dekoderdir.
Dərhal gözə çarpan praktik fayda Würstchen V2-nin diqqətəlayiq sürətidir. O, SDXL-dən 2-2.5 dəfə daha sürətli sürətlə işləyir, bu sahədə diqqətəlayiq irəliləyişdir. AI görüntü yaratmaq.
Hər hansı texnoloji yenilikdə olduğu kimi, burada da güzəştlər ola bilər. Şəkil keyfiyyəti baxımından bəzi ekspertlər cüzi itkini təklif edirlər, baxmayaraq ki, hələ də konkret sübutlar təqdim etmək üçün hərtərəfli və dürüst müqayisə gözlənilir.
Yaradılmış mətndən şəkilə nümunələr aşağıda verilmişdir:
Daha çox əlaqəli mövzuları oxuyun:
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.