Xəbər Hesabatı Texnologiya
Sentyabr 19, 2023

Würstchen V2 Modeli qalib gəlir Stable Diffusion Yüksək Rezolyusiyada Şəkillər Yaratmaq üçün Təsirli Sürətli XL

Son bir tvit müəllifinin “Würstchen” (almanca “kolbasa”) adlı məqaləsi həm həvəskarların, həm də mütəxəssislərin diqqətini cəlb etmişdir. Tvitdə yeni Würstchen V2 modelindən istifadə edərək şəkillərin yaradılmasının maraqlı nəticələri paylaşılıb.

Würstchen V2 Modeli qalib gəlir Stable Diffusion Yüksək Rezolyusiyada Şəkillər Yaratmaq üçün Təsirli Sürətli XL
əlaqədar: Midjourney 5.2 və Stable Diffusion Yaradıcı Mətndən Şəkilə Nəsil üçün SDXL 0.9 Yeniləmələri

Würstchen sürətli və səmərəlidir, kimi modellərdən daha sürətli şəkillər yaradır Stable Diffusion Daha az yaddaş istifadə edərkən XL. O, həmçinin təlim xərclərini azaldıb, Würstchen v1 ilə 9,000×512 rezolyusiyada cəmi 512 GPU saat məşq tələb olunur. Stable Diffusion 1.4. Xərclərin bu 16 dəfə azalması təkcə yeni təcrübələr aparan tədqiqatçılara fayda vermir, həm də bu cür modelləri öyrətmək üçün daha çox təşkilata qapı açır. Würstchen v2 24,602 GPU saatı istifadə etdi, bu da onu yalnız 6×1.4-də öyrədilmiş SD512-dən 512 dəfə ucuz etdi.

Süni intellekt cəmiyyətinin diqqətini dərhal cəlb edən bir xüsusiyyət Würstchen V2-nin təsirli sürətidir. Müəllifin sözlərinə görə, bu modeldən istifadə etməklə 1024×2048 ölçülü dörd şəkil yaratmaq cəmi 7 saniyə çəkir. Bunu perspektivə qoymaq üçün SDXL modeli eyni vəzifəni yerinə yetirmək üçün nisbətən ləng 40 saniyə tələb edəcəkdir.

Daha əvvəl təqdim edilən Würstchen V1, əsasını SDXL ilə Latent olaraq paylaşır Diffuziya modeli lakin daha sürətli Unet arxitekturasını özündə birləşdirir. İcma Würstchen V2-nin arxitekturası ilə bağlı əlavə təfərrüatları səbirsizliklə gözlədiyi üçün təkmilləşdirilmiş sürət onu diqqətəlayiq inkişaf kimi qeyd edir.

Würstchen V2 a diffuziya modeli Bu, yüksək sıxılmış şəkillərin gizli məkanında işləyir, təlim və nəticə çıxarmaq üçün hesablama xərclərini böyük ölçüdə azaldır. Bu, əvvəllər görülməmiş bir cəsarət olan 42x məkan sıxlığına nail olan yeni dizayndan istifadə edir. Würstchen, sıxılmış şəkilləri yenidən piksel məkanına deşifrə edən iki mərhələli sıxılma, Stage A və Stage B istifadə edir. Üçüncü model, Mərhələ C, yüksək sıxılmış gizli məkanda öyrənilir, daha ucuz və daha sürətli nəticə çıxarmağa imkan verərkən, cari yüksək performanslı modellər üçün istifadə edilən hesablamanın fraksiyalarını tələb edir.

Würstchen V2 iki diffuziya mərhələsindən ibarətdir:

  • Mərhələ A: Bu mərhələ mətn şərti diffuziyanı əhatə edir və heyrətamiz 1 milyard parametrə malikdir. Buradakı sürətlənmə ultra yüksək sıxılma üsulları vasitəsilə əldə edilir. Qeyd edək ki, SDXL-də göründüyü kimi 128x128x4 gizli kod ölçüsü əvəzinə, Würstchen V2 əvvəlcə 24x24x16 təsvir ölçüsündə işləyir. Bu, daha az piksel, lakin daha çox kanal deməkdir ki, bu da sürətin əhəmiyyətli dərəcədə artması ilə nəticələnir.
  • Mərhələ B: Bu, 600 milyon parametrlə təchiz edilmiş diffuziya modelidir, təsviri 24×24-dən 128×128 təsvir ölçüsünə qədər dekompressiyaya cavabdehdir.

Prosesi tamamlamaq, gizli kodu göstərilən görüntüyə çevirən 20 milyon parametrli dekoderdir.

Dərhal gözə çarpan praktik fayda Würstchen V2-nin diqqətəlayiq sürətidir. O, SDXL-dən 2-2.5 dəfə daha sürətli sürətlə işləyir, bu sahədə diqqətəlayiq irəliləyişdir. AI görüntü yaratmaq.

Hər hansı texnoloji yenilikdə olduğu kimi, burada da güzəştlər ola bilər. Şəkil keyfiyyəti baxımından bəzi ekspertlər cüzi itkini təklif edirlər, baxmayaraq ki, hələ də konkret sübutlar təqdim etmək üçün hərtərəfli və dürüst müqayisə gözlənilir.

Yaradılmış mətndən şəkilə nümunələr aşağıda verilmişdir:

Daha çox əlaqəli mövzuları oxuyun:

Məsuliyyətdən imtina

uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.

Müəllif haqqında

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

Ətraflı məqalələr
Damir Yalalov
Damir Yalalov

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

İnstitusional iştah dəyişkənlik fonunda Bitcoin ETF-lərə doğru artır

13F sənədləri vasitəsilə edilən açıqlamalar, Bitcoin ETF-ləri ilə məşğul olan görkəmli institusional investorları ortaya qoyur və bu, artan qəbulu vurğulayır ...

Daha çox məlumat

Hökm günü gəldi: ABŞ Məhkəməsi DOJ-nin iddiasını nəzərdən keçirərkən CZ-nin taleyi tarazlıqda qalır

Changpeng Zhao bu gün Sietldəki ABŞ məhkəməsində hökm oxumağa hazırlaşır.

Daha çox məlumat
İnnovativ Texniki İcmamıza Qoşulun
Daha çox oxu
Daha çox oxu
Layer3 Bu Yay L3 Tokenini işə salacaq, ümumi tədarükün 51%-ni icmaya ayıracaq
Markets Xəbər Hesabatı Texnologiya
Layer3 Bu Yay L3 Tokenini işə salacaq, ümumi tədarükün 51%-ni icmaya ayıracaq
10 May 2024
Edvard Snoudenin Bitcoin tərtibatçılarına son xəbərdarlığı: “Məxfiliyi protokol səviyyəsində prioritet edin və ya onu itirmək riski ilə
Markets təhlükəsizlik Wiki Proqram təminatı Hekayələr və Rəylər Texnologiya
Edvard Snoudenin Bitcoin tərtibatçılarına son xəbərdarlığı: “Məxfiliyi protokol səviyyəsində prioritet edin və ya onu itirmək riski ilə
10 May 2024
Optimizmlə dəstəklənən Ethereum Layer 2 Şəbəkəsi Mayın 15-də Mainnetini işə salacaq
Xəbər Hesabatı Texnologiya
Optimizmlə dəstəklənən Ethereum Layer 2 Şəbəkəsi Mayın 15-də Mainnetini işə salacaq
10 May 2024
Bu həftənin ən yaxşı sövdələşmələri, AI, IT-yə əsas investisiyalar, Web3, və Kripto (06-10.04)
Həzm Biznes Markets Proqram təminatı Texnologiya
Bu həftənin ən yaxşı sövdələşmələri, AI, IT-yə əsas investisiyalar, Web3, və Kripto (06-10.04)
10 May 2024
CRYPTOMERIA LABS PTE. LTD.