Würstchen V2 modeli g'alaba qozondi Stable Diffusion Yuqori aniqlikdagi tasvirlarni yaratish uchun ajoyib tezlik bilan XL
Yaqinda tvit muallifning “Würstchen” (nemischa “kolbasa”) sarlavhali maqolasi ishqibozlar va mutaxassislarning e’tiborini tortdi. Tvit yangi Würstchen V2 modelidan foydalangan holda tasvirlarni yaratishning qiziqarli natijalari bilan o'rtoqlashdi.
tegishli: Midjourney 5.2 va Stable Diffusion Ijodiy matndan tasvirga yaratish uchun SDXL 0.9 yangilanishlari |
Würstchen tez va samarali bo'lib, bunday modellarga qaraganda tezroq tasvirlarni yaratadi Stable Diffusion XL kamroq xotiradan foydalanganda. Shuningdek, u oʻquv xarajatlarini kamaytirdi, Würstchen v1 bilan 9,000×512 piksellar sonida atigi 512 GPU soati oʻqishni talab qiladi, bunga 150,000 GPU soat sarflangan. Stable Diffusion 1.4. Xarajatlarning 16 baravar kamayishi nafaqat tadqiqotchilarga yangi eksperimentlar o'tkazishda foyda keltiradi, balki ko'proq tashkilotlarga bunday modellarni o'qitish uchun eshiklarni ochadi. Würstchen v2 24,602 GPU soatini ishlatdi, bu faqat 6 × 1.4 da o'qitiladigan SD512 dan 512 baravar arzonroq bo'ldi.
Würstchen V2 - a diffuziya modeli Bu tasvirlarning yuqori siqilgan yashirin maydonida ishlaydi, bu esa o'qitish va xulosa chiqarish uchun hisoblash xarajatlarini kattalik tartibida kamaytiradi. U 42x fazoviy siqilishga erishadigan yangi dizayndan foydalanadi, bu ilgari ko'rilmagan. Würstchen ikki bosqichli siqishni qo'llaydi, Stage A va Stage B, ular siqilgan tasvirlarni piksel maydoniga qaytaradi. Uchinchi model, Stage C, yuqori darajada siqilgan yashirin fazoda o'rganiladi, bu esa arzonroq va tezroq xulosa chiqarish imkonini beradigan joriy yuqori samarali modellar uchun ishlatiladigan hisoblash fraktsiyalarini talab qiladi.
Würstchen V2 ikkita diffuziya bosqichini o'z ichiga oladi:
- A bosqichi: Ushbu bosqich matn shartli diffuziyani o'z ichiga oladi va hayratlanarli 1 milliard parametrga ega. Bu erda tezlashuvga ultra yuqori siqish texnikasi orqali erishiladi. Shunisi e'tiborga loyiqki, SDXL-da ko'rinib turganidek, yashirin kod o'lchami 128x128x4 o'rniga, Würstchen V2 dastlab 24x24x16 o'lchamda ishlaydi. Bu kamroq piksellar, lekin ko'proq kanallar degan ma'noni anglatadi, natijada tezlik sezilarli darajada oshadi.
- B bosqichi: Bu 600 million parametr bilan jihozlangan diffuziya modeli bo'lib, tasvirni 24 × 24 dan 128 × 128 o'lchamlarigacha ochish uchun javobgardir.
Jarayonni yakunlash - bu yashirin kodni ko'rsatilgan tasvirga aylantiradigan 20 million parametrli dekoder.
Darhol ko'zga tashlanadigan amaliy foyda Würstchen V2 ning ajoyib tezligidir. U SDXL dan 2-2.5 baravar tezroq tezlikda ishlaydi, bu sohadagi e'tiborga molik yutuqlar AI tasvirni yaratish.
Har qanday texnologik innovatsiyada bo'lgani kabi, o'zaro kelishuvlar bo'lishi mumkin. Tasvir sifati nuqtai nazaridan, ba'zi ekspertlar biroz yo'qotishni taklif qilmoqdalar, ammo aniq dalillarni taqdim etish uchun har tomonlama va halol taqqoslash kutilmoqda.
Yaratilgan matndan tasvirga misollar quyida keltirilgan:
Ko'proq tegishli mavzularni o'qing:
Masʼuliyatdan voz kechish
Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.
Muallif haqida
Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.
Boshqa maqolalarDamir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.