Yangiliklar hisoboti texnologiya
Sentyabr 19, 2023

Würstchen V2 modeli g'alaba qozondi Stable Diffusion Yuqori aniqlikdagi tasvirlarni yaratish uchun ajoyib tezlik bilan XL

Yaqinda tvit muallifning “Würstchen” (nemischa “kolbasa”) sarlavhali maqolasi ishqibozlar va mutaxassislarning e’tiborini tortdi. Tvit yangi Würstchen V2 modelidan foydalangan holda tasvirlarni yaratishning qiziqarli natijalari bilan o'rtoqlashdi.

Würstchen V2 modeli g'alaba qozondi Stable Diffusion Yuqori aniqlikdagi tasvirlarni yaratish uchun ajoyib tezlik bilan XL
tegishli: Midjourney 5.2 va Stable Diffusion Ijodiy matndan tasvirga yaratish uchun SDXL 0.9 yangilanishlari

Würstchen tez va samarali bo'lib, bunday modellarga qaraganda tezroq tasvirlarni yaratadi Stable Diffusion XL kamroq xotiradan foydalanganda. Shuningdek, u oʻquv xarajatlarini kamaytirdi, Würstchen v1 bilan 9,000×512 piksellar sonida atigi 512 GPU soati oʻqishni talab qiladi, bunga 150,000 GPU soat sarflangan. Stable Diffusion 1.4. Xarajatlarning 16 baravar kamayishi nafaqat tadqiqotchilarga yangi eksperimentlar o'tkazishda foyda keltiradi, balki ko'proq tashkilotlarga bunday modellarni o'qitish uchun eshiklarni ochadi. Würstchen v2 24,602 GPU soatini ishlatdi, bu faqat 6 × 1.4 da o'qitiladigan SD512 dan 512 baravar arzonroq bo'ldi.

AI hamjamiyatining e'tiborini tortgan o'ziga xos xususiyat - bu Würstchen V2 ning ta'sirchan tezligi. Muallifning so‘zlariga ko‘ra, ushbu model yordamida 1024×2048 o‘lchamdagi to‘rtta tasvirni yaratish atigi 7 soniyani oladi. Buni istiqbolga kiritish uchun, SDXL modeli bir xil vazifani bajarish uchun nisbatan sekin 40 soniyani talab qiladi.

Ilgari taqdim etilgan Würstchen V1 o'z asosini SDXL bilan Latent sifatida baham ko'radi Diffuziya modeli lekin tezroq Unet arxitekturasini o'z ichiga oladi. Hamjamiyat Würstchen V2 arxitekturasi bo'yicha qo'shimcha tafsilotlarni intiqlik bilan kutayotganligi sababli, yuqori tezlikning o'zi uni diqqatga sazovor rivojlanish sifatida belgilaydi.

Würstchen V2 - a diffuziya modeli Bu tasvirlarning yuqori siqilgan yashirin maydonida ishlaydi, bu esa o'qitish va xulosa chiqarish uchun hisoblash xarajatlarini kattalik tartibida kamaytiradi. U 42x fazoviy siqilishga erishadigan yangi dizayndan foydalanadi, bu ilgari ko'rilmagan. Würstchen ikki bosqichli siqishni qo'llaydi, Stage A va Stage B, ular siqilgan tasvirlarni piksel maydoniga qaytaradi. Uchinchi model, Stage C, yuqori darajada siqilgan yashirin fazoda o'rganiladi, bu esa arzonroq va tezroq xulosa chiqarish imkonini beradigan joriy yuqori samarali modellar uchun ishlatiladigan hisoblash fraktsiyalarini talab qiladi.

Würstchen V2 ikkita diffuziya bosqichini o'z ichiga oladi:

  • A bosqichi: Ushbu bosqich matn shartli diffuziyani o'z ichiga oladi va hayratlanarli 1 milliard parametrga ega. Bu erda tezlashuvga ultra yuqori siqish texnikasi orqali erishiladi. Shunisi e'tiborga loyiqki, SDXL-da ko'rinib turganidek, yashirin kod o'lchami 128x128x4 o'rniga, Würstchen V2 dastlab 24x24x16 o'lchamda ishlaydi. Bu kamroq piksellar, lekin ko'proq kanallar degan ma'noni anglatadi, natijada tezlik sezilarli darajada oshadi.
  • B bosqichi: Bu 600 million parametr bilan jihozlangan diffuziya modeli bo'lib, tasvirni 24 × 24 dan 128 × 128 o'lchamlarigacha ochish uchun javobgardir.

Jarayonni yakunlash - bu yashirin kodni ko'rsatilgan tasvirga aylantiradigan 20 million parametrli dekoder.

Darhol ko'zga tashlanadigan amaliy foyda Würstchen V2 ning ajoyib tezligidir. U SDXL dan 2-2.5 baravar tezroq tezlikda ishlaydi, bu sohadagi e'tiborga molik yutuqlar AI tasvirni yaratish.

Har qanday texnologik innovatsiyada bo'lgani kabi, o'zaro kelishuvlar bo'lishi mumkin. Tasvir sifati nuqtai nazaridan, ba'zi ekspertlar biroz yo'qotishni taklif qilmoqdalar, ammo aniq dalillarni taqdim etish uchun har tomonlama va halol taqqoslash kutilmoqda.

Yaratilgan matndan tasvirga misollar quyida keltirilgan:

Ko'proq tegishli mavzularni o'qing:

Masʼuliyatdan voz kechish

Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.

Muallif haqida

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Boshqa maqolalar
Damir Yalolov
Damir Yalolov

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Institutsional ishtaha o'zgaruvchanlik sharoitida Bitcoin ETFlariga nisbatan o'sib bormoqda

13F arizalari orqali oshkor qilish Bitcoin ETFs bilan shug'ullanadigan taniqli institutsional investorlarni ochib beradi, bu esa tobora ortib borayotgan qabul qilinishini ta'kidlaydi ...

Ko'proq ma'lumot oling

Hukm chiqarish kuni keldi: AQSh sudi DOJning iltimosini ko'rib chiqayotgani sababli CZ taqdiri muvozanatda.

Changpeng Chjao bugun AQShning Sietldagi sudida hukm chiqarilishiga tayyor.

Ko'proq ma'lumot oling
Innovatsion texnologiyalar hamjamiyatimizga qo'shiling
Ko'proq o'qing
Ko'proq o'qing
Donald Trampning kriptovalyutaga o'tishi: raqibdan advokatga va bu AQSh kriptovalyuta bozori uchun nimani anglatadi
ish Birja Hikoyalar va sharhlar texnologiya
Donald Trampning kriptovalyutaga o'tishi: raqibdan advokatga va bu AQSh kriptovalyuta bozori uchun nimani anglatadi
, 10 2024 mumkin
Layer3 bu yozda L3 tokenini ishga tushiradi va umumiy ta'minotning 51 foizini hamjamiyatga ajratadi
Birja Yangiliklar hisoboti texnologiya
Layer3 bu yozda L3 tokenini ishga tushiradi va umumiy ta'minotning 51 foizini hamjamiyatga ajratadi
, 10 2024 mumkin
Edvard Snoudenning bitkoin ishlab chiquvchilarga oxirgi ogohlantirishi: “Maxfiylikni protokol darajasidagi ustuvor vazifaga aylantiring yoki uni yoʻqotish xavfi bor.
Birja xavfsizlik Wiki Dastur Hikoyalar va sharhlar texnologiya
Edvard Snoudenning bitkoin ishlab chiquvchilarga oxirgi ogohlantirishi: “Maxfiylikni protokol darajasidagi ustuvor vazifaga aylantiring yoki uni yoʻqotish xavfi bor.
, 10 2024 mumkin
Optimizmga asoslangan Ethereum Layer 2 tarmog‘i 15-mayda o‘zining asosiy tarmog‘ini ishga tushiradi
Yangiliklar hisoboti texnologiya
Optimizmga asoslangan Ethereum Layer 2 tarmog‘i 15-mayda o‘zining asosiy tarmog‘ini ishga tushiradi
, 10 2024 mumkin
CRYPTOMERIA LABS PTE. LTD.