Yangiliklar hisoboti texnologiya
Noyabr 24, 2022

Stability AI"s Stable Diffusion 2-algoritm nihoyat ommaviy: yangi depth2img modeli, o'ta o'lchamli yuksalish, kattalar uchun kontent yo'q

Qisqacha

Stable Diffusion 2.0 modeli avvalgisiga qaraganda tezroq, ochiq manba, kengaytiriladigan va mustahkamroq

Stable Diffusion real vaqt rejimida ko'rsatish uchun yangi xususiyatlar bilan GPU-ga tayyor bo'ladi

Chuqurlik bo'yicha stable diffusion model - Ijodiy ilovalar uchun yangi g'oyalar bilan tasvirdan tasvirga

Stability AI mavjud chiqarildi haqida o'z blogida yangi maqola Stable Diffusion 2. Unda, Stability AI boshqa zamonaviy usullar bilan taqqoslaganda, avvalgisiga qaraganda samaraliroq va mustahkam bo'lgan yangi algoritmni taklif qiladi.

Ochiq AI Stable Diffusion 2-algoritm nihoyat ommaviy: yangi depth2img modeli, o'ta o'lchamli yuksalish, kattalar uchun kontent yo'q

CompVisning asl nusxasi Stable Diffusion V1 modeli inqilob qildi ochiq manbaning tabiati AI modellari va butun dunyo bo'ylab yuzlab turli modellar va yutuqlarni ishlab chiqardi. U 10,000 33,000 ta Github yulduziga eng tez ko'tarilishdan birini ko'rdi, ikki oydan kamroq vaqt ichida XNUMX XNUMX ga yetdi, bu Github'dagi ko'proq dasturlarga qaraganda tezroq.

original Stable Diffusion V1 versiyasini Robin Rombaxning dinamik jamoasi boshqargan (Stability AI) va Prof. Doktor Björn Ommer boshchiligidagi LMU Munichdagi CompVis guruhidan Patrik Esser (Runway ML). Ular laboratoriyaning Latent bilan oldingi ishiga asoslanishdi Diffuziya modellari va LAION va Eleuther AI tomonidan tanqidiy yordam oldi.

Ochiq AI Stable Diffusion 2-algoritm nihoyat ommaviy: yangi depth2img modeli, o'ta o'lchamli yuksalish, kattalar uchun kontent yo'q
Ochiq AI Stable Diffusion 2-algoritm nihoyat ommaviy: yangi depth2img modeli, o'ta o'lchamli yuksalish, kattalar uchun kontent yo'q

nima undayapti Stable Diffusion v1 dan farq qiladi Stable Diffusion v2? 

Stable Diffusion 2.0 oldingi versiyaga nisbatan bir qator muhim yaxshilanishlar va xususiyatlarni o'z ichiga oladi, shuning uchun ularni ko'rib chiqamiz.

The Stable Diffusion 2.0 versiyasida LAION tomonidan ishlab chiqilgan yangi matn kodlovchisi (OpenCLIP) bilan o'qitilgan mustahkam matndan tasvirga modellar mavjud. Stability AI, bu sifatini sezilarli darajada oshiradi yaratilgan tasvirlar oldingi V1 nashrlariga qaraganda. Ushbu nashrning matndan tasvirga modellari standart o'lchamlari 512 × 512 piksel va 768 × 768 piksel bo'lgan tasvirlarni chiqarishi mumkin.

Ushbu modellar tomonidan yaratilgan LAION-5B ma'lumotlar to'plamining estetik kichik to'plamidan foydalangan holda o'qitiladi Stability AIning DeepFloyd jamoasi, keyin LAION ning NSFW filtri yordamida kattalar tarkibini istisno qilish uchun filtrlanadi.

50 ta DDIM namuna bosqichi, 50 ta klassifikatorsiz yo'naltiruvchi shkala va 1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0 va 8.0 dan foydalangan holda baholashlar nazorat punktlarining nisbatan yaxshilanganligini ko'rsatadi:

nima undayapti Stable Diffusion v1 dan farq qiladi Stable Diffusion v2?

Stable Diffusion 2.0 endi Upscaler Diffusion modelini o'z ichiga oladi, bu tasvir o'lchamlarini to'rt marta oshiradi. Bizning modelimizga misol Upscaling past sifatli yaratilgan tasvir (128 × 128) yuqori aniqlikdagi tasvirga quyida ko'rsatilgan (512 × 512). Stable Diffusion 2.0, bizning matndan tasvirga modellarimiz bilan birlashganda, endi 2048 × 2048 yoki undan yuqori o'lchamdagi tasvirlarni yaratishi mumkin.

Yangi chuqurlik boshqariladi stable diffusion model, depth2img, V1 dan oldingi tasvirdan tasvirga funksiyasini butunlay yangi ijodiy imkoniyatlar bilan kengaytiradi. Depth2img kirish tasvirining chuqurligini aniqlaydi (mavjud model yordamida) va keyin yangisini yaratadi tasvirlar matn va chuqur ma'lumotlarga asoslanadi. Depth-to-Image ko'plab yangi ijodiy ilovalarni taqdim etishi mumkin, bu esa tasvirning uyg'unligi va chuqurligini saqlab qolgan holda asl nusxadan sezilarli darajada farq qiladigan o'zgarishlarni taklif qiladi.

Nima yangilik Stable Diffusion 2?

  • yangi stable diffusion model 768 × 768 piksellar sonini taklif qiladi.
  • U-Net 1.5 versiyasi bilan bir xil miqdordagi parametrlarga ega, ammo u noldan o'qitilgan va matn kodlovchisi sifatida OpenCLIP-ViT/H dan foydalanadi. V-bashorat modeli deb ataladigan model SD 2.0-v.
  • Yuqorida aytib o'tilgan model SD 2.0 bazasidan sozlangan, u ham mavjud va 512 × 512 tasvirlarda odatiy shovqinni bashorat qilish modeli sifatida o'rgatilgan.
  • X4 masshtabli yashirin matnga asoslangan diffuziya modeli qo'shildi.
  • Aniqlangan SD 2.0 tayanch chuqurligi bo'yicha stable diffusion model. Model tuzilmani saqlaydigan img2img va shaklni shartli sintez qilish uchun ishlatilishi mumkin va MiDaS tomonidan chiqarilgan monokulyar chuqurlik hisoblariga asoslanadi.
  • SD 2.0 asosiga qurilgan, matnga asoslangan takomillashtirilgan rasm chizish modeli.

Ishlab chiquvchilar xuddi dastlabki iteratsiya kabi qattiq mehnat qilishdi Stable Diffusion, modelni bitta grafik protsessorda ishlash uchun optimallashtirish uchun — ular boshidanoq uni imkon qadar ko'proq odamlar uchun ochiq qilishni xohlashdi. Ular millionlab odamlar ushbu modellarni qo'lga kiritib, ajoyib narsalarni yaratish uchun hamkorlik qilganda nima sodir bo'lishini allaqachon ko'rgan. Bu ochiq manbaning kuchi: zamonaviy modelni o'qitish uchun resurslarga ega bo'lmagan, lekin u bilan aql bovar qilmaydigan narsalarni qilish qobiliyatiga ega bo'lgan millionlab iqtidorli odamlarning ulkan salohiyatidan foydalanish.

Nima yangilik Stable Diffusion 2?

Depth2img kabi kuchli yangi xususiyatlar va yanada yaxshi piksellar sonini oshirish imkoniyatlari bilan birgalikda ushbu yangi yangilanish ko'plab yangi ilovalar uchun asos bo'lib xizmat qiladi va yangi ijodiy salohiyatni portlatish imkonini beradi.

Davomi haqida batafsil ma'lumot Stable Diffusion:

Masʼuliyatdan voz kechish

Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.

Muallif haqida

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Boshqa maqolalar
Damir Yalolov
Damir Yalolov

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Institutsional ishtaha o'zgaruvchanlik sharoitida Bitcoin ETFlariga nisbatan o'sib bormoqda

13F arizalari orqali oshkor qilish Bitcoin ETFs bilan shug'ullanadigan taniqli institutsional investorlarni ochib beradi, bu esa tobora ortib borayotgan qabul qilinishini ta'kidlaydi ...

Ko'proq ma'lumot oling

Hukm chiqarish kuni keldi: AQSh sudi DOJning iltimosini ko'rib chiqayotgani sababli CZ taqdiri muvozanatda.

Changpeng Chjao bugun AQShning Sietldagi sudida hukm chiqarilishiga tayyor.

Ko'proq ma'lumot oling
Innovatsion texnologiyalar hamjamiyatimizga qo'shiling
Ko'proq o'qing
Ko'proq o'qing
Injective inEVM-ga qayta tiklash xavfsizligini olib kelish uchun AltLayer bilan kuchlarni birlashtiradi
ish Yangiliklar hisoboti texnologiya
Injective inEVM-ga qayta tiklash xavfsizligini olib kelish uchun AltLayer bilan kuchlarni birlashtiradi
, 3 2024 mumkin
Masa, MASA kreditlash pulini joriy qilish uchun kassa bilan hamkorlik qiladi, USDC asosida qarz olishga imkon beradi
Birja Yangiliklar hisoboti texnologiya
Masa, MASA kreditlash pulini joriy qilish uchun kassa bilan hamkorlik qiladi, USDC asosida qarz olishga imkon beradi
, 3 2024 mumkin
Velodrome kelgusi haftalarda Superchain beta-versiyasini ishga tushiradi va OP Stack Layer 2 blokcheynlarida kengayadi
Birja Yangiliklar hisoboti texnologiya
Velodrome kelgusi haftalarda Superchain beta-versiyasini ishga tushiradi va OP Stack Layer 2 blokcheynlarida kengayadi
, 3 2024 mumkin
CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi
ish Yangiliklar hisoboti texnologiya
CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi
, 3 2024 mumkin
CRYPTOMERIA LABS PTE. LTD.