Xəbər Hesabatı Texnologiya
Noyabr 24, 2022

Stability AI'S Stable Diffusion 2 Alqoritm Nəhayət Ümumidir: yeni Depth2img modeli, super rezolyusiyaya malik artırıcı, böyüklər üçün məzmun yoxdur

Qısaca

Stable Diffusion 2.0 modeli əvvəlkindən daha sürətli, açıq mənbəli, genişləndirilə bilən, daha möhkəmdir

Stable Diffusion real vaxt rejimində göstərmək üçün yeni funksiyalarla GPU-ya hazır olur

Dərinliyə yönəldilmiş stable diffusion model – Yaradıcı tətbiqlər üçün yeni ideyalarla şəkildən-şəklə

Stability AI var azad haqqında öz bloqunda yeni bir kağız Stable Diffusion 2. İçində, Stability AI digər müasir üsullarla müqayisə edərkən əvvəlkindən daha səmərəli və möhkəm olan yeni alqoritm təklif edir.

AI-ləri açın Stable Diffusion 2 Alqoritm Nəhayət Ümumidir: yeni Depth2img modeli, super rezolyusiyaya malik artırıcı, böyüklər üçün məzmun yoxdur

CompVis-in orijinalı Stable Diffusion V1 modeli inqilab etdi açıq mənbənin təbiəti AI modelləri və dünyada yüzlərlə müxtəlif modellər və inkişaflar istehsal etdi. O, Github-dakı daha çox proqramdan daha sürətli iki aydan az müddətdə 10,000-ə çatan 33,000 Github ulduzuna ən sürətli yüksəlişlərdən birini gördü.

Orijinal Stable Diffusion V1 buraxılışı Robin Rombachın dinamik komandası tərəfindən idarə edildi (Stability AI) və Prof. Dr. Björn Ommerin rəhbərlik etdiyi LMU Münhendəki CompVis Qrupundan Patrick Esser (Runway ML). Laboratoriyanın Latent ilə əvvəlki işini qurdular Diffuziya modelləri və LAION və Eleuther AI-dən kritik dəstək aldı.

AI-ləri açın Stable Diffusion 2 Alqoritm Nəhayət Ümumidir: yeni Depth2img modeli, super rezolyusiyaya malik artırıcı, böyüklər üçün məzmun yoxdur
AI-ləri açın Stable Diffusion 2 Alqoritm Nəhayət Ümumidir: yeni Depth2img modeli, super rezolyusiyaya malik artırıcı, böyüklər üçün məzmun yoxdur

Nə edir Stable Diffusion v1-dən fərqlidir Stable Diffusion v2? 

Stable Diffusion 2.0 əvvəlki versiya ilə müqayisədə bir sıra əhəmiyyətli təkmilləşdirmələr və funksiyaları ehtiva edir, ona görə də gəlin onlara nəzər salaq.

The Stable Diffusion 2.0 buraxılışı LAION tərəfindən işlənib hazırlanmış yeni mətn kodlayıcısı (OpenCLIP) ilə öyrədilmiş möhkəm mətndən-şəklə uyğun modellərə malikdir. Stability AI, bu da keyfiyyətini əhəmiyyətli dərəcədə artırır yaradılmış şəkillər əvvəlki V1 buraxılışları üzərində. Bu buraxılışın mətndən şəkilə modelləri 512×512 piksel və 768×768 piksel standart qətnamə ilə şəkillər çıxara bilər.

Bu modellər tərəfindən yaradılan LAION-5B məlumat dəstinin estetik alt dəstindən istifadə etməklə öyrədilir Stability AI's DeepFloyd komandası, sonra LAION-un NSFW filtrindən istifadə edərək böyüklər üçün məzmunu istisna etmək üçün süzülür.

50 DDIM nümunə addımı, 50 təsnifatçısız istiqamətləndirici şkala və 1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0 və 8.0-dan istifadə etməklə qiymətləndirmələr yoxlama məntəqələrinin nisbi yaxşılaşmasını göstərir:

Nə edir Stable Diffusion v1-dən fərqlidir Stable Diffusion v2?

Stable Diffusion 2.0 artıq təsvirin ayırdetmə qabiliyyətini dörd dəfə artıran Upscaler Diffusion modelini özündə birləşdirir. Modelimizdən bir nümunə yüksəltmə aşağı keyfiyyətli yaradılan təsvirin (128×128) daha yüksək ayırdetmə təsvirinə çevrilməsi aşağıda göstərilmişdir (512×512). Stable Diffusion 2.0, mətndən şəkilə modellərimizlə birləşdirildikdə, indi 2048×2048 və ya daha yüksək qətnamə ilə şəkillər yarada bilər.

Yeni dərinlik idarə olunur stable diffusion model, depth2img, V1-dən əvvəlki təsvirdən-şəklə funksiyasını tamamilə yeni yaradıcılıq imkanları ilə genişləndirir. Depth2img giriş şəklinin dərinliyini müəyyən edir (mövcud modeldən istifadə etməklə) və sonra yenisini yaradır şəkillər həm mətn, həm də dərin məlumat əsasında. Depth-to-Image çoxlu sayda yeni yaradıcı tətbiqlər təqdim edə bilər, təsvirin tutarlılığını və dərinliyini qoruyaraq orijinaldan əhəmiyyətli dərəcədə fərqli görünən dəyişikliklər təklif edir.

Yeni nə var Stable Diffusion 2?

  • Yeni stable diffusion model 768×768 qətnamə təklif edir.
  • U-Net 1.5 versiyası ilə eyni parametrlərə malikdir, lakin o, sıfırdan öyrədilir və mətn kodlayıcısı kimi OpenCLIP-ViT/H istifadə edir. Sözdə v-proqnozlaşdırma modeli SD 2.0-v-dir.
  • Yuxarıda qeyd olunan model SD 2.0 bazasından düzəldilib, o da mövcuddur və 512×512 təsvirlərdə tipik səs-küy proqnozlaşdırma modeli kimi öyrədilmişdir.
  • X4 miqyası ilə gizli mətnlə idarə olunan diffuziya modeli əlavə edildi.
  • Təmizlənmiş SD 2.0-baza dərinliyi ilə idarə olunur stable diffusion model. Model strukturu qoruyan img2img və forma şərti sintez üçün istifadə edilə bilər və MiDaS tərəfindən çıxarılan monokulyar dərinlik təxminlərinə əsaslanır.
  • SD 2.0 təməli üzərində qurulmuş təkmilləşdirilmiş mətnlə idarə olunan rəsm modeli.

Tərtibatçılar ilkin iterasiya kimi çox çalışdılar Stable Diffusion, modeli tək GPU-da işləmək üçün optimallaşdırmaq üçün—onlar əvvəldən onu mümkün qədər çox insan üçün əlçatan etmək istəyirdilər. Milyonlarla insan bu modellərə əl atdıqda və tamamilə əlamətdar şeylər yaratmaq üçün əməkdaşlıq etdikdə nə baş verdiyini onlar artıq görmüşlər. Bu, açıq mənbənin gücüdür: ən müasir model hazırlamaq üçün resursları olmayan, lakin onlarla inanılmaz işlər görmək qabiliyyətinə malik milyonlarla istedadlı insanın geniş potensialından istifadə etmək.

Yeni nə var Stable Diffusion 2?

Depth2img kimi güclü yeni xüsusiyyətlər və daha yaxşı həlletmə imkanları ilə birlikdə bu yeni yeniləmə çoxlu yeni tətbiqlər üçün əsas olacaq və yeni yaradıcı potensialın partlamasına imkan verəcək.

Haqqında daha ətraflı oxuyun Stable Diffusion:

Məsuliyyətdən imtina

uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.

Müəllif haqqında

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

Ətraflı məqalələr
Damir Yalalov
Damir Yalalov

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

İnstitusional iştah dəyişkənlik fonunda Bitcoin ETF-lərə doğru artır

13F sənədləri vasitəsilə edilən açıqlamalar, Bitcoin ETF-ləri ilə məşğul olan görkəmli institusional investorları ortaya qoyur və bu, artan qəbulu vurğulayır ...

Daha çox məlumat

Hökm günü gəldi: ABŞ Məhkəməsi DOJ-nin iddiasını nəzərdən keçirərkən CZ-nin taleyi tarazlıqda qalır

Changpeng Zhao bu gün Sietldəki ABŞ məhkəməsində hökm oxumağa hazırlaşır.

Daha çox məlumat
İnnovativ Texniki İcmamıza Qoşulun
Daha çox oxu
Daha çox oxu
Injective inEVM-ə Yenidən Təhlükəsizliyi Gətirmək üçün AltLayer ilə Gücləri Birləşdirir
Biznes Xəbər Hesabatı Texnologiya
Injective inEVM-ə Yenidən Təhlükəsizliyi Gətirmək üçün AltLayer ilə Gücləri Birləşdirir
3 May 2024
Masa, MASA Kredit Hövzəsini təqdim etmək üçün Teller ilə Birləşir, Bazada USDC Borc Almağa imkan verir
Markets Xəbər Hesabatı Texnologiya
Masa, MASA Kredit Hövzəsini təqdim etmək üçün Teller ilə Birləşir, Bazada USDC Borc Almağa imkan verir
3 May 2024
Velodrome qarşıdakı həftələrdə Superchain Beta Versiyasını işə salır və OP Stack Layer 2 Blockchain-də genişlənir
Markets Xəbər Hesabatı Texnologiya
Velodrome qarşıdakı həftələrdə Superchain Beta Versiyasını işə salır və OP Stack Layer 2 Blockchain-də genişlənir
3 May 2024
CARV, məlumat təbəqəsini mərkəzləşdirməmək və mükafatları yaymaq üçün Aethir ilə tərəfdaşlıq elan edir
Biznes Xəbər Hesabatı Texnologiya
CARV, məlumat təbəqəsini mərkəzləşdirməmək və mükafatları yaymaq üçün Aethir ilə tərəfdaşlıq elan edir
3 May 2024
CRYPTOMERIA LABS PTE. LTD.