Stability AI'S Stable Diffusion 2 Alqoritm Nəhayət Ümumidir: yeni Depth2img modeli, super rezolyusiyaya malik artırıcı, böyüklər üçün məzmun yoxdur
Qısaca
Stable Diffusion 2.0 modeli əvvəlkindən daha sürətli, açıq mənbəli, genişləndirilə bilən, daha möhkəmdir
Stable Diffusion real vaxt rejimində göstərmək üçün yeni funksiyalarla GPU-ya hazır olur
Dərinliyə yönəldilmiş stable diffusion model – Yaradıcı tətbiqlər üçün yeni ideyalarla şəkildən-şəklə
Stability AI var azad haqqında öz bloqunda yeni bir kağız Stable Diffusion 2. İçində, Stability AI digər müasir üsullarla müqayisə edərkən əvvəlkindən daha səmərəli və möhkəm olan yeni alqoritm təklif edir.
CompVis-in orijinalı Stable Diffusion V1 modeli inqilab etdi açıq mənbənin təbiəti AI modelləri və dünyada yüzlərlə müxtəlif modellər və inkişaflar istehsal etdi. O, Github-dakı daha çox proqramdan daha sürətli iki aydan az müddətdə 10,000-ə çatan 33,000 Github ulduzuna ən sürətli yüksəlişlərdən birini gördü.
Orijinal Stable Diffusion V1 buraxılışı Robin Rombachın dinamik komandası tərəfindən idarə edildi (Stability AI) və Prof. Dr. Björn Ommerin rəhbərlik etdiyi LMU Münhendəki CompVis Qrupundan Patrick Esser (Runway ML). Laboratoriyanın Latent ilə əvvəlki işini qurdular Diffuziya modelləri və LAION və Eleuther AI-dən kritik dəstək aldı.
Nə edir Stable Diffusion v1-dən fərqlidir Stable Diffusion v2?
Stable Diffusion 2.0 əvvəlki versiya ilə müqayisədə bir sıra əhəmiyyətli təkmilləşdirmələr və funksiyaları ehtiva edir, ona görə də gəlin onlara nəzər salaq.
The Stable Diffusion 2.0 buraxılışı LAION tərəfindən işlənib hazırlanmış yeni mətn kodlayıcısı (OpenCLIP) ilə öyrədilmiş möhkəm mətndən-şəklə uyğun modellərə malikdir. Stability AI, bu da keyfiyyətini əhəmiyyətli dərəcədə artırır yaradılmış şəkillər əvvəlki V1 buraxılışları üzərində. Bu buraxılışın mətndən şəkilə modelləri 512×512 piksel və 768×768 piksel standart qətnamə ilə şəkillər çıxara bilər.
Bu modellər tərəfindən yaradılan LAION-5B məlumat dəstinin estetik alt dəstindən istifadə etməklə öyrədilir Stability AI's DeepFloyd komandası, sonra LAION-un NSFW filtrindən istifadə edərək böyüklər üçün məzmunu istisna etmək üçün süzülür.
50 DDIM nümunə addımı, 50 təsnifatçısız istiqamətləndirici şkala və 1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0 və 8.0-dan istifadə etməklə qiymətləndirmələr yoxlama məntəqələrinin nisbi yaxşılaşmasını göstərir:
Stable Diffusion 2.0 artıq təsvirin ayırdetmə qabiliyyətini dörd dəfə artıran Upscaler Diffusion modelini özündə birləşdirir. Modelimizdən bir nümunə yüksəltmə aşağı keyfiyyətli yaradılan təsvirin (128×128) daha yüksək ayırdetmə təsvirinə çevrilməsi aşağıda göstərilmişdir (512×512). Stable Diffusion 2.0, mətndən şəkilə modellərimizlə birləşdirildikdə, indi 2048×2048 və ya daha yüksək qətnamə ilə şəkillər yarada bilər.
Yeni dərinlik idarə olunur stable diffusion model, depth2img, V1-dən əvvəlki təsvirdən-şəklə funksiyasını tamamilə yeni yaradıcılıq imkanları ilə genişləndirir. Depth2img giriş şəklinin dərinliyini müəyyən edir (mövcud modeldən istifadə etməklə) və sonra yenisini yaradır şəkillər həm mətn, həm də dərin məlumat əsasında. Depth-to-Image çoxlu sayda yeni yaradıcı tətbiqlər təqdim edə bilər, təsvirin tutarlılığını və dərinliyini qoruyaraq orijinaldan əhəmiyyətli dərəcədə fərqli görünən dəyişikliklər təklif edir.
Yeni nə var Stable Diffusion 2?
- Yeni stable diffusion model 768×768 qətnamə təklif edir.
- U-Net 1.5 versiyası ilə eyni parametrlərə malikdir, lakin o, sıfırdan öyrədilir və mətn kodlayıcısı kimi OpenCLIP-ViT/H istifadə edir. Sözdə v-proqnozlaşdırma modeli SD 2.0-v-dir.
- Yuxarıda qeyd olunan model SD 2.0 bazasından düzəldilib, o da mövcuddur və 512×512 təsvirlərdə tipik səs-küy proqnozlaşdırma modeli kimi öyrədilmişdir.
- X4 miqyası ilə gizli mətnlə idarə olunan diffuziya modeli əlavə edildi.
- Təmizlənmiş SD 2.0-baza dərinliyi ilə idarə olunur stable diffusion model. Model strukturu qoruyan img2img və forma şərti sintez üçün istifadə edilə bilər və MiDaS tərəfindən çıxarılan monokulyar dərinlik təxminlərinə əsaslanır.
- SD 2.0 təməli üzərində qurulmuş təkmilləşdirilmiş mətnlə idarə olunan rəsm modeli.
Tərtibatçılar ilkin iterasiya kimi çox çalışdılar Stable Diffusion, modeli tək GPU-da işləmək üçün optimallaşdırmaq üçün—onlar əvvəldən onu mümkün qədər çox insan üçün əlçatan etmək istəyirdilər. Milyonlarla insan bu modellərə əl atdıqda və tamamilə əlamətdar şeylər yaratmaq üçün əməkdaşlıq etdikdə nə baş verdiyini onlar artıq görmüşlər. Bu, açıq mənbənin gücüdür: ən müasir model hazırlamaq üçün resursları olmayan, lakin onlarla inanılmaz işlər görmək qabiliyyətinə malik milyonlarla istedadlı insanın geniş potensialından istifadə etmək.
Depth2img kimi güclü yeni xüsusiyyətlər və daha yaxşı həlletmə imkanları ilə birlikdə bu yeni yeniləmə çoxlu yeni tətbiqlər üçün əsas olacaq və yeni yaradıcı potensialın partlamasına imkan verəcək.
Haqqında daha ətraflı oxuyun Stable Diffusion:
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.