Stability AI SDXL Beta adlı yeni modeli buraxır
Qısaca
Stability AI SDXL Beta adlı yeni modeli buraxdı (Stable Diffusion XL Beta). Bu, daha çox parametrləri və bəzi naməlum təkmilləşdirmələri olan daha böyük modeldir. DreamStudio-da mövcuddur, Stability AI's rəsmi görüntü generatorudur və heyrətamiz vizuallar yaratmaq üçün qabaqcıl alqoritmlərdən və dərin öyrənmə üsullarından istifadə edir.
Stability AI qısaltması olan SDXL Beta adlı yeni modelin ön görünüşünü təqdim etdi Stable Diffusion XL Beta. İndiyə qədər şirkət model haqqında çoxlu məlumat paylaşmayıb, lakin o, bunu etmək istəyən hər kəs üçün sınaqdan keçirilə bilər. Bu SDXL modeli haqqında yenilik nədir? stable diffusion? Onun üstünlükləri və mənfi cəhətləri nələrdir? Gəlin araşdıraq.
Daha ətraflı: Midjourney və Dall-E Rəssam Stilləri Nümunələri ilə Dump: 130 Məşhur AI Rəsm Texnikası |
SDXL modeli tam olaraq nədir?
SDXL modeli hazırda mövcud olan yeni bir modeldir təlim olunur. O, bitməkdən çox uzaqdır və yayımlanana qədər onunla bağlı bir çox təfərrüatlar dəyişə bilər; bildiyimizə görə, o, hətta SDXL modeli adlandırılmaya bilər. Bildiyimiz odur ki, o, daha çox parametrləri və bəzi naməlum təkmilləşdirmələri olan daha böyük modeldir. Bu, v2 modeli deyil, v3 modelidir (nə deməkdir). Mümkündür ki, v2 modelindəki təkmilləşdirmələr sistemin işini yaxşılaşdıra bilər, lakin əlavə məlumat olmadan bu təkmilləşdirmələrin nə dərəcədə əhəmiyyətli ola biləcəyini müəyyən etmək çətindir. Bundan əlavə, bu versiyada hansı xüsusi parametrlərin əlavə edildiyini və ya düzəliş edildiyini bilmək faydalı olardı.
SDXL modeli hazırda DreamStudio-da mövcuddur, Stability AIrəsmi görüntü generatoru. Yoxlamaq üçün model menyusundan SDXL Beta seçin. Görünür, inkişaf etmiş alqoritmlərdən istifadə edir və dərin öyrənmə texnikaları geniş tətbiqlər üçün mükəmməl olan heyrətamiz vizuallar yaratmaq.
Təkmilləşdirilməsi
Oxunan mətn. SDXL oxunaqlı mətn yaratmağa qadirdir və bu, yəqin ki, onun ən diqqət çəkən xüsusiyyətidir, çünki mövcud v1 və v2.1 modellərində bu mümkün deyildi. SDXL-in yaradılan mətni hər zaman dəqiq deyil Stable Diffusion Aşağıdakı mətn. Bununla belə, v2.1 modelini bir yana qoyaq, v1-dən çox üstündür. Bunun səbəbi, SDXL-lərin daha mürəkkəb dil strukturlarını anlamağa və yaratmağa imkan verən daha təkmil dərin öyrənmə alqoritmindən istifadə etməsidir. Gələcək inkişafla, daha dəqiq və etibarlı olmaq potensialına malikdir.
İnsan anatomiyası. Anatomik cəhətdən düzgün insan fiqurlarının dəqiq nəsli uzun müddətdir problem olmuşdur stable diffusion. Əlavə və ya əskik əzaların olması çox yaygındır. Rəngləmə adətən onları düzəltmək üçün istifadə olunur və ya daha yaxınlarda siz istinad təsvirindən pozanın dublikatını çıxarmaq üçün ControlNet-in Open Pose funksiyasından istifadə edə bilərsiniz. SDXL Beta modelinin burada təkmilləşdirildiyini qeyd etməkdən məmnunuq. SDXL Beta modeli istinad şəkillərindən pozaların dəqiq surətdə təkrarlanmasında əhəmiyyətli irəliləyiş göstərmişdir. Bu, animasiya və virtual reallıq kimi müxtəlif tətbiqlər üçün dəyərli bir vasitə ola bilər.
Portret üslubu. SDXL Beta fotoşəkillərə bənzəyən əla portretlər istehsal edir – bu, 1.5 versiyası ilə müqayisədə təkmilləşdirmədir. SDXL Beta-da təkmilləşdirilmiş alqoritm portretlərin detallarını və rəng dəqiqliyini artırır, nəticədə daha təbii və real görünüş əldə edilir. İstifadəçilər arzu etdikləri effektlərə nail olmaq üçün kəskinlik və doyma səviyyələrini də tənzimləyə bilərlər.
Duoton. Duotone açar sözü həmişə v1.5 modelində ağ-qara fotoşəkillər yaradır. Ancaq indi SDXL Beta tərəfindən istehsal olunan iki tonlu şəkillər müxtəlif rənglərdə olur. Aydındır ki, v1 modelləri ilə müqayisədə qabiliyyəti təlqini şərh edin təkmilləşdi, nəticədə v2 modellərindən daha dəqiq və uyğun cavablar alındı, bu da onları təbii dil emal tapşırıqları üçün daha etibarlı alətə çevirdi.
Bədii üslublar. Bəzi kiçik düzəlişlər edildi, lakin yeni modelin daha yaxşı nəticələr verib-vermədiyini müəyyən etmək çətindir, çünki onlar sadəcə unikaldır. Mümkündür ki, bu düzəlişlər şəxsi üstünlük və ya subyektiv rəy məsələsi ola bilər və bu, düzəliş etməyi çətinləşdirir defionların keyfiyyətinə dair ilkin mühakimə. Buna baxmayaraq, düzəlişlərin unikallığı diqqətəlayiq ola bilər və daha çox araşdırmağa dəyər.
Nəticə
- Stable Diffusion nəhayət məntiqli mətn yarada bilər.
- SDXL v2.1 və (daha az dərəcədə) v1.5 modellərindən daha estetik baxımdan xoşagələn şəkillər təqdim edir.
- Yeni model daha dəqiq təsvirlər istehsal edir.
- İnsan anatomiyası təkmilləşdi.
- Mənfi göstərişlər v2.1-dəki kimi zəruri deyil.
- O, real portretlər yarada bilir.
- Modeldəki bəzi qəribəliklər buraxılmazdan əvvəl düzəldiləcək.
Daha çox əlaqəli məqaləni oxuyun:
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.