Stability AI یک مدل جدید به نام SDXL Beta منتشر می کند
به طور خلاصه
Stability AI مدل جدیدی به نام SDXL Beta (Stable Diffusion XL بتا). این یک مدل بزرگتر با پارامترهای بیشتر و برخی پیشرفت های ناشناخته است. در DreamStudio موجود است، Stability AIتولید کننده تصویر رسمی است و از الگوریتم های پیشرفته و تکنیک های یادگیری عمیق برای ایجاد تصاویری خیره کننده استفاده می کند.
Stability AI پیش نمایشی از یک مدل جدید به نام SDXL Beta را معرفی کرده است Stable Diffusion XL بتا. تا کنون، این شرکت اطلاعات زیادی در مورد این مدل به اشتراک نگذاشته است، اما برای هر کسی که بخواهد این کار را انجام دهد، برای آزمایش در دسترس است. این مدل SDXL برای چه چیزی جدید است stable diffusion? مزایا و معایب آن چیست؟ بیایید بررسی کنیم.
مدل SDXL دقیقا چیست؟
مدل SDXL مدل جدیدی است که در حال حاضر است در حال آموزش دادن. هنوز کامل نشده است و تا زمان انتشار، ممکن است بسیاری از جزئیات در مورد آن تغییر کند. همانطور که می دانیم، ممکن است حتی مدل SDXL نامیده نشود. تنها چیزی که می دانیم این است که یک مدل بزرگتر با پارامترهای بیشتر و برخی پیشرفت های ناشناخته است. این یک مدل v2 است، نه یک مدل v3 (به هر معنی که باشد). این امکان وجود دارد که پیشرفتها در مدل v2 بتواند عملکرد سیستم را بهبود بخشد، اما بدون اطلاعات بیشتر، تعیین اینکه این پیشرفتها چقدر قابل توجه هستند دشوار است. علاوه بر این، دانستن اینکه چه پارامترهای خاصی در این نسخه اضافه یا تنظیم شده است مفید خواهد بود.
مدل SDXL در حال حاضر در DreamStudio موجود است. Stability AIتولید کننده رسمی تصویر SDXL Beta را از منوی مدل انتخاب کنید تا آن را بررسی کنید. به نظر می رسد از الگوریتم های پیشرفته و تکنیک های یادگیری عمیق برای ایجاد تصاویری خیره کننده که برای طیف گسترده ای از برنامه ها مناسب هستند.
ارتقاء
متن خوانا SDXL قادر به تولید متن خوانا است و احتمالاً قابل توجه ترین ویژگی آن است زیرا در مدل های v1 و v2.1 موجود امکان پذیر نبود. متن تولید شده SDXL همیشه دقیق نیست همانطور که در متن مشاهده می کنید Stable Diffusion متن زیر با این حال، نسبت به v2.1 بسیار برتر است، چه رسد به مدل v1. این به این دلیل است که SDXL از الگوریتم یادگیری عمیق پیشرفته تری استفاده می کند که به آن اجازه می دهد ساختارهای زبانی پیچیده تری را درک و تولید کند. با توسعه بیشتر، پتانسیل دقیق تر و قابل اعتمادتر شدن را دارد.
آناتومی انسان. تولید دقیق فیگورهای انسان از نظر آناتومی درست برای مدت طولانی یک چالش بوده است stable diffusion. وجود اندام اضافی یا از دست رفته شایع است. Inpainting معمولاً برای رفع آنها استفاده می شود، یا اخیراً می توانید از ویژگی Open Pose ControlNet برای کپی کردن یک ژست از یک تصویر مرجع استفاده کنید. ما خوشحالیم که توجه داشته باشیم که اینجا جایی است که مدل بتا SDXL بهبود یافته است. مدل بتا SDXL پیشرفت قابل توجهی را در کپی برداری دقیق از تصاویر مرجع نشان داده است. این می تواند یک ابزار ارزشمند برای برنامه های مختلف مانند انیمیشن و واقعیت مجازی باشد.
سبک پرتره. SDXL Beta پرتره های بسیار خوبی را ایجاد می کند که شبیه عکس هستند - این یک ارتقاء در مقایسه با نسخه 1.5 است. الگوریتم بهبود یافته در SDXL Beta جزئیات و دقت رنگ پرتره ها را افزایش می دهد و در نتیجه ظاهری طبیعی تر و واقعی تر به وجود می آورد. کاربران همچنین می توانند سطوح وضوح و اشباع را برای دستیابی به اثرات دلخواه خود تنظیم کنند.
دوتن. کلمه کلیدی duotone همیشه عکس های سیاه و سفید در مدل v1.5 تولید می کند. با این حال، در حال حاضر، تصاویر دوتایی تولید شده توسط SDXL Beta در رنگ های متنوعی عرضه می شوند. واضح است که در مقایسه با مدل های v1، قابلیت اعلان را تفسیر کنید بهبود یافته است و منجر به پاسخهای دقیقتر و مرتبطتر از مدلهای v2 میشود و آنها را به ابزاری مطمئنتر برای وظایف پردازش زبان طبیعی تبدیل میکند.
سبک های هنری برخی تنظیمات جزئی انجام شده است، اما تعیین اینکه آیا مدل جدید نتایج بهتری ارائه می دهد یا خیر، دشوار است زیرا آنها به سادگی منحصر به فرد هستند. ممکن است این تنظیمات مربوط به ترجیحات شخصی یا نظر ذهنی باشد که ایجاد یک را دشوار می کند defiقضاوت دقیق در مورد کیفیت آنها با این وجود، منحصر به فرد بودن تنظیمات ممکن است قابل توجه و ارزش بررسی بیشتر باشد.
نتیجه
- Stable Diffusion در نهایت می تواند متنی تولید کند که منطقی باشد.
- SDXL تصاویر زیبایی شناختی بیشتری نسبت به مدل های v2.1 و (به میزان کمتر) v1.5 ارائه می دهد.
- مدل جدید تصاویری با دقت بیشتری تولید می کند.
- آناتومی انسان بهبود یافته است.
- اعلان های منفی به اندازه نسخه 2.1 ضروری نیستند.
- می تواند پرتره های واقعی ایجاد کند.
- برخی از موارد عجیب و غریب در مدل قبل از انتشار برطرف خواهد شد.
مقالات مرتبط بیشتر را بخوانید:
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.