گزارش خبری پیشرفته
آوریل 10، 2023

Stability AI یک مدل جدید به نام SDXL Beta منتشر می کند

به طور خلاصه

Stability AI مدل جدیدی به نام SDXL Beta (Stable Diffusion XL بتا). این یک مدل بزرگتر با پارامترهای بیشتر و برخی پیشرفت های ناشناخته است. در DreamStudio موجود است، Stability AIتولید کننده تصویر رسمی است و از الگوریتم های پیشرفته و تکنیک های یادگیری عمیق برای ایجاد تصاویری خیره کننده استفاده می کند.

Stability AI پیش نمایشی از یک مدل جدید به نام SDXL Beta را معرفی کرده است Stable Diffusion XL بتا. تا کنون، این شرکت اطلاعات زیادی در مورد این مدل به اشتراک نگذاشته است، اما برای هر کسی که بخواهد این کار را انجام دهد، برای آزمایش در دسترس است. این مدل SDXL برای چه چیزی جدید است stable diffusion? مزایا و معایب آن چیست؟ بیایید بررسی کنیم.

ادامه مطلب: Midjourney و Dall-E Artist Styles Dump با مثال: 130 تکنیک معروف نقاشی هوش مصنوعی

مدل SDXL دقیقا چیست؟

مدل SDXL مدل جدیدی است که در حال حاضر است در حال آموزش دادن. هنوز کامل نشده است و تا زمان انتشار، ممکن است بسیاری از جزئیات در مورد آن تغییر کند. همانطور که می دانیم، ممکن است حتی مدل SDXL نامیده نشود. تنها چیزی که می دانیم این است که یک مدل بزرگتر با پارامترهای بیشتر و برخی پیشرفت های ناشناخته است. این یک مدل v2 است، نه یک مدل v3 (به هر معنی که باشد). این امکان وجود دارد که پیشرفت‌ها در مدل v2 بتواند عملکرد سیستم را بهبود بخشد، اما بدون اطلاعات بیشتر، تعیین اینکه این پیشرفت‌ها چقدر قابل توجه هستند دشوار است. علاوه بر این، دانستن اینکه چه پارامترهای خاصی در این نسخه اضافه یا تنظیم شده است مفید خواهد بود.

مدل SDXL در حال حاضر در DreamStudio موجود است. Stability AIتولید کننده رسمی تصویر SDXL Beta را از منوی مدل انتخاب کنید تا آن را بررسی کنید. به نظر می رسد از الگوریتم های پیشرفته و تکنیک های یادگیری عمیق برای ایجاد تصاویری خیره کننده که برای طیف گسترده ای از برنامه ها مناسب هستند.

مدل SDXL دقیقا چیست؟

ارتقاء

متن خوانا SDXL قادر به تولید متن خوانا است و احتمالاً قابل توجه ترین ویژگی آن است زیرا در مدل های v1 و v2.1 موجود امکان پذیر نبود. متن تولید شده SDXL همیشه دقیق نیست همانطور که در متن مشاهده می کنید Stable Diffusion متن زیر با این حال، نسبت به v2.1 بسیار برتر است، چه رسد به مدل v1. این به این دلیل است که SDXL از الگوریتم یادگیری عمیق پیشرفته تری استفاده می کند که به آن اجازه می دهد ساختارهای زبانی پیچیده تری را درک و تولید کند. با توسعه بیشتر، پتانسیل دقیق تر و قابل اعتمادتر شدن را دارد.

درخواست: عکس یک آقایی که کاغذ سفیدی در دست دارد که روی آن نوشته شده است: «بدون تقلبی»
درخواست: عکس یک آقایی که کاغذ سفیدی در دست دارد که روی آن نوشته شده است: «بدون تقلبی»
عکس زنی مو قرمز که تابلویی سیاه و سفید با فونت‌های سفید در دست دارد که روی آن نوشته شده است "بدون شوخی"
اعلان: عکس زنی مو قرمز که تابلویی سیاه با فونت های سفید در دست دارد که روی آن نوشته شده است: «جوک نیست»
اعلان: عکس یک زن چینی که در سینما نشسته و بشقاب را در دست دارد که روی آن عبارت «درد و هواپیما» نوشته شده است.
درخواست: عکس یک زن چینی که در سینما نشسته و بشقاب را در دست دارد که روی آن عبارت «درد و هواپیما» نوشته شده است.

آناتومی انسان. تولید دقیق فیگورهای انسان از نظر آناتومی درست برای مدت طولانی یک چالش بوده است stable diffusion. وجود اندام اضافی یا از دست رفته شایع است. Inpainting معمولاً برای رفع آنها استفاده می شود، یا اخیراً می توانید از ویژگی Open Pose ControlNet برای کپی کردن یک ژست از یک تصویر مرجع استفاده کنید. ما خوشحالیم که توجه داشته باشیم که اینجا جایی است که مدل بتا SDXL بهبود یافته است. مدل بتا SDXL پیشرفت قابل توجهی را در کپی برداری دقیق از تصاویر مرجع نشان داده است. این می تواند یک ابزار ارزشمند برای برنامه های مختلف مانند انیمیشن و واقعیت مجازی باشد.

عکس زنی با لباس ورزشی که توپ را در دست راست می چرخاند
درخواست: عکس زنی با لباس ورزشی که توپ را در دست راست می‌چرخاند
عکس پسری که زیر ماه قرمز نشسته است
اعلان: عکس پسری که زیر ماه قرمز نشسته است
اعلان: عکسی پیرمردی را نشان می دهد که در جنگل در حال دویدن است.

سبک پرتره. SDXL Beta پرتره های بسیار خوبی را ایجاد می کند که شبیه عکس هستند - این یک ارتقاء در مقایسه با نسخه 1.5 است. الگوریتم بهبود یافته در SDXL Beta جزئیات و دقت رنگ پرتره ها را افزایش می دهد و در نتیجه ظاهری طبیعی تر و واقعی تر به وجود می آورد. کاربران همچنین می توانند سطوح وضوح و اشباع را برای دستیابی به اثرات دلخواه خود تنظیم کنند.

اعلان: عکس پسر و دختر
اعلان: عکس پسر و دختر
درخواست: یک عکس پرتره از یک مرد چاق
درخواست: یک عکس پرتره از یک مرد چاق
اعلان: عکس زنی از دهه 80
اعلان: عکس زنی از دهه 80

دوتن. کلمه کلیدی duotone همیشه عکس های سیاه و سفید در مدل v1.5 تولید می کند. با این حال، در حال حاضر، تصاویر دوتایی تولید شده توسط SDXL Beta در رنگ های متنوعی عرضه می شوند. واضح است که در مقایسه با مدل های v1، قابلیت اعلان را تفسیر کنید بهبود یافته است و منجر به پاسخ‌های دقیق‌تر و مرتبط‌تر از مدل‌های v2 می‌شود و آنها را به ابزاری مطمئن‌تر برای وظایف پردازش زبان طبیعی تبدیل می‌کند.

پرتره سگ به سبک دوتایی
درخواست: پرتره سگ به سبک دوتایی
منظره دوگانه جزیره
اعلان: منظره دوگانه جزیره
پرتره دوتایی زن جوان آفریقایی
اعلان: پرتره دوتایی زن جوان آفریقایی

سبک های هنری برخی تنظیمات جزئی انجام شده است، اما تعیین اینکه آیا مدل جدید نتایج بهتری ارائه می دهد یا خیر، دشوار است زیرا آنها به سادگی منحصر به فرد هستند. ممکن است این تنظیمات مربوط به ترجیحات شخصی یا نظر ذهنی باشد که ایجاد یک را دشوار می کند defiقضاوت دقیق در مورد کیفیت آنها با این وجود، منحصر به فرد بودن تنظیمات ممکن است قابل توجه و ارزش بررسی بیشتر باشد.

نیویورک اثر ایوان آیوازوفسکی
v 1.5: نیویورک اثر ایوان آیوازوفسکی
نیویورک اثر ایوان آیوازوفسکی
SDXL: نیویورک اثر ایوان آیوازوفسکی
جنگل قدیمی نوشته کریستوفر بالاسکاس
v 1.5: Old Forest اثر کریستوفر بالاسکاس
جنگل قدیمی نوشته کریستوفر بالاسکاس
SDXL: Old Forest اثر کریستوفر بالااسکاس

نتیجه

  • Stable Diffusion در نهایت می تواند متنی تولید کند که منطقی باشد.
  • SDXL تصاویر زیبایی شناختی بیشتری نسبت به مدل های v2.1 و (به میزان کمتر) v1.5 ارائه می دهد.
  • مدل جدید تصاویری با دقت بیشتری تولید می کند.
  • آناتومی انسان بهبود یافته است.
  • اعلان های منفی به اندازه نسخه 2.1 ضروری نیستند.
  • می تواند پرتره های واقعی ایجاد کند.
  • برخی از موارد عجیب و غریب در مدل قبل از انتشار برطرف خواهد شد.

مقالات مرتبط بیشتر را بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories

راه حل تجارت استیبل کوین چشم ملل BRICS

by ویکتوریا پالچیک
ممکن است 01، 2024
به خبرنامه ما بپیوندید.
آخرین اخبار

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید

بنیانگذاران کیف پول سامورایی متهم به تسهیل 2 میلیارد دلار در معاملات Darknet شدند

دلهره از بنیانگذاران کیف پول سامورای نشان دهنده یک شکست قابل توجه برای صنعت است که تاکیدی بر ادامه دار بودن ...

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Ankr با پلتفرم بلاک چین هوش مصنوعی شبکه Talus برای باز کردن نقدینگی بیت کوین برای هوش مصنوعی همکاری می کند
کسب و کار گزارش خبری پیشرفته
Ankr با پلتفرم بلاک چین هوش مصنوعی شبکه Talus برای باز کردن نقدینگی بیت کوین برای هوش مصنوعی همکاری می کند
ممکن است 1، 2024
Binance Labs از Movement Labs برای تسهیل ادغام حرکت فیس بوک در میان بلاک چین ها پشتیبانی می کند.
کسب و کار گزارش خبری پیشرفته
Binance Labs از Movement Labs برای تسهیل ادغام حرکت فیس بوک در میان بلاک چین ها پشتیبانی می کند.
ممکن است 1، 2024
راه حل تجارت استیبل کوین چشم ملل BRICS
کسب و کار بازارها داستان ها و نقدها پیشرفته
راه حل تجارت استیبل کوین چشم ملل BRICS
ممکن است 1، 2024
BOB شبکه بیت کوین L2 با لایه صفر برای کارکردهای پیشرفته ادغام می شود
کسب و کار گزارش خبری پیشرفته
BOB شبکه بیت کوین L2 با لایه صفر برای کارکردهای پیشرفته ادغام می شود
ممکن است 1، 2024
CRYPTOMERIA LABS PTE. محدود