Stability AI Випускає нову модель під назвою SDXL Beta
Коротко
Stability AI випустила нову модель під назвою SDXL Beta (Stable Diffusion XL Beta). Це більша модель з більшою кількістю параметрів і деякими невідомими вдосконаленнями. Він доступний на DreamStudio, Stability AIОфіційний генератор зображень, який використовує вдосконалені алгоритми та методи глибокого навчання для створення приголомшливих візуальних ефектів.
Stability AI представила попередній перегляд нової моделі під назвою SDXL Beta, скорочення від Stable Diffusion XL Бета. Поки що компанія не поділилася великою кількістю інформації про модель, але вона доступна для тестування всім, хто хоче це зробити. Що нового в цій моделі SDXL? stable diffusion? Які його переваги та недоліки? Давайте розслідуємо.
Детальніше: Midjourney Дамп стилів художника та Dall-E із прикладами: 130 відомих технік малювання AI |
Що таке модель SDXL?
Модель SDXL є новою моделлю, яка в даний час проходить навчання. Він ще далекий від завершення, і до моменту його виходу багато деталей про нього можуть змінитися; Наскільки ми знаємо, це може навіть не називатися моделлю SDXL. Все, що ми знаємо, це те, що це більша модель з більшою кількістю параметрів і деякими невідомими вдосконаленнями. Це модель v2, а не v3 (що б це не означало). Цілком можливо, що вдосконалення в моделі v2 можуть покращити продуктивність системи, але без додаткової інформації важко визначити, наскільки значними можуть бути ці покращення. Крім того, було б корисно знати, які конкретні параметри були додані або налаштовані в цій версії.
Модель SDXL наразі доступна на DreamStudio, Stability AIофіційний генератор зображень. Щоб перевірити, виберіть SDXL Beta у меню моделі. Здається, він використовує передові алгоритми та техніки глибокого навчання створювати приголомшливі візуальні ефекти, які ідеально підходять для широкого спектру застосувань.
поліпшення
Розбірливий текст. SDXL здатний генерувати розбірливий текст, і це, мабуть, його найяскравіша функція, оскільки це було неможливо в існуючих моделях v1 і v2.1. Згенерований SDXL текст не завжди точний, як ви можете бачити в Stable Diffusion Текст нижче. Однак він значно перевершує v2.1, не кажучи вже про модель v1. Це пояснюється тим, що SDXL використовує вдосконалений алгоритм глибокого навчання, який дозволяє розуміти та генерувати складніші мовні структури. З подальшим розвитком він має потенціал стати ще більш точним і надійним.
Анатомія людини. Точна генерація анатомічно правильних фігур людини вже давно є проблемою для stable diffusion. Наявність додаткових або відсутніх кінцівок є поширеним явищем. Для їх виправлення зазвичай використовується Inpainting, або, нещодавно, ви можете використовувати функцію Open Pose ControlNet, щоб скопіювати позу з контрольного зображення. Ми раді відзначити, що модель SDXL Beta покращилася. Бета-модель SDXL продемонструвала значне покращення в точному дублюванні поз із контрольних зображень. Це може бути цінним інструментом для різних програм, таких як анімація та віртуальна реальність.
Портретний стиль. SDXL Beta створює чудові портрети, які виглядають як фотографії – це оновлення порівняно з версією 1.5. Удосконалений алгоритм у версії SDXL Beta покращує деталі та точність кольорів портретів, створюючи більш природний і реалістичний вигляд. Користувачі також можуть регулювати рівні різкості та насиченості для досягнення бажаного ефекту.
Duotone. Ключове слово duotone завжди створює чорно-білі фотографії в моделі v1.5. Однак тепер двоколірні зображення, створені SDXL Beta, доступні в різних кольорах. Зрозуміло, що порівняно з моделями v1 можливість інтерпретувати підказку покращився, що призвело до більш точних і релевантних відповідей від моделей v2, що зробило їх більш надійним інструментом для завдань обробки природної мови.
Художні стилі. Були деякі незначні коригування, але важко визначити, чи забезпечує нова модель кращі результати, оскільки вони просто унікальні. Цілком можливо, що ці коригування можуть бути питанням особистих уподобань або суб’єктивної думки, що ускладнює внесення defiпозитивне судження про їх якість. Тим не менш, унікальність коригувань може бути заслуговує на увагу та варто досліджувати далі.
Висновок
- Stable Diffusion може нарешті створити текст, який має сенс.
- SDXL забезпечує більш естетично привабливі зображення, ніж моделі v2.1 і (меншою мірою) v1.5.
- Нова модель створює більш точні зображення.
- Анатомія людини вдосконалилася.
- Негативні підказки не такі необхідні, як у v2.1.
- Він може створювати реалістичні портрети.
- Деякі дивацтва в моделі будуть виправлені до випуску.
Читайте більше пов’язаних статей:
відмова
Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.
про автора
Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.
інші статтіДамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.