Звіт про новини Технологія
Квітень 10, 2023

Stability AI Випускає нову модель під назвою SDXL Beta

Коротко

Stability AI випустила нову модель під назвою SDXL Beta (Stable Diffusion XL Beta). Це більша модель з більшою кількістю параметрів і деякими невідомими вдосконаленнями. Він доступний на DreamStudio, Stability AIОфіційний генератор зображень, який використовує вдосконалені алгоритми та методи глибокого навчання для створення приголомшливих візуальних ефектів.

Stability AI представила попередній перегляд нової моделі під назвою SDXL Beta, скорочення від Stable Diffusion XL Бета. Поки що компанія не поділилася великою кількістю інформації про модель, але вона доступна для тестування всім, хто хоче це зробити. Що нового в цій моделі SDXL? stable diffusion? Які його переваги та недоліки? Давайте розслідуємо.

Детальніше: Midjourney Дамп стилів художника та Dall-E із прикладами: 130 відомих технік малювання AI

Що таке модель SDXL?

Модель SDXL є новою моделлю, яка в даний час проходить навчання. Він ще далекий від завершення, і до моменту його виходу багато деталей про нього можуть змінитися; Наскільки ми знаємо, це може навіть не називатися моделлю SDXL. Все, що ми знаємо, це те, що це більша модель з більшою кількістю параметрів і деякими невідомими вдосконаленнями. Це модель v2, а не v3 (що б це не означало). Цілком можливо, що вдосконалення в моделі v2 можуть покращити продуктивність системи, але без додаткової інформації важко визначити, наскільки значними можуть бути ці покращення. Крім того, було б корисно знати, які конкретні параметри були додані або налаштовані в цій версії.

Модель SDXL наразі доступна на DreamStudio, Stability AIофіційний генератор зображень. Щоб перевірити, виберіть SDXL Beta у меню моделі. Здається, він використовує передові алгоритми та техніки глибокого навчання створювати приголомшливі візуальні ефекти, які ідеально підходять для широкого спектру застосувань.

Що таке модель SDXL?

поліпшення

Розбірливий текст. SDXL здатний генерувати розбірливий текст, і це, мабуть, його найяскравіша функція, оскільки це було неможливо в існуючих моделях v1 і v2.1. Згенерований SDXL текст не завжди точний, як ви можете бачити в Stable Diffusion Текст нижче. Однак він значно перевершує v2.1, не кажучи вже про модель v1. Це пояснюється тим, що SDXL використовує вдосконалений алгоритм глибокого навчання, який дозволяє розуміти та генерувати складніші мовні структури. З подальшим розвитком він має потенціал стати ще більш точним і надійним.

Підказка: фотографія джентльмена, який тримає білий папір із написом «Без підробок»
Підказка: фотографія джентльмена, який тримає білий папір із написом «Без підробок»
Фото рудоволосої жінки, яка тримає чорну табличку з білими шрифтами, на якій написано "Без жартів"
Підказка: фотографія рудоволосої жінки, яка тримає чорну табличку з білими шрифтами, на якій написано «Без жартів».
Підказка: фотографія китаянки, яка сидить у кінотеатрі, тримаючи тарілку зі словом «Біль і літак».
Підказка: фотографія китаянки, яка сидить у кінотеатрі, тримаючи в руках тарілку зі словом «Біль і літак».

Анатомія людини. Точна генерація анатомічно правильних фігур людини вже давно є проблемою для stable diffusion. Наявність додаткових або відсутніх кінцівок є поширеним явищем. Для їх виправлення зазвичай використовується Inpainting, або, нещодавно, ви можете використовувати функцію Open Pose ControlNet, щоб скопіювати позу з контрольного зображення. Ми раді відзначити, що модель SDXL Beta покращилася. Бета-модель SDXL продемонструвала значне покращення в точному дублюванні поз із контрольних зображень. Це може бути цінним інструментом для різних програм, таких як анімація та віртуальна реальність.

Фото жінки в спортивному спорядженні, яка крутить м’яч у правій руці
Підказка: фотографія жінки в спортивному спорядженні, яка обертає м’яч у правій руці
Фото хлопчика, що сидить під червоним місяцем
Підказка: фотографія хлопчика, що сидить під червоним місяцем
Підказка: на фото зображено старого, що біжить лісом.

Портретний стиль. SDXL Beta створює чудові портрети, які виглядають як фотографії – це оновлення порівняно з версією 1.5. Удосконалений алгоритм у версії SDXL Beta покращує деталі та точність кольорів портретів, створюючи більш природний і реалістичний вигляд. Користувачі також можуть регулювати рівні різкості та насиченості для досягнення бажаного ефекту.

Підказка: зображення хлопчика та дівчинки
Підказка: зображення хлопчика та дівчинки
Підказка: портретне фото товстого хлопця
Підказка: портретне фото товстого хлопця
Підказка: фотознімок жінки 80-х
Підказка: фотознімок жінки 80-х

Duotone. Ключове слово duotone завжди створює чорно-білі фотографії в моделі v1.5. Однак тепер двоколірні зображення, створені SDXL Beta, доступні в різних кольорах. Зрозуміло, що порівняно з моделями v1 можливість інтерпретувати підказку покращився, що призвело до більш точних і релевантних відповідей від моделей v2, що зробило їх більш надійним інструментом для завдань обробки природної мови.

портрет собаки в двоколірному стилі
Підказка: двоколірний портрет собаки
двоколірний пейзаж острова
Підказка: двоколірний пейзаж острова
двоколірний портрет молодої африканської жінки
Підказка: двоколірний портрет молодої африканської жінки

Художні стилі. Були деякі незначні коригування, але важко визначити, чи забезпечує нова модель кращі результати, оскільки вони просто унікальні. Цілком можливо, що ці коригування можуть бути питанням особистих уподобань або суб’єктивної думки, що ускладнює внесення defiпозитивне судження про їх якість. Тим не менш, унікальність коригувань може бути заслуговує на увагу та варто досліджувати далі.

Нью-Йорк Івана Айвазовського
v 1.5: Нью-Йорк Івана Айвазовського
Нью-Йорк Івана Айвазовського
SDXL: Нью-Йорк Івана Айвазовського
Старий ліс Крістофера Баласкаса
т. 1.5: Старий ліс Крістофера Баласкаса
Старий ліс Крістофера Баласкаса
SDXL: Старий ліс Крістофера Баласкаса

Висновок

  • Stable Diffusion може нарешті створити текст, який має сенс.
  • SDXL забезпечує більш естетично привабливі зображення, ніж моделі v2.1 і (меншою мірою) v1.5.
  • Нова модель створює більш точні зображення.
  • Анатомія людини вдосконалилася.
  • Негативні підказки не такі необхідні, як у v2.1.
  • Він може створювати реалістичні портрети.
  • Деякі дивацтва в моделі будуть виправлені до випуску.

Читайте більше пов’язаних статей:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories

Рішення для торгівлі стейблкойнами BRICS Nations Eye

by Вікторія Пальчик
Травень 01, 2024
Приєднуйтеся до нашої розсилки.
Останні новини

Настав день винесення вироку: суд США розглядає прохання Міністерства юстиції щодо долі CZ.

Changpeng Zhao готовий зіткнутися з вироком у американському суді в Сіетлі сьогодні.

Дізнайтеся більше

Засновників гаманця Samourai Wallet звинувачують у сприянні угодам у Darknet на суму 2 мільярди доларів

Занепокоєння засновників гаманця Samourai Wallet є помітною невдачею для галузі, підкреслюючи постійне...

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Ankr співпрацює з AI Blockchain Platform Talus Network, щоб розблокувати ліквідність біткойнів для AI
Business Звіт про новини Технологія
Ankr співпрацює з AI Blockchain Platform Talus Network, щоб розблокувати ліквідність біткойнів для AI
Травень 1, 2024
Binance Labs підтримує Movement Labs, щоб сприяти інтеграції Facebook Move через блокчейни
Business Звіт про новини Технологія
Binance Labs підтримує Movement Labs, щоб сприяти інтеграції Facebook Move через блокчейни
Травень 1, 2024
Рішення для торгівлі стейблкойнами BRICS Nations Eye
Business ринки Розповіді та огляди Технологія
Рішення для торгівлі стейблкойнами BRICS Nations Eye
Травень 1, 2024
Мережа Bitcoin L2 BOB інтегрується з LayerZero для покращеної функціональності
Business Звіт про новини Технологія
Мережа Bitcoin L2 BOB інтегрується з LayerZero для покращеної функціональності
Травень 1, 2024
CRYPTOMERIA LABS PTE. LTD.