Новостной репортаж Технологии
10 апреля 2023

Stability AI Выпускает новую модель под названием SDXL Beta

Коротко

Stability AI выпустила новую модель под названием SDXL Beta (Stable Diffusion XL бета). Это более крупная модель с большим количеством параметров и некоторыми неизвестными улучшениями. Он доступен на DreamStudio, Stability AIофициальный генератор изображений и использует передовые алгоритмы и методы глубокого обучения для создания потрясающих визуальных эффектов.

Stability AI представила предварительный просмотр новой модели под названием SDXL Beta, сокращенно Stable Diffusion XL бета. Пока что компания не поделилась большой информацией о модели, но она доступна для тестирования всем желающим. Что нового в этой модели SDXL для stable diffusion? Каковы его преимущества и недостатки? Давайте исследовать.

Прочитайте больше: Midjourney и Дамп художественных стилей Dall-E с примерами: 130 известных техник рисования ИИ

Что такое модель SDXL?

Модель SDXL — это новая модель, которая в настоящее время обучение. Он далек от завершения, и к тому времени, когда он будет выпущен, многие детали о нем могут измениться; насколько нам известно, ее можно даже не называть моделью SDXL. Все, что мы знаем, это то, что это более крупная модель с большим количеством параметров и некоторыми неизвестными улучшениями. Это модель v2, а не модель v3 (что бы это ни значило). Возможно, улучшения в модели v2 могут повысить производительность системы, но без дополнительной информации трудно определить, насколько значительными могут быть эти улучшения. Кроме того, было бы полезно узнать, какие именно параметры были добавлены или изменены в этой версии.

Модель SDXL в настоящее время доступна в DreamStudio, Stability AIофициальный генератор изображений. Выберите SDXL Beta в меню модели, чтобы проверить его. Кажется, он использует продвинутые алгоритмы и методы глубокого обучения для создания потрясающих визуальных эффектов, идеально подходящих для широкого спектра приложений.

Что такое модель SDXL?

Улучшения

Разборчивый текст. SDXL способен генерировать разборчивый текст, и это, вероятно, его самая замечательная особенность, поскольку это было невозможно в существующих моделях v1 и v2.1. Сгенерированный SDXL текст не всегда точен, как вы можете видеть на Stable Diffusion Текст ниже. Однако он намного превосходит v2.1, не говоря уже о модели v1. Это связано с тем, что SDXL использует более продвинутый алгоритм глубокого обучения, который позволяет ему понимать и генерировать более сложные языковые структуры. При дальнейшем развитии он может стать еще более точным и надежным.

Подсказка: фотография джентльмена, держащего в руках белую бумагу с надписью «Нет подделкам».
Подсказка: фотография джентльмена, держащего в руках белую бумагу с надписью «Нет подделкам».
Фотография рыжеволосой женщины с черной табличкой с белыми шрифтами с надписью «Без шуток».
Подсказка: фотография рыжеволосой женщины с черной табличкой с белыми шрифтами, на которой написано «Без шуток».
Подсказка: фотография китаянки, сидящей в кинотеатре и держащей тарелку с надписью «Боль и самолет».
Подсказка: фото китаянки, сидящей в кинотеатре и держащей в руках тарелку с надписью «Боль и самолет».

Анатомия человека. Точное создание анатомически правильных человеческих фигур долгое время было сложной задачей. stable diffusion. Наличие дополнительных или отсутствующих конечностей является обычным явлением. Для их исправления обычно используется Inpainting, или, совсем недавно, вы можете использовать функцию Open Pose ControlNet, чтобы дублировать позу из эталонного изображения. Мы рады отметить, что именно здесь модель SDXL Beta улучшилась. Модель SDXL Beta продемонстрировала значительное улучшение в точном воспроизведении поз с эталонных изображений. Это может быть ценным инструментом для различных приложений, таких как анимация и виртуальная реальность.

Фотография женщины в спортивном костюме, крутящей мяч в правой руке
Подсказка: фото женщины в спортивном костюме, крутящей мяч в правой руке.
Фото мальчика, сидящего под красной луной
Подсказка: фотография мальчика, сидящего под красной луной.
Подсказка: На фотографии изображен старик, бегущий по лесу.

Портретный стиль. SDXL Beta создает отличные портреты, которые выглядят как фотографии — это обновление по сравнению с версией 1.5. Улучшенный алгоритм в SDXL Beta улучшает детализацию и точность цветопередачи портретов, что делает их более естественными и реалистичными. Пользователи также могут регулировать уровни резкости и насыщенности для достижения желаемого эффекта.

Подсказка: фото мальчика и девочки
Подсказка: фото мальчика и девочки
Подсказка: портретное фото толстого парня
Подсказка: портретное фото толстого парня
Подсказка: фотоснимок женщины из 80-х
Подсказка: фотоснимок женщины из 80-х

Дуотон. Ключевое слово duotone всегда создает черно-белые фотографии в модели v1.5. Однако теперь двухцветные изображения, создаваемые SDXL Beta, бывают разных цветов. Понятно, что по сравнению с моделями v1 возможность интерпретировать подсказку улучшилась, что привело к более точным и релевантным ответам от моделей v2, что сделало их более надежным инструментом для задач обработки естественного языка.

двухцветный портрет собаки
Подсказка: двухцветный портрет собаки
двухцветный пейзаж острова
Подсказка: двухцветный пейзаж острова
двухцветный портрет молодой африканки
Подсказка: двухцветный портрет молодой африканки

Художественные стили. Были внесены некоторые незначительные корректировки, но трудно определить, обеспечивает ли новая модель лучшие результаты, поскольку они просто уникальны. Возможно, эти корректировки могут быть вопросом личных предпочтений или субъективного мнения, что затрудняет выполнение defiобъективное суждение об их качестве. Тем не менее, уникальность корректировок заслуживает внимания и заслуживает дальнейшего изучения.

Нью-Йорк Ивана Айвазовского
v 1.5: Нью-Йорк Ивана Айвазовского
Нью-Йорк Ивана Айвазовского
SDXL: Нью-Йорк Ивана Айвазовского
Старый лес, Кристофер Баласкас
v 1.5: Старый лес, Кристофер Баласкас
Старый лес, Кристофер Баласкас
SDXL: Старый лес Кристофера Баласкаса

Заключение

  • Stable Diffusion может, наконец, создать текст, который имеет смысл.
  • SDXL обеспечивает более эстетичное изображение, чем модели v2.1 и (в меньшей степени) v1.5.
  • Новая модель создает более точные изображения.
  • Анатомия человека улучшилась.
  • Отрицательные подсказки не так необходимы, как в версии 2.1.
  • Он может создавать реалистичные портреты.
  • Некоторые странности в модели будут исправлены перед релизом.

Читайте больше статей по теме:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше

Основателей Samourai Wallet обвиняют в содействии сделкам в даркнете на 2 миллиарда долларов

Задержание основателей Samourai Wallet представляет собой заметную неудачу для отрасли, подчеркивая упорное...

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Ankr сотрудничает с блокчейн-платформой искусственного интеллекта Talus Network, чтобы разблокировать ликвидность биткойнов для искусственного интеллекта
Бизнес Новостной репортаж Технологии
Ankr сотрудничает с блокчейн-платформой искусственного интеллекта Talus Network, чтобы разблокировать ликвидность биткойнов для искусственного интеллекта
1 мая 2024
Binance Labs поддерживает лаборатории Movement, чтобы облегчить интеграцию Facebook Move в блокчейны
Бизнес Новостной репортаж Технологии
Binance Labs поддерживает лаборатории Movement, чтобы облегчить интеграцию Facebook Move в блокчейны
1 мая 2024
Страны БРИКС рассматривают торговое решение для стейблкоинов
Бизнес Области применения: Истории и обзоры Технологии
Страны БРИКС рассматривают торговое решение для стейблкоинов
1 мая 2024
Сеть Bitcoin L2 BOB интегрируется с LayerZero для расширения функциональности
Бизнес Новостной репортаж Технологии
Сеть Bitcoin L2 BOB интегрируется с LayerZero для расширения функциональности
1 мая 2024
CRYPTOMERIA LABS PTE. ООО