Новостной репортаж Технологии
17 ноября 2022

Nvidia анонсировала eDiff-I: новый генеративный ИИ для синтеза текста и изображений с мгновенной передачей стилей

Коротко

Nvidia запускает eDiff-I, чтобы помочь предприятиям создавать высококачественные привлекательные изображения

Техника eDiff-I регулярно обеспечивает более высокое качество синтеза, чем DALL-E2 и Stable diffusion

eDiff-I — это новый инструмент для создания контента с использованием ИИ, приводит беспрецедентные возможности синтеза текста в изображение для маркетологов и предприятий, как недавно было объявлено Nvidia. С помощью eDiff-I предприятия могут быстро и легко создавать высококачественные привлекательные визуальные эффекты без необходимости использования дорогостоящего оборудования или профессиональной помощи. eDiff-I использует обработку естественного языка (NLP) для интерпретации ввода пользователя и создания соответствующих изображений. Затем ИИ анализирует изображения и выбирает наиболее подходящее в зависимости от контекста. В результате получается высококачественное профессионально выглядящее изображение, которое можно использовать для различных целей, таких как маркетинговые материалы, сообщения в социальных сетях, кампании по электронной почте и многое другое.

eDiff-I — это Генеративный ИИ следующего поколения инструмент для создания контента, который обеспечивает беспрецедентный текст в изображение синтез, быстрая передача стиля и интуитивное рисование словами. В качестве диффузионной модели для создания визуальных эффектов из текста eDiff-I предлагает обучить ансамбль экспертных сетей шумоподавления, каждая из которых специализирована для определенного интервала шума, в ответ на эмпирический вывод о том, что поведение диффузионных моделей различается на разных этапах выборки.

Nvidia анонсировала eDiff-I: новый генеративный ИИ для синтеза текста и изображений с мгновенной передачей стилей

Встраивание текста T5, встраивание изображений CLIP и встраивание текста CLIP составляют основу концепции eDiff-I. Эта методология может создавать фотореалистичную графику в ответ на любой текстовый запрос.

Он предоставляет две дополнительные возможности в дополнение к синтезу текста в изображение: (1) перенос стиля, который позволяет нам управлять стилем сгенерированного образца, используя изображение эталонного стиля, и (2) «Рисовать словами», инструмент который позволяет пользователям создавать изображения, рисуя карты сегментации на холсте.

Трубопровод
Трубопровод

Конвейер состоит из каскада трех моделей диффузии: базовой модели, которая может создавать образцы с разрешением 64×64, и двух стеков сверхвысокого разрешения, которые могут постепенно повышать разрешение изображений до разрешения 256×256 и 1024×1024 соответственно. Модели вычисляют T5 XXL и встраивание текста после получения подписи в качестве входных данных. Эти вложения изображений можно использовать как вектор стиля. Затем добавьте эти вложения в наш каскадный диффузионные модели, которые постепенно создают изображения с разрешением 1024 x 1024.

Подход eDiff-I последовательно приводит к лучшему качеству синтеза по сравнению с алгоритмами преобразования текста в изображение с открытым исходным кодом (Stable diffusion) и (ДАЛЛ-Е2).

Итоги
Итоги

Когда используются вложения изображений CLIP, подход eDiff-I облегчает передачу стиля. eDiff-I сначала извлекает CLIP вложения изображений из изображения эталонного стиля, которые можно использовать в качестве эталонного вектора стиля. Стилистическую ссылку можно увидеть на левой панели рисунка ниже. Результаты, когда включено условие стиля, отображаются на центральной панели. Результаты, когда условие стиля отключено, отображаются на панели справа. Когда применяется условие стиля, модель eDiff-I создает выходные данные, которые также соответствуют стилю входной подписи. Когда формирование стиля отключено, получаются естественные фотографии.

Передача стиля
Передача стиля

Выбирая фразы и набрасывая их на изображение, пользователи метода eDiff-I могут изменить размещение вещей, перечисленных в текстовой подсказке. После этого модель использует Подскажите и карты для создания образов которые совместимы как с заголовком, так и с входной картой.

Прочитайте соответствующие статьи:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше

Основателей Samourai Wallet обвиняют в содействии сделкам в даркнете на 2 миллиарда долларов

Задержание основателей Samourai Wallet представляет собой заметную неудачу для отрасли, подчеркивая упорное...

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Pantera Capital инвестирует в блокчейн TON и выражает уверенность в потенциале Telegram расширить доступность криптовалют
Бизнес Новостной репортаж Технологии
Pantera Capital инвестирует в блокчейн TON и выражает уверенность в потенциале Telegram расширить доступность криптовалют
2 мая 2024
Mitosis привлекает финансирование в размере 7 миллионов долларов от Amber Group и Foresight Ventures для развития своего модульного протокола ликвидности
Бизнес Новостной репортаж Технологии
Mitosis привлекает финансирование в размере 7 миллионов долларов от Amber Group и Foresight Ventures для развития своего модульного протокола ликвидности
2 мая 2024
Galxe сотрудничает с Jambo, чтобы расширить глобальную доступность Web3
Бизнес Новостной репортаж Технологии
Galxe сотрудничает с Jambo, чтобы расширить глобальную доступность Web3
2 мая 2024
Google Med-Gemini готова дать фору GPT-4 Благодаря превосходным характеристикам в здравоохранении
AI Wiki Новости Software Технологии
Google Med-Gemini готова дать фору GPT-4 Благодаря превосходным характеристикам в здравоохранении
2 мая 2024
CRYPTOMERIA LABS PTE. ООО