Новостной репортаж
06 ноября 2022

ERNIE-ViLG 2.0: новая модель преобразования текста в изображение от Baidu превосходит Dalle-2 и Stable Diffusion

Коротко

И Далле-2, и Stable Diffusion значительно уступили ERNIE-ViLG 2.0

ЭРНИ-ВИЛГ 2.0 — это модель преобразования текста в изображение, которая обеспечивает более высокую производительность, чем Dalle-2 и Stable Diffusion, две самые популярные модели преобразования текста в изображение, доступные в настоящее время. Новая модель была разработана и обучена командой исследователей из Baidu, и результаты захватывают дух.

Новая модель преобразования текста в изображение ERNIE-ViLG 2.0 превосходит Dalle-2 и Stable Diffusion
Образ, созданный ERNIE-ViLG 2.0

Результаты показали, что ERNIE-ViLG 2.0 значительно превосходит Dalle-2 и Stable Diffusion. Это значительное достижение, демонстрирующее мощь структуры ERNIE. Metaverse Post команда сравнила ERNIE-ViLG 2.0 с Stable Diffusion ниже:

ЭРНИ-ВИЛГ 2.0
Stable Diffusion
ЭРНИ-ВИЛГ 2.0
Stable Diffusion
ЭРНИ-ВИЛГ 2.0
Stable Diffusion
ЭРНИ-ВИЛГ 2.0
Stable Diffusion
ЭРНИ-ВИЛГ 2.0

Эти результаты убедительно подтверждают гипотезу о том, что ERNIE-ViLG 2.0 является более эффективным система преобразования текста в изображение, чем Dalle-2 и Stable Diffusion.

Архитектура Unet от Stable Diffusion взято за основу, но с изменениями:

  • Смесь экспертов по шумоподавлению: Существует 10 нейронных сетей вместо одной, каждая из которых отвечает только за определенные этапы диффузии.
  • Текстовые знания: Автоматически изменил вес слов в запросе, чтобы ключевые слова получили больший вес.
  • Визуальные знания: В процессе обучения объекты обнаруживались на промежуточных результатах генерации, а также увеличивался вес функции потерь на участках с объектами.

В результате крупнейший в мире модель преобразования текста в изображение получил 24 миллиарда параметров (в 10 раз больше, чем SD) для обучения модели.

По сравнению с более ранними моделями ERNIE-ViLG 2.0 значительно превосходит их по качеству изображения и совпадению изображения с текстом при одновременном тестировании на двуязычном ViLG-300. подсказка установленный человеком.

Подсказки просто автоматически переводятся с китайского на английский в ОбниматьЛицо публичная демонстрация перед отправкой в ​​​​ИИ. Отсюда вытекает множество особенностей.

  • ЭРНИ не знаком с международными общественными деятелями. Например, ЭРНИ не знает Арнольда Шварценеггера. У него, безусловно, есть местные фавориты в Китае.
  • В результате метод использования имен знаменитостей в подсказках позволяет резко повысить качество лица не удается.
  • Вы можете ожидать некоторых искажений из-за перевода с китайского, так что вас могут ждать сюрпризы, если вы не говорите по-китайски.
  • Он даже ничего не знает о Греге Рутковски.

Прочитайте соответствующие статьи:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше

Основателей Samourai Wallet обвиняют в содействии сделкам в даркнете на 2 миллиарда долларов

Задержание основателей Samourai Wallet представляет собой заметную неудачу для отрасли, подчеркивая упорное...

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Ankr сотрудничает с блокчейн-платформой искусственного интеллекта Talus Network, чтобы разблокировать ликвидность биткойнов для искусственного интеллекта
Бизнес Новостной репортаж Технологии
Ankr сотрудничает с блокчейн-платформой искусственного интеллекта Talus Network, чтобы разблокировать ликвидность биткойнов для искусственного интеллекта
1 мая 2024
Binance Labs поддерживает лаборатории Movement, чтобы облегчить интеграцию Facebook Move в блокчейны
Бизнес Новостной репортаж Технологии
Binance Labs поддерживает лаборатории Movement, чтобы облегчить интеграцию Facebook Move в блокчейны
1 мая 2024
Страны БРИКС рассматривают торговое решение для стейблкоинов
Бизнес Области применения: Истории и обзоры Технологии
Страны БРИКС рассматривают торговое решение для стейблкоинов
1 мая 2024
Сеть Bitcoin L2 BOB интегрируется с LayerZero для расширения функциональности
Бизнес Новостной репортаж Технологии
Сеть Bitcoin L2 BOB интегрируется с LayerZero для расширения функциональности
1 мая 2024
CRYPTOMERIA LABS PTE. ООО