ERNIE-ViLG 2.0: новая модель преобразования текста в изображение от Baidu превосходит Dalle-2 и Stable Diffusion
Коротко
И Далле-2, и Stable Diffusion значительно уступили ERNIE-ViLG 2.0
ЭРНИ-ВИЛГ 2.0 — это модель преобразования текста в изображение, которая обеспечивает более высокую производительность, чем Dalle-2 и Stable Diffusion, две самые популярные модели преобразования текста в изображение, доступные в настоящее время. Новая модель была разработана и обучена командой исследователей из Baidu, и результаты захватывают дух.
Результаты показали, что ERNIE-ViLG 2.0 значительно превосходит Dalle-2 и Stable Diffusion. Это значительное достижение, демонстрирующее мощь структуры ERNIE. Metaverse Post команда сравнила ERNIE-ViLG 2.0 с Stable Diffusion ниже:
Эти результаты убедительно подтверждают гипотезу о том, что ERNIE-ViLG 2.0 является более эффективным система преобразования текста в изображение, чем Dalle-2 и Stable Diffusion.
Архитектура Unet от Stable Diffusion взято за основу, но с изменениями:
- Смесь экспертов по шумоподавлению: Существует 10 нейронных сетей вместо одной, каждая из которых отвечает только за определенные этапы диффузии.
- Текстовые знания: Автоматически изменил вес слов в запросе, чтобы ключевые слова получили больший вес.
- Визуальные знания: В процессе обучения объекты обнаруживались на промежуточных результатах генерации, а также увеличивался вес функции потерь на участках с объектами.
В результате крупнейший в мире модель преобразования текста в изображение получил 24 миллиарда параметров (в 10 раз больше, чем SD) для обучения модели.
Подсказки просто автоматически переводятся с китайского на английский в ОбниматьЛицо публичная демонстрация перед отправкой в ИИ. Отсюда вытекает множество особенностей.
- ЭРНИ не знаком с международными общественными деятелями. Например, ЭРНИ не знает Арнольда Шварценеггера. У него, безусловно, есть местные фавориты в Китае.
- В результате метод использования имен знаменитостей в подсказках позволяет резко повысить качество лица не удается.
- Вы можете ожидать некоторых искажений из-за перевода с китайского, так что вас могут ждать сюрпризы, если вы не говорите по-китайски.
- Он даже ничего не знает о Греге Рутковски.
Прочитайте соответствующие статьи:
Отказ от ответственности
В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.
Об авторе
Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета.
Другие статьиДамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета.