Звіт про новини
Листопад 06, 2022

ERNIE-ViLG 2.0: нова модель перетворення тексту в зображення від Baidu перевершує Dalle-2 і Stable Diffusion

Коротко

І Далле-2, і Stable Diffusion були значно перевершені ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 це модель перетворення тексту в зображення, яка пропонує кращу продуктивність, ніж Dalle-2 і Stable Diffusion, дві найпопулярніші доступні моделі перетворення тексту в зображення. Нова модель була розроблена та навчена групою дослідників з Baidu, і результати вражають.

Нова модель перетворення тексту в зображення ERNIE-ViLG 2.0 перевершує Dalle-2 і Stable Diffusion
Зображення, створене ERNIE-ViLG 2.0

Результати показали, що ERNIE-ViLG 2.0 значно перевершив Dalle-2 і Stable Diffusion. Це значне досягнення, яке демонструє потужність системи ERNIE. The Metaverse Post команда порівняла ERNIE-ViLG 2.0 з Stable Diffusion нижче:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Ці результати забезпечують сильну підтримку гіпотези про те, що ERNIE-ViLG 2.0 є більш ефективним система перетворення тексту в зображення, ніж Dalle-2 і Stable Diffusion.

Архітектура Unet від Stable Diffusion взято за основу, але зі змінами:

  • Суміш експертів із усунення шуму: Існує 10 нейронних мереж замість однієї, кожна з яких відповідає лише за певні етапи дифузії.
  • Текстові знання: Автоматично перезважує слова в запиті, щоб ключові слова отримали більшу вагу.
  • Візуальне знання: Під час навчання об'єкти були виявлені на проміжних результатах генерації, а вага функції втрат на регіонах з об'єктами була збільшена.

В результаті найбільший у світі модель тексту в зображення випустив 24 мільярди параметрів (у 10 разів більше, ніж SD) для навчання моделі.

У порівнянні з більш ранніми моделями, ERNIE-ViLG 2.0 значно перевершує їх за якістю зображення та відповідністю зображення до тексту при одночасному тестуванні на двомовному ViLG-300 підказка встановлений особою.

Підказки просто автоматично перекладаються з китайської на англійську в HuggingFace публічну демонстрацію перед надсиланням у ШІ. З цього випливає багато особливостей.

  • ЕРНІ не знає міжнародних громадських діячів. Наприклад, ERNIE не знає Арнольда Шварценеггера. У нього, звичайно, є місцеві фаворити в Китаї.
  • У результаті метод використання імен знаменитостей у підказках значно покращує якість особи не вдається.
  • Ви можете очікувати певних спотворень через переклад з китайської, тому вас можуть чекати деякі сюрпризи, якщо ви не розмовляєте китайською.
  • Він навіть нічого не знає про Грега Рутковскі.

Читайте відповідні статті:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories

Рішення для торгівлі стейблкойнами BRICS Nations Eye

by Вікторія Пальчик
Травень 01, 2024
Приєднуйтеся до нашої розсилки.
Останні новини

Настав день винесення вироку: суд США розглядає прохання Міністерства юстиції щодо долі CZ.

Changpeng Zhao готовий зіткнутися з вироком у американському суді в Сіетлі сьогодні.

Дізнайтеся більше

Засновників гаманця Samourai Wallet звинувачують у сприянні угодам у Darknet на суму 2 мільярди доларів

Занепокоєння засновників гаманця Samourai Wallet є помітною невдачею для галузі, підкреслюючи постійне...

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Ankr співпрацює з AI Blockchain Platform Talus Network, щоб розблокувати ліквідність біткойнів для AI
Business Звіт про новини Технологія
Ankr співпрацює з AI Blockchain Platform Talus Network, щоб розблокувати ліквідність біткойнів для AI
Травень 1, 2024
Binance Labs підтримує Movement Labs, щоб сприяти інтеграції Facebook Move через блокчейни
Business Звіт про новини Технологія
Binance Labs підтримує Movement Labs, щоб сприяти інтеграції Facebook Move через блокчейни
Травень 1, 2024
Рішення для торгівлі стейблкойнами BRICS Nations Eye
Business ринки Розповіді та огляди Технологія
Рішення для торгівлі стейблкойнами BRICS Nations Eye
Травень 1, 2024
Мережа Bitcoin L2 BOB інтегрується з LayerZero для покращеної функціональності
Business Звіт про новини Технологія
Мережа Bitcoin L2 BOB інтегрується з LayerZero для покращеної функціональності
Травень 1, 2024
CRYPTOMERIA LABS PTE. LTD.