ERNIE-ViLG 2.0: нова модель перетворення тексту в зображення від Baidu перевершує Dalle-2 і Stable Diffusion
Коротко
І Далле-2, і Stable Diffusion були значно перевершені ERNIE-ViLG 2.0
ERNIE-ViLG 2.0 це модель перетворення тексту в зображення, яка пропонує кращу продуктивність, ніж Dalle-2 і Stable Diffusion, дві найпопулярніші доступні моделі перетворення тексту в зображення. Нова модель була розроблена та навчена групою дослідників з Baidu, і результати вражають.
Результати показали, що ERNIE-ViLG 2.0 значно перевершив Dalle-2 і Stable Diffusion. Це значне досягнення, яке демонструє потужність системи ERNIE. The Metaverse Post команда порівняла ERNIE-ViLG 2.0 з Stable Diffusion нижче:
Ці результати забезпечують сильну підтримку гіпотези про те, що ERNIE-ViLG 2.0 є більш ефективним система перетворення тексту в зображення, ніж Dalle-2 і Stable Diffusion.
Архітектура Unet від Stable Diffusion взято за основу, але зі змінами:
- Суміш експертів із усунення шуму: Існує 10 нейронних мереж замість однієї, кожна з яких відповідає лише за певні етапи дифузії.
- Текстові знання: Автоматично перезважує слова в запиті, щоб ключові слова отримали більшу вагу.
- Візуальне знання: Під час навчання об'єкти були виявлені на проміжних результатах генерації, а вага функції втрат на регіонах з об'єктами була збільшена.
В результаті найбільший у світі модель тексту в зображення випустив 24 мільярди параметрів (у 10 разів більше, ніж SD) для навчання моделі.
Підказки просто автоматично перекладаються з китайської на англійську в HuggingFace публічну демонстрацію перед надсиланням у ШІ. З цього випливає багато особливостей.
- ЕРНІ не знає міжнародних громадських діячів. Наприклад, ERNIE не знає Арнольда Шварценеггера. У нього, звичайно, є місцеві фаворити в Китаї.
- У результаті метод використання імен знаменитостей у підказках значно покращує якість особи не вдається.
- Ви можете очікувати певних спотворень через переклад з китайської, тому вас можуть чекати деякі сюрпризи, якщо ви не розмовляєте китайською.
- Він навіть нічого не знає про Грега Рутковскі.
Читайте відповідні статті:
відмова
Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.
про автора
Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.
інші статтіДамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.