ERNIE-ViLG 2.0: Новият модел текст към изображение от Baidu превъзхожда Dalle-2 и Stable Diffusion
Накратко
Както Dalle-2, така и Stable Diffusion бяха значително по-добри от ERNIE-ViLG 2.0
ERNIE-ViLG 2.0 е модел текст към изображение, който предлага по-добра производителност от Dalle-2 и Stable Diffusion, два от най-популярните налични в момента модели текст към изображение. Новият модел е проектиран и обучен от екип от изследователи от Baidu, а резултатите са спиращи дъха.
Резултатите показват, че ERNIE-ViLG 2.0 значително превъзхожда Dalle-2 и Stable Diffusion. Това е значително постижение и демонстрира силата на рамката ERNIE. The Metaverse Post екип сравни ERNIE-ViLG 2.0 с Stable Diffusion По-долу:
Тези резултати осигуряват силна подкрепа за хипотезата, че ERNIE-ViLG 2.0 е по-ефективен система текст към изображение отколкото както Dalle-2, така и Stable Diffusion.
Архитектурата на Unet от Stable Diffusion се взема за основа, но с промени:
- Смес от експерти по обезшумяване: Има 10 невронни мрежи вместо само една, като всяка е отговорна само за определени стъпки на разпространение.
- Текстови познания: Автоматично претегля думите в заявката, така че ключовите думи да получат по-голяма тежест.
- Визуално познание: По време на обучението бяха открити обекти в резултатите от междинното генериране и теглото на функцията за загуба на региони с обекти беше увеличено.
В резултат на това най-големият в света модел текст към изображение излезе с 24 милиарда параметри (10 пъти по-големи от SD) за обучение на модела.
Подканите просто се превеждат автоматично от китайски на английски в HuggingFace публична демонстрация, преди да бъде изпратена в AI. Много функции произтичат от това.
- ЪРНИ не познава международни публични личности. Например ЪРНИ не познава Арнолд Шварценегер. Със сигурност има местни фаворити в Китай.
- В резултат на това методът за използване на имена на знаменитости в подкани води до драстично повишаване на качеството на лица неуспешна.
- Можете да очаквате известно изкривяване поради превода от китайски, така че може да има някои изненади за вас, ако не говорите китайски.
- То дори не знае нищо за Грег Рутковски.
Прочетете свързани статии:
Отказ от отговорност
В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.
За автора
Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.
Още статииДамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.