Informe de notícies
Novembre 06, 2022

ERNIE-ViLG 2.0: el nou model de text a imatge de Baidu supera a Dalle-2 i Stable Diffusion

En breu

Tant Dalle-2 com Stable Diffusion van ser significativament superiors a ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 és un model de text a imatge que ofereix un millor rendiment que Dalle-2 i Stable Diffusion, dos dels models de text a imatge més populars disponibles actualment. El nou model va ser dissenyat i entrenat per un equip d'investigadors de Baidu, i els resultats són impressionants.

El nou model de text a imatge ERNIE-ViLG 2.0 supera Dalle-2 i Stable Diffusion
La imatge creada per ERNIE-ViLG 2.0

Els resultats van demostrar que ERNIE-ViLG 2.0 va superar significativament el rendiment de Dalle-2 i Stable Diffusion. Aquest és un assoliment important i demostra el poder del marc ERNIE. El Metaverse Post equip va comparar ERNIE-ViLG 2.0 amb Stable Diffusion a continuació:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Aquests resultats donen un fort suport a la hipòtesi que ERNIE-ViLG 2.0 és més eficaç sistema de text a imatge que Dalle-2 i Stable Diffusion.

L'arquitectura Unet des de Stable Diffusion es pren com a base, però amb canvis:

  • Una barreja d'experts en denoising: Hi ha 10 xarxes neuronals en lloc d'una, cadascuna de les quals és responsable només de determinats passos de difusió.
  • Coneixements textuals: S'han tornat a ponderar automàticament les paraules de la consulta perquè les paraules clau tinguin més pes.
  • Coneixement visual: Durant l'entrenament, es van detectar objectes en resultats de generació intermèdia i es va augmentar el pes de la funció de pèrdua a les regions amb objectes.

Com a resultat, el més gran del món model text a imatge va sortir amb 24 mil milions de paràmetres (10 vegades més grans que SD) per entrenar el model.

En comparació amb els models anteriors, ERNIE-ViLG 2.0 els supera molt en termes de qualitat d'imatge i de concordança d'imatge a text quan es prova simultàniament al ViLG-300 bilingüe. Prompt establert per una persona.

Les sol·licituds simplement es tradueixen del xinès a l'anglès automàticament al Cara abraçada demostració pública abans de ser enviada a l'IA. D'això surten moltes característiques.

  • ERNIE no coneix personalitats públiques internacionals. Per exemple, ERNIE no coneix a Arnold Schwarzenegger. Sens dubte, té els favorits locals a la Xina.
  • Com a resultat, el mètode d'utilitzar noms de celebritats en les indicacions per augmentar dràsticament la qualitat de cares falla.
  • Podeu esperar una mica de distorsió a causa de la traducció del xinès, de manera que potser us esperen algunes sorpreses si no parleu xinès.
  • Ni tan sols sap res de Greg Rutkowski.

Llegeix articles relacionats:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

més articles
Damir Yalalov
Damir Yalalov

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

L'apetit institucional creix cap als ETF de Bitcoin enmig de la volatilitat

Les divulgacions a través de les presentacions 13F revelen inversors institucionals notables que s'estan incursionant en els ETF de Bitcoin, subratllant una acceptació creixent de...

saber Més

Arriba el dia de la sentència: el destí de CZ està en equilibri mentre el tribunal nord-americà considera la petició del DOJ

Changpeng Zhao està a punt d'enfrontar-se avui a la sentència en un tribunal dels Estats Units a Seattle.

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
Injective uneix forces amb AltLayer per aportar seguretat de restauració a inEVM
Negocis Informe de notícies Tecnologia
Injective uneix forces amb AltLayer per aportar seguretat de restauració a inEVM
Pot 3, 2024
Masa s'uneix amb Teller per presentar el grup de préstecs MASA, que permet l'endeutament de l'USDC a la base
mercats Informe de notícies Tecnologia
Masa s'uneix amb Teller per presentar el grup de préstecs MASA, que permet l'endeutament de l'USDC a la base
Pot 3, 2024
Velodrome llança la versió beta de Superchain en les properes setmanes i s'expandeix a les cadenes de blocs de la capa 2 de la pila OP
mercats Informe de notícies Tecnologia
Velodrome llança la versió beta de Superchain en les properes setmanes i s'expandeix a les cadenes de blocs de la capa 2 de la pila OP
Pot 3, 2024
CARV anuncia associació amb Aethir per descentralitzar la seva capa de dades i distribuir recompenses
Negocis Informe de notícies Tecnologia
CARV anuncia associació amb Aethir per descentralitzar la seva capa de dades i distribuir recompenses
Pot 3, 2024
CRYPTOMERIA LABS PTE. LTD.