Informe de noticias
06 de noviembre.

ERNIE-ViLG 2.0: El nuevo modelo de texto a imagen de Baidu supera a Dalle-2 y Stable Diffusion

En Resumen

Tanto Dalle-2 como Stable Diffusion fueron superados significativamente por ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 es un modelo de texto a imagen que ofrece un mejor rendimiento que Dalle-2 y Stable Diffusion, dos de los modelos de texto a imagen más populares actualmente disponibles. El nuevo modelo fue diseñado y entrenado por un equipo de investigadores de Baidu y los resultados son impresionantes.

El nuevo modelo de texto a imagen ERNIE-ViLG 2.0 supera a Dalle-2 y Stable Diffusion
La imagen creada por ERNIE-ViLG 2.0

Los resultados demostraron que ERNIE-ViLG 2.0 superó significativamente a Dalle-2 y Stable Diffusion. Este es un logro significativo y demuestra el poder del marco ERNIE. El Metaverse Post equipo comparó ERNIE-ViLG 2.0 con Stable Diffusion aqui:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Estos resultados brindan un fuerte apoyo a la hipótesis de que ERNIE-ViLG 2.0 es un método más eficaz sistema de texto a imagen que Dalle-2 y Stable Diffusion.

La arquitectura Unet desde Stable Diffusion se toma como base, pero con cambios:

  • Una mezcla de expertos en eliminación de ruido: Hay 10 redes neuronales en lugar de solo una, y cada una es responsable solo de ciertos pasos de difusión.
  • Conocimiento textual: Volvió a ponderar automáticamente las palabras en la consulta para que las palabras clave tuvieran más peso.
  • Conocimiento visual: Durante el entrenamiento, se detectaron objetos en resultados de generación intermedia y se aumentó el peso de la función de pérdida en regiones con objetos.

Como resultado, el más grande del mundo modelo de texto a imagen salió con 24 mil millones de parámetros (10 veces más grande que SD) para entrenar el modelo.

En comparación con modelos anteriores, ERNIE-ViLG 2.0 los supera ampliamente en términos de calidad de imagen y coincidencia de imagen con texto cuando se prueba simultáneamente en el modelo bilingüe ViLG-300. puntual establecido por una persona.

Los avisos simplemente se traducen del chino al inglés automáticamente en el AbrazandoCara demostración pública antes de ser enviado a la IA. Muchas características fluyen de esto.

  • ERNIE no conoce a figuras públicas internacionales. Por ejemplo, ERNIE no conoce a Arnold Schwarzenegger. Ciertamente tiene favoritos locales en China.
  • Como resultado, el método de utilizar nombres de celebridades en las indicaciones para mejorar drásticamente la calidad de caras falla.
  • Puede esperar cierta distorsión debido a la traducción del chino, por lo que puede haber algunas sorpresas reservadas para usted si no habla chino.
  • Ni siquiera sabe nada sobre Greg Rutkowski.

Leer artículos relacionados:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Crece el apetito institucional por los ETF de Bitcoin en medio de la volatilidad

Las divulgaciones a través de presentaciones 13F revelan que notables inversores institucionales incursionan en los ETF de Bitcoin, lo que subraya una creciente aceptación de...

Para saber más

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Injective une fuerzas con AltLayer para llevar la seguridad de recuperación a inEVM
Empresa Informe de noticias Tecnología
Injective une fuerzas con AltLayer para llevar la seguridad de recuperación a inEVM
3 de mayo de 2024
Masa se asocia con Teller para presentar el fondo de préstamos MASA y permite pedir prestado al USDC en base
Industrias Informe de noticias Tecnología
Masa se asocia con Teller para presentar el fondo de préstamos MASA y permite pedir prestado al USDC en base
3 de mayo de 2024
Velodrome lanza la versión Beta de Superchain en las próximas semanas y se expande a través de las cadenas de bloques OP Stack Layer 2
Industrias Informe de noticias Tecnología
Velodrome lanza la versión Beta de Superchain en las próximas semanas y se expande a través de las cadenas de bloques OP Stack Layer 2
3 de mayo de 2024
CARV anuncia asociación con Aethir para descentralizar su capa de datos y distribuir recompensas
Empresa Informe de noticias Tecnología
CARV anuncia asociación con Aethir para descentralizar su capa de datos y distribuir recompensas
3 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.