Informe de noticias
06 de noviembre.

ERNIE-ViLG 2.0: El nuevo modelo de texto a imagen de Baidu supera a Dalle-2 y Stable Diffusion

En Resumen

Tanto Dalle-2 como Stable Diffusion fueron superados significativamente por ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 es un modelo de texto a imagen que ofrece un mejor rendimiento que Dalle-2 y Stable Diffusion, dos de los modelos de texto a imagen más populares actualmente disponibles. El nuevo modelo fue diseñado y entrenado por un equipo de investigadores de Baidu y los resultados son impresionantes.

El nuevo modelo de texto a imagen ERNIE-ViLG 2.0 supera a Dalle-2 y Stable Diffusion
La imagen creada por ERNIE-ViLG 2.0

Los resultados demostraron que ERNIE-ViLG 2.0 superó significativamente a Dalle-2 y Stable Diffusion. Este es un logro significativo y demuestra el poder del marco ERNIE. El Metaverse Post equipo comparó ERNIE-ViLG 2.0 con Stable Diffusion aqui:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Estos resultados brindan un fuerte apoyo a la hipótesis de que ERNIE-ViLG 2.0 es un método más eficaz sistema de texto a imagen que Dalle-2 y Stable Diffusion.

La arquitectura Unet desde Stable Diffusion se toma como base, pero con cambios:

  • Una mezcla de expertos en eliminación de ruido: Hay 10 redes neuronales en lugar de solo una, y cada una es responsable solo de ciertos pasos de difusión.
  • Conocimiento textual: Volvió a ponderar automáticamente las palabras en la consulta para que las palabras clave tuvieran más peso.
  • Conocimiento visual: Durante el entrenamiento, se detectaron objetos en resultados de generación intermedia y se aumentó el peso de la función de pérdida en regiones con objetos.

Como resultado, el más grande del mundo modelo de texto a imagen salió con 24 mil millones de parámetros (10 veces más grande que SD) para entrenar el modelo.

En comparación con modelos anteriores, ERNIE-ViLG 2.0 los supera ampliamente en términos de calidad de imagen y coincidencia de imagen con texto cuando se prueba simultáneamente en el modelo bilingüe ViLG-300. puntual establecido por una persona.

Los avisos simplemente se traducen del chino al inglés automáticamente en el AbrazandoCara demostración pública antes de ser enviado a la IA. Muchas características fluyen de esto.

  • ERNIE no conoce a figuras públicas internacionales. Por ejemplo, ERNIE no conoce a Arnold Schwarzenegger. Ciertamente tiene favoritos locales en China.
  • Como resultado, el método de utilizar nombres de celebridades en las indicaciones para mejorar drásticamente la calidad de caras falla.
  • Puede esperar cierta distorsión debido a la traducción del chino, por lo que puede haber algunas sorpresas reservadas para usted si no habla chino.
  • Ni siquiera sabe nada sobre Greg Rutkowski.

Leer artículos relacionados:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Hot Stories
Suscríbase a nuestro boletín.
Últimas Noticias

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más

Los fundadores de Samourai Wallet son acusados ​​de facilitar 2 millones de dólares en acuerdos en la Darknet

La detención de los fundadores de Samourai Wallet representa un revés notable para la industria, lo que subraya la persistente...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Ankr colabora con la plataforma AI Blockchain Talus Network para desbloquear la liquidez de Bitcoin para la IA
Empresa Informe de noticias Tecnología
Ankr colabora con la plataforma AI Blockchain Talus Network para desbloquear la liquidez de Bitcoin para la IA
1 de mayo de 2024
Binance Labs apoya los laboratorios de movimiento para facilitar la integración de movimientos de Facebook a través de blockchains
Empresa Informe de noticias Tecnología
Binance Labs apoya los laboratorios de movimiento para facilitar la integración de movimientos de Facebook a través de blockchains
1 de mayo de 2024
Las naciones BRICS miran la solución comercial de monedas estables
Empresa Industrias Historias y comentarios Tecnología
Las naciones BRICS miran la solución comercial de monedas estables
1 de mayo de 2024
Bitcoin L2 Network BOB se integra con LayerZero para una funcionalidad mejorada
Empresa Informe de noticias Tecnología
Bitcoin L2 Network BOB se integra con LayerZero para una funcionalidad mejorada
1 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.