ERNIE-ViLG 2.0: El nuevo modelo de texto a imagen de Baidu supera a Dalle-2 y Stable Diffusion
En Resumen
Tanto Dalle-2 como Stable Diffusion fueron superados significativamente por ERNIE-ViLG 2.0
ERNIE-ViLG 2.0 es un modelo de texto a imagen que ofrece un mejor rendimiento que Dalle-2 y Stable Diffusion, dos de los modelos de texto a imagen más populares actualmente disponibles. El nuevo modelo fue diseñado y entrenado por un equipo de investigadores de Baidu y los resultados son impresionantes.
Los resultados demostraron que ERNIE-ViLG 2.0 superó significativamente a Dalle-2 y Stable Diffusion. Este es un logro significativo y demuestra el poder del marco ERNIE. El Metaverse Post equipo comparó ERNIE-ViLG 2.0 con Stable Diffusion aqui:
Estos resultados brindan un fuerte apoyo a la hipótesis de que ERNIE-ViLG 2.0 es un método más eficaz sistema de texto a imagen que Dalle-2 y Stable Diffusion.
La arquitectura Unet desde Stable Diffusion se toma como base, pero con cambios:
- Una mezcla de expertos en eliminación de ruido: Hay 10 redes neuronales en lugar de solo una, y cada una es responsable solo de ciertos pasos de difusión.
- Conocimiento textual: Volvió a ponderar automáticamente las palabras en la consulta para que las palabras clave tuvieran más peso.
- Conocimiento visual: Durante el entrenamiento, se detectaron objetos en resultados de generación intermedia y se aumentó el peso de la función de pérdida en regiones con objetos.
Como resultado, el más grande del mundo modelo de texto a imagen salió con 24 mil millones de parámetros (10 veces más grande que SD) para entrenar el modelo.
Los avisos simplemente se traducen del chino al inglés automáticamente en el AbrazandoCara demostración pública antes de ser enviado a la IA. Muchas características fluyen de esto.
- ERNIE no conoce a figuras públicas internacionales. Por ejemplo, ERNIE no conoce a Arnold Schwarzenegger. Ciertamente tiene favoritos locales en China.
- Como resultado, el método de utilizar nombres de celebridades en las indicaciones para mejorar drásticamente la calidad de caras falla.
- Puede esperar cierta distorsión debido a la traducción del chino, por lo que puede haber algunas sorpresas reservadas para usted si no habla chino.
- Ni siquiera sabe nada sobre Greg Rutkowski.
Leer artículos relacionados:
Observación
En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.
Sobre el Autor
Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.
Más artículosDamir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.