Informe de noticias Tecnología
17 de noviembre.

Nvidia anunció eDiff-I: nueva IA generativa para síntesis de texto e imágenes con transferencia instantánea de estilos

En Resumen

Nvidia lanza eDiff-I para ayudar a las empresas a crear imágenes atractivas y de alta calidad

La técnica eDiff-I produce regularmente una mayor calidad de síntesis que DALL-E2 y Stable diffusion

eDiff-I es una nueva herramienta de creación de contenido de IA que proporciona un Capacidades de síntesis de texto a imagen sin precedentes para profesionales del marketing y empresas, como anunció recientemente Nvidia. Con eDiff-I, las empresas pueden crear rápida y fácilmente imágenes atractivas y de alta calidad sin necesidad de equipos costosos o ayuda profesional. eDiff-I utiliza procesamiento de lenguaje natural (NLP) para interpretar la entrada del usuario y generar las imágenes correspondientes. Luego, la IA analiza las imágenes y elige la más adecuada según el contexto. El resultado es una imagen de alta calidad y aspecto profesional que se puede utilizar para una variedad de propósitos, como materiales de marketing, publicaciones en redes sociales, campañas de correo electrónico y más.

eDiff-I es un IA generativa de próxima generación herramienta de creación de contenido que proporciona texto a imagen síntesis, transferencia de estilo rápida y pintura intuitiva con palabras. Como modelo de difusión para crear imágenes a partir de texto, eDiff-I sugiere entrenar un conjunto de redes expertas en eliminación de ruido, cada una especializada en un intervalo de ruido particular, en respuesta al hallazgo empírico de que el comportamiento de los modelos de difusión varía en las diferentes fases del muestreo.

Nvidia anunció eDiff-I: nueva IA generativa para síntesis de texto e imágenes con transferencia instantánea de estilos

Las incrustaciones de texto T5, las incrustaciones de imágenes CLIP y las incrustaciones de texto CLIP proporcionan la base para el concepto eDiff-I. Esta metodología puede producir gráficos fotorrealistas en respuesta a cualquier consulta de texto.

Presenta dos capacidades adicionales además de la síntesis de texto a imagen: (1) transferencia de estilo, que nos permite controlar el estilo de la muestra generada utilizando una imagen de estilo de referencia, y (2) "Pintar con palabras", una herramienta que permite a los usuarios crear imágenes pintando mapas de segmentación sobre lienzo.

Tubería
Tubería

El proceso consta de una cascada de tres modelos de difusión: un modelo base que puede crear muestras con una resolución de 64×64 y dos pilas de superresolución que pueden muestrear gradualmente las imágenes a resoluciones de 256×256 y 1024×1024, respectivamente. Los modelos calculan T5 XXL y la incrustación de texto después de recibir un título como entrada. Estas incrustaciones de imágenes se pueden utilizar como vector de estilo. Luego, introduzca estas incrustaciones en nuestra cascada modelos de difusión, que producen gradualmente imágenes con una resolución de 1024 x 1024.

El enfoque eDiff-I da como resultado consistentemente una mejor calidad de síntesis en comparación con los algoritmos de texto a imagen de código abierto (Stable diffusion) y (DALL-E2).

Resultados
Resultados

Cuando se emplean las incrustaciones de imágenes CLIP, el enfoque eDiff-I facilita la transferencia de estilo. eDiff-I primero extrae el CLIP incrustaciones de imágenes de una imagen de estilo de referencia, que se puede utilizar como un vector de referencia de estilo. Se puede ver una referencia estilística en el panel izquierdo de la figura a continuación. Los resultados cuando se activa el acondicionamiento de estilo se muestran en el panel central. Los resultados cuando se desactiva el acondicionamiento de estilo se muestran en el panel de la derecha. Cuando se aplica el condicionamiento de estilo, el modelo eDiff-I crea resultados que también son fieles al estilo del título de entrada. Cuando se desactiva el acondicionamiento de estilo, se producen fotografías de aspecto natural.

Transferencia de estilo
Transferencia de estilo

Al elegir frases y garabatearlas en la imagen, los usuarios del método eDiff-I pueden cambiar la ubicación de las cosas que se enumeran en el mensaje de texto. Después de eso, el modelo utiliza el indicador y los mapas para crear imágenes que son compatibles tanto con el título como con el mapa de entrada.

Leer artículos relacionados:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más

Los fundadores de Samourai Wallet son acusados ​​de facilitar 2 millones de dólares en acuerdos en la Darknet

La detención de los fundadores de Samourai Wallet representa un revés notable para la industria, lo que subraya la persistente...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
AltLayer ingresa a la segunda fase de su iniciativa de participación y presenta el token reALT
Industrias Informe de noticias Tecnología
AltLayer ingresa a la segunda fase de su iniciativa de participación y presenta el token reALT
2 de mayo de 2024
La cadena BNB publica el informe del primer trimestre de 1 y destaca una reducción del 2024% en su pérdida de valor, mientras que BSC TVL se dispara un 55.8%
Industrias Informe de noticias Tecnología
La cadena BNB publica el informe del primer trimestre de 1 y destaca una reducción del 2024% en su pérdida de valor, mientras que BSC TVL se dispara un 55.8%
2 de mayo de 2024
Naver y Kaia de Kakao: la nueva potencia asiática de blockchain lista para revolucionar los mercados criptográficos globales
Empresa Software Historias y comentarios Tecnología
Naver y Kaia de Kakao: la nueva potencia asiática de blockchain lista para revolucionar los mercados criptográficos globales
2 de mayo de 2024
Aave Labs presenta la propuesta 'Aave 2030' que incluye el lanzamiento del protocolo Aave V4
Empresa Informe de noticias Tecnología
Aave Labs presenta la propuesta 'Aave 2030' que incluye el lanzamiento del protocolo Aave V4
2 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.