Informe de noticias Tecnología
22 de noviembre.

Investigadores del MIT y Google presentan StableRep, un modelo de inteligencia artificial para reforzar la producción de imágenes

En Resumen

Los científicos informáticos del MIT y Google presentaron StableRep, un modelo de inteligencia artificial que transforma indicaciones de texto en imágenes precisas utilizando Stable Diffusion.

Investigadores del MIT y Google presentan un programa de inteligencia artificial que mejora la producción de imágenes a partir de indicaciones

MIT y Google Los científicos informáticos han presentado StableRep, un modelo de inteligencia artificial diseñado para transformar leyendas escritas descriptivas en imágenes correspondientes precisas utilizando imágenes generadas por Stable Diffusion. Esta herramienta está orientada a mejorar la capacidad de las redes neuronales para generar imágenes basadas en descripciones textuales.

Según los investigadores, las imágenes sintéticas pueden ayudar a los modelos de IA a aprender representaciones visuales con mayor precisión en comparación con fotografías reales.

StableRep tiene como objetivo capacitar a los investigadores para gestionar el proceso algorítmico de aprendizaje automático entrenando un modelo en una multitud de imágenes generadas por Stable Diffusion en respuesta al mismo mensaje. Así, el modelo aprenderá una gama más amplia de representaciones visuales, defideterminar qué imágenes se alinean estrechamente con las indicaciones dadas.

Los investigadores prevén el surgimiento de un ecosistema de modelos de IA, algunos de los cuales se entrenarán con datos reales o sintéticos. Actualmente, los esfuerzos se centran en enseñar al modelo a aprender más sobre conceptos de alto nivel a través de la comprensión y la variabilidad contextual, en lugar de simplemente alimentarlo con datos.

StableRep ayudará a los desarrolladores y motores de IA 

En el Centro de modelos de texto a imagen radica su capacidad para vincular objetos con palabras. Cuando se les presenta un mensaje de texto de entrada, estos modelos deben generar una imagen que coincida estrechamente con la descripción proporcionada. Para lograrlo, deben adquirir una comprensión de las representaciones visuales de objetos del mundo real.

De acuerdo con un reciente papel preimpreso en arXiv, StableRep supera a SimCLR y CLIP en términos de representaciones aprendidas utilizando el mismo conjunto de indicaciones de texto y las imágenes reales correspondientes en conjuntos de datos a gran escala, basándose únicamente en imágenes sintéticas. 

El documento continúa: "Cuando introducimos aún más la supervisión del lenguaje, StableRep entrenado con 20 millones de imágenes sintéticas logra una mayor precisión que CLIP entrenado con 50 millones de imágenes reales".

SimCLR y CLIP son algoritmos de aprendizaje automático empleados para generar imágenes a partir de mensajes de texto.

Este enfoque innovador permite a los desarrolladores de IA entrenar redes neuronales con menos imágenes sintéticas que las reales y, al mismo tiempo, lograr mejores resultados. La aparición de métodos similares a StableRep sugiere un futuro en el que los modelos de conversión de texto a imagen podrían entrenarse predominantemente con datos sintéticos, reduciendo la dependencia de imágenes reales y respaldando motores de inteligencia artificial cuando se enfrenten a limitaciones en los recursos en línea disponibles.

Aviso

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Alisa, una dedicada periodista del MPost, se especializa en criptomonedas, pruebas de conocimiento cero, inversiones y el amplio ámbito de Web3. Con buen ojo para las tendencias y tecnologías emergentes, ofrece una cobertura completa para informar e involucrar a los lectores en el panorama en constante evolución de las finanzas digitales.

Más artículos
alisa davidson
alisa davidson

Alisa, una dedicada periodista del MPost, se especializa en criptomonedas, pruebas de conocimiento cero, inversiones y el amplio ámbito de Web3. Con buen ojo para las tendencias y tecnologías emergentes, ofrece una cobertura completa para informar e involucrar a los lectores en el panorama en constante evolución de las finanzas digitales.

Hot Stories
Suscríbase a nuestro boletín.
Últimas Noticias

De Ripple a The Big Green DAO: cómo los proyectos de criptomonedas contribuyen a la caridad

Exploremos iniciativas que aprovechen el potencial de las monedas digitales para causas benéficas.

Para saber más

AlphaFold 3, Med-Gemini y otros: la forma en que la IA transformará la atención médica en 2024

La IA se manifiesta de varias maneras en la atención médica, desde descubrir nuevas correlaciones genéticas hasta potenciar sistemas quirúrgicos robóticos...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Las 10 mejores herramientas de inteligencia artificial gratuitas para creación de contenido, edición de video y más
AI Wiki Digest Educación Estilo de vida Software Tecnología
Las 10 mejores herramientas de inteligencia artificial gratuitas para creación de contenido, edición de video y más
14 de mayo de 2024
La Comisión de Valores de Hong Kong advierte sobre estafas deepfake dirigidas a la criptoindustria: implicaciones para la seguridad de los inversores
Estilo de vida Seguridad Wiki Software Historias y comentarios Tecnología
La Comisión de Valores de Hong Kong advierte sobre estafas deepfake dirigidas a la criptoindustria: implicaciones para la seguridad de los inversores
14 de mayo de 2024
Ripple y Evmos colaboran en el desarrollo de la cadena lateral EVM de XRP Ledger con tecnología EvmOS
Empresa Informe de noticias Tecnología
Ripple y Evmos colaboran en el desarrollo de la cadena lateral EVM de XRP Ledger con tecnología EvmOS
14 de mayo de 2024
5ireChain inicia el incentivo 'Testnet Thunder: GA' para pruebas de estrés de la red e invita a los usuarios a participar Airdrop Recompensas
Informe de noticias Tecnología
5ireChain inicia el incentivo 'Testnet Thunder: GA' para pruebas de estrés de la red e invita a los usuarios a participar Airdrop Recompensas
14 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.