Informe de noticias Tecnología
Sábado, Junio 19, 2023

SnapFusion: modelo rápido de texto a imagen para dispositivos móviles en 1.9 segundos

En Resumen

SnapFusion cambia la creación de contenido al ejecutar modelos de difusión de texto a imagen directamente en dispositivos móviles, reduciendo costos y abordando problemas de privacidad.

SnapFusion es un modelo de IA de texto a imagen que permite a los usuarios generar imágenes sorprendentes a partir de descripciones en lenguaje natural, todo en tan solo dos segundos en sus dispositivos móviles. Atrás quedaron los días de confiar en GPU de alta gama o servicios basados ​​en la nube para ejecutar estos modelos complejos. SnapFusion democratiza la creación de contenido al poner el poder de la difusión de texto a imagen en manos de los usuarios.

SnapFusion: modelo de texto a imagen rápido y eficiente para dispositivos móviles en 1.9 segundos
Créditos: Midjourney /lili10292#2100

Crear imágenes realistas a partir de descripciones de texto siempre ha sido una tarea desafiante. Modelos anteriores grandes arquitecturas de red requeridas y múltiples iteraciones de eliminación de ruido, haciéndolas computacionalmente costoso y lento. Además, la ejecución de estos modelos a menudo implicaba el envío de datos de usuario a servicios de terceros, elevando preocupaciones sobre la privacidad.

Para abordar estos desafíos, los creadores de SnapFusion desarrollaron una arquitectura de red eficiente y mejoraron el proceso de destilación por pasos. Al identificar redundancias en el modelo original, introdujeron un UNet eficiente y redujeron el cálculo del decodificador de imágenes a través de destilación de datos. Además, mejoraron la destilación de pasos explorando estrategias de capacitación e introduciendo técnicas de regularización.

arxiv.org/pdf/2306.00980.pdf

Extensos experimentos sobre el Conjunto de datos MS-COCO demostró la superioridad de SnapFusion. Con solo ocho pasos de eliminación de ruido, SnapFusion logró mejores puntajes FID y CLIP en comparación con el anterior modelo de última generación, Stable Diffusion v1.5, que requirió 50 pasos. Esta notable mejora en eficiencia y rendimiento abre nuevas posibilidades para la creación de contenido.

El impacto de SnapFusion va más allá de sus logros técnicos. Mediante la ejecución modelos de difusión de texto a imagen directamente en dispositivos móviles, elimina la necesidad de costosas GPU y servicios basados ​​en la nube. Esto no solo reduce los costos, sino que también aborda las preocupaciones de privacidad asociadas con el envío de datos de usuarios a terceros. Los usuarios ahora pueden dar rienda suelta a su creatividad y generar imágenes de alta calidad sobre la marcha.

El tamaño del parámetro del modelo se puede reducir aún más para que sea compatible con varios dispositivos de borde. Además, optimizar el modelo para diferentes dispositivos móviles para lograr una inferencia rápida velocidades es un tema de investigación en curso.

Es esencial usar SnapFusion y tecnologías similares de manera responsable para evitar aplicaciones maliciosas. Se pueden tomar medidas, como sistemas de detección automática que identifiquen y marquen el contenido de imágenes que infrinja las normas. Al lograr un equilibrio entre la innovación y las consideraciones éticas, SnapFusion puede cambiar la creación de contenido al tiempo que garantiza una experiencia de usuario segura y responsable.

Lea más sobre la IA:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Hot Stories

Inside Wall Street Memes (WSM): Revelando los titulares

by Viktoriia Palchik
07 de mayo de 2024

Descubra las cripto ballenas: quién es quién en el mercado

by Viktoriia Palchik
07 de mayo de 2024
Suscríbase a nuestro boletín.
Últimas Noticias

Crece el apetito institucional por los ETF de Bitcoin en medio de la volatilidad

Las divulgaciones a través de presentaciones 13F revelan que notables inversores institucionales incursionan en los ETF de Bitcoin, lo que subraya una creciente aceptación de...

Para saber más

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
LD Capital, Antalpha Ventures y Highblock Limited unen fuerzas para lanzar un fondo de liquidez ETF de Hong Kong de 128 millones de dólares
Empresa Industrias Informe de noticias
LD Capital, Antalpha Ventures y Highblock Limited unen fuerzas para lanzar un fondo de liquidez ETF de Hong Kong de 128 millones de dólares
8 de mayo de 2024
Inside Wall Street Memes (WSM): Revelando los titulares
Empresa Industrias Historias y comentarios Tecnología
Inside Wall Street Memes (WSM): Revelando los titulares
7 de mayo de 2024
Descubra las cripto ballenas: quién es quién en el mercado
Empresa Industrias Historias y comentarios Tecnología
Descubra las cripto ballenas: quién es quién en el mercado
7 de mayo de 2024
Orbiter Finance se asocia con la red Zulu de capa 2 de Bitcoin y se implementa en Is Lwazi Testnet
Empresa Informe de noticias Tecnología
Orbiter Finance se asocia con la red Zulu de capa 2 de Bitcoin y se implementa en Is Lwazi Testnet 
7 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.