Informe de noticias Tecnología
23 de noviembre.

Text-to-SVG: Berkeley anunció la abstracción del modelo de difusión basado en píxeles

En Resumen

Síntesis de texto a imagen: los investigadores de UC Berkeley demuestran gráficos vectoriales con texto condicionado modelos de difusión

En la síntesis de texto a imagen, los modelos de difusión tienen demostrado resultados sobresalientes. Los modelos de difusión aprenden a producir imágenes rasterizadas de objetos y situaciones extremadamente diversos utilizando enormes bases de datos de imágenes anotadas. Sin embargo, para los iconos, gráficos y pegatinas digitales, los diseñadores suelen emplear representaciones vectoriales de imágenes como Scalable Vector Graphics (SVG). Los gráficos vectoriales son pequeños y se pueden escalar a cualquier tamaño.

Text-to-SVG: Berkeley anunció la abstracción del modelo de difusión basado en píxeles

UC Berkeley demuestra cómo producir gráficos vectoriales que se pueden exportar como SVG utilizando un modelo de difusión condicionado por texto que se entrenó en representaciones de píxeles de imágenes. Logra esto sin usar colecciones extensas de SVG con subtítulos. En cambio, los investigadores de Berkeley vectorizan un difusión de texto a imagen muestree y ajústelo con una pérdida de muestreo de destilación de puntaje, motivado por el trabajo reciente en la síntesis de texto a 3D.

Ejemplo de vectores generados

Echa un vistazo a la galería SVG recién generada esta página.

Los gráficos vectoriales son pequeños pero mantienen su nitidez cuando se escalan a cualquier tamaño. Investigadores de Berkeley mejoran una pérdida de texto de imagen basada en Score Distillation Sampling para optimizar gráficos vectoriales. El renderizador SVG diferenciable DiffVG, que utiliza VectorFusion, hace posibles las imágenes inversas.

Además, VectorFusion permite una configuración de múltiples etapas que es más efectiva y de mayor calidad. Este método comienza tomando muestras raster de la modelo de difusión de texto a imagen , que son Stable Diffusion. Luego, VectorFusion rastrea automáticamente las muestras usando LIVE. Estas muestras, sin embargo, frecuentemente carecen de detalles, son aburridas o difíciles de adaptar a gráficos vectoriales. Mejora de la vitalidad y la consistencia textual a través del muestreo de destilación de puntajes.

VectorFusion puede producir pixel art al estilo de los videojuegos antiguos al limitar las rutas SVG a cuadrados en una cuadrícula.

Este enfoque se expande fácilmente para admitir la generación de texto a boceto. Para aprender un dibujo lineal abstracto que represente con precisión el texto proporcionado por el usuario, primero dibujamos 16 trazos elegidos al azar. Luego, optimizamos nuestra pérdida de muestreo de destilación de puntuación latente.

Leer artículos relacionados:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Hot Stories
Suscríbase a nuestro boletín.
Últimas Noticias

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más

Los fundadores de Samourai Wallet son acusados ​​de facilitar 2 millones de dólares en acuerdos en la Darknet

La detención de los fundadores de Samourai Wallet representa un revés notable para la industria, lo que subraya la persistente...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Pantera Capital invierte en TON Blockchain y expresa confianza en el potencial de Telegram para ampliar la accesibilidad a las criptomonedas
Empresa Informe de noticias Tecnología
Pantera Capital invierte en TON Blockchain y expresa confianza en el potencial de Telegram para ampliar la accesibilidad a las criptomonedas
2 de mayo de 2024
Mitosis recauda 7 millones de dólares en financiación de Amber Group y Foresight Ventures para avanzar en su protocolo de liquidez modular
Empresa Informe de noticias Tecnología
Mitosis recauda 7 millones de dólares en financiación de Amber Group y Foresight Ventures para avanzar en su protocolo de liquidez modular
2 de mayo de 2024
Galxe se asocia con Jambo para ampliar la accesibilidad global a Web3
Empresa Informe de noticias Tecnología
Galxe se asocia con Jambo para ampliar la accesibilidad global a Web3
2 de mayo de 2024
Med-Gemini de Google está listo para dar una ventaja a GPT-4 Con su desempeño superior en atención médica
AI Wiki Noticias Software Tecnología
Med-Gemini de Google está listo para dar una ventaja a GPT-4 Con su desempeño superior en atención médica
2 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.