Informe de noticias Tecnología
Abril 10, 2023

Stability AI Lanza un nuevo modelo llamado SDXL Beta

En Resumen

Stability AI ha lanzado un nuevo modelo llamado SDXL Beta (Stable Diffusion XLBeta). Es un modelo más grande con más parámetros y algunas mejoras desconocidas. Está disponible en DreamStudio, Stability AIEl generador de imágenes oficial de y utiliza algoritmos avanzados y técnicas de aprendizaje profundo para crear imágenes impresionantes.

Stability AI ha presentado una vista previa de un nuevo modelo llamado SDXL Beta, abreviatura de Stable Diffusion Beta XL. Hasta el momento, la compañía no ha compartido mucha información sobre el modelo, pero está disponible para pruebas para cualquiera que quiera hacerlo. ¿Qué tiene de novedoso este modelo SDXL para stable diffusion? ¿Cuáles son sus ventajas y desventajas? Investiguemos.

Más información: Midjourney y Dall-E Artist Styles Dump con ejemplos: 130 famosas técnicas de pintura de IA

¿Qué es exactamente el modelo SDXL?

El modelo SDXL es un nuevo modelo que actualmente está siendo entrenado. Está lejos de estar terminado, y para cuando se publique, muchos detalles al respecto pueden cambiar; por lo que sabemos, es posible que ni siquiera se llame modelo SDXL. Todo lo que sabemos es que es un modelo más grande con más parámetros y algunas mejoras desconocidas. Es un modelo v2, no un modelo v3 (lo que sea que eso signifique). Es posible que las mejoras en el modelo v2 puedan mejorar el rendimiento del sistema, pero sin más información, es difícil determinar cuán significativas pueden ser estas mejoras. Además, sería útil saber qué parámetros específicos se han agregado o ajustado en esta versión.

El modelo SDXL está actualmente disponible en DreamStudio, Stability AIEl generador de imágenes oficial de. Seleccione SDXL Beta en el menú del modelo para comprobarlo. Parece utilizar algoritmos avanzados y técnicas de aprendizaje profundo para crear impresionantes imágenes que son perfectas para una amplia gama de aplicaciones.

¿Qué es exactamente el modelo SDXL?

Mejoradas

Texto legible. SDXL es capaz de generar texto legible y es probablemente su característica más llamativa, ya que no era posible en los modelos v1 y v2.1 existentes. El texto generado por SDXL no siempre es preciso, como puede ver en el Stable Diffusion Texto a continuación. Sin embargo, es muy superior a la v2.1, y mucho menos al modelo v1. Esto se debe a que SDXL utiliza un algoritmo de aprendizaje profundo más avanzado que le permite comprender y generar estructuras de lenguaje más complejas. Con un mayor desarrollo, tiene el potencial de volverse aún más preciso y confiable.

Aviso: foto de un caballero sosteniendo un papel blanco que dice "No Fakes"
Aviso: foto de un caballero sosteniendo un papel blanco que dice "No Fakes"
Foto de una mujer pelirroja sosteniendo un cartel negro con letras blancas que dice "Sin bromas"
Aviso: Foto de una mujer pelirroja sosteniendo un cartel negro con letras blancas que dice "Sin bromas".
Mensaje: Foto de una mujer china sentada en un cine sosteniendo un plato con la palabra "Dolor y avión" escrita en él.
Mensaje: Foto de una mujer china sentada en un cine sosteniendo un plato con la palabra “Dolor y avión” escrita en él.

Anatomía humana. La generación precisa de figuras humanas anatómicamente correctas ha sido durante mucho tiempo un desafío para stable diffusion. La presencia de extremidades adicionales o faltantes es común. Por lo general, se usa volver a pintar para corregirlos o, más recientemente, puede usar la función Open Pose de ControlNet para duplicar una pose a partir de una imagen de referencia. Nos complace señalar que aquí es donde ha mejorado el modelo SDXL Beta. El modelo SDXL Beta ha mostrado una mejora significativa en la duplicación precisa de poses a partir de imágenes de referencia. Esta puede ser una herramienta valiosa para diversas aplicaciones, como animación y realidad virtual.

Foto de una mujer con ropa deportiva girando la pelota en la mano derecha
Mensaje: Foto de una mujer con ropa deportiva haciendo girar la pelota en la mano derecha
Foto de un niño sentado bajo la luna roja.
Aviso: foto de un niño sentado bajo la luna roja
Mensaje: Una foto muestra a un anciano corriendo en el bosque.

Estilo de retrato. SDXL Beta produce excelentes retratos que parecen fotos: es una actualización en comparación con la versión 1.5. El algoritmo mejorado en SDXL Beta mejora los detalles y la precisión del color de los retratos, lo que da como resultado una apariencia más natural y realista. Los usuarios también pueden ajustar los niveles de nitidez y saturación para lograr los efectos deseados.

Mensaje: una foto de un niño y una niña
Mensaje: una foto de un niño y una niña
Aviso: una foto de retrato de un tipo gordo
Aviso: una foto de retrato de un tipo gordo
Aviso: una foto de una mujer de los 80
Aviso: una foto de una mujer de los 80

Duotono. La palabra clave duotono siempre produce fotos en blanco y negro en el modelo v1.5. Sin embargo, ahora, las imágenes de duotono producidas por SDXL Beta vienen en una variedad de colores. Está claro que, en comparación con los modelos v1, la capacidad de interpretar el aviso ha mejorado, dando como resultado respuestas más precisas y relevantes de los modelos v2, lo que los convierte en una herramienta más confiable para las tareas de procesamiento del lenguaje natural.

retrato estilo duotono de un perro
Aviso: retrato estilo duotono de un perro
paisaje de duotono de la isla
Aviso: paisaje de duotono de la isla
retrato en duotono de una joven africana
Aviso: retrato en duotono de una joven africana

Estilos artísticos. Ha habido algunos ajustes menores, pero es difícil determinar si el nuevo modelo ofrece mejores resultados, ya que son simplemente únicos. Es posible que estos ajustes sean una cuestión de preferencia personal u opinión subjetiva, lo que dificulta hacer una defijuicio positivo sobre su calidad. No obstante, la singularidad de los ajustes puede ser notable y merece la pena explorarla más a fondo.

Nueva York por Ivan Aivazovsky
v 1.5: Nueva York por Ivan Aivazovsky
Nueva York por Ivan Aivazovsky
SDXL: Nueva York de Ivan Aivazovsky
Viejo bosque de Christopher Balaskas
v 1.5: Bosque Viejo por Christopher Balaskas
Viejo bosque de Christopher Balaskas
SDXL: Viejo bosque de Christopher Balaskas

Conclusión

  • Stable Diffusion finalmente puede producir un texto que tenga sentido.
  • SDXL proporciona imágenes estéticamente más agradables que los modelos v2.1 y (en menor medida) v1.5.
  • El nuevo modelo produce imágenes que son más precisas.
  • La anatomía humana ha mejorado.
  • Las indicaciones negativas no son tan necesarias como en v2.1.
  • Puede crear retratos realistas.
  • Algunas rarezas en el modelo se corregirán antes del lanzamiento.

Leer más artículos relacionados:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Hot Stories
Suscríbase a nuestro boletín.
Últimas Noticias

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más

Los fundadores de Samourai Wallet son acusados ​​de facilitar 2 millones de dólares en acuerdos en la Darknet

La detención de los fundadores de Samourai Wallet representa un revés notable para la industria, lo que subraya la persistente...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Ankr colabora con la plataforma AI Blockchain Talus Network para desbloquear la liquidez de Bitcoin para la IA
Empresa Informe de noticias Tecnología
Ankr colabora con la plataforma AI Blockchain Talus Network para desbloquear la liquidez de Bitcoin para la IA
1 de mayo de 2024
Binance Labs apoya los laboratorios de movimiento para facilitar la integración de movimientos de Facebook a través de blockchains
Empresa Informe de noticias Tecnología
Binance Labs apoya los laboratorios de movimiento para facilitar la integración de movimientos de Facebook a través de blockchains
1 de mayo de 2024
Las naciones BRICS miran la solución comercial de monedas estables
Empresa Industrias Historias y comentarios Tecnología
Las naciones BRICS miran la solución comercial de monedas estables
1 de mayo de 2024
Bitcoin L2 Network BOB se integra con LayerZero para una funcionalidad mejorada
Empresa Informe de noticias Tecnología
Bitcoin L2 Network BOB se integra con LayerZero para una funcionalidad mejorada
1 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.