Stability AI Lanza un nuevo modelo llamado SDXL Beta
En Resumen
Stability AI ha lanzado un nuevo modelo llamado SDXL Beta (Stable Diffusion XLBeta). Es un modelo más grande con más parámetros y algunas mejoras desconocidas. Está disponible en DreamStudio, Stability AIEl generador de imágenes oficial de y utiliza algoritmos avanzados y técnicas de aprendizaje profundo para crear imágenes impresionantes.
Stability AI ha presentado una vista previa de un nuevo modelo llamado SDXL Beta, abreviatura de Stable Diffusion Beta XL. Hasta el momento, la compañía no ha compartido mucha información sobre el modelo, pero está disponible para pruebas para cualquiera que quiera hacerlo. ¿Qué tiene de novedoso este modelo SDXL para stable diffusion? ¿Cuáles son sus ventajas y desventajas? Investiguemos.
Más información: Midjourney y Dall-E Artist Styles Dump con ejemplos: 130 famosas técnicas de pintura de IA |
¿Qué es exactamente el modelo SDXL?
El modelo SDXL es un nuevo modelo que actualmente está siendo entrenado. Está lejos de estar terminado, y para cuando se publique, muchos detalles al respecto pueden cambiar; por lo que sabemos, es posible que ni siquiera se llame modelo SDXL. Todo lo que sabemos es que es un modelo más grande con más parámetros y algunas mejoras desconocidas. Es un modelo v2, no un modelo v3 (lo que sea que eso signifique). Es posible que las mejoras en el modelo v2 puedan mejorar el rendimiento del sistema, pero sin más información, es difícil determinar cuán significativas pueden ser estas mejoras. Además, sería útil saber qué parámetros específicos se han agregado o ajustado en esta versión.
El modelo SDXL está actualmente disponible en DreamStudio, Stability AIEl generador de imágenes oficial de. Seleccione SDXL Beta en el menú del modelo para comprobarlo. Parece utilizar algoritmos avanzados y técnicas de aprendizaje profundo para crear impresionantes imágenes que son perfectas para una amplia gama de aplicaciones.
Mejoradas
Texto legible. SDXL es capaz de generar texto legible y es probablemente su característica más llamativa, ya que no era posible en los modelos v1 y v2.1 existentes. El texto generado por SDXL no siempre es preciso, como puede ver en el Stable Diffusion Texto a continuación. Sin embargo, es muy superior a la v2.1, y mucho menos al modelo v1. Esto se debe a que SDXL utiliza un algoritmo de aprendizaje profundo más avanzado que le permite comprender y generar estructuras de lenguaje más complejas. Con un mayor desarrollo, tiene el potencial de volverse aún más preciso y confiable.
Anatomía humana. La generación precisa de figuras humanas anatómicamente correctas ha sido durante mucho tiempo un desafío para stable diffusion. La presencia de extremidades adicionales o faltantes es común. Por lo general, se usa volver a pintar para corregirlos o, más recientemente, puede usar la función Open Pose de ControlNet para duplicar una pose a partir de una imagen de referencia. Nos complace señalar que aquí es donde ha mejorado el modelo SDXL Beta. El modelo SDXL Beta ha mostrado una mejora significativa en la duplicación precisa de poses a partir de imágenes de referencia. Esta puede ser una herramienta valiosa para diversas aplicaciones, como animación y realidad virtual.
Estilo de retrato. SDXL Beta produce excelentes retratos que parecen fotos: es una actualización en comparación con la versión 1.5. El algoritmo mejorado en SDXL Beta mejora los detalles y la precisión del color de los retratos, lo que da como resultado una apariencia más natural y realista. Los usuarios también pueden ajustar los niveles de nitidez y saturación para lograr los efectos deseados.
Duotono. La palabra clave duotono siempre produce fotos en blanco y negro en el modelo v1.5. Sin embargo, ahora, las imágenes de duotono producidas por SDXL Beta vienen en una variedad de colores. Está claro que, en comparación con los modelos v1, la capacidad de interpretar el aviso ha mejorado, dando como resultado respuestas más precisas y relevantes de los modelos v2, lo que los convierte en una herramienta más confiable para las tareas de procesamiento del lenguaje natural.
Estilos artísticos. Ha habido algunos ajustes menores, pero es difícil determinar si el nuevo modelo ofrece mejores resultados, ya que son simplemente únicos. Es posible que estos ajustes sean una cuestión de preferencia personal u opinión subjetiva, lo que dificulta hacer una defijuicio positivo sobre su calidad. No obstante, la singularidad de los ajustes puede ser notable y merece la pena explorarla más a fondo.
Conclusión
- Stable Diffusion finalmente puede producir un texto que tenga sentido.
- SDXL proporciona imágenes estéticamente más agradables que los modelos v2.1 y (en menor medida) v1.5.
- El nuevo modelo produce imágenes que son más precisas.
- La anatomía humana ha mejorado.
- Las indicaciones negativas no son tan necesarias como en v2.1.
- Puede crear retratos realistas.
- Algunas rarezas en el modelo se corregirán antes del lanzamiento.
Leer más artículos relacionados:
Observación
En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.
Sobre el Autor
Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.
Más artículosDamir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.