Stability AI Lance un nouveau modèle appelé SDXL Beta
En bref
Stability AI a sorti un nouveau modèle appelé SDXL Beta (Stable Diffusion XL Bêta). C'est un modèle plus grand avec plus de paramètres et quelques améliorations inconnues. Il est disponible chez DreamStudio, Stability AIest le générateur d'images officiel de et utilise des algorithmes avancés et des techniques d'apprentissage en profondeur pour créer des visuels époustouflants.
Stability AI a dévoilé en avant-première un nouveau modèle appelé SDXL Beta, abréviation de Stable Diffusion Bêta XL. Jusqu'à présent, la société n'a pas partagé beaucoup d'informations sur le modèle, mais il est disponible pour des tests pour tous ceux qui le souhaitent. Quelle est la nouveauté de ce modèle SDXL pour stable diffusion? Quels sont ses avantages et ses inconvénients ? Enquêtons.
Lire la suite: Midjourney et Dall-E Artist Styles Dump avec des exemples : 130 techniques de peinture AI célèbres |
Qu'est-ce que le modèle SDXL exactement ?
Le modèle SDXL est un nouveau modèle qui est actuellement être formé. Il est loin d'être terminé, et au moment de sa sortie, de nombreux détails à son sujet pourraient changer ; pour autant que nous sachions, il ne s'appelle peut-être même pas le modèle SDXL. Tout ce que nous savons, c'est qu'il s'agit d'un modèle plus grand avec plus de paramètres et quelques améliorations inconnues. C'est un modèle v2, pas un modèle v3 (quoi que cela signifie). Il est possible que les améliorations apportées au modèle v2 améliorent les performances du système, mais sans plus d'informations, il est difficile de déterminer l'importance de ces améliorations. De plus, il serait utile de savoir quels paramètres spécifiques ont été ajoutés ou ajustés dans cette version.
Le modèle SDXL est actuellement disponible chez DreamStudio, Stability AILe générateur d'images officiel de . Sélectionnez SDXL Beta dans le menu du modèle pour le vérifier. Il semble utiliser des algorithmes avancés et techniques d'apprentissage en profondeur pour créer des visuels époustouflants qui sont parfaits pour un large éventail d'applications.
Améliorations
Texte lisible. SDXL est capable de générer du texte lisible et c'est probablement sa caractéristique la plus frappante car cela n'était pas possible dans les modèles v1 et v2.1 existants. Le texte généré par SDXL n'est pas toujours précis, comme vous pouvez le voir dans le Stable Diffusion Texte ci-dessous. Cependant, il est de loin supérieur au modèle v2.1, sans parler du modèle v1. En effet, SDXL utilise un algorithme d'apprentissage en profondeur plus avancé qui lui permet de comprendre et de générer des structures de langage plus complexes. Avec un développement ultérieur, il a le potentiel de devenir encore plus précis et fiable.
Anatomie humaine. La génération précise de figures humaines anatomiquement correctes a longtemps été un défi pour stable diffusion. La présence de membres supplémentaires ou manquants est fréquente. L'inpainting est généralement utilisé pour les corriger ou, plus récemment, vous pouvez utiliser la fonction Open Pose de ControlNet pour dupliquer une pose à partir d'une image de référence. Nous sommes heureux de constater que c'est là que le modèle SDXL Beta s'est amélioré. Le modèle SDXL Beta a montré une amélioration significative dans la duplication précise des poses à partir d'images de référence. Cela peut être un outil précieux pour diverses applications telles que l'animation et la réalité virtuelle.
Style portrait. SDXL Beta produit d'excellents portraits qui ressemblent à des photos - c'est une mise à niveau par rapport à la version 1.5. L'algorithme amélioré de SDXL Beta améliore les détails et la précision des couleurs des portraits, ce qui donne un aspect plus naturel et réaliste. Les utilisateurs peuvent également régler les niveaux de netteté et de saturation pour obtenir les effets souhaités.
Bichromie. Le mot-clé bichromie produit toujours des photos en noir et blanc dans le modèle v1.5. Cependant, maintenant, les images bicolores produites par SDXL Beta sont disponibles dans une variété de couleurs. Il est clair que par rapport aux modèles v1, la possibilité de interpréter l'invite s'est améliorée, résultant en des réponses plus précises et pertinentes des modèles v2, ce qui en fait un outil plus fiable pour les tâches de traitement du langage naturel.
Styles artistiques. Il y a eu quelques ajustements mineurs, mais il est difficile de déterminer si le nouveau modèle donne de meilleurs résultats car ils sont tout simplement uniques. Il est possible que ces ajustements soient une question de préférence personnelle ou d'opinion subjective, ce qui rend difficile l'élaboration d'une évaluation. defijugement natif sur leur qualité. Néanmoins, le caractère unique des ajustements peut être remarquable et mérite d’être approfondi.
Conclusion
- Stable Diffusion peut enfin produire un texte qui a du sens.
- SDXL fournit des images plus esthétiques que les modèles v2.1 et (dans une moindre mesure) les modèles v1.5.
- Le nouveau modèle produit des images plus précises.
- L'anatomie humaine s'est améliorée.
- Les invites négatives ne sont pas aussi nécessaires que dans la v2.1.
- Il peut créer des portraits réalistes.
- Certaines bizarreries du modèle seront corrigées avant la sortie.
Lire plus d'articles connexes:
Clause de non-responsabilité
En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.
A propos de l'auteur
Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet.
Plus d'articlesDamir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet.