Rapport de nouvelles Technologie
10 avril 2023

Stability AI Lance un nouveau modèle appelé SDXL Beta

En bref

Stability AI a sorti un nouveau modèle appelé SDXL Beta (Stable Diffusion XL Bêta). C'est un modèle plus grand avec plus de paramètres et quelques améliorations inconnues. Il est disponible chez DreamStudio, Stability AIest le générateur d'images officiel de et utilise des algorithmes avancés et des techniques d'apprentissage en profondeur pour créer des visuels époustouflants.

Stability AI a dévoilé en avant-première un nouveau modèle appelé SDXL Beta, abréviation de Stable Diffusion Bêta XL. Jusqu'à présent, la société n'a pas partagé beaucoup d'informations sur le modèle, mais il est disponible pour des tests pour tous ceux qui le souhaitent. Quelle est la nouveauté de ce modèle SDXL pour stable diffusion? Quels sont ses avantages et ses inconvénients ? Enquêtons.

Lire la suite: Midjourney et Dall-E Artist Styles Dump avec des exemples : 130 techniques de peinture AI célèbres

Qu'est-ce que le modèle SDXL exactement ?

Le modèle SDXL est un nouveau modèle qui est actuellement être formé. Il est loin d'être terminé, et au moment de sa sortie, de nombreux détails à son sujet pourraient changer ; pour autant que nous sachions, il ne s'appelle peut-être même pas le modèle SDXL. Tout ce que nous savons, c'est qu'il s'agit d'un modèle plus grand avec plus de paramètres et quelques améliorations inconnues. C'est un modèle v2, pas un modèle v3 (quoi que cela signifie). Il est possible que les améliorations apportées au modèle v2 améliorent les performances du système, mais sans plus d'informations, il est difficile de déterminer l'importance de ces améliorations. De plus, il serait utile de savoir quels paramètres spécifiques ont été ajoutés ou ajustés dans cette version.

Le modèle SDXL est actuellement disponible chez DreamStudio, Stability AILe générateur d'images officiel de . Sélectionnez SDXL Beta dans le menu du modèle pour le vérifier. Il semble utiliser des algorithmes avancés et techniques d'apprentissage en profondeur pour créer des visuels époustouflants qui sont parfaits pour un large éventail d'applications.

Qu'est-ce que le modèle SDXL exactement ?

Améliorations

Texte lisible. SDXL est capable de générer du texte lisible et c'est probablement sa caractéristique la plus frappante car cela n'était pas possible dans les modèles v1 et v2.1 existants. Le texte généré par SDXL n'est pas toujours précis, comme vous pouvez le voir dans le Stable Diffusion Texte ci-dessous. Cependant, il est de loin supérieur au modèle v2.1, sans parler du modèle v1. En effet, SDXL utilise un algorithme d'apprentissage en profondeur plus avancé qui lui permet de comprendre et de générer des structures de langage plus complexes. Avec un développement ultérieur, il a le potentiel de devenir encore plus précis et fiable.

Invite : photo d'un homme tenant un papier blanc sur lequel est écrit "No Fakes"
Invite : photo d'un homme tenant un papier blanc sur lequel est écrit "No Fakes"
Photo d'une femme rousse tenant une pancarte noire avec des polices blanches indiquant "No Jokes"
Invite : photo d'une femme rousse tenant une pancarte noire avec des polices blanches indiquant "No Jokes"
Invite : Photo d'une femme chinoise assise dans un cinéma tenant une assiette avec le mot "Pain and Plane" écrit dessus.
Invite : Photo d'une femme chinoise assise dans un cinéma tenant une assiette sur laquelle est écrit le mot "Pain and Plane".

Anatomie humaine. La génération précise de figures humaines anatomiquement correctes a longtemps été un défi pour stable diffusion. La présence de membres supplémentaires ou manquants est fréquente. L'inpainting est généralement utilisé pour les corriger ou, plus récemment, vous pouvez utiliser la fonction Open Pose de ControlNet pour dupliquer une pose à partir d'une image de référence. Nous sommes heureux de constater que c'est là que le modèle SDXL Beta s'est amélioré. Le modèle SDXL Beta a montré une amélioration significative dans la duplication précise des poses à partir d'images de référence. Cela peut être un outil précieux pour diverses applications telles que l'animation et la réalité virtuelle.

Photo d'une femme en tenue de sport faisant tourner le ballon dans la main droite
Invite : Photo d'une femme en tenue de sport faisant tourner le ballon dans la main droite
Photo d'un garçon assis sous la lune rouge
Invite : photo d'un garçon assis sous la lune rouge
Invite : Une photo montre un vieil homme courant dans la forêt.

Style portrait. SDXL Beta produit d'excellents portraits qui ressemblent à des photos - c'est une mise à niveau par rapport à la version 1.5. L'algorithme amélioré de SDXL Beta améliore les détails et la précision des couleurs des portraits, ce qui donne un aspect plus naturel et réaliste. Les utilisateurs peuvent également régler les niveaux de netteté et de saturation pour obtenir les effets souhaités.

Invite : une photo d'un garçon et d'une fille
Invite : une photo d'un garçon et d'une fille
Invite : une photo de portrait d'un gros gars
Invite : une photo de portrait d'un gros gars
Prompt : une photo d'une femme des années 80
Prompt : une photo d'une femme des années 80

Bichromie. Le mot-clé bichromie produit toujours des photos en noir et blanc dans le modèle v1.5. Cependant, maintenant, les images bicolores produites par SDXL Beta sont disponibles dans une variété de couleurs. Il est clair que par rapport aux modèles v1, la possibilité de interpréter l'invite s'est améliorée, résultant en des réponses plus précises et pertinentes des modèles v2, ce qui en fait un outil plus fiable pour les tâches de traitement du langage naturel.

portrait de style bicolore d'un chien
Invite : portrait de style bicolore d'un chien
paysage bicolore de l'île
Invite : paysage bicolore de l'île
portrait bicolore d'une jeune femme africaine
Invite : portrait bicolore d'une jeune femme africaine

Styles artistiques. Il y a eu quelques ajustements mineurs, mais il est difficile de déterminer si le nouveau modèle donne de meilleurs résultats car ils sont tout simplement uniques. Il est possible que ces ajustements soient une question de préférence personnelle ou d'opinion subjective, ce qui rend difficile l'élaboration d'une évaluation. defijugement natif sur leur qualité. Néanmoins, le caractère unique des ajustements peut être remarquable et mérite d’être approfondi.

New York par Ivan Aivazovsky
v 1.5 : New York par Ivan Aivazovsky
New York par Ivan Aivazovsky
SDXL : New York d'Ivan Aivazovsky
Vieille forêt de Christopher Balaskas
v 1.5 : Vieille forêt par Christopher Balaskas
Vieille forêt de Christopher Balaskas
SDXL : Vieille forêt de Christopher Balaskas

Conclusion

  • Stable Diffusion peut enfin produire un texte qui a du sens.
  • SDXL fournit des images plus esthétiques que les modèles v2.1 et (dans une moindre mesure) les modèles v1.5.
  • Le nouveau modèle produit des images plus précises.
  • L'anatomie humaine s'est améliorée.
  • Les invites négatives ne sont pas aussi nécessaires que dans la v2.1.
  • Il peut créer des portraits réalistes.
  • Certaines bizarreries du modèle seront corrigées avant la sortie.

Lire plus d'articles connexes:

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Plus d'articles
Damir Yalalov
Damir Yalalov

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus

Les fondateurs de Samourai Wallet accusés d'avoir facilité 2 milliards de dollars de transactions sur le Darknet

L'appréhension des fondateurs de Samourai Wallet représente un revers notable pour l'industrie, soulignant la persistance...

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Ankr collabore avec le réseau Talus de la plate-forme AI Blockchain pour débloquer la liquidité Bitcoin pour l'IA
La Brochure Rapport de nouvelles Technologie
Ankr collabore avec le réseau Talus de la plate-forme AI Blockchain pour débloquer la liquidité Bitcoin pour l'IA
1 mai 2024
Binance Labs soutient Movement Labs pour faciliter l'intégration de Facebook à travers les blockchains
La Brochure Rapport de nouvelles Technologie
Binance Labs soutient Movement Labs pour faciliter l'intégration de Facebook à travers les blockchains
1 mai 2024
Les nations BRICS envisagent une solution commerciale stable
La Brochure Marchés Histoires et critiques Technologie
Les nations BRICS envisagent une solution commerciale stable
1 mai 2024
Le réseau Bitcoin L2 BOB s'intègre à LayerZero pour une fonctionnalité améliorée
La Brochure Rapport de nouvelles Technologie
Le réseau Bitcoin L2 BOB s'intègre à LayerZero pour une fonctionnalité améliorée
1 mai 2024
CRYPTOMERIA LABS PTE. LTD.