Rapport de nouvelles Technologie
Le 23 juin 2023

Midjourney 5.2 et Stable Diffusion Mises à jour SDXL 0.9 pour la génération de création de texte en image

En bref

StabilityAI a sorti le dernier modèle, Stable Diffusion SDXL 0.9, qui promet une perception améliorée de instructions et des détails d'image améliorés.

Midjourney 5.2 introduit de nouvelles fonctionnalités telles que Outpainting, la commande /shorten, des variations personnalisables et la transformation d'image 1: 1.

Ces mises à jour devraient améliorer l'expérience utilisateur et renforcer la créativité dans le processus de création.

Aujourd'hui, les deux principaux générateurs de texte en image ont publié des mises à jour importantes. Précision améliorée dans la génération d'images réalistes à partir de descriptions textuelles, ainsi que de nouvelles fonctionnalités permettant aux utilisateurs de contrôler le style et la composition des images générées.

Midjourney 5.2 et Stable Diffusion Mises à jour SDXL 0.9 pour la génération d'images créatives
Crédit: Midjourney

Nouvelles fonctionnalités dans Midjourney 5.2

En plus des StabilityAIles mises à jour, Midjourney a également introduit des fonctionnalités intéressantes avec la sortie de Midjourney 5.2. Un ajout notable est la fonction Zoom arrière, qui ressemble Remplissage génératif d'Adobe pour Photoshop. Cependant, il est important de noter que MidjourneyLa fonction Zoom arrière de n'implique pas de masques, et le résultat dépend en grande partie de l'étendue du paramètre "do Out".

Midjourney 5.2 apporte une gamme de nouvelles fonctionnalités qui améliorent l'expérience utilisateur. Notamment, la sortie de Stable Diffusion XL 0.9 a éclipsé la forte mise à jour de Midjourney, ce que de nombreux utilisateurs ont initialement ignoré.

Certaines des principales fonctionnalités et améliorations de Midjourney 5.2:

  • Outpainting : les utilisateurs peuvent désormais explorer la fonction Outpainting avec des options telles que 1.5, 2 et des paramètres personnalisés. Lorsqu'elle est utilisée de manière itérative, cette fonctionnalité donne des résultats impressionnants.
  • Variations personnalisables : La force des variations dans Midjourney est maintenant personnalisable. Les utilisateurs peuvent basculer sans effort entre des variations faibles et fortes en sélectionnant deux boutons, offrant une plus grande flexibilité dans le processus de création.
  • Transformation d'images 1:1 : Midjourney permet désormais aux utilisateurs de transformer n'importe quelle image en un carré au format 1:1, permettant une intégration transparente dans divers contextes.

Aussi, les Midjourney 5.2 a introduit une nouvelle fonctionnalité appelée l'analyseur d'invite, ce qui facilite encore la génération d'images impressionnantes. Avec la commande « /raccourcir [votre invite] », les utilisateurs peuvent désormais identifier les mots importants et éliminer ceux qui ne sont pas nécessaires, en optimisant leur demande les meilleurs résultats. L'analyseur attribue également des poids à chaque mot, permettant aux utilisateurs de choisir parmi cinq options pour l'invite la plus appropriée. En termes plus simples, cela aide à transformer des idées vagues en une invite qui correspond mieux aux intentions et aux besoins des utilisateurs.

En matière de contrôle de processus, Midjourney a rattrapé la concurrence. Cependant, en termes de convivialité, Midjourney tombe en arrière. Ceux qui recherchent la commodité plutôt que la flexibilité peuvent être attirés par luciole d'adobe, une plate-forme concurrente connue pour ses fonctionnalités conviviales. D'autre part, Stable Diffusion, avec sa nature open source et ses extensions, offre une flexibilité inégalée. Malgré StabilityAILes retards occasionnels et les déclarations ambiguës telles que "50 % formé" et "sera disponible à la mi-juillet, mais c'est inexact", une fois que les pondérations seront disponibles, tout s'alignera en douceur.

Avec ces avancées, Midjourney continue de fournir des fonctionnalités intéressantes pour une génération d'images simple et efficace. Les utilisateurs peuvent désormais bénéficier d'un meilleur contrôle sur leurs invites, ce qui se traduit par de meilleurs résultats. À mesure que la technologie progresse, des plateformes comme Midjourney visent à améliorer les expériences des utilisateurs et à rendre les efforts créatifs plus accessibles à tous.

De plus, la dernière version de Midjourney met l'accent sur le réalisme, particulièrement visible dans génération artistique. Pour mettre en évidence ces améliorations, une comparaison a été faite entre une invite et une graine dans Midjourney versions 5.1 et 5.2.

Des exemples fraîchement générés par Midjourney 5.2:

Nouvelles fonctionnalités dans Stable Diffusion SDXL0.9

StabilityAI a apporté des améliorations avec la sortie de son dernier modèle, Stable Diffusion SDXL0.9. Ils promettent une meilleure perception de instructions et des détails d'image améliorés, permettant aux utilisateurs de créer des visuels plus captivants. Mieux encore, vous pouvez déjà tester gratuitement le nouveau modèle sur Chute de clips.

La Stable Diffusion Le modèle SDXL 0.9 a attiré l'attention depuis sa publication par StabilityAI. Bien que la confirmation officielle de la sortie soit disponible, le lien n'a pas encore été fourni. Dans sa version de base, le modèle SDXL 0.9 dispose d'un nombre impressionnant de paramètres de 3.5 milliards. De plus, il existe des plans pour un autre ensemble de deux modèles, totalisant un remarquable 6.6 milliards de paramètres.

Pour obtenir une meilleure génération d'images, StabilityAI emploie une concaténation de deux modèles CLIP : le clip de base de OpenAI et OpenCLIP ViT-G/14. Cette fusion permet de générer des détails plus précis dans les images. Comparaisons d'images appariées entre les SDXL bêta et la nouvelle version, SDXL 0.9, démontrent clairement l'amélioration substantielle de la qualité.

Il convient de noter que l'utilisation du modèle SDXL 0.9 lors de l'inférence nécessite une carte vidéo avec au moins 16 Go de VRAM pour garantir des performances fluides. Alors que les utilisateurs attendent avec impatience un article de blog complet avec tous les détails et la publication du code, on s'attend à d'autres améliorations et opportunités.

Exemples fraîchement générés par SDXL 0.9 :

En savoir plus sur l'IA :

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Plus d'articles
Damir Yalalov
Damir Yalalov

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

L’appétit institutionnel augmente pour les ETF Bitcoin dans un contexte de volatilité

Les divulgations via les dépôts 13F révèlent que des investisseurs institutionnels notables se sont lancés dans les ETF Bitcoin, soulignant une acceptation croissante de...

En savoir plus

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Le passage de Donald Trump à la cryptographie : d'opposant à défenseur, et ce que cela signifie pour le marché américain des cryptomonnaies
La Brochure Marchés Histoires et critiques Technologie
Le passage de Donald Trump à la cryptographie : d'opposant à défenseur, et ce que cela signifie pour le marché américain des cryptomonnaies
10 mai 2024
Layer3 lancera le jeton L3 cet été, allouant 51 % de l'offre totale à la communauté
Marchés Rapport de nouvelles Technologie
Layer3 lancera le jeton L3 cet été, allouant 51 % de l'offre totale à la communauté
10 mai 2024
Dernier avertissement d'Edward Snowden aux développeurs de Bitcoin : « Faites de la confidentialité une priorité au niveau du protocole, sinon vous risquez de la perdre.
Marchés Sécurité Wiki Logiciels Histoires et critiques Technologie
Dernier avertissement d'Edward Snowden aux développeurs de Bitcoin : « Faites de la confidentialité une priorité au niveau du protocole, sinon vous risquez de la perdre.
10 mai 2024
Ethereum Layer 2 Network Mint, alimenté par Optimism, lancera son réseau principal le 15 mai
Rapport de nouvelles Technologie
Ethereum Layer 2 Network Mint, alimenté par Optimism, lancera son réseau principal le 15 mai
10 mai 2024
CRYPTOMERIA LABS PTE. LTD.