Dall-E 3 contre. Midjourney: Une grande comparaison des générateurs d'art IA les plus avancés
Rejoignez-nous dans ce voyage passionnant alors que nous explorons Dall-E 3 et Midjourneyles subtilités, les complexités et le potentiel inexploité de . Cet article met en évidence les comparaisons les plus intrigantes basées sur les recherches effectuées par Atachkina, passionnée d’IA ; si vous souhaitez en savoir plus, cliquez sur le lien.
Pro Tips |
---|
1. Découvrez le Top 50 des invites de conversion texte-image pour les générateurs d'art IA Midjourney et DALL-E. |
2. Allumez votre créativité avec le Top 20 des générateurs d'art de synthèse texte-image IA de 2023. |
Cet article fournit une invite texte-image, une image montrant les résultats de Dall-E 3 et Midjourney, et une explication des différences entre les deux générateurs d'art. Commençons.
Les deux réseaux de neurones se sont comportés admirablement dans ce cas, avec le Midjourney surperformant légèrement les autres.
Dall-E 3 a fait un travail bien pire ici ; il a obtenu les couleurs vives des styles, mais pas la clarté des détails ; des corps difformes apparaissaient en arrière-plan, et les visages n'étaient pas du tout réussis.
Les deux endroits se sont avérés intéressants, mais Dall-E 3 a encore une fois eu du mal avec les visages. Au lieu de cela, il a fabriqué un sac beige en peluche, comme indiqué dans l'invite, et Midjourney l'a ignoré. Dans ce cas, Dall-E 3 s’est montré très obéissant en exécutant l’invite.
Et encore une fois, même si les deux grilles font d'excellents collages, Dall-E 3 est plus fidèle à l'invite ; il ajoutait uniquement les héros que nous avions spécifiés, il ne pouvait pas se transformer en joker et il croisait le capitaine avec Batman.
Midjourney a pu combiner les styles respectifs des deux artistes à partir de l'invite, tandis que Dall-E 3 a simplement ajouté beaucoup de détails chargés et de couleurs vives à l'arrière-plan.
Une fois de plus, les chats sont en pleine forme et les deux réseaux de neurones comprennent parfaitement les caméras argentiques. Cependant, le Dall-E 3 ajoute même du grain aux images.
Dall-E 3 a créé un jeune Leonardo DiCaprio avec des textures de pull cool, un grain de film et une palette de couleurs ajoutés et reflète très froidement l'ambiance d'une datcha russe. Midjourney était un bon réflecteur de couleurs pour le film et DiCaprio lui a donné une apparence plus mature.
Bien que les deux les réseaux de neurones sont adeptes de la création de collages, si vous regardez bien, Midjourney déforme les visages et certaines formes d'objets, tandis que Dall-E 3 est plus précis dans l'exécution des personnages eux-mêmes - il s'est même avéré qu'il s'agissait de Chewbacca.
Lorsque vous zoomez sur les photographies, vous remarquerez que le Dall-E 3 a les yeux flous ; Midjourney, par contre, est impeccable. Dall-E 3 a également prescrit une marque ; les serpents sur les têtes semblent plus vivants et en mouvement ; Midjourney les faisait toujours couchés plutôt que sur la tête.
Les deux sont cool, mais Midjourney a pris en compte le style de l'artiste ainsi que l'effet d'une caméra argentique, tandis que Dall-E 3 a ignoré le plan complet et ne l'a pas pris en compte.
Nous avons également pris la décision de tester une photo avec des fées, mais Dall-E 3 a obstinément refusé de coopérer. Midjourney n'a pas ignoré les ailes car la référence avec les ailes avait été ajoutée. Lorsque Dall-E 3 a pris une photo, elle a offert des possibilités intrigantes, mais avec une Américaine.
Midjourney a fait un travail fantastique, mais nous souhaitons attirer une attention particulière sur la façon dont Dall-E 3 a créé les effets du film dans l'image en haut à droite et a ajouté sa propre écriture blanche ; ça s'est bien passé.
Dall-E 3 a réussi à réaliser à nouveau très docilement tous les héros de l'invite dans une seule image. Midjourney j'ai essayé très fort et j'ai même failli réussir.
À première vue, il semble que les deux soient bons, mais une inspection plus minutieuse révèle que le Dall-E 3 manque de volume photoréaliste et que Midjourney manipulé les joints avec des fourchettes avec fracas.
Les deux générateurs maîtrisent leurs domaines respectifs, Dall-E 3 excellant en texte et Midjourney exceller dans le photoréalisme.
La physique et la géométrie des sèche-cheveux sont difficiles à comprendre Midjourney. Vous pouvez passer beaucoup de temps à vous battre avec des essais et des références, et parfois les résultats ressemblent à un sèche-cheveux, mais Dall-E 3 a produit un résultat acceptable du premier coup et a même écrit le texte.
Le seul œil est bon, mais c'est une autre histoire. Dans Midjourney, nous avons écrit une invite négative – pas de dessin animé, d’illustration, plat, deux yeux. Dall-E 3 a immédiatement obéi et a fait un œil, un sourire et un coup de chapeau, mais il a catégoriquement refusé que quiconque la prenne en photo.
Midjourney a rendu la génération pas comme Brad, nous avons donc utilisé le service supplémentaire Insight Échange de visage mettre le visage de Brad sur la génération ; il y avait un post à ce sujet ici. Dall-E 3 sait qui est Brad Pitt et peut dessiner des étoiles sans aucun logiciel supplémentaire.
Les deux maillages sont bons, mais Dall-E 3 peut créer des cornes de licorne tout en Midjourney ne le peut généralement pas.
Dall-E 3 a fait du bon travail en mettant les personnages en action ; on peut voir un orc et un elfe avec des oreilles d'elfe. Il y a aussi une personne qui porte un survêtement Nike, mais ses yeux sont tachés. Les oreilles pointues des elfes sont pour la plupart ignorées par Midjourney, et Nike est également ignoré.
Lorsque l’« illustration » post-scriptum a été initialement exclue de l’invite, Dall-E 3 en a créé une. Nous avons alors décidé de le comparer à MidjourneyL'illustration. Alors que Midjourney Ressemblant davantage aux illustrations de l'ère soviétique et n'incluant pas les ailes de fée, Dall-E 3 a fait un travail fantastique en dessinant le marteau et la faucille. L'exemple de droite montre comment Dall-E 3 pourrait apparaître dans le texte.
Toutefois, Midjourney je suis entré dans le photoréalisme; il n'y a pas de personnage principal dans les images, seulement l'environnement, mais ça reste cool. Dall-E 3 ne voulait plus figurer sur la photo.
Dall-E 3 contre. Midjourney: Avantages et inconvénients
Au fur et à mesure que les utilisateurs explorent cette technologie, plusieurs forces et limites notables sont apparues, permettant ainsi de mieux comprendre ses fonctionnalités.
Avantages:
- Obéissance rapide : L'une des caractéristiques les plus remarquables du Dall-E 3 est sa remarquable capacité à suivre les instructions avec précision. Les utilisateurs ont signalé que le modèle d'IA répond efficacement à un large éventail d'entrées, ce qui en fait un outil polyvalent pour diverses tâches.
- Créativité aux multiples facettes : Dall-E 3 présente la capacité de représenter plusieurs personnages dans une seule image, élargissant ainsi son potentiel de narration et de projets créatifs. Cette approche multiforme améliore son utilité dans différents domaines.
- Intégration de texte : Les utilisateurs ont noté la capacité du Dall-E 3 à intégrer de manière transparente du texte dans les images. Cette fonctionnalité facilite la création de contenu visuellement attrayant avec des éléments textuels intégrés.
Inconvénients:
- Clarté de l'image: Une limitation notable est la tendance de l’IA à produire des images avec des visages et des yeux flous. Bien qu’il excelle en termes de créativité, il lui manque parfois la clarté et la précision du contenu généré par l’homme.
- Cohérence des styles : Dall-E 3 ne reproduit pas systématiquement les styles d'artistes spécifiques, ce qui peut être un inconvénient pour ceux qui recherchent une émulation artistique précise.
- Exigence VPN : L'accès à Dall-E 3 nécessite actuellement l'utilisation d'un VPN, ce qui peut poser des problèmes d'accessibilité pour certains utilisateurs.
- Gestion des images: Les utilisateurs ont rencontré des limitations lors de la gestion des images générées sur le site Web Microsoft Bing. Notamment, il n'y a pas de fonction d'orientation du format et l'historique des images est limité aux téléchargements récents, nécessitant une copie immédiate pour une utilisation ultérieure.
- Vitesse de génération : Dans certains cas, le processus de génération dans Dall-E 3 s'est révélé plus lent que celui d'autres modèles d'IA.
Malgré ces limitations, le Dall-E 3 est très prometteur. Les utilisateurs et les experts reconnaissent son potentiel pour révolutionner la création de contenu et la narration. Comme OpenAI continue d'affiner et d'élargir ses offres, on s'attend à ce que les atouts du Dall-E 3 brillent encore plus, ce qui en fera un outil précieux dans divers domaines.
FAQ
Dall-E 3 et Midjourney ont leurs forces et leurs faiblesses. Dall-E 3 obéit particulièrement aux invites et peut intégrer du texte de manière transparente dans les images. Cependant, il produit parfois des images avec des visages et des yeux flous et peut ne pas reproduire de manière cohérente les styles d'artistes spécifiques. D'autre part, Midjourney excelle dans le photoréalisme mais ne capture pas toujours l'essence de certaines invites avec autant de précision que Dall-E 3.
L'article fournit des invites texte-image, présentant les résultats de Dall-E 3 et Midjourney, et explique les différences entre les deux générateurs d'art.
Les deux modèles d’IA ont leurs forces et leurs faiblesses. Par exemple, dans une invite concernant un astronaute sur Jupiter, Midjourney a légèrement surpassé Dall-E 3. Cependant, dans une autre invite concernant Wonder Woman, Dall-E 3 était plus précis dans la capture de l'essence de l'invite.
- Obéissance prompte: Dall-E 3 suit avec précision les invites.
- Créativité aux multiples facettes: Il peut représenter plusieurs personnages dans une seule image.
- Intégration de texte: Dall-E 3 peut intégrer de manière transparente du texte dans des images.
- Clarté de l'image: Il produit parfois des images avec des visages et des yeux flous.
- Cohérence des styles: Dall-E 3 ne reproduit pas systématiquement les styles d'artistes spécifiques.
- Gestion des images: Il existe des limitations lors de la gestion des images générées sur le site Web Microsoft Bing.
- Vitesse de génération: Le processus de génération du Dall-E 3 peut être plus lent par rapport aux autres modèles d'IA.
Clause de non-responsabilité
En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.
A propos de l'auteur
Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet.
Plus d'articlesDamir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet.