AI Wiki L'art Technologie
02 octobre 2023

Dall-E 3 contre. Midjourney: Une grande comparaison des générateurs d'art IA les plus avancés

Rejoignez-nous dans ce voyage passionnant alors que nous explorons Dall-E 3 et Midjourneyles subtilités, les complexités et le potentiel inexploité de . Cet article met en évidence les comparaisons les plus intrigantes basées sur les recherches effectuées par Atachkina, passionnée d’IA ; si vous souhaitez en savoir plus, cliquez sur le lien.

Dall-E 3 contre. Midjourney: Une grande comparaison des générateurs d'art IA les plus avancés
Pro Tips
1. Découvrez le Top 50 des invites de conversion texte-image pour les générateurs d'art IA Midjourney et DALL-E.
2. Allumez votre créativité avec le Top 20 des générateurs d'art de synthèse texte-image IA de 2023.

Cet article fournit une invite texte-image, une image montrant les résultats de Dall-E 3 et Midjourney, et une explication des différences entre les deux générateurs d'art. Commençons.

invite : Un astronaute se tient sur Jupiter et observe le lever du soleil. interface futuriste, perspective à la première personne, commandant de l'espace, pluviomètre et interface utilisateur HUD Rise

Les deux réseaux de neurones se sont comportés admirablement dans ce cas, avec le Midjourney surperformant légèrement les autres.

invite : prise de vue par Slim Aarons de Wonder Woman dans la pièce, couches et textures complexes, conception détaillée des personnages, arrière-plan avec des scènes lumineuses, fantaisistes et colorées, correction des couleurs pastel comme les films de Wes Anderson, grain de film et Tokina AT-X 11-16mm f /2.8 pro dx ii

Dall-E 3 a fait un travail bien pire ici ; il a obtenu les couleurs vives des styles, mais pas la clarté des détails ; des corps difformes apparaissaient en arrière-plan, et les visages n'étaient pas du tout réussis.

invite : photo d'un cybercot mignon et potelé dans sa résidence en ligne
invite : photographie professionnelle en studio commercial pour Nike ; modèle aux cheveux longs; photo de tout le corps ; portant un T-shirt Nike beige ; veste en jean Nike inhabituelle; sac Nike en peluche beige doux; baskets Nike violet doux; debout sur un fond rose-bleu clair ; arrière-plan futuriste d'une forme profilée complexe avec rétroéclairage ; tourné sur Hasselblad X1D ;

Les deux endroits se sont avérés intéressants, mais Dall-E 3 a encore une fois eu du mal avec les visages. Au lieu de cela, il a fabriqué un sac beige en peluche, comme indiqué dans l'invite, et Midjourney l'a ignoré. Dans ce cas, Dall-E 3 s’est montré très obéissant en exécutant l’invite.

invite : figure de bulle en lancer de rayons aux couleurs pastel, sculpture féminine aux finitions métalliques, brillant/brillant, turbulences vibrantes, pigeoncore, poses non conventionnelles, art anamorphique, irisation/opalescence, boucles de retour vidéo, yeux brillants, courbes audacieuses, figuratisme brillant et fluide
invite : un collage rétro vintage de super-héros, dont Wonder Woman, Captain America, Batman et The Joker

Et encore une fois, même si les deux grilles font d'excellents collages, Dall-E 3 est plus fidèle à l'invite ; il ajoutait uniquement les héros que nous avions spécifiés, il ne pouvait pas se transformer en joker et il croisait le capitaine avec Batman.

invite : goutte de traçage de rayons métalliques, art anamorphique, détails accrocheurs, lignes précises, courbes audacieuses, figuratisme brillant et fluide, couleurs pastel, fond sombre
invite : des calques et des textures simples, une conception de personnages complexe, des arrière-plans vifs, fantaisistes et colorés, une correction des couleurs pastel à la manière des films de Wes Anderson, un grain de film et un objectif Tokina at-x 11-16mm f/2.8 pro dx ii sont tous présents dans cette image de Spider-Man se relaxant sur un canapé prise par Slim Aarons.

Midjourney a pu combiner les styles respectifs des deux artistes à partir de l'invite, tandis que Dall-E 3 a simplement ajouté beaucoup de détails chargés et de couleurs vives à l'arrière-plan.

invite : une photographie des années 80 de gros chats mignons et potelés participant à un cours d'aérobic tout en arborant d'amusants leggings léopard et des bodys roses a été prise avec un Kodak Gold 200.

Une fois de plus, les chats sont en pleine forme et les deux réseaux de neurones comprennent parfaitement les caméras argentiques. Cependant, le Dall-E 3 ajoute même du grain aux images.

Dans les années 1990, Leonardo DiCaprio incarne un maître Jedi dans une datcha russe, brandissant un sabre laser et portant un pull vert tricoté.

Dall-E 3 a créé un jeune Leonardo DiCaprio avec des textures de pull cool, un grain de film et une palette de couleurs ajoutés et reflète très froidement l'ambiance d'une datcha russe. Midjourney était un bon réflecteur de couleurs pour le film et DiCaprio lui a donné une apparence plus mature.

invite : un collage de Star Wars images dans un style rétro vintage

Bien que les deux les réseaux de neurones sont adeptes de la création de collages, si vous regardez bien, Midjourney déforme les visages et certaines formes d'objets, tandis que Dall-E 3 est plus précis dans l'exécution des personnages eux-mêmes - il s'est même avéré qu'il s'agissait de Chewbacca.

invite : une photo d'une méduse gorgone russe portant du streetwear hypebeast Balenciaga et se promenant dans une rue de Manhattan avec des serpents pour cheveux

Lorsque vous zoomez sur les photographies, vous remarquerez que le Dall-E 3 a les yeux flous ; Midjourney, par contre, est impeccable. Dall-E 3 a également prescrit une marque ; les serpents sur les têtes semblent plus vivants et en mouvement ; Midjourney les faisait toujours couchés plutôt que sur la tête.

Invite : Cette photographie primée de Slim Aarons présente un homme-araignée déguisé en fée portant une robe rose duveteuse et tenant une baguette magique. Elle a été prise avec un appareil photo Fuji Superia X-TRA 800.

Les deux sont cool, mais Midjourney a pris en compte le style de l'artiste ainsi que l'effet d'une caméra argentique, tandis que Dall-E 3 a ignoré le plan complet et ne l'a pas pris en compte.

invite : fée de l'URSS avec des ailes et un costume d'astronaute

Nous avons également pris la décision de tester une photo avec des fées, mais Dall-E 3 a obstinément refusé de coopérer. Midjourney n'a pas ignoré les ailes car la référence avec les ailes avait été ajoutée. Lorsque Dall-E 3 a pris une photo, elle a offert des possibilités intrigantes, mais avec une Américaine.

invite : un escargot posant pour un portrait tout en portant une tenue hipster contemporaine, des couches et des textures complexes 4K, une conception détaillée des personnages et un grain de film. L’arrière-plan présente des scènes vibrantes, fantaisistes et colorées.

Midjourney a fait un travail fantastique, mais nous souhaitons attirer une attention particulière sur la façon dont Dall-E 3 a créé les effets du film dans l'image en haut à droite et a ajouté sa propre écriture blanche ; ça s'est bien passé.

invite : Spider-Man, Batman et Iron Man se sont réunis pour boire une bière dans un bar.

Dall-E 3 a réussi à réaliser à nouveau très docilement tous les héros de l'invite dans une seule image. Midjourney j'ai essayé très fort et j'ai même failli réussir.

Invite : Salade d'été de tomates et de concombres, macro, scène complète, couleurs chaudes, hyperréaliste photoréaliste de haute qualité, éclairage naturel, Unreal 5 Engine, étalonnage des couleurs, photographie éditoriale, photographie, séance photo, grand, épique, artgerm, photo avec un objectif 70 mm, profondeur de champ, DOF, flou d'inclinaison, vitesse d'obturation 1/1000, F/22, balance des blancs, 32k, super-résolution

À première vue, il semble que les deux soient bons, mais une inspection plus minutieuse révèle que le Dall-E 3 manque de volume photoréaliste et que Midjourney manipulé les joints avec des fourchettes avec fracas.

invite : un McDonald's dans le style de paysages spatiaux imaginatifs avec des figures humaines réalistes, deux voitures et un tracteur, avec une lune au-dessus. Les Nasbis, Pierre Pellegrini, saturation audacieuse, scientifique et pionnière, firecore

Les deux générateurs maîtrisent leurs domaines respectifs, Dall-E 3 excellant en texte et Midjourney exceller dans le photoréalisme.

Le sèche-cheveux BaByliss D570DE est utilisé dans un intérieur moderne avec un éclairage du soir, un design industriel et des couleurs pastel, parfait pour une séance photo en studio.

La physique et la géométrie des sèche-cheveux sont difficiles à comprendre Midjourney. Vous pouvez passer beaucoup de temps à vous battre avec des essais et des références, et parfois les résultats ressemblent à un sèche-cheveux, mais Dall-E 3 a produit un résultat acceptable du premier coup et a même écrit le texte.

invite : photo de Turanga Leela borgne de futurama

Le seul œil est bon, mais c'est une autre histoire. Dans Midjourney, nous avons écrit une invite négative – pas de dessin animé, d’illustration, plat, deux yeux. Dall-E 3 a immédiatement obéi et a fait un œil, un sourire et un coup de chapeau, mais il a catégoriquement refusé que quiconque la prenne en photo.

L'acteur Brad Pitt est vu dans les années 1990 en train d'arroser les plates-bandes d'un potager dans une datcha russe tout en portant un débardeur rayé et un pantalon de survêtement adidas. La scène a été capturée sur Agfa Vista 400.

Midjourney a rendu la génération pas comme Brad, nous avons donc utilisé le service supplémentaire Insight Échange de visage mettre le visage de Brad sur la génération ; il y avait un post à ce sujet ici. Dall-E 3 sait qui est Brad Pitt et peut dessiner des étoiles sans aucun logiciel supplémentaire.

invite : une belle fille, des licornes, des technologies Apple et un collage rétro vintage de galaxies

Les deux maillages sont bons, mais Dall-E 3 peut créer des cornes de licorne tout en Midjourney ne le peut généralement pas.

invite : une glace à la main, des vêtements de sport Nike et un superbe elfe fantastique assis à côté d'un orc sur une photo de rue.

Dall-E 3 a fait du bon travail en mettant les personnages en action ; on peut voir un orc et un elfe avec des oreilles d'elfe. Il y a aussi une personne qui porte un survêtement Nike, mais ses yeux sont tachés. Les oreilles pointues des elfes sont pour la plupart ignorées par Midjourney, et Nike est également ignoré.

invite : dessin d'une fée de l'URSS habillée en astronaute

Lorsque l’« illustration » post-scriptum a été initialement exclue de l’invite, Dall-E 3 en a créé une. Nous avons alors décidé de le comparer à MidjourneyL'illustration. Alors que Midjourney Ressemblant davantage aux illustrations de l'ère soviétique et n'incluant pas les ailes de fée, Dall-E 3 a fait un travail fantastique en dessinant le marteau et la faucille. L'exemple de droite montre comment Dall-E 3 pourrait apparaître dans le texte.

invite : une datcha sur Jupiter, les anneaux orbitaux de la planète sont visibles au loin, un extraterrestre prépare un barbecue, des dessins de personnages complexes, des arrière-plans lumineux, farfelus et colorés, une correction des couleurs pastel à la manière des films de Wes Anderson, du grain de film et un Tokina AT -Objectif X 11-16 mm f/2.8 Pro dX II

Toutefois, Midjourney je suis entré dans le photoréalisme; il n'y a pas de personnage principal dans les images, seulement l'environnement, mais ça reste cool. Dall-E 3 ne voulait plus figurer sur la photo.

invite : grain de film, nourriture pour chien, conception de personnages complexe, couches et textures, scènes lumineuses, farfelues et colorées en arrière-plan et correction des couleurs pastel comme dans un film de Wes Anderson

Dall-E 3 contre. Midjourney: Avantages et inconvénients

Au fur et à mesure que les utilisateurs explorent cette technologie, plusieurs forces et limites notables sont apparues, permettant ainsi de mieux comprendre ses fonctionnalités.

Avantages:

  1. Obéissance rapide : L'une des caractéristiques les plus remarquables du Dall-E 3 est sa remarquable capacité à suivre les instructions avec précision. Les utilisateurs ont signalé que le modèle d'IA répond efficacement à un large éventail d'entrées, ce qui en fait un outil polyvalent pour diverses tâches.
  2. Créativité aux multiples facettes : Dall-E 3 présente la capacité de représenter plusieurs personnages dans une seule image, élargissant ainsi son potentiel de narration et de projets créatifs. Cette approche multiforme améliore son utilité dans différents domaines.
  3. Intégration de texte : Les utilisateurs ont noté la capacité du Dall-E 3 à intégrer de manière transparente du texte dans les images. Cette fonctionnalité facilite la création de contenu visuellement attrayant avec des éléments textuels intégrés.

Inconvénients:

  1. Clarté de l'image: Une limitation notable est la tendance de l’IA à produire des images avec des visages et des yeux flous. Bien qu’il excelle en termes de créativité, il lui manque parfois la clarté et la précision du contenu généré par l’homme.
  2. Cohérence des styles : Dall-E 3 ne reproduit pas systématiquement les styles d'artistes spécifiques, ce qui peut être un inconvénient pour ceux qui recherchent une émulation artistique précise.
  3. Exigence VPN : L'accès à Dall-E 3 nécessite actuellement l'utilisation d'un VPN, ce qui peut poser des problèmes d'accessibilité pour certains utilisateurs.
  4. Gestion des images: Les utilisateurs ont rencontré des limitations lors de la gestion des images générées sur le site Web Microsoft Bing. Notamment, il n'y a pas de fonction d'orientation du format et l'historique des images est limité aux téléchargements récents, nécessitant une copie immédiate pour une utilisation ultérieure.
  5. Vitesse de génération : Dans certains cas, le processus de génération dans Dall-E 3 s'est révélé plus lent que celui d'autres modèles d'IA.

Malgré ces limitations, le Dall-E 3 est très prometteur. Les utilisateurs et les experts reconnaissent son potentiel pour révolutionner la création de contenu et la narration. Comme OpenAI continue d'affiner et d'élargir ses offres, on s'attend à ce que les atouts du Dall-E 3 brillent encore plus, ce qui en fera un outil précieux dans divers domaines.

FAQ

Dall-E 3 et Midjourney ont leurs forces et leurs faiblesses. Dall-E 3 obéit particulièrement aux invites et peut intégrer du texte de manière transparente dans les images. Cependant, il produit parfois des images avec des visages et des yeux flous et peut ne pas reproduire de manière cohérente les styles d'artistes spécifiques. D'autre part, Midjourney excelle dans le photoréalisme mais ne capture pas toujours l'essence de certaines invites avec autant de précision que Dall-E 3.

L'article fournit des invites texte-image, présentant les résultats de Dall-E 3 et Midjourney, et explique les différences entre les deux générateurs d'art.

Les deux modèles d’IA ont leurs forces et leurs faiblesses. Par exemple, dans une invite concernant un astronaute sur Jupiter, Midjourney a légèrement surpassé Dall-E 3. Cependant, dans une autre invite concernant Wonder Woman, Dall-E 3 était plus précis dans la capture de l'essence de l'invite.

  • Obéissance prompte: Dall-E 3 suit avec précision les invites.
  • Créativité aux multiples facettes: Il peut représenter plusieurs personnages dans une seule image.
  • Intégration de texte: Dall-E 3 peut intégrer de manière transparente du texte dans des images.
  • Clarté de l'image: Il produit parfois des images avec des visages et des yeux flous.
  • Cohérence des styles: Dall-E 3 ne reproduit pas systématiquement les styles d'artistes spécifiques.
  • Gestion des images: Il existe des limitations lors de la gestion des images générées sur le site Web Microsoft Bing.
  • Vitesse de génération: Le processus de génération du Dall-E 3 peut être plus lent par rapport aux autres modèles d'IA.

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Plus d'articles
Damir Yalalov
Damir Yalalov

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Hot Stories
Rejoignez notre newsletter.
Dernières infos

L’appétit institutionnel augmente pour les ETF Bitcoin dans un contexte de volatilité

Les divulgations via les dépôts 13F révèlent que des investisseurs institutionnels notables se sont lancés dans les ETF Bitcoin, soulignant une acceptation croissante de...

En savoir plus

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Zeta Markets lance une communauté Airdrop, alloue 1% de l'offre de jetons Z aux communautés Solana
Marchés Rapport de nouvelles Technologie
Zeta Markets lance une communauté Airdrop, alloue 1% de l'offre de jetons Z aux communautés Solana
8 mai 2024
Les obligations numériques basées sur la blockchain de la KfW : un pas vers un écosystème financier plus transparent et plus efficace
La Brochure Logiciels Histoires et critiques Technologie
Les obligations numériques basées sur la blockchain de la KfW : un pas vers un écosystème financier plus transparent et plus efficace
8 mai 2024
Loi révisée sur les dons en Corée du Sud : est-ce un pas en avant ou en arrière pour la crypto-phianthropie ?
Crypto Wiki Digérer La Brochure Marchés Technologie
Loi révisée sur les dons en Corée du Sud : est-ce un pas en avant ou en arrière pour la crypto-phianthropie ?
8 mai 2024
L'IA générative en 2024 : tendances émergentes, avancées et perspectives d'avenir
AI Wiki Logiciels Histoires et critiques Technologie
L'IA générative en 2024 : tendances émergentes, avancées et perspectives d'avenir
8 mai 2024
CRYPTOMERIA LABS PTE. LTD.