Dall-E 3 vs. Midjourney: Una gran comparació dels generadors d'art d'IA més avançats
Uneix-te a nosaltres en aquest emocionant viatge mentre explorem Dall-E 3 i Midjourneysubtileses, complexitats i potencial sense explotar. Aquest article destaca les comparacions més intrigants basades en la investigació realitzada per l'entusiasta de la IA Atachkina; si estàs interessat en aprendre més, fes clic a enllaç.
Consells Pro |
---|
1. Descobriu el Els 50 principals missatges de text a imatge per a AI Art Generators Midjourney i DALL-E. |
2. Enceneu la vostra creativitat amb el Els 20 millors generadors d'art de text a imatge d'IA de 2023. |
Aquest article proporciona un missatge de text a imatge, una imatge que mostra els resultats de Dall-E 3 i Midjourney, i una explicació de les diferències entre ambdós generadors d'art. Anem a començar.
Ambdues xarxes neuronals van tenir un rendiment admirable en aquest cas, amb el Midjourney superant lleugerament els altres.
Dall-E 3 va fer una feina molt pitjor aquí; va obtenir els colors brillants dels estils, però no la claredat dels detalls; al fons van aparèixer cossos deformats i les cares no van tenir gens d'èxit.
Van resultar interessants els dos llocs, però Dall-E 3 va tornar a lluitar amb les cares. En lloc d'això, va fer una bossa beix de peluix tal com s'indica a la indicació i Midjourney ho va ignorar. En aquest cas, Dall-E 3 va ser molt obedient a l'hora de dur a terme la indicació.
I una vegada més, mentre que ambdues graelles fan collages excel·lents, Dall-E 3 és més fidel a la indicació; va afegir només els herois que vam especificar, no es podia convertir en un bromista i va creuar el capità amb Batman.
Midjourney va poder combinar els estils respectius dels dos artistes des del missatge, mentre que Dall-E 3 només va afegir molts detalls ocupats i colors brillants al fons.
Una vegada més, els gats estan en plena forma i ambdues xarxes neuronals comprenen perfectament les càmeres de pel·lícula. Tanmateix, Dall-E 3 fins i tot afegeix gra a les imatges.
Dall-E 3 va crear un jove Leonardo DiCaprio amb unes textures de pont genials, va afegir gra de pel·lícula i un esquema de color i va reflectir molt fredament la sensació d'una casa rural russa. Midjourney va ser un bon reflector de color per a la pel·lícula i DiCaprio li va donar una aparença més madura.
Encara que tots dos xarxes neuronals són experts en la creació de collages, si us fixeu bé, Midjourney distorsiona cares i algunes formes d'objectes, mentre que Dall-E 3 és més precís en l'execució dels propis personatges, fins i tot va resultar ser Chewbacca.
Quan amplieu les fotografies, notareu que Dall-E 3 té els ulls borrosos; Midjourney, en canvi, és impecable. Dall-E 3 també va prescriure una marca; les serps dels caps semblen estar més vives i en moviment; Midjourney sempre els feia estirats, més que al cap.
Tots dos són genials, però Midjourney va considerar l'estil de l'artista així com l'efecte d'una càmera de cinema, mentre que Dall-E 3 va ignorar el pla de llargada i no ho va tenir en compte.
També vam prendre la decisió de provar una foto amb fades, però Dall-E 3 es va negar obstinadament a cooperar. Midjourney no ignorava les ales perquè s'havia afegit la referència amb ales. Quan Dall-E 3 va fer una foto, va oferir algunes possibilitats intrigants, però amb una dona americana.
Midjourney va fer un treball fantàstic, però volem cridar l'atenció especial sobre com Dall-E 3 va crear els efectes de la pel·lícula a la imatge superior dreta i va afegir una escriptura blanca pròpia; va sortir genial.
Dall-E 3 va poder adonar-se de manera molt obedient de tots els herois de la indicació en una imatge una vegada més. Midjourney es va esforçar molt i fins i tot va estar a prop d'aconseguir-ho.
A primera vista, sembla que tots dos són bons, però una inspecció més detallada revela que el Dall-E 3 no té volum fotorealista i que Midjourney manejava les articulacions amb forquilles amb un cop.
Tots dos generadors són competents en els seus respectius camps, amb Dall-E 3 excel·lent en text i Midjourney destacant en el fotorealisme.
La física i la geometria dels assecadors de cabells són difícils Midjourney. Podeu passar molt de temps lluitant amb proves i referències, i de vegades els resultats s'assemblen a un assecador de cabells, però Dall-E 3 va produir un resultat acceptable al primer intent i fins i tot va escriure el text.
L'únic ull és bo, però això és una altra història. En Midjourney, vam escriure una indicació negativa: sense dibuixos animats, il·lustracions, plans, dos ulls. Dall-E 3 va obeir immediatament i va fer un ull, un somriure i es va treure el barret, però es va negar rotundament a deixar que ningú li fes una foto.
Midjourney va fer que la generació no fos com Brad, així que vam utilitzar el servei addicional Insight Face Swap posar la cara de Brad a la generació; hi havia una publicació sobre això aquí. Dall-E 3 sap qui és Brad Pitt i pot dibuixar estrelles sense cap programari addicional.
Les dues malles són bones, però Dall-E 3 pot crear banyes d'unicorn mentre Midjourney normalment no pot.
Dall-E 3 va fer una bona feina posant els personatges en acció; podem veure un orc i un elf amb orelles d'elf. També hi ha una persona que porta un xandall de Nike, però té els ulls tacats. Les orelles punxegudes elfes són ignorades en la seva majoria Midjourney, i Nike també és ignorat.
Quan la "il·lustració" postdata es va deixar inicialment fora de l'indicador, Dall-E 3 en va crear una. Aleshores vam decidir comparar-ho Midjourneyla il·lustració de. Mentre Midjourney s'assemblava més a les il·lustracions de l'època soviètica i no incloïa les ales de fades, Dall-E 3 va fer un treball fantàstic dibuixant la falç i el martell. L'exemple de la dreta mostra com podria aparèixer Dall-E 3 al text.
No obstant això, Midjourney va entrar al fotorealisme; no hi ha cap personatge principal a les imatges, només l'entorn, però encara és genial. Dall-E 3 no volia tornar a estar a la foto.
Dall-E 3 vs. Midjourney: Pros i contres
A mesura que els usuaris exploren aquesta tecnologia, han sortit a la llum diversos punts forts i limitacions notables, que ofereixen una visió més detallada de la seva funcionalitat.
Pros:
- Obediència ràpida: Una de les característiques més destacades de Dall-E 3 és la seva notable capacitat per seguir les indicacions amb precisió. Els usuaris han informat que el model d'IA respon eficaçment a una àmplia gamma d'entrada, el que el converteix en una eina versàtil per a diverses tasques.
- Creativitat polifacètica: Dall-E 3 mostra la capacitat de representar diversos personatges dins d'una sola imatge, ampliant el seu potencial per a la narració d'històries i projectes creatius. Aquest enfocament polifacètic millora la seva utilitat en diferents dominis.
- Integració de text: Els usuaris han observat la competència de Dall-E 3 a l'hora d'integrar text perfectament a les imatges. Aquesta característica facilita la creació de contingut visualment atractiu amb elements textuals incrustats.
Contres:
- Claritat de la imatge: Una limitació notable és la tendència de la IA a produir imatges amb cares i ulls borrosos. Tot i que sobresurt en creativitat, de vegades no té la claredat i la precisió que es veuen en el contingut generat per humans.
- Coherència d'estil: Dall-E 3 no replica constantment els estils d'artistes específics, que pot ser un inconvenient per a aquells que busquen una emulació artística precisa.
- Requisit de VPN: Actualment, l'accés a Dall-E 3 requereix l'ús d'una VPN, cosa que pot suposar problemes d'accessibilitat per a alguns usuaris.
- Gestió d'imatges: Els usuaris s'han trobat amb limitacions a l'hora de gestionar les imatges generades al lloc web de Microsoft Bing. En particular, no hi ha cap funció d'orientació de format i l'historial d'imatges està restringit a les càrregues recents, la qual cosa requereix una còpia immediata per a un ús posterior.
- Velocitat de generació: En alguns casos, s'ha informat que el procés de generació a Dall-E 3 és més lent en comparació amb altres models d'IA.
Malgrat aquestes limitacions, Dall-E 3 té una promesa substancial. Tant els usuaris com els experts reconeixen el seu potencial per revolucionar la creació de contingut i la narració de històries. Com OpenAI continua perfeccionant i ampliant la seva oferta, s'espera que els punts forts de Dall-E 3 brillin encara més, convertint-lo en una eina valuosa en diversos camps.
Preguntes freqüents
Tant Dall-E 3 com Midjourney tenen els seus punts forts i febles. Dall-E 3 és notablement obedient a les indicacions i pot integrar text perfectament a les imatges. Tanmateix, de vegades produeix imatges amb cares i ulls borrosos i és possible que no reprodueixin de manera coherent els estils d'artistes específics. Per altra banda, Midjourney sobresurt en el fotorealisme, però potser no sempre capta l'essència de determinades indicacions amb tanta precisió com Dall-E 3.
L'article proporciona indicacions de text a imatge, que mostren els resultats tant de Dall-E 3 com Midjourney, i explica les diferències entre els dos generadors d'art.
Tots dos models d'IA tenen els seus punts forts i febles. Per exemple, en un missatge sobre un astronauta a Júpiter, Midjourney va superar lleugerament el Dall-E 3. No obstant això, en una altra indicació sobre Wonder Woman, Dall-E 3 va ser més precisa a l'hora de capturar l'essència de la indicació.
- Obediència ràpida: Dall-E 3 segueix les indicacions amb precisió.
- Creativitat polifacètica: pot representar diversos personatges en una sola imatge.
- Integració de textos: Dall-E 3 pot integrar text a les imatges de manera perfecta.
- Claredat de la imatge: De vegades produeix imatges amb cares i ulls borrosos.
- Coherència d'estil: Dall-E 3 no replica constantment els estils d'artistes específics.
- Gestió d’imatges: hi ha limitacions a l'hora de gestionar les imatges generades al lloc web de Microsoft Bing.
- Velocitat de generació: El procés de generació de Dall-E 3 pot ser més lent en comparació amb altres models d'IA.
renúncia
En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.
About The Autor
Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.
més articlesDamir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.