AI Wiki Arte Tecnología
02 de Octubre de 2023

Dall-E 3 vs. Midjourney: Una gran comparación de los generadores de arte con IA más avanzados

Únase a nosotros en este emocionante viaje mientras exploramos Dall-E 3 y MidjourneyLas sutilezas, complejidades y potencial sin explotar de. Este artículo destaca las comparaciones más intrigantes basadas en la investigación realizada por el entusiasta de la IA Atachkina; Si está interesado en obtener más información, haga clic en liga.

Dall-E 3 vs. Midjourney: Una gran comparación de los generadores de arte con IA más avanzados
Consejos importantes
1. Descubre el Los 50 mensajes principales de conversión de texto a imagen para generadores de arte con IA Midjourney y DALL-E.
2. Enciende tu creatividad con el Los 20 mejores generadores de arte de texto a imagen con IA de 2023.

Este artículo proporciona un mensaje de texto a imagen, una imagen que muestra los resultados de Dall-E 3 y Midjourneyy una explicación de las diferencias entre los dos generadores de arte. Vamos a empezar.

Mensaje: Un astronauta se encuentra en Júpiter y observa la salida del sol. interfaz futurista, perspectiva en primera persona, comandante espacial, pluviómetro y interfaz de usuario HUD Rise

Ambas redes neuronales funcionaron admirablemente en este caso, con el Midjourney superando ligeramente a los demás.

Mensaje: filmada por Slim Aarons de Wonder Woman en la habitación, capas y texturas complejas, diseño detallado de personajes, fondo con escenas brillantes, extravagantes y coloridas, corrección de colores pastel como las películas de Wes Anderson, grano de película y Tokina AT-X 11-16 mm f /2.8 pro dx ii

Dall-E 3 hizo un trabajo mucho peor aquí; consiguió los colores brillantes de los estilos, pero no la claridad de los detalles; Al fondo aparecían cuerpos deformes y los rostros no tenían ningún éxito.

Aviso: imagen de una linda y gordita cibercuna en su residencia en línea.
mensaje: fotografía de estudio comercial profesional para Nike; modelo con pelo largo; toma de cuerpo completo; vistiendo una camiseta Nike beige; chaqueta vaquera Nike inusual; bolso Nike de felpa suave color beige; zapatillas Nike de color morado suave; de pie sobre un fondo azul rosa claro; fondo futurista de una forma compleja y estilizada con retroiluminación; filmada con Hasselblad X1D;

Ambos lugares resultaron interesantes, pero Dall-E 3 volvió a tener problemas con las caras. En cambio, hizo una bolsa de felpa de color beige como se indica en el mensaje, y Midjourney lo ignoré. En este caso, Dall-E 3 fue muy obediente al ejecutar la indicación.

Indicaciones: figura de burbuja con trazado de rayos en colores pastel, escultura femenina con acabados metálicos, brillante/brillante, turbulencia vibrante, pigeoncore, poses poco convencionales, arte anamórfico, iridiscencia/opalescencia, bucles de retroalimentación de vídeo, ojos brillantes, curvas atrevidas, figuratismo brillante y fluido.
Aviso: un collage retro antiguo de superhéroes, incluidos Wonder Woman, Capitán América, Batman y The Joker.

Y una vez más, si bien ambas cuadrículas crean excelentes collages, Dall-E 3 es más fiel al mensaje; agregó solo los héroes que especificamos, no podía convertirse en un comodín y cruzó al capitán con Batman.

Indicaciones: mancha de trazado de rayos metálico, arte anamórfico, detalles llamativos, líneas precisas, curvas atrevidas, figuratismo fluido y brillante, colores pastel, fondo oscuro
Aviso: Capas y texturas simples, diseño de personajes intrincado, fondos vívidos, caprichosos y coloridos, corrección de color pastel al estilo de las películas de Wes Anderson, grano de película y una lente Tokina at-x 11-16 mm f/2.8 pro dx ii están todos presentes. en esta imagen de Spider-Man relajándose en un sofá tomada por Slim Aarons.

Midjourney Pudo combinar los estilos respectivos de los dos artistas desde el mensaje, mientras que Dall-E 3 simplemente agregó muchos detalles ocupados y colores brillantes al fondo.

Aviso: Una fotografía de los años 80 de lindos gatos gordos y regordetes participando en una clase de aeróbic mientras lucían divertidas mallas de leopardo y monos rosas fue tomada con una Kodak Gold 200.

Los gatos vuelven a estar en plena forma y ambas redes neuronales comprenden perfectamente las cámaras de película. Sin embargo, Dall-E 3 incluso añade grano a las imágenes.

Años 1990, Leonardo DiCaprio interpreta a un maestro Jedi en una dacha rusa mientras empuña un sable láser y viste un jersey verde de punto.

Dall-E 3 creó un joven Leonardo DiCaprio con texturas de jersey geniales, agregó grano de película y combinación de colores y reflejó muy fríamente la sensación de una dacha rusa. Midjourney Fue un buen reflector de color para la película y DiCaprio le dio una apariencia más madura.

mensaje: un collage de Star Wars imágenes en un estilo retro vintage

Aunque ambos redes neuronales son expertos en crear collages, si miras de cerca, Midjourney distorsiona las caras y algunas formas de los objetos, mientras que Dall-E 3 es más preciso en la ejecución de los propios personajes; incluso resultó ser Chewbacca.

Mensaje: una imagen de una gorgona medusa rusa vistiendo ropa urbana hypebeast de Balenciaga y paseando por una calle de Manhattan con serpientes en lugar de cabello.

Cuando haces zoom en las fotografías, notarás que Dall-E 3 tiene los ojos borrosos; Midjourney, por otro lado, es impecable. Dall-E 3 también prescribió una marca; las serpientes en las cabezas parecen más vivas y en movimiento; Midjourney Siempre los hacía acostados, en lugar de boca arriba.

Aviso: Esta fotografía galardonada de Slim Aarons muestra a un hombre araña disfrazado de hada con un vestido rosa esponjoso y sosteniendo una varita mágica. Fue tomada con una cámara Fuji Superia X-TRA 800.

Ambos son geniales, pero Midjourney consideró el estilo del artista así como el efecto de una cámara cinematográfica, mientras que Dall-E 3 ignoró el plano de larga duración y no lo consideró.

mensaje: Hada de la URSS con alas y disfraz de astronauta

También decidimos probar una fotografía con hadas, pero Dall-E 3 se negó obstinadamente a cooperar. Midjourney No ignoró las alas porque se había agregado la referencia con alas. Cuando Dall-E 3 tomó una fotografía, ofreció algunas posibilidades intrigantes, pero con una mujer estadounidense.

Mensaje: un caracol posando para un retrato mientras viste un atuendo hipster contemporáneo, capas y texturas complejas en 4K, diseño de personajes detallado y grano de película. El fondo presenta escenas vibrantes, extravagantes y coloridas.

Midjourney hizo un trabajo fantástico, pero queremos llamar la atención especialmente sobre cómo Dall-E 3 creó los efectos de la película en la imagen superior derecha y agregó su propia escritura a mano en blanco; resultó genial.

Mensaje: Spider-Man, Batman y Iron Man se reunieron para tomar una cerveza en un bar.

Dall-E 3 pudo plasmar muy obedientemente a todos los héroes del mensaje en una sola imagen una vez más. Midjourney Se esforzó mucho e incluso estuvo cerca de lograrlo.

Aviso: Ensalada de verano de tomates y pepinos, macro, escena completa, colores cálidos, alta calidad fotorrealista hiperrealista, iluminación natural, 5 Unreal Engine, gradación de color, fotografía editorial, fotografía, sesión de fotos, Alto, épico, artgerm, toma con una lente de 70 mm, Profundidad de campo, DOF, Desenfoque de inclinación, Velocidad de obturación 1/1000, F/22, Balance de blancos, 32k, Superresolución

A primera vista, parece que ambos son buenos, pero una inspección más cercana revela que el Dall-E 3 carece de volumen fotorrealista y que Midjourney manejó las articulaciones con tenedores con fuerza.

Mensaje: un McDonald's al estilo de los paisajes espaciales imaginativos con figuras humanas realistas, dos coches y un tractor, con una luna encima. Les Nasbis, Pierre Pellegrini, basado en la ciencia, pionero en saturación audaz, firecore

Ambos generadores dominan sus respectivos campos, y Dall-E 3 destaca en texto y Midjourney destacando en fotorrealismo.

El secador de pelo BaByliss D570DE se utiliza en un interior moderno con iluminación nocturna, diseño industrial y colores pastel, perfecto para una sesión de estudio.

La física y la geometría de los secadores de pelo son difíciles para Midjourney. Puedes pasar mucho tiempo luchando con intentos y referencias, y ocasionalmente los resultados se parecen a un secador de pelo, pero Dall-E 3 produjo un resultado aceptable en el primer intento e incluso escribió el texto.

mensaje: foto de Turanga Leela tuerto de futurama

El único ojo es bueno, pero esa es otra historia. En Midjourney, escribimos un mensaje negativo: sin caricatura, ilustración, plano, dos ojos. Dall-E 3 obedeció inmediatamente e hizo un ojo, una sonrisa y se quitó el sombrero, pero se negó rotundamente a permitir que nadie le tomara una foto.

Se ve al actor Brad Pitt en la década de 1990 regando los huertos de una dacha rusa mientras viste una camiseta sin mangas a rayas y pantalones deportivos de adidas. La escena fue capturada con Agfa Vista 400.

Midjourney hizo que a la generación no le gustara Brad, así que utilizamos el servicio adicional Insight Intercambio cara poner el rostro de Brad en la generación; hubo una publicación al respecto aquí. Dall-E 3 sabe quién es Brad Pitt y puede dibujar estrellas sin ningún software adicional.

Mensaje: una hermosa niña, unicornios, tecnologías de Apple y un collage retro antiguo de galaxias.

Ambas mallas son buenas, pero Dall-E 3 puede crear cuernos de unicornio mientras Midjourney normalmente no puede.

Mensaje: helado en mano, ropa deportiva Nike y un impresionante elfo de fantasía sentado junto a un orco en una foto de la calle.

Dall-E 3 hizo un buen trabajo al poner a los personajes en acción; podemos ver un orco y un elfo con orejas de elfo. También hay una persona que lleva un chándal Nike, pero tiene los ojos manchados. Las orejas puntiagudas de los elfos son en su mayoría ignoradas por Midjourney, y Nike tampoco se tiene en cuenta.

mensaje: dibujo de un hada de la URSS vestida de astronauta

Cuando la “ilustración” posdata inicialmente se omitió del mensaje, Dall-E 3 creó una. Entonces decidimos compararlo con MidjourneyLa ilustración. Mientras Midjourney Se parecía más a las ilustraciones de la era soviética y no incluía las alas de hadas, Dall-E 3 hizo un trabajo fantástico dibujando la hoz y el martillo. El ejemplo de la derecha muestra cómo podría aparecer Dall-E 3 en el texto.

Mensaje: Una dacha en Júpiter, los anillos orbitales del planeta se pueden ver en la distancia, un extraterrestre cocina una barbacoa, diseños de personajes intrincados, fondos brillantes, extravagantes y coloridos, corrección de colores pastel al estilo de las películas de Wes Anderson, grano de película y un Tokina AT -Lente X 11-16 mm f/2.8 Pro dX II

Sin embargo, Midjourney entró en el fotorrealismo; No hay ningún personaje principal en las imágenes, solo el entorno, pero aun así es genial. Dall-E 3 no quería volver a aparecer en la foto.

Mensaje: grano de película, comida para perros, diseño de personajes intrincados, capas y texturas, escenas brillantes, extravagantes y coloridas de fondo y corrección de colores pastel como en una película de Wes Anderson.

Dall-E 3 vs. Midjourney: Pros y contras

A medida que los usuarios exploran esta tecnología, han salido a la luz varias fortalezas y limitaciones notables, lo que arroja más información sobre su funcionalidad.

Pros:

  1. Obediencia inmediata: Una de las características más destacadas de Dall-E 3 es su notable capacidad para seguir indicaciones con precisión. Los usuarios han informado que el modelo de IA responde eficazmente a una amplia gama de entradas, lo que lo convierte en una herramienta versátil para diversas tareas.
  2. Creatividad multifacética: Dall-E 3 exhibe la capacidad de representar múltiples personajes dentro de una sola imagen, ampliando su potencial para contar historias y proyectos creativos. Este enfoque multifacético mejora su utilidad en diferentes dominios.
  3. Integración de texto: Los usuarios han notado la habilidad de Dall-E 3 para integrar texto perfectamente en imágenes. Esta característica facilita la creación de contenido visualmente atractivo con elementos textuales incrustados.

Contras:

  1. Claridad de imagen: Una limitación notable es la tendencia de la IA a producir imágenes con rostros y ojos borrosos. Si bien sobresale en creatividad, a veces carece de la claridad y precisión que se ven en el contenido generado por humanos.
  2. Consistencia de estilo: Dall-E 3 no replica consistentemente los estilos de artistas específicos, lo que puede ser un inconveniente para quienes buscan una emulación artística precisa.
  3. Requisito de VPN: Actualmente, el acceso a Dall-E 3 requiere el uso de una VPN, lo que puede plantear desafíos de accesibilidad para algunos usuarios.
  4. Gestión de imágenes: Los usuarios han encontrado limitaciones al administrar las imágenes generadas en el sitio web de Microsoft Bing. En particular, no hay una función de orientación de formato y el historial de imágenes está restringido a cargas recientes, lo que requiere una copia inmediata para su uso posterior.
  5. Velocidad de generación: En algunos casos, se ha informado que el proceso de generación en Dall-E 3 es más lento en comparación con otros modelos de IA.

A pesar de estas limitaciones, Dall-E 3 es muy prometedor. Tanto los usuarios como los expertos reconocen su potencial para revolucionar la creación de contenidos y la narración de historias. Como OpenAI continúa perfeccionando y ampliando su oferta, se espera que los puntos fuertes de Dall-E 3 brillen aún más, convirtiéndolo en una herramienta valiosa en diversos campos.

Preguntas Frecuentes

Tanto Dall-E 3 como Midjourney tienen sus fortalezas y debilidades. Dall-E 3 obedece notablemente las indicaciones y puede integrar texto perfectamente en imágenes. Sin embargo, a veces produce imágenes con rostros y ojos borrosos y es posible que no reproduzca de manera consistente los estilos de artistas específicos. Por otro lado, Midjourney sobresale en fotorrealismo, pero es posible que no siempre capture la esencia de ciertas indicaciones con tanta precisión como Dall-E 3.

El artículo proporciona indicaciones de texto a imagen, que muestran los resultados de Dall-E 3 y Midjourneyy explica las diferencias entre los dos generadores de arte.

Ambos modelos de IA tienen sus fortalezas y debilidades. Por ejemplo, en una pregunta sobre un astronauta en Júpiter, Midjourney superó ligeramente a Dall-E 3. Sin embargo, en otro mensaje sobre Wonder Woman, Dall-E 3 fue más preciso al capturar la esencia del mensaje.

  • Obediencia inmediata: Dall-E 3 sigue las indicaciones con precisión.
  • Creatividad multifacética: Puede representar varios personajes en una sola imagen.
  • Integración de texto: Dall-E 3 puede integrar perfectamente texto en imágenes.
  • Claridad de imagen: A veces produce imágenes con caras y ojos borrosos.
  • Coherencia de estilo: Dall-E 3 no replica consistentemente los estilos de artistas específicos.
  • Manejo de imagen: Existen limitaciones al administrar imágenes generadas en el sitio web de Microsoft Bing.
  • Velocidad de generación: El proceso de generación de Dall-E 3 puede ser más lento en comparación con otros modelos de IA.

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Hot Stories
Suscríbase a nuestro boletín.
Últimas Noticias

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más

Los fundadores de Samourai Wallet son acusados ​​de facilitar 2 millones de dólares en acuerdos en la Darknet

La detención de los fundadores de Samourai Wallet representa un revés notable para la industria, lo que subraya la persistente...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Pantera Capital invierte en TON Blockchain y expresa confianza en el potencial de Telegram para ampliar la accesibilidad a las criptomonedas
Empresa Informe de noticias Tecnología
Pantera Capital invierte en TON Blockchain y expresa confianza en el potencial de Telegram para ampliar la accesibilidad a las criptomonedas
2 de mayo de 2024
Mitosis recauda 7 millones de dólares en financiación de Amber Group y Foresight Ventures para avanzar en su protocolo de liquidez modular
Empresa Informe de noticias Tecnología
Mitosis recauda 7 millones de dólares en financiación de Amber Group y Foresight Ventures para avanzar en su protocolo de liquidez modular
2 de mayo de 2024
Galxe se asocia con Jambo para ampliar la accesibilidad global a Web3
Empresa Informe de noticias Tecnología
Galxe se asocia con Jambo para ampliar la accesibilidad global a Web3
2 de mayo de 2024
Med-Gemini de Google está listo para dar una ventaja a GPT-4 Con su desempeño superior en atención médica
AI Wiki Noticias Software Tecnología
Med-Gemini de Google está listo para dar una ventaja a GPT-4 Con su desempeño superior en atención médica
2 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.