Dall-E 3 vs. Midjourney: Una gran comparación de los generadores de arte con IA más avanzados
Únase a nosotros en este emocionante viaje mientras exploramos Dall-E 3 y MidjourneyLas sutilezas, complejidades y potencial sin explotar de. Este artículo destaca las comparaciones más intrigantes basadas en la investigación realizada por el entusiasta de la IA Atachkina; Si está interesado en obtener más información, haga clic en liga.
Consejos importantes |
---|
1. Descubre el Los 50 mensajes principales de conversión de texto a imagen para generadores de arte con IA Midjourney y DALL-E. |
2. Enciende tu creatividad con el Los 20 mejores generadores de arte de texto a imagen con IA de 2023. |
Este artículo proporciona un mensaje de texto a imagen, una imagen que muestra los resultados de Dall-E 3 y Midjourneyy una explicación de las diferencias entre los dos generadores de arte. Vamos a empezar.
Ambas redes neuronales funcionaron admirablemente en este caso, con el Midjourney superando ligeramente a los demás.
Dall-E 3 hizo un trabajo mucho peor aquí; consiguió los colores brillantes de los estilos, pero no la claridad de los detalles; Al fondo aparecían cuerpos deformes y los rostros no tenían ningún éxito.
Ambos lugares resultaron interesantes, pero Dall-E 3 volvió a tener problemas con las caras. En cambio, hizo una bolsa de felpa de color beige como se indica en el mensaje, y Midjourney lo ignoré. En este caso, Dall-E 3 fue muy obediente al ejecutar la indicación.
Y una vez más, si bien ambas cuadrículas crean excelentes collages, Dall-E 3 es más fiel al mensaje; agregó solo los héroes que especificamos, no podía convertirse en un comodín y cruzó al capitán con Batman.
Midjourney Pudo combinar los estilos respectivos de los dos artistas desde el mensaje, mientras que Dall-E 3 simplemente agregó muchos detalles ocupados y colores brillantes al fondo.
Los gatos vuelven a estar en plena forma y ambas redes neuronales comprenden perfectamente las cámaras de película. Sin embargo, Dall-E 3 incluso añade grano a las imágenes.
Dall-E 3 creó un joven Leonardo DiCaprio con texturas de jersey geniales, agregó grano de película y combinación de colores y reflejó muy fríamente la sensación de una dacha rusa. Midjourney Fue un buen reflector de color para la película y DiCaprio le dio una apariencia más madura.
Aunque ambos redes neuronales son expertos en crear collages, si miras de cerca, Midjourney distorsiona las caras y algunas formas de los objetos, mientras que Dall-E 3 es más preciso en la ejecución de los propios personajes; incluso resultó ser Chewbacca.
Cuando haces zoom en las fotografías, notarás que Dall-E 3 tiene los ojos borrosos; Midjourney, por otro lado, es impecable. Dall-E 3 también prescribió una marca; las serpientes en las cabezas parecen más vivas y en movimiento; Midjourney Siempre los hacía acostados, en lugar de boca arriba.
Ambos son geniales, pero Midjourney consideró el estilo del artista así como el efecto de una cámara cinematográfica, mientras que Dall-E 3 ignoró el plano de larga duración y no lo consideró.
También decidimos probar una fotografía con hadas, pero Dall-E 3 se negó obstinadamente a cooperar. Midjourney No ignoró las alas porque se había agregado la referencia con alas. Cuando Dall-E 3 tomó una fotografía, ofreció algunas posibilidades intrigantes, pero con una mujer estadounidense.
Midjourney hizo un trabajo fantástico, pero queremos llamar la atención especialmente sobre cómo Dall-E 3 creó los efectos de la película en la imagen superior derecha y agregó su propia escritura a mano en blanco; resultó genial.
Dall-E 3 pudo plasmar muy obedientemente a todos los héroes del mensaje en una sola imagen una vez más. Midjourney Se esforzó mucho e incluso estuvo cerca de lograrlo.
A primera vista, parece que ambos son buenos, pero una inspección más cercana revela que el Dall-E 3 carece de volumen fotorrealista y que Midjourney manejó las articulaciones con tenedores con fuerza.
Ambos generadores dominan sus respectivos campos, y Dall-E 3 destaca en texto y Midjourney destacando en fotorrealismo.
La física y la geometría de los secadores de pelo son difíciles para Midjourney. Puedes pasar mucho tiempo luchando con intentos y referencias, y ocasionalmente los resultados se parecen a un secador de pelo, pero Dall-E 3 produjo un resultado aceptable en el primer intento e incluso escribió el texto.
El único ojo es bueno, pero esa es otra historia. En Midjourney, escribimos un mensaje negativo: sin caricatura, ilustración, plano, dos ojos. Dall-E 3 obedeció inmediatamente e hizo un ojo, una sonrisa y se quitó el sombrero, pero se negó rotundamente a permitir que nadie le tomara una foto.
Midjourney hizo que a la generación no le gustara Brad, así que utilizamos el servicio adicional Insight Intercambio cara poner el rostro de Brad en la generación; hubo una publicación al respecto aquí. Dall-E 3 sabe quién es Brad Pitt y puede dibujar estrellas sin ningún software adicional.
Ambas mallas son buenas, pero Dall-E 3 puede crear cuernos de unicornio mientras Midjourney normalmente no puede.
Dall-E 3 hizo un buen trabajo al poner a los personajes en acción; podemos ver un orco y un elfo con orejas de elfo. También hay una persona que lleva un chándal Nike, pero tiene los ojos manchados. Las orejas puntiagudas de los elfos son en su mayoría ignoradas por Midjourney, y Nike tampoco se tiene en cuenta.
Cuando la “ilustración” posdata inicialmente se omitió del mensaje, Dall-E 3 creó una. Entonces decidimos compararlo con MidjourneyLa ilustración. Mientras Midjourney Se parecía más a las ilustraciones de la era soviética y no incluía las alas de hadas, Dall-E 3 hizo un trabajo fantástico dibujando la hoz y el martillo. El ejemplo de la derecha muestra cómo podría aparecer Dall-E 3 en el texto.
Sin embargo, Midjourney entró en el fotorrealismo; No hay ningún personaje principal en las imágenes, solo el entorno, pero aun así es genial. Dall-E 3 no quería volver a aparecer en la foto.
Dall-E 3 vs. Midjourney: Pros y contras
A medida que los usuarios exploran esta tecnología, han salido a la luz varias fortalezas y limitaciones notables, lo que arroja más información sobre su funcionalidad.
Pros:
- Obediencia inmediata: Una de las características más destacadas de Dall-E 3 es su notable capacidad para seguir indicaciones con precisión. Los usuarios han informado que el modelo de IA responde eficazmente a una amplia gama de entradas, lo que lo convierte en una herramienta versátil para diversas tareas.
- Creatividad multifacética: Dall-E 3 exhibe la capacidad de representar múltiples personajes dentro de una sola imagen, ampliando su potencial para contar historias y proyectos creativos. Este enfoque multifacético mejora su utilidad en diferentes dominios.
- Integración de texto: Los usuarios han notado la habilidad de Dall-E 3 para integrar texto perfectamente en imágenes. Esta característica facilita la creación de contenido visualmente atractivo con elementos textuales incrustados.
Contras:
- Claridad de imagen: Una limitación notable es la tendencia de la IA a producir imágenes con rostros y ojos borrosos. Si bien sobresale en creatividad, a veces carece de la claridad y precisión que se ven en el contenido generado por humanos.
- Consistencia de estilo: Dall-E 3 no replica consistentemente los estilos de artistas específicos, lo que puede ser un inconveniente para quienes buscan una emulación artística precisa.
- Requisito de VPN: Actualmente, el acceso a Dall-E 3 requiere el uso de una VPN, lo que puede plantear desafíos de accesibilidad para algunos usuarios.
- Gestión de imágenes: Los usuarios han encontrado limitaciones al administrar las imágenes generadas en el sitio web de Microsoft Bing. En particular, no hay una función de orientación de formato y el historial de imágenes está restringido a cargas recientes, lo que requiere una copia inmediata para su uso posterior.
- Velocidad de generación: En algunos casos, se ha informado que el proceso de generación en Dall-E 3 es más lento en comparación con otros modelos de IA.
A pesar de estas limitaciones, Dall-E 3 es muy prometedor. Tanto los usuarios como los expertos reconocen su potencial para revolucionar la creación de contenidos y la narración de historias. Como OpenAI continúa perfeccionando y ampliando su oferta, se espera que los puntos fuertes de Dall-E 3 brillen aún más, convirtiéndolo en una herramienta valiosa en diversos campos.
Preguntas Frecuentes
Tanto Dall-E 3 como Midjourney tienen sus fortalezas y debilidades. Dall-E 3 obedece notablemente las indicaciones y puede integrar texto perfectamente en imágenes. Sin embargo, a veces produce imágenes con rostros y ojos borrosos y es posible que no reproduzca de manera consistente los estilos de artistas específicos. Por otro lado, Midjourney sobresale en fotorrealismo, pero es posible que no siempre capture la esencia de ciertas indicaciones con tanta precisión como Dall-E 3.
El artículo proporciona indicaciones de texto a imagen, que muestran los resultados de Dall-E 3 y Midjourneyy explica las diferencias entre los dos generadores de arte.
Ambos modelos de IA tienen sus fortalezas y debilidades. Por ejemplo, en una pregunta sobre un astronauta en Júpiter, Midjourney superó ligeramente a Dall-E 3. Sin embargo, en otro mensaje sobre Wonder Woman, Dall-E 3 fue más preciso al capturar la esencia del mensaje.
- Obediencia inmediata: Dall-E 3 sigue las indicaciones con precisión.
- Creatividad multifacética: Puede representar varios personajes en una sola imagen.
- Integración de texto: Dall-E 3 puede integrar perfectamente texto en imágenes.
- Claridad de imagen: A veces produce imágenes con caras y ojos borrosos.
- Coherencia de estilo: Dall-E 3 no replica consistentemente los estilos de artistas específicos.
- Manejo de imagen: Existen limitaciones al administrar imágenes generadas en el sitio web de Microsoft Bing.
- Velocidad de generación: El proceso de generación de Dall-E 3 puede ser más lento en comparación con otros modelos de IA.
Observación
En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.
Sobre el Autor
Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.
Más artículosDamir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.