达尔-E 3 vs. Midjourney:最先进的人工智能艺术生成器的大比较
与我们一起踏上这段激动人心的旅程,探索 Dall-E 3 和 Midjourney的微妙性、复杂性和未开发的潜力。 本文重点介绍了基于人工智能爱好者 Atachkina 所做研究的最有趣的比较; 如果您有兴趣了解更多信息,请点击 链接.
专业技巧 |
---|
1. 揭开 前 50 个文本转图像提示 适用于 AI 艺术生成器 Midjourney 和达尔-E。 |
2. 激发你的创造力 前 20 名 AI 文本转图像艺术生成器 2023。 |
本文提供了文本转图像提示,图像显示了 Dall-E 3 的结果以及 Midjourney,以及两者之间差异的解释 艺术发电机。 让我们开始。
在这种情况下,两个神经网络都表现出色, Midjourney 稍微优于其他人。
Dall-E 3 在这里做得更糟糕; 它得到了款式的鲜艳色彩,但没有细节的清晰; 背景中出现了变形的尸体,面孔一点也不成功。
事实证明,这两个地方都很有趣,但 Dall-E 3 再次在面孔上遇到了困难。 相反,它按照提示中的说明制作了一个毛绒米色包,并且 Midjourney 忽略了它。 在这种情况下,Dall-E 3非常听话地执行了提示。
再说一次,虽然两个网格都能制作出出色的拼贴画,但 Dall-E 3 更忠实于提示; 它只添加了我们指定的英雄,它不能变成小丑,而且它把队长和蝙蝠侠交叉了。
Midjourney 能够从提示中结合两位艺术家各自的风格,而 Dall-E 3 只是在背景中添加了很多繁杂的细节和鲜艳的色彩。
猫再次处于最佳状态,并且两个神经网络都完美地理解胶片相机。 然而,Dall-E 3 甚至为图片添加了颗粒感。
Dall-E 3 塑造了年轻的莱昂纳多·迪卡普里奥,带有酷炫的毛衣纹理,添加了胶片颗粒和配色方案,非常酷地体现了俄罗斯别墅的感觉。 Midjourney 为电影起到了很好的色彩反光作用,迪卡普里奥给了她更成熟的外表。
两者都有 神经网络 擅长创作拼贴画,如果你仔细观察, Midjourney 扭曲了脸部和一些物体形状,而 Dall-E 3 在角色本身的执行上更加准确——甚至证明是楚巴卡。
当你放大照片时,你会发现 Dall-E 3 的眼睛很模糊; Midjourney,另一方面,是完美无缺的。 Dall-E 3还规定了一个品牌; 头上的蛇显得更有活力、更活跃; Midjourney 总是让它们躺着,而不是头朝下。
两者都很酷,但是 Midjourney 考虑了艺术家的风格以及胶片摄影机的效果,而Dall-E 3忽略了全身镜头,没有考虑。
我们也做出了和仙女们合影测试的决定,但Dall-E 3却执意不肯配合。 Midjourney 没有忽略翅膀,因为添加了翅膀的参考。 当 Dall-E 3 确实拍了一张照片时,它提供了一些有趣的可能性,但对象是一位美国女性。
Midjourney 做得非常出色,但我们想特别关注 Dall-E 3 如何在右上角的图片中创建电影效果并添加自己的白色手写体; 结果很棒。
Dall-E 3 能够非常乖巧地再次在一张图像中实现提示中的所有英雄。 Midjourney 非常努力,甚至接近成功。
乍一看,两者都不错,但仔细观察就会发现,Dall-E 3 缺乏逼真的体积,而且 Midjourney 用叉子处理关节时发出一声巨响。
两位生成器都精通各自的领域,其中 Dall-E 3 在文本和 Midjourney 擅长照片写实主义。
吹风机的物理和几何形状很难理解 Midjourney。 你可能会花很多时间在尝试和参考上苦苦挣扎,有时结果就像吹风机一样,但 Dall-E 3 在第一次尝试时就产生了可接受的结果,甚至写出了文本。
唯一的眼睛是好的,但那是另一个故事了。 在 Midjourney,我们写了一个负面提示——没有卡通、插画、扁平、两只眼睛。 Dall-E 3立即服从,做出一只眼睛、一个微笑、摘下帽子,但它断然拒绝让任何人给她拍照。
Midjourney 让这一代人不像布拉德,所以我们使用了额外的服务 Insight 面部交换 让布拉德的面容出现在这一代人面前; 这里有一篇关于它的帖子。 Dall-E 3 知道布拉德·皮特是谁,并且无需任何附加软件即可绘制星星。
两种网格都很好,但 Dall-E 3 可以创建独角兽角,而 Midjourney 通常不能。
Dall-E 3 很好地将角色付诸行动; 我们可以看到一个兽人和一个长着精灵耳朵的精灵。 还有一个人穿着耐克运动服,但眼睛被弄脏了。 精灵的尖耳朵大多被忽视 Midjourney,而耐克也无视。
当后记“插图”最初被排除在提示之外时,Dall-E 3 创建了一个。 然后我们决定将其与 Midjourney的插图。 尽管 Midjourney Dall-E 3 的锤子和镰刀的绘制非常类似于苏联时代的插图,并且不包括仙女翅膀。 右侧的示例显示了 Dall-E 3 在文本中的显示方式。
然而, Midjourney 进入照相写实主义; 图像中没有主角,只有周围的环境,但仍然很酷。 Dall-E 3 不想再出现在照片中。
达尔-E 3 vs. Midjourney:优点和缺点
随着用户探索这项技术,一些显着的优点和局限性逐渐显现出来,从而进一步了解其功能。
优点:
- 及时服从: Dall-E 3 的突出特点之一是其准确遵循提示的卓越能力。 用户报告说,人工智能模型可以有效地响应各种输入,使其成为执行各种任务的多功能工具。
- 多方面的创造力: Dall-E 3 展示了在单个图像中描绘多个角色的能力,扩展了其讲故事和创意项目的潜力。 这种多方面的方法增强了其在不同领域的实用性。
- 文本整合: 用户注意到 Dall-E 3 能够熟练地将文本无缝集成到图像中。 此功能有助于创建具有嵌入文本元素的视觉吸引力内容。
缺点:
- 图像清晰度: 一个显着的限制是人工智能倾向于生成面部和眼睛模糊的图像。 虽然它在创造力方面表现出色,但有时缺乏人类生成内容的清晰度和精确度。
- 风格一致性: Dall-E 3 并不能始终如一地复制特定艺术家的风格,这对于那些寻求精确艺术模拟的人来说可能是一个缺点。
- VPN 要求: 目前访问 Dall-E 3 需要使用 VPN,这可能会给某些用户带来访问挑战。
- 图像管理: 用户在管理 Microsoft Bing 网站上生成的图像时遇到了限制。 值得注意的是,没有格式定向功能,并且图像历史记录仅限于最近上传的图像,因此需要立即复制以供以后使用。
- 生成速度: 据报道,在某些情况下,Dall-E 3 中的生成过程比其他 AI 模型要慢。
尽管存在这些限制,Dall-E 3 仍具有巨大的前景。 用户和专家都认识到它彻底改变内容创作和故事讲述的潜力。 作为 OpenAI 随着Dall-E 3不断完善和扩展其产品,预计Dall-E XNUMX的优势将更加闪耀,使其成为各个领域的宝贵工具。
常见问题
Dall-E 3 和 Midjourney 有他们的优点和缺点。 Dall-E 3 特别服从提示,可以将文本无缝地集成到图像中。 然而,它有时会产生面部和眼睛模糊的图像,并且可能无法始终如一地复制特定艺术家的风格。 另一方面, Midjourney 擅长照片写实主义,但可能无法始终像 Dall-E 3 那样准确地捕捉某些提示的本质。
本文提供了文本到图像的提示,展示了 Dall-E 3 和 Midjourney,并解释了两种艺术生成器之间的差异。
这两种人工智能模型都有其优点和缺点。 例如,在有关木星上的太空人的提示中, Midjourney 稍微优于 Dall-E 3。不过,在另一篇有关《神奇女侠》的提示中,Dall-E 3 在捕捉提示的本质方面更为准确。
- 及时服从:Dall-E 3 准确地遵循提示。
- 多方面的创造力:它可以在单个图像中描绘多个字符。
- 文本整合:Dall-E 3 可以将文本无缝集成到图像中。
- 图像清晰度:有时会生成脸部和眼睛模糊的图像。
- 风格一致性:Dall-E 3 并不能始终如一地复制特定艺术家的风格。
- 影像管理:管理 Microsoft Bing 网站上生成的图像时存在限制。
- 生成速度:与其他 AI 模型相比,Dall-E 3 的生成过程可能较慢。
免责声明
在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。
关于作者
Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。
更多文章Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。