AI Wiki 宝品 テクノロジー
2023 年 10 月 02 日

ダルイー 3 vs. Midjourney: 最先端のAIアートジェネレーターを大比較

Dall-E 3 を探索するこのスリル満点の旅に参加してください。 Midjourneyの繊細さ、複雑さ、そして未開発の可能性。 この記事では、AI 愛好家の Atachkina が行った調査に基づいた最も興味深い比較を紹介します。 さらに詳しく知りたい場合は、 .

ダルイー 3 vs. Midjourney: 最先端のAIアートジェネレーターを大比較
プロのヒント
1. 明らかにする テキストから画像へのプロンプト トップ 50 AIアートジェネレーター向け Midjourney そしてDALL-E。
2. あなたの創造性に火をつけてください。 AI テキストから画像へのアート ジェネレーター トップ 20 2023の。

この記事では、テキストから画像へのプロンプト、Dall-E 3 の結果を示す画像、および Midjourney、および XNUMX つの違いの説明 アートジェネレーター。 さぁ、始めよう。

プロンプト: 宇宙飛行士が木星に立って日の出を観察します。 未来的なインターフェイス、一人称視点、スペースコマンダー、レインメーター、HUD Rise UI

この場合、両方のニューラル ネットワークが見事に機能しました。 Midjourney 他のものよりわずかに優れています。

プロンプト: ワンダーウーマンのスリム・アーロンズが部屋で撮影、複雑なレイヤーとテクスチャ、詳細なキャラクターデザイン、明るく奇抜でカラフルなシーンの背景、ウェス・アンダーソン映画のようなパステルカラー補正、フィルムグレインとTokina AT-X 11-16mm f /2.8プロDXⅡ

Dall-E 3 はここではさらにひどい仕事をしました。 スタイルの明るい色は得られましたが、細部の鮮明さは得られませんでした。 背景には変形した体が現れ、顔はまったくうまくいきませんでした。

プロンプト: オンライン住居にあるかわいい、ぽっちゃりしたサイバーコットの写真
プロンプト: ナイキのプロの商業スタジオ撮影。 長い髪のモデル。 全身ショット。 ベージュのナイキ T シャツを着ています。 珍しいナイキのデニムジャケット。 ソフトベージュのぬいぐるみナイキバッグ。 柔らかい紫色のナイキスニーカー。 明るいピンクと青の背景の上に立っています。 バックライト付きの複雑な流線形の未来的な背景。 ハッセルブラッド X1D で撮影。

どちらの場所でも興味深い結果となったが、Dall-E 3 はまたも顔に苦戦した。 代わりに、プロンプトの指示に従って豪華なベージュのバッグを作成しました。 Midjourney それを無視した。 この例では、Dall-E 3 は非常に従順に指示を実行しました。

プロンプト: パステル カラーのレイ トレーシングされたバブル フィギュア、メタリック仕上げの女性の彫刻、光沢のある/光沢のある、活気のある乱気流、ピジョンコア、型破りなポーズ、アナモルフィック アート、虹色/乳白光、ビデオ フィードバック ループ、光沢のある目、大胆な曲線、光沢のある、流動的な具象表現
プロンプト: ワンダーウーマン、キャプテン アメリカ、バットマン、ジョーカーなどのスーパーヒーローのヴィンテージのレトロなコラージュ

もう一度言いますが、どちらのグリッドも優れたコラージュを作成しますが、Dall-E 3 はプロンプトにより忠実です。 私たちが指定したヒーローのみが追加され、ジョーカーになることはできず、キャプテンとバットマンが交差しました。

プロンプト: メタリック レイ トレーシングのブロブ、アナモフィック アート、目を引くディテール、精密なライン、大胆な曲線、光沢のある流動的な具象表現、パステル カラー、暗い背景
プロンプト: シンプルなレイヤーとテクスチャ、複雑なキャラクター デザイン、鮮やかで奇抜でカラフルな背景、ウェス アンダーソン映画風のパステル カラー補正、フィルム グレイン、Tokina at-x 11-16mm f/2.8 pro dx ii レンズがすべて存在します。スリム・アーロンズが撮影したソファでくつろぐスパイダーマンのこの画像。

Midjourney Dall-E 3 はプロンプトから XNUMX 人のアーティストのそれぞれのスタイルを組み合わせることができましたが、Dall-E XNUMX は背景に多くの忙しい詳細と明るい色を追加しただけです。

プロンプト: 面白いヒョウのレギンスとピンクのボディスーツを着てエアロビクスのクラスに参加しているぽっちゃりしたかわいい太った猫の 80 年代の写真は、Kodak Gold 200 で撮影されました。

もう一度言いますが、猫たちは絶好調で、どちらのニューラル ネットワークもフィルム カメラを完全に理解しています。 ただし、Dall-E 3 は写真に粒状感を加えます。

1990年代、レオナルド・ディカプリオは、ライトセーバーを振り回し、緑色のニットジャンパーを着て、ロシアのダーチャでジェダイ・マスターを演じていた。

Dall-E 3 は、クールなジャンパー テクスチャを使用して若いレオナルド ディカプリオを作成し、フィルム グレインと配色を追加して、ロシアのダーチャの雰囲気を非常にクールに反映しました。 Midjourney は映画にぴったりの色の反射材であり、ディカプリオは彼女により成熟した外観を与えました。

プロンプト: のコラージュ スターウォーズ ヴィンテージレトロなスタイルの画像

両方とも ニューラルネットワーク よく見ると、コラージュを作るのが上手です。 Midjourney Dall-E 3 は顔や一部のオブジェクトの形状を歪めますが、Dall-E XNUMX はキャラクター自体の実行がより正確であり、チューバッカであることが判明しました。

プロンプト: バレンシアガのハイプビーストのストリートウェアを着て、髪にヘビを付けてマンハッタンの通りを散歩しているロシアのゴルゴン メドゥーサの写真

写真を拡大すると、Dall-E 3 の目がぼやけていることがわかります。 Midjourney一方、完璧です。 Dall-E 3 ではブランドも規定されています。 頭の上のヘビはより生き生きと動いているように見えます。 Midjourney 常に頭の上ではなく、横たわらせました。

プロンプト: スリム・アーロンズによる受賞歴のあるこの写真には、ピンクのふわふわのドレスを着て魔法の杖を持った妖精に変装したスパイダーマンが写っています。 Fuji Superia X-TRA 800 カメラで撮影しました。

どちらもカッコいいですが、 Midjourney Dall-E 3 はアーティストのスタイルとフィルムカメラの効果を考慮していましたが、Dall-E XNUMX は全身ショットを無視し、考慮していませんでした。

プロンプト: 翼と宇宙飛行士の衣装を持つソ連の妖精

妖精との写真撮影もテストすることにしたが、Dall-E 3は頑なに協力を拒否した。 Midjourney 翼付きの参照が追加されているため、翼は無視されませんでした。 Dall-E 3 が実際に写真を撮ったとき、いくつかの興味深い可能性が示されましたが、相手はアメリカ人女性でした。

プロンプト: 現代的な流行に敏感な服装、4K の複雑なレイヤーとテクスチャ、詳細なキャラクター デザイン、フィルム グレインを着てポートレートのポーズをとるカタツムリ。 背景には、活気に満ちた、奇抜で、カラフルなシーンが描かれています。

Midjourney は素晴らしい仕事をしましたが、Dall-E 3 が右上の写真のフィルム効果をどのように作成し、独自の白い手書き文字を追加したかに特に注目していただきたいと思います。 それは素晴らしかったです。

プロンプト: スパイダーマン、バットマン、アイアンマンはバーでビールを飲みに集まりました。

Dall-E 3 は、プロンプトのすべてのヒーローを XNUMX つの画像に非常に素直にもう一度実現することができました。 Midjourney とても一生懸命努力して、成功に近づくところまで来ました。

プロンプト: トマトとキュウリのサマーサラダ、マクロ、フルシーン、温かみのある色、高品質のフォトリアリスティック、ハイパーリアリスティック、自然光、 アンリアルエンジン5, カラーグレーディング, エディトリアル写真, 写真, 写真撮影, 背の高い, エピック, アートジャーム, 70mm レンズで撮影, 被写界深度, DOF, チルトブラー, シャッタースピード 1/1000, F/22, ホワイトバランス, 32k, 超解像度

一見すると、どちらも優れているように見えますが、よく見てみると、Dall-E 3 にはフォトリアリスティックなボリュームが欠けており、 Midjourney 関節をフォークでバタンと扱いました。

プロンプト: 現実的な人物、XNUMX 台の車、トラクターを備えた想像力豊かな宇宙風景のスタイルのマクドナルド、その上に月があります。 Les Nasbis、ピエール ペレグリーニ、科学ベース、先駆的な大胆な彩度、ファイアコア

どちらのジェネレーターもそれぞれの分野に精通しており、Dall-E 3 はテキストと Midjourney フォトリアリズムに優れています。

ヘアドライヤー BaByliss D570DE は、夜の照明、インダストリアル デザイン、パステル カラーを備えたモダンなインテリアで使用されており、スタジオ撮影に最適です。

ヘアドライヤーの物理学と形状は難しいです。 Midjourney。 試行と参照に苦労するのに多くの時間を費やし、場合によっては結果がヘアドライヤーに似てしまうこともありますが、Dall-E 3 は最初の試行で満足のいく結果を生成し、テキストも書きました。

プロンプト: フューチュラマの片目のトゥランガ・リーラの写真

目だけは良いのですが、それはまた別の話です。 で Midjourney、私たちは否定的なプロンプトを書きました – 漫画、イラスト、平らな、3 つの目はありません。 Dall-E XNUMX はすぐに従って、片目で微笑み、帽子を脱ぎましたが、誰にも写真を撮らせることをきっぱりと拒否しました。

俳優のブラッド・ピットは、1990年代にアディダスのストライプのタンクトップとスウェットパンツを着て、ロシアのダーチャの菜園の苗床に水やりをしているところを捉えられている。 このシーンは Agfa Vista 400 で撮影されました。

Midjourney この世代はブラッドのようなものではなかったので、追加のサービス Insight を使用しました フェイススワップ ブラッドの顔をこの世代に伝えるために。 それについての投稿がここにありました。 Dall-E 3 はブラッド ピットが誰であるかを知っており、追加のソフトウェアなしで星を描くことができます。

プロンプト: 美しい少女、ユニコーン、Apple テクノロジー、銀河のヴィンテージのレトロなコラージュ

どちらのメッシュも優れていますが、Dall-E 3 はユニコーンの角を作成できます。 Midjourney 通常はできません。

プロンプト: アイスクリームを手に、ナイキのスポーツウェアを持ち、ストリート写真ではオークの隣に座っている見事なファンタジーのエルフ。

Dall-E 3 はキャラクターを行動に移すのに良い仕事をしました。 エルフの耳を持ったオークとエルフが見えます。 ナイキのジャージを着ている人もいますが、目が汚れています。 エルフのとがった耳はほとんど無視されます。 Midjourney、ナイキも無視されます。

プロンプト: 宇宙飛行士の格好をしたソ連の妖精の絵

追記の「イラスト」が当初プロンプトに表示されなかったとき、Dall-E 3 が作成しました。 次にそれを比較することにしました Midjourneyさんのイラストです。 その間 Midjourney ソ連時代のイラストによく似ており、妖精の羽は含まれていませんでしたが、Dall-E 3 はハンマーと鎌を素晴らしい仕事で描きました。 右の例は、Dall-E 3 がテキスト内でどのように表示されるかを示しています。

プロンプト: 木星のダーチャ、遠くに見える惑星の軌道輪、バーベキューを作るエイリアン、複雑なキャラクターデザイン、明るく風変わりでカラフルな背景、ウェス・アンダーソン映画風のパステルカラー補正、フィルムグレイン、トキナーAT -X 11-16mm f/2.8 Pro dX II レンズ

しかしながら、 Midjourney フォトリアリズムに移行しました。 主人公は映っておらず、周囲だけが映っていますが、それでもかっこいいです。 Dall-E 3 は再び写真に写りたくなかった。

プロンプト: フィルム グレイン、ドッグ フード、複雑なキャラクター デザイン、レイヤーとテクスチャ、背景の明るく風変わりでカラフルなシーン、ウェス アンダーソン映画のようなパステル カラー補正

ダルイー 3 vs. Midjourney:長所と短所

ユーザーがこのテクノロジーを探索すると、いくつかの注目すべき長所と制限が明らかになり、その機能についてのさらなる洞察が得られます。

長所:

  1. 即時の服従: Dall-E 3 の傑出した機能の XNUMX つは、プロンプトに正確に従う驚くべき能力です。 ユーザーは、AI モデルが広範囲の入力に効果的に応答し、さまざまなタスクに多用途のツールになっていると報告しています。
  2. 多面的な創造性: Dall-E 3 は、単一の画像内に複数のキャラクターを描写する機能を示し、ストーリーテリングやクリエイティブなプロジェクトの可能性を広げます。 この多面的なアプローチにより、さまざまなドメインにわたってその有用性が高まります。
  3. テキストの統合: ユーザーは、Dall-E 3 がテキストを画像にシームレスに統合する能力に優れていることに注目しています。 この機能により、テキスト要素が埋め込まれた視覚的に魅力的なコンテンツの作成が容易になります。

短所:

  1. 画像の明瞭さ: 注目すべき制限は、AI が顔や目がぼやけた画像を生成する傾向があることです。 創造性には優れていますが、人間が作成したコンテンツに見られるような明瞭さと正確さに欠けることがあります。
  2. スタイルの一貫性: Dall-E 3 は特定のアーティストのスタイルを一貫して複製しているわけではありません, これは、正確な芸術的なエミュレーションを求める人にとっては欠点になるかもしれません。
  3. VPN 要件: 現在、Dall-E 3 にアクセスするには VPN を使用する必要があり、一部のユーザーにとってはアクセシビリティの問題が生じる可能性があります。
  4. 画像管理: ユーザーは、Microsoft Bing Web サイトで生成されたイメージを管理するときに制限に遭遇しました。 特に、フォーマット指向機能はなく、画像履歴は最近のアップロードに制限されているため、後で使用するためにすぐにコピーする必要があります。
  5. 生成速度: 場合によっては、Dall-E 3 の生成プロセスが他の AI モデルに比べて遅いと報告されています。

こうした制限にもかかわらず、Dall-E 3 には大きな可能性が秘められています。 ユーザーも専門家も同様に、コンテンツ作成とストーリーテリングに革命をもたらす可能性を認識しています。 として OpenAI Dall-E 3 は今後も製品の改良と拡張を続けることで、Dall-E XNUMX の強みがさらに輝き、さまざまな分野で価値あるツールとなることが期待されています。

よくあるご質問

Dall-E 3 と Midjourney それぞれの長所と短所があります。 Dall-E 3 はプロンプトに特に従順で、テキストを画像にシームレスに統合できます。 ただし、顔や目がぼやけた画像が生成される場合があり、特定のアーティストのスタイルを一貫して複製できない場合があります。 一方で、 Midjourney フォトリアリズムに優れていますが、Dall-E 3 ほど正確に特定のプロンプトの本質を常に捉えているとは限りません。

この記事では、テキストから画像へのプロンプトを提供し、Dall-E 3 と Midjourney、XNUMXつのアートジェネレーターの違いについて説明します。

どちらの AI モデルにも長所と短所があります。 たとえば、木星の宇宙飛行士についてのプロンプトでは、 Midjourney ただし、ワンダーウーマンに関する別のプロンプトでは、Dall-E 3 の方がプロンプトの本質をより正確に捉えていました。

  • 即時の服従: Dall-E 3 はプロンプトに正確に従います。
  • 多面的な創造性:XNUMX枚の画像内に複数のキャラクターを描くことができます。
  • テキストの統合: Dall-E 3 は、テキストを画像にシームレスに統合できます。
  • 画像の明瞭さ: 顔や目がぼやけた画像が生成されることがあります。
  • スタイルの一貫性: Dall-E 3 は、特定のアーティストのスタイルを一貫して複製するわけではありません。
  • 画像管理: Microsoft Bing Web サイトで生成されたイメージを管理する場合には制限があります。
  • 生成速度: Dall-E 3 の生成プロセスは、他の AI モデルに比べて遅くなる可能性があります。

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

より多くの記事
ダミル・ヤラロフ
ダミル・ヤラロフ

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

Hot Stories
ニュースレターにご参加ください。
最新ニュース

ボラティリティの中でビットコインETFへの機関投資家の意欲が高まる

13Fの提出書類による開示では、著名な機関投資家がビットコインETFに手を出していることが明らかになり、...

詳細を知りたい

量刑の日が到来:米国裁判所が司法省の申し立てを検討する中、CZの運命は均衡を保っている

Changpeng Zhao氏は本日、シアトルの米国裁判所で判決を受ける予定である。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
Radiant CapitalがRFP-34提案を開始し、weETHがイーサリアムとアービトラム展開にオンボーディングすることを提案
ニュースレポート テクノロジー
Radiant CapitalがRFP-34提案を開始し、weETHがイーサリアムとアービトラム展開にオンボーディングすることを提案
2024 年 5 月 7 日
仮想通貨取引所バイナンス、8月XNUMX日に新たな取引ペアを立ち上げ、取引ボットを利用可能に
マーケット ニュースレポート テクノロジー
仮想通貨取引所バイナンス、8月XNUMX日に新たな取引ペアを立ち上げ、取引ボットを利用可能に
2024 年 5 月 7 日
Stacks、Moonriver Network、Hedera、Iron Fish が Axelar のインターチェーン アンプ プログラムに参加
ニュースレポート テクノロジー
Stacks、Moonriver Network、Hedera、Iron Fish が Axelar のインターチェーン アンプ プログラムに参加
2024 年 5 月 7 日
テスラ、ドージコインを採用:テスラのオンラインショップでの支払いオプションとしてミームコインが大幅に強化
マーケット ストーリーとレビュー テクノロジー
テスラ、ドージコインを採用:テスラのオンラインショップでの支払いオプションとしてミームコインが大幅に強化
2024 年 5 月 7 日
CRYPTOMERIA LABS PTE。 株式会社。