AI Wiki Art Teknologi
Oktober 02, 2023

Dall-E 3 lwn. Midjourney: Perbandingan Besar Penjana Seni AI Termaju

Sertai kami dalam perjalanan yang mendebarkan ini sambil kami meneroka Dall-E 3 dan Midjourneykehalusan, kerumitan dan potensi yang belum diterokai. Artikel ini menyerlahkan perbandingan yang paling menarik berdasarkan penyelidikan yang dilakukan oleh Atachkina peminat AI; jika anda berminat untuk mengetahui lebih lanjut, klik pada pautan.

Dall-E 3 lwn. Midjourney: Perbandingan Besar Penjana Seni AI Termaju
Tips Pro
1. Membongkar 50 Gesaan Teks-ke-Imej Teratas untuk Penjana Seni AI Midjourney dan DALL-E.
2. Semarakkan Kreativiti Anda dengan 20 Penjana Seni Teks-ke-Imej AI Teratas daripada 2023.

Artikel ini menyediakan gesaan teks-ke-imej, imej yang menunjukkan hasil daripada Dall-E 3 dan Midjourney, dan penjelasan tentang perbezaan antara keduanya penjana seni. Mari kita mulakan.

segera: Seorang angkasawan berdiri di atas Musytari dan memerhati matahari terbit. antara muka futuristik, perspektif orang pertama, komander angkasa, meter hujan dan UI HUD Rise

Kedua-dua rangkaian saraf menunjukkan prestasi yang mengagumkan dalam kes ini, dengan Midjourney sedikit mengatasi prestasi yang lain.

gesaan: dirakam oleh Slim Aarons of Wonder Woman di dalam bilik, lapisan dan tekstur yang kompleks, reka bentuk watak terperinci, latar belakang dengan pemandangan yang terang, aneh dan berwarna-warni, pembetulan warna pastel seperti filem Wes Anderson, butiran filem dan Tokina AT-X 11-16mm f /2.8 pro dx ii

Dall-E 3 melakukan kerja yang lebih teruk di sini; ia mendapat warna-warna terang gaya, tetapi bukan kejelasan butiran; badan yang cacat muncul di latar belakang, dan wajah tidak berjaya sama sekali.

prompt: gambar katil siber yang comel dan montel di kediaman dalam taliannya
segera: fotografi studio komersial profesional untuk Nike; model dengan rambut panjang; pukulan seluruh badan; memakai baju-T Nike kuning air; jaket denim Nike yang luar biasa; beg nike mewah lembut kuning air; kasut nike ungu lembut; berdiri di atas latar belakang merah jambu-biru muda; latar belakang futuristik bentuk diperkemas kompleks dengan lampu latar; ditembak pada Hasselblad X1D;

Ia ternyata menarik kedua-dua tempat, tetapi Dall-E 3 sekali lagi bergelut dengan wajah. Sebaliknya, ia membuat beg kuning air mewah seperti yang diarahkan dalam gesaan, dan Midjourney tidak menghiraukannya. Dalam hal ini, Dall-E 3 sangat patuh dalam melaksanakan gesaan.

gesaan: figura buih surih sinar dalam warna pastel, arca wanita dengan kemasan logam, berkilat/berkilat, gelora bertenaga, teras merpati, pose tidak konvensional, seni anamorfik, iridescence/opalescence, gelung maklum balas video, mata berkilat, lengkung tebal, berkilat, figuratisme cecair
prompt: kolaj retro vintaj wira-wira, termasuk Wonder Woman, Captain America, Batman dan The Joker

Dan sekali lagi, sementara kedua-dua grid menghasilkan kolaj yang sangat baik, Dall-E 3 lebih setia kepada gesaan; ia menambah hanya wira yang kami nyatakan, ia tidak boleh berubah menjadi pelawak, dan ia melintasi kapten dengan Batman.

gesaan: gumpalan pengesanan sinar logam, seni anamorfik, perincian menarik perhatian, garis ketepatan, lengkung tebal, berkilat, kiasan bendalir, warna pastel, latar belakang gelap
gesaan: Lapisan dan tekstur yang ringkas, reka bentuk watak yang rumit, latar belakang yang terang, aneh dan berwarna-warni, pembetulan warna pastel ala filem Wes Anderson, butiran filem dan kanta Tokina at-x 11-16mm f/2.8 pro dx ii semuanya ada. dalam imej Spider-Man sedang berehat di atas sofa yang diambil oleh Slim Aarons.

Midjourney dapat menggabungkan gaya masing-masing dua artis dari gesaan, manakala Dall-E 3 hanya menambah banyak butiran sibuk dan warna-warna terang ke latar belakang.

gesaan: Gambar 80-an kucing gemuk comel tembam menyertai kelas aerobik sambil memakai legging harimau bintang yang lucu dan pakaian badan merah jambu diambil pada Kodak Gold 200.

Sekali lagi, kucing berada dalam bentuk terbaik, dan kedua-dua rangkaian saraf memahami kamera filem dengan sempurna. Walau bagaimanapun, Dall-E 3 malah menambah butiran pada gambar.

1990-an, Leonardo DiCaprio memainkan watak seorang ahli Jedi di dacha Rusia sambil memegang lightsaber dan memakai jumper hijau rajutan.

Dall-E 3 mencipta Leonardo DiCaprio muda dengan tekstur pelompat yang sejuk, menambah butiran filem dan skema warna dan dengan sangat sejuk mencerminkan rasa dacha Rusia. Midjourney adalah pemantul warna yang baik untuk filem itu, dan DiCaprio memberikan penampilan yang lebih matang.

gesaan: kolaj daripada Star Wars imej dalam gaya retro vintaj

Walaupun kedua-duanya rangkaian saraf mahir mencipta kolaj, jika anda melihat dengan teliti, Midjourney memesongkan muka dan beberapa bentuk objek, manakala Dall-E 3 lebih tepat dalam pelaksanaan watak-watak itu sendiri-bahkan ternyata Chewbacca.

gesaan: gambar gorgon medusa russian memakai pakaian jalanan Balenciaga hypebeast dan berjalan-jalan di jalan di Manhattan dengan ular untuk rambut

Apabila anda mengezum masuk pada gambar, anda akan dapati bahawa Dall-E 3 mempunyai mata yang kabur; Midjourney, sebaliknya, adalah sempurna. Dall-E 3 juga menetapkan jenama; ular di kepala kelihatan lebih hidup dan bergerak; Midjourney selalu membuat mereka berbaring, bukannya di atas kepala.

Prompt: Gambar pemenang anugerah oleh Slim Aarons ini menampilkan lelaki labah-labah yang menyamar sebagai bidadari memakai gaun gebu merah jambu dan memegang tongkat ajaib. Ia diambil dengan kamera Fuji Superia X-TRA 800.

Kedua-duanya keren, tetapi Midjourney menganggap gaya artis serta kesan kamera filem, sedangkan Dall-E 3 mengabaikan syot penuh dan tidak menganggapnya.

gesaan: dongeng USSR dengan sayap dan kostum angkasawan

Kami juga membuat keputusan untuk menguji gambar dengan pari-pari, tetapi Dall-E 3 dengan keras enggan bekerjasama. Midjourney tidak mengabaikan sayap kerana rujukan dengan sayap telah ditambah. Apabila Dall-E 3 mengambil gambar, ia menawarkan beberapa kemungkinan yang menarik, tetapi dengan seorang wanita Amerika.

gesaan: siput bergambar potret sambil memakai pakaian hipster kontemporari, lapisan dan tekstur kompleks 4K, reka bentuk watak terperinci dan butiran filem. Latar belakang menampilkan pemandangan yang rancak, aneh dan berwarna-warni.

Midjourney melakukan kerja yang hebat, tetapi kami ingin menarik perhatian khusus kepada bagaimana Dall-E 3 mencipta kesan filem dalam gambar kanan atas dan menambah tulisan tangan putih sendiri; ternyata hebat.

gesaan: Spider-Man, Batman dan Iron Man berkumpul untuk minum bir di sebuah bar.

Dall-E 3 dapat dengan sangat patuh menyedari semua wira gesaan dalam satu imej sekali lagi. Midjourney berusaha bersungguh-sungguh malah hampir berjaya.

Prompt: Salad musim panas tomato dan timun, makro, pemandangan penuh, warna hangat, hiperrealistik fotorealistik berkualiti tinggi, pencahayaan semula jadi, Unreal Engine 5, penggredan warna, fotografi editorial, fotografi, pemotretan, Tinggi, epik, artgerm, tangkapan dengan kanta 70mm, Depth of Field, DOF, Tilt Blur, Shutter Speed ​​1/1000, F/22, White Balance, 32k, Super-Resolution

Pada pandangan pertama, nampaknya kedua-duanya bagus, tetapi pemeriksaan lebih dekat mendedahkan bahawa Dall-E 3 tidak mempunyai volum fotorealistik dan itu Midjourney mengendalikan sendi dengan garpu dengan dentuman.

prompt: McDonald's dalam gaya landskap angkasa imaginatif dengan figura manusia yang realistik, dua kereta dan traktor, dengan bulan di atasnya. Les Nasbis, Pierre Pellegrini, berasaskan sains, penepuan berani perintis, firecore

Kedua-dua penjana mahir dalam bidang masing-masing, dengan Dall-E 3 cemerlang dalam teks dan Midjourney cemerlang dalam fotorealisme.

Pengering rambut BaByliss D570DE digunakan dalam ruang dalaman moden dengan pencahayaan malam, reka bentuk industri dan warna pastel, sesuai untuk penggambaran studio.

Fizik dan geometri pengering rambut adalah sukar Midjourney. Anda boleh menghabiskan banyak masa bergelut dengan percubaan dan rujukan, dan kadangkala hasilnya menyerupai pengering rambut, tetapi Dall-E 3 menghasilkan hasil yang boleh diterima pada percubaan pertama dan juga menulis teks.

gesaan: foto Turanga Leela bermata satu daripada futurama

Satu-satunya mata yang baik, tetapi itu cerita lain. Dalam Midjourney, kami menulis gesaan negatif – tiada kartun, ilustrasi, rata, dua mata. Dall-E 3 serta-merta mematuhi dan melepaskan sebelah mata, senyuman dan topi, tetapi ia menolak untuk membenarkan sesiapa mengambil gambarnya.

Pelakon Brad Pitt dilihat pada tahun 1990-an menyiram katil kebun sayur di atas dacha Rusia sambil memakai tank top berjalur dan seluar peluh dari adidas. Adegan itu dirakam di Agfa Vista 400.

Midjourney menjadikan generasi tidak seperti Brad, jadi kami menggunakan perkhidmatan tambahan Insight Bertukar Wajah untuk meletakkan wajah Brad pada generasi; ada catatan mengenainya di sini. Dall-E 3 tahu siapa Brad Pitt dan boleh melukis bintang tanpa sebarang perisian tambahan.

gesaan: seorang gadis cantik, unicorn, teknologi epal dan kolaj retro vintaj galaksi

Kedua-dua jerat adalah baik, tetapi Dall-E 3 boleh mencipta tanduk unicorn sementara Midjourney biasanya tidak boleh.

gesaan: ais krim di tangan, pakaian sukan nike dan bunian fantasi yang menakjubkan duduk di sebelah orc dalam gambar jalanan.

Dall-E 3 melakukan kerja yang baik untuk meletakkan watak-watak itu ke dalam tindakan; kita boleh melihat orc dan elf dengan telinga bunian. Ada juga yang memakai tracksuit Nike, tetapi matanya comot. Telinga runcing bunian kebanyakannya diabaikan oleh Midjourney, dan Nike juga tidak diendahkan.

gesaan: lukisan peri USSR berpakaian seperti angkasawan

Apabila postskrip "ilustrasi" pada mulanya ditinggalkan daripada gesaan, Dall-E 3 mencipta satu. Kami kemudian memutuskan untuk membandingkannya Midjourneyilustrasi. manakala Midjourney lebih menyerupai ilustrasi era Soviet dan tidak termasuk sayap dongeng, Dall-E 3 melakukan kerja yang hebat melukis tukul dan sabit. Contoh di sebelah kanan menunjukkan bagaimana Dall-E 3 mungkin muncul dalam teks.

gesaan: Sebuah dacha di Musytari, cincin orbit planet dapat dilihat dari jauh, makhluk asing memasak barbeku, reka bentuk watak yang rumit, latar belakang yang terang, aneh dan berwarna-warni, pembetulan warna pastel ala filem Wes Anderson, bijirin filem dan Tokina AT -X 11-16mm f/2.8 Kanta Pro dX II

Walau bagaimanapun, Midjourney pergi ke fotorealisme; tiada watak utama dalam imej, hanya persekitaran, tetapi masih sejuk. Dall-E 3 tidak mahu berada dalam foto itu lagi.

gesaan: bijirin filem, makanan anjing, reka bentuk watak yang rumit, lapisan dan tekstur, adegan cerah, aneh dan berwarna-warni di latar belakang, dan pembetulan warna pastel seperti dalam filem Wes Anderson

Dall-E 3 lwn. Midjourney: Kebaikan dan keburukan

Semasa pengguna meneroka teknologi ini, beberapa kekuatan dan batasan yang ketara telah terserlah, memberikan gambaran lanjut tentang fungsinya.

Kelebihan:

  1. Ketaatan segera: Salah satu ciri menonjol Dall-E 3 ialah keupayaannya yang luar biasa untuk mengikut gesaan dengan tepat. Pengguna telah melaporkan bahawa model AI bertindak balas dengan berkesan kepada pelbagai input, menjadikannya alat serba boleh untuk pelbagai tugas.
  2. Kreativiti pelbagai rupa: Dall-E 3 mempamerkan keupayaan untuk menggambarkan berbilang watak dalam satu imej, mengembangkan potensinya untuk projek bercerita dan kreatif. Pendekatan pelbagai rupa ini meningkatkan utilitinya merentas domain yang berbeza.
  3. Penyepaduan Teks: Pengguna telah melihat kecekapan Dall-E 3 dalam menyepadukan teks dengan lancar ke dalam imej. Ciri ini memudahkan penciptaan kandungan yang menarik secara visual dengan elemen teks terbenam.

Cons:

  1. Kejelasan Imej: Had yang ketara ialah kecenderungan AI untuk menghasilkan imej dengan muka dan mata yang kabur. Walaupun ia cemerlang dalam kreativiti, ia kadangkala tidak mempunyai kejelasan dan ketepatan yang dilihat dalam kandungan yang dihasilkan manusia.
  2. Ketekalan Gaya: Dall-E 3 tidak secara konsisten meniru gaya artis tertentu, yang mungkin menjadi kelemahan bagi mereka yang mencari emulasi artistik yang tepat.
  3. Keperluan VPN: Akses kepada Dall-E 3 pada masa ini memerlukan penggunaan VPN, yang mungkin menimbulkan cabaran kebolehaksesan untuk sesetengah pengguna.
  4. Pengurusan Imej: Pengguna telah menghadapi had semasa menguruskan imej yang dijana pada tapak web Microsoft Bing. Terutamanya, tiada fungsi orientasi format dan sejarah imej terhad kepada muat naik terbaharu, yang memerlukan penyalinan segera untuk kegunaan kemudian.
  5. Kelajuan Penjanaan: Dalam sesetengah kes, proses penjanaan dalam Dall-E 3 telah dilaporkan lebih perlahan berbanding model AI yang lain.

Walaupun had ini, Dall-E 3 memegang janji yang besar. Pengguna dan pakar sama-sama mengiktiraf potensinya untuk merevolusikan penciptaan kandungan dan penceritaan. Sebagai OpenAI terus memperhalusi dan mengembangkan penawarannya, dijangkakan kekuatan Dall-E 3 akan lebih bersinar, menjadikannya alat yang berharga dalam pelbagai bidang.

Soalan Lazim

Kedua-dua Dall-E 3 dan Midjourney mempunyai kekuatan dan kelemahan mereka. Dall-E 3 amat mematuhi gesaan dan boleh menyepadukan teks dengan lancar ke dalam imej. Walau bagaimanapun, ia kadangkala menghasilkan imej dengan muka dan mata yang kabur dan mungkin tidak secara konsisten meniru gaya artis tertentu. Sebaliknya, Midjourney cemerlang dalam fotorealisme tetapi mungkin tidak selalu menangkap intipati gesaan tertentu setepat Dall-E 3.

Artikel itu menyediakan gesaan teks-ke-imej, mempamerkan hasil daripada kedua-dua Dall-E 3 dan Midjourney, dan menerangkan perbezaan antara dua penjana seni.

Kedua-dua model AI mempunyai kekuatan dan kelemahan mereka. Sebagai contoh, dalam gesaan tentang seorang angkasawan di Musytari, Midjourney sedikit mengatasi prestasi Dall-E 3. Walau bagaimanapun, dalam gesaan lain tentang Wonder Woman, Dall-E 3 lebih tepat dalam menangkap intipati gesaan itu.

  • Ketaatan Segera: Dall-E 3 mengikut gesaan dengan tepat.
  • Kreativiti Pelbagai Rupa: Ia boleh menggambarkan berbilang aksara dalam satu imej.
  • Integrasi Teks: Dall-E 3 boleh menyepadukan teks ke dalam imej dengan lancar.
  • Kejelasan Imej: Ia kadangkala menghasilkan imej dengan muka dan mata kabur.
  • Ketekalan Gaya: Dall-E 3 tidak secara konsisten meniru gaya artis tertentu.
  • Pengurusan Imej: Terdapat had semasa menguruskan imej yang dijana pada tapak web Microsoft Bing.
  • Kelajuan Penjanaan: Proses penjanaan Dall-E 3 boleh menjadi lebih perlahan berbanding model AI yang lain.

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Lebih Lanjut
Maklumat Lanjut
Zeta Markets Memulakan Komuniti Airdrop, Memperuntukkan 1% Daripada Bekalan Token Z Kepada Komuniti Solana
pasaran Laporan Berita Teknologi
Zeta Markets Memulakan Komuniti Airdrop, Memperuntukkan 1% Daripada Bekalan Token Z Kepada Komuniti Solana
Semoga 8, 2024
Bon Digital Berasaskan Blockchain KfW: Lonjakan Ke Arah Ekosistem Kewangan yang Lebih Telus dan Cekap
Perniagaan perisian Cerita dan Ulasan Teknologi
Bon Digital Berasaskan Blockchain KfW: Lonjakan Ke Arah Ekosistem Kewangan yang Lebih Telus dan Cekap
Semoga 8, 2024
Akta Derma Disemak Korea Selatan: Adakah Ia Satu Langkah Ke Hadapan atau Ke Belakang untuk Kedermawanan Kripto?
Crypto Wiki Digest Perniagaan pasaran Teknologi
Akta Derma Disemak Korea Selatan: Adakah Ia Satu Langkah Ke Hadapan atau Ke Belakang untuk Kedermawanan Kripto?
Semoga 8, 2024
AI Generatif pada 2024: Aliran Muncul, Terobosan dan Tinjauan Masa Depan
AI Wiki perisian Cerita dan Ulasan Teknologi
AI Generatif pada 2024: Aliran Muncul, Terobosan dan Tinjauan Masa Depan
Semoga 8, 2024