AI Wiki Seni Teknologi
Oktober 02, 2023

Dall-E 3 vs. Midjourney: Perbandingan Besar dari Generator AI Art Tercanggih

Bergabunglah bersama kami dalam perjalanan mendebarkan ini saat kami menjelajahi Dall-E 3 dan Midjourneykehalusan, kompleksitas, dan potensi yang belum dimanfaatkan. Artikel ini menyoroti perbandingan paling menarik berdasarkan penelitian yang dilakukan oleh penggila AI Atachkina; jika Anda tertarik untuk mempelajari lebih lanjut, klik link.

Dall-E 3 vs. Midjourney: Perbandingan Besar dari Generator AI Art Tercanggih
Tips Pro
1. Temukan 50 Perintah Teks-ke-Gambar Teratas untuk Generator Seni AI Midjourney dan DALL-E.
2. Kobarkan Kreativitas Anda dengan 20 Generator Seni Teks-ke-Gambar AI Teratas dari 2023.

Artikel ini menyediakan prompt teks-ke-gambar, gambar yang memperlihatkan hasil dari Dall-E 3 dan Midjourney, dan penjelasan perbedaan keduanya pembangkit seni. Mari kita mulai.

cepat: Seorang antariksa berdiri di Jupiter dan mengamati matahari terbit. antarmuka futuristik, perspektif orang pertama, komandan luar angkasa, pengukur hujan, dan HUD Rise UI

Kedua jaringan saraf memiliki kinerja yang mengagumkan dalam kasus ini, dengan Midjourney sedikit mengungguli yang lain.

cepat: diambil oleh Slim Aarons dari Wonder Woman di dalam ruangan, lapisan dan tekstur yang rumit, desain karakter yang detail, latar belakang dengan adegan yang cerah, imajinasi dan penuh warna, koreksi warna pastel seperti film Wes Anderson, butiran film dan Tokina AT-X 11-16mm f /2.8 pro dx ii

Dall-E 3 melakukan pekerjaan yang jauh lebih buruk di sini; ia mendapatkan warna-warna cerah dari gayanya, tetapi tidak memiliki kejelasan detailnya; tubuh cacat muncul di latar belakang, dan wajah sama sekali tidak berhasil.

prompt: gambar cybercot yang lucu dan gemuk di kediaman online-nya
prompt: fotografi studio komersial profesional untuk Nike; model dengan rambut panjang; tembakan seluruh tubuh; mengenakan kaos Nike krem; jaket denim Nike yang tidak biasa; tas nike mewah berwarna krem ​​lembut; sepatu kets nike ungu lembut; berdiri di atas latar belakang merah muda-biru muda; latar belakang futuristik dengan bentuk ramping yang kompleks dengan cahaya latar; ditembak pada Hasselblad X1D;

Ternyata kedua tempat itu menarik, tetapi Dall-E 3 sekali lagi kesulitan menghadapinya. Sebaliknya, itu membuat tas krem ​​​​yang mewah seperti yang diinstruksikan pada prompt, dan Midjourney mengabaikannya. Dalam hal ini Dall-E 3 sangat patuh dalam menjalankan perintahnya.

petunjuk: figur gelembung ray-tracing dalam warna-warna pastel, patung wanita dengan finishing metalik, mengkilat/mengkilat, turbulensi semarak, inti merpati, pose tidak lazim, seni anamorfik, warna-warni/opalescence, loop umpan balik video, mata berkilau, lekuk tebal, berkilau, figuratisme cair
prompt: kolase pahlawan super retro kuno, termasuk Wonder Woman, Captain America, Batman, dan The Joker

Dan sekali lagi, meskipun kedua grid menghasilkan kolase yang sangat bagus, Dall-E 3 lebih sesuai dengan perintahnya; itu hanya menambahkan pahlawan yang kami tentukan, itu tidak bisa berubah menjadi joker, dan itu melintasi kapten dengan Batman.

petunjuk: gumpalan penelusuran sinar metalik, seni anamorphic, detail menarik, garis presisi, kurva tebal, berkilau, figuratisme cair, warna pastel, latar belakang gelap
petunjuk: Lapisan dan tekstur sederhana, desain karakter yang rumit, latar belakang yang hidup, unik, dan penuh warna, koreksi warna pastel ala film Wes Anderson, butiran film, dan lensa Tokina at-x 11-16mm f/2.8 pro dx ii semuanya hadir dalam gambar Spider-Man sedang bersantai di sofa yang diambil oleh Slim Aarons.

Midjourney mampu menggabungkan gaya masing-masing artis dari prompt, sedangkan Dall-E 3 hanya menambahkan banyak detail sibuk dan warna-warna cerah ke latar belakang.

cepat: Foto tahun 80-an kucing gemuk lucu gemuk yang berpartisipasi dalam kelas aerobik sambil mengenakan legging macan tutul yang lucu dan bodysuit merah muda diambil dengan Kodak Gold 200.

Sekali lagi, kucing-kucing itu berada dalam kondisi prima, dan kedua jaringan saraf memahami kamera film dengan sempurna. Namun, Dall-E 3 bahkan menambahkan butiran pada gambar.

Tahun 1990-an, Leonardo DiCaprio berperan sebagai master Jedi di dacha Rusia sambil memegang lightsaber dan mengenakan jumper rajutan berwarna hijau.

Dall-E 3 menciptakan Leonardo DiCaprio muda dengan tekstur jumper yang keren, menambahkan butiran film dan skema warna dan dengan sangat keren mencerminkan nuansa dacha Rusia. Midjourney adalah reflektor warna yang bagus untuk film tersebut, dan DiCaprio memberinya penampilan yang lebih dewasa.

cepat: kolase star Wars gambar dalam gaya retro vintage

Meskipun keduanya jaringan saraf mahir membuat kolase, jika diperhatikan lebih dekat, Midjourney mendistorsi wajah dan beberapa bentuk objek, sementara Dall-E 3 lebih akurat dalam eksekusi karakternya sendiri—bahkan ternyata adalah Chewbacca.

prompt: gambar medusa gorgon Rusia yang mengenakan pakaian jalanan hypebeast Balenciaga dan berjalan-jalan di Manhattan dengan rambut ular

Saat Anda memperbesar foto, Anda akan melihat bahwa Dall-E 3 memiliki mata buram; Midjourney, di sisi lain, sempurna. Dall-E 3 juga menentukan merek; ular di kepala tampak lebih hidup dan bergerak; Midjourney selalu membuat mereka berbaring, bukan di kepala.

Petunjuk: Foto pemenang penghargaan oleh Slim Aarons ini menampilkan manusia laba-laba yang menyamar sebagai peri mengenakan gaun berbulu merah muda dan memegang tongkat ajaib. Itu diambil dengan kamera Fuji Superia X-TRA 800.

Keduanya keren, tapi Midjourney mempertimbangkan gaya artis serta efek kamera film, sedangkan Dall-E 3 mengabaikan pengambilan gambar full-length dan tidak mempertimbangkannya.

petunjuk: Peri Uni Soviet dengan sayap dan kostum astronot

Kami juga membuat keputusan untuk menguji foto dengan peri, namun Dall-E 3 dengan keras kepala menolak untuk bekerja sama. Midjourney tidak mengabaikan sayap karena referensi dengan sayap telah ditambahkan. Ketika Dall-E 3 mengambil gambarnya, ada beberapa kemungkinan yang menarik, tetapi dengan seorang wanita Amerika.

prompt: seekor siput berpose untuk potret sambil mengenakan pakaian hipster kontemporer, lapisan dan tekstur kompleks 4K, desain karakter mendetail, dan butiran film. Latar belakangnya menampilkan pemandangan yang hidup, imajinasi, dan penuh warna.

Midjourney melakukan pekerjaan yang luar biasa, tapi kami ingin menarik perhatian khusus pada bagaimana Dall-E 3 menciptakan efek film di gambar kanan atas dan menambahkan tulisan tangan putihnya sendiri; ternyata bagus.

petunjuk: Spider-Man, Batman, dan Iron Man berkumpul untuk minum bir di bar.

Dall-E 3 mampu dengan patuh mewujudkan semua pahlawan prompt dalam satu gambar sekali lagi. Midjourney berusaha sangat keras dan bahkan nyaris berhasil.

Prompt: Salad tomat dan mentimun musim panas, makro, pemandangan penuh, warna-warna hangat, hiperrealistis fotorealistik berkualitas tinggi, pencahayaan alami, Unreal Engine 5, gradasi warna, fotografi editorial, fotografi, pemotretan, Tinggi, epik, artgerm, dibidik dengan lensa 70mm, Depth of Field, DOF, Tilt Blur, Shutter Speed ​​1/1000, F/22, White Balance, 32k, Resolusi Super

Pada pandangan pertama, tampak bahwa keduanya baik, namun pemeriksaan lebih dekat mengungkapkan bahwa Dall-E 3 tidak memiliki volume fotorealistik dan itu Midjourney menangani sambungan dengan garpu dengan keras.

prompt: McDonald's dalam gaya bentang ruang angkasa imajinatif dengan sosok manusia yang realistis, dua mobil, dan sebuah traktor, dengan bulan di atasnya. Les Nasbis, Pierre Pellegrini, berbasis sains, perintis saturasi yang berani, firecore

Kedua generator tersebut mahir di bidangnya masing-masing, dengan Dall-E 3 unggul dalam bidang teks dan Midjourney unggul dalam fotorealisme.

Pengering rambut BaByliss D570DE digunakan dalam interior modern dengan pencahayaan malam hari, desain industrial, dan warna-warna pastel, cocok untuk pemotretan studio.

Fisika dan geometri pengering rambut sulit dilakukan Midjourney. Anda dapat menghabiskan banyak waktu berjuang dengan percobaan dan referensi, dan terkadang hasilnya menyerupai pengering rambut, tetapi Dall-E 3 menghasilkan hasil yang dapat diterima pada percobaan pertama dan bahkan menulis teksnya.

prompt: foto Turanga Leela bermata satu dari futurama

Satu-satunya mata yang bagus, tapi itu lain cerita. Di dalam Midjourney, kami menulis prompt negatif – tidak ada kartun, ilustrasi, datar, dua mata. Dall-E 3 segera menurutinya dan melepaskan satu matanya, tersenyum, dan melepas topinya, namun ia dengan tegas menolak membiarkan siapa pun mengambil fotonya.

Aktor Brad Pitt terlihat pada tahun 1990-an menyirami kebun sayur di dacha Rusia sambil mengenakan tank top bergaris dan celana olahraga dari adidas. Adegan itu ditangkap pada Agfa Vista 400.

Midjourney membuat generasinya tidak seperti Brad, jadi kami menggunakan layanan ekstra Insight Swap Wajah untuk menampilkan wajah Brad pada generasi tersebut; ada postingan tentang itu di sini. Dall-E 3 mengetahui siapa Brad Pitt dan dapat menggambar bintang tanpa perangkat lunak tambahan apa pun.

prompt: seorang gadis cantik, unicorn, teknologi apel, dan kolase galaksi retro kuno

Kedua jaringnya bagus, tapi Dall-E 3 bisa membuat tanduk unicorn Midjourney biasanya tidak bisa.

prompt: es krim di tangan, pakaian olahraga nike, dan peri fantasi menakjubkan yang duduk di samping orc di foto jalanan.

Dall-E 3 berhasil mewujudkan karakter-karakternya dengan baik; kita bisa melihat orc dan elf dengan telinga elf. Ada juga yang pakai baju olahraga Nike, tapi matanya luntur. Telinga elf yang runcing sebagian besar diabaikan oleh Midjourney, dan Nike juga diabaikan.

cepat: gambar peri Uni Soviet yang berpakaian seperti astronot

Ketika “ilustrasi” tambahan pada awalnya tidak disertakan dalam prompt, Dall-E 3 membuat satu. Kami kemudian memutuskan untuk membandingkannya Midjourneyilustrasinya. Ketika Midjourney lebih mirip ilustrasi era Soviet dan tidak menyertakan sayap peri, Dall-E 3 melakukan pekerjaan luar biasa dalam menggambar palu dan arit. Contoh di sebelah kanan menunjukkan bagaimana Dall-E 3 mungkin muncul dalam teks.

petunjuk: Sebuah dacha di Jupiter, cincin orbit planet dapat dilihat dari kejauhan, alien memasak barbekyu, desain karakter yang rumit, latar belakang yang cerah, aneh dan penuh warna, koreksi warna pastel ala film Wes Anderson, butiran film, dan Tokina AT -Lensa X 11-16mm f/2.8 Pro dX II

Namun, Midjourney masuk ke fotorealisme; tidak ada karakter utama dalam gambar, hanya lingkungan sekitar, tapi tetap keren. Dall-E 3 tidak ingin difoto lagi.

prompt: butiran film, makanan anjing, desain karakter yang rumit, lapisan dan tekstur, pemandangan yang cerah, aneh, dan penuh warna di latar belakang, dan koreksi warna pastel seperti dalam film Wes Anderson

Dall-E 3 vs. Midjourney: Pro dan kontra

Saat pengguna menjelajahi teknologi ini, beberapa kekuatan dan keterbatasan penting terungkap, sehingga menambah wawasan tentang fungsinya.

Pro:

  1. Ketaatan Segera: Salah satu fitur menonjol dari Dall-E 3 adalah kemampuannya yang luar biasa untuk mengikuti petunjuk secara akurat. Pengguna telah melaporkan bahwa model AI merespons secara efektif berbagai masukan, menjadikannya alat serbaguna untuk berbagai tugas.
  2. Kreativitas Beragam: Dall-E 3 menunjukkan kemampuan untuk menggambarkan banyak karakter dalam satu gambar, memperluas potensinya untuk proyek bercerita dan kreatif. Pendekatan multifaset ini meningkatkan kegunaannya di berbagai domain.
  3. Integrasi Teks: Pengguna telah mencatat kemahiran Dall-E 3 dalam mengintegrasikan teks ke dalam gambar dengan mulus. Fitur ini memfasilitasi pembuatan konten yang menarik secara visual dengan elemen tekstual yang disematkan.

Cons:

  1. Kejelasan Gambar: Keterbatasan penting adalah kecenderungan AI untuk menghasilkan gambar dengan wajah dan mata kabur. Meskipun unggul dalam kreativitas, terkadang kejelasan dan ketepatannya kurang seperti yang terlihat pada konten buatan manusia.
  2. Konsistensi Gaya: Dall-E 3 tidak secara konsisten meniru gaya artis tertentu, yang mungkin menjadi kelemahan bagi mereka yang mencari emulasi artistik yang tepat.
  3. Persyaratan VPN: Akses ke Dall-E 3 saat ini memerlukan penggunaan VPN, yang mungkin menimbulkan tantangan aksesibilitas bagi sebagian pengguna.
  4. Manajemen Gambar: Pengguna mengalami keterbatasan saat mengelola gambar yang dihasilkan di situs web Microsoft Bing. Khususnya, tidak ada fungsi orientasi format, dan riwayat gambar dibatasi pada unggahan terbaru, sehingga memerlukan penyalinan segera untuk digunakan nanti.
  5. Kecepatan Generasi: Dalam beberapa kasus, proses pembangkitan di Dall-E 3 dilaporkan lebih lambat dibandingkan model AI lainnya.

Terlepas dari keterbatasan ini, Dall-E 3 memiliki potensi yang besar. Pengguna dan pakar sama-sama menyadari potensinya untuk merevolusi pembuatan konten dan penyampaian cerita. Sebagai OpenAI terus menyempurnakan dan memperluas penawarannya, diharapkan kekuatan Dall-E 3 akan semakin bersinar, menjadikannya alat yang berharga di berbagai bidang.

Pertanyaan Umum (FAQ)

Baik Dall-E 3 dan Midjourney mempunyai kekuatan dan kelemahan masing-masing. Dall-E 3 sangat patuh terhadap perintah dan dapat mengintegrasikan teks dengan mulus ke dalam gambar. Namun, terkadang menghasilkan gambar dengan wajah dan mata buram dan mungkin tidak secara konsisten meniru gaya artis tertentu. Di samping itu, Midjourney unggul dalam fotorealisme tetapi mungkin tidak selalu menangkap esensi dari petunjuk tertentu seakurat Dall-E 3.

Artikel ini memberikan petunjuk teks-ke-gambar, menampilkan hasil dari Dall-E 3 dan Midjourney, dan menjelaskan perbedaan antara kedua generator seni tersebut.

Kedua model AI memiliki kelebihan dan kelemahan masing-masing. Misalnya, dalam sebuah prompt tentang angkasawan di Jupiter, Midjourney sedikit mengungguli Dall-E 3. Namun, pada prompt lain tentang Wonder Woman, Dall-E 3 lebih akurat dalam menangkap esensi dari prompt tersebut.

  • Ketaatan yang Cepat: Dall-E 3 secara akurat mengikuti petunjuknya.
  • Kreativitas Beraneka Ragam: Dapat menggambarkan banyak karakter dalam satu gambar.
  • Integrasi Teks: Dall-E 3 dapat mengintegrasikan teks ke dalam gambar dengan mulus.
  • Kejelasan Gambar: Terkadang menghasilkan gambar dengan wajah dan mata buram.
  • Konsistensi Gaya: Dall-E 3 tidak secara konsisten meniru gaya artis tertentu.
  • Manajemen Gambar: Ada batasan saat mengelola gambar yang dihasilkan di situs web Microsoft Bing.
  • Kecepatan Generasi: Proses pembuatan Dall-E 3 mungkin lebih lambat dibandingkan model AI lainnya.

Penolakan tanggung jawab

Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.

Tentang Penulis

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

lebih artikel
Damir Yalalov
Damir Yalalov

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

Hot Stories
Bergabunglah dengan Buletin Kami.
Berita Terkini

Selera Institusional Tumbuh Terhadap ETF Bitcoin Di Tengah Volatilitas

Pengungkapan melalui pengajuan 13F mengungkapkan investor institusi terkemuka yang mencoba-coba ETF Bitcoin, menggarisbawahi semakin besarnya penerimaan ...

Tahu lebih banyak

Hari Hukuman Tiba: Nasib CZ Digantung Saat Pengadilan AS Mempertimbangkan Permohonan DOJ

Changpeng Zhao siap menghadapi hukuman di pengadilan AS di Seattle hari ini.

Tahu lebih banyak
Bergabunglah dengan Komunitas Teknologi Inovatif Kami
Baca Selengkapnya
Baca lebih lanjut
Nexo Memulai 'Perburuan' Untuk Menghadiahi Pengguna Token NEXO senilai $12 Juta Karena Terlibat dengan Ekosistemnya
pasar Laporan berita Teknologi
Nexo Memulai 'Perburuan' Untuk Menghadiahi Pengguna Token NEXO senilai $12 Juta Karena Terlibat dengan Ekosistemnya
8 Mei 2024
Pertukaran Revolut X Revolut Membujuk Pedagang Kripto dengan Tanpa Biaya Pembuat, dan Analisis Tingkat Lanjut
pasar Perangkat lunak Cerita dan Ulasan Teknologi
Pertukaran Revolut X Revolut Membujuk Pedagang Kripto dengan Tanpa Biaya Pembuat, dan Analisis Tingkat Lanjut
8 Mei 2024
Lisk Secara Resmi Bertransisi Ke Ethereum Layer 2 Dan Meluncurkan Core v4.0.6
Laporan berita Teknologi
Lisk Secara Resmi Bertransisi Ke Ethereum Layer 2 Dan Meluncurkan Core v4.0.6
8 Mei 2024
Koin Meme Baru Mei 2024: 7 Pilihan untuk Penggemar Kripto
intisari pasar Teknologi
Koin Meme Baru Mei 2024: 7 Pilihan untuk Penggemar Kripto
8 Mei 2024