Dall-E 3 vs. Midjourney: Perbandingan Besar dari Generator AI Art Tercanggih
Bergabunglah bersama kami dalam perjalanan mendebarkan ini saat kami menjelajahi Dall-E 3 dan Midjourneykehalusan, kompleksitas, dan potensi yang belum dimanfaatkan. Artikel ini menyoroti perbandingan paling menarik berdasarkan penelitian yang dilakukan oleh penggila AI Atachkina; jika Anda tertarik untuk mempelajari lebih lanjut, klik link.
Tips Pro |
---|
1. Temukan 50 Perintah Teks-ke-Gambar Teratas untuk Generator Seni AI Midjourney dan DALL-E. |
2. Kobarkan Kreativitas Anda dengan 20 Generator Seni Teks-ke-Gambar AI Teratas dari 2023. |
Artikel ini menyediakan prompt teks-ke-gambar, gambar yang memperlihatkan hasil dari Dall-E 3 dan Midjourney, dan penjelasan perbedaan keduanya pembangkit seni. Mari kita mulai.
Kedua jaringan saraf memiliki kinerja yang mengagumkan dalam kasus ini, dengan Midjourney sedikit mengungguli yang lain.
Dall-E 3 melakukan pekerjaan yang jauh lebih buruk di sini; ia mendapatkan warna-warna cerah dari gayanya, tetapi tidak memiliki kejelasan detailnya; tubuh cacat muncul di latar belakang, dan wajah sama sekali tidak berhasil.
Ternyata kedua tempat itu menarik, tetapi Dall-E 3 sekali lagi kesulitan menghadapinya. Sebaliknya, itu membuat tas krem yang mewah seperti yang diinstruksikan pada prompt, dan Midjourney mengabaikannya. Dalam hal ini Dall-E 3 sangat patuh dalam menjalankan perintahnya.
Dan sekali lagi, meskipun kedua grid menghasilkan kolase yang sangat bagus, Dall-E 3 lebih sesuai dengan perintahnya; itu hanya menambahkan pahlawan yang kami tentukan, itu tidak bisa berubah menjadi joker, dan itu melintasi kapten dengan Batman.
Midjourney mampu menggabungkan gaya masing-masing artis dari prompt, sedangkan Dall-E 3 hanya menambahkan banyak detail sibuk dan warna-warna cerah ke latar belakang.
Sekali lagi, kucing-kucing itu berada dalam kondisi prima, dan kedua jaringan saraf memahami kamera film dengan sempurna. Namun, Dall-E 3 bahkan menambahkan butiran pada gambar.
Dall-E 3 menciptakan Leonardo DiCaprio muda dengan tekstur jumper yang keren, menambahkan butiran film dan skema warna dan dengan sangat keren mencerminkan nuansa dacha Rusia. Midjourney adalah reflektor warna yang bagus untuk film tersebut, dan DiCaprio memberinya penampilan yang lebih dewasa.
Meskipun keduanya jaringan saraf mahir membuat kolase, jika diperhatikan lebih dekat, Midjourney mendistorsi wajah dan beberapa bentuk objek, sementara Dall-E 3 lebih akurat dalam eksekusi karakternya sendiri—bahkan ternyata adalah Chewbacca.
Saat Anda memperbesar foto, Anda akan melihat bahwa Dall-E 3 memiliki mata buram; Midjourney, di sisi lain, sempurna. Dall-E 3 juga menentukan merek; ular di kepala tampak lebih hidup dan bergerak; Midjourney selalu membuat mereka berbaring, bukan di kepala.
Keduanya keren, tapi Midjourney mempertimbangkan gaya artis serta efek kamera film, sedangkan Dall-E 3 mengabaikan pengambilan gambar full-length dan tidak mempertimbangkannya.
Kami juga membuat keputusan untuk menguji foto dengan peri, namun Dall-E 3 dengan keras kepala menolak untuk bekerja sama. Midjourney tidak mengabaikan sayap karena referensi dengan sayap telah ditambahkan. Ketika Dall-E 3 mengambil gambarnya, ada beberapa kemungkinan yang menarik, tetapi dengan seorang wanita Amerika.
Midjourney melakukan pekerjaan yang luar biasa, tapi kami ingin menarik perhatian khusus pada bagaimana Dall-E 3 menciptakan efek film di gambar kanan atas dan menambahkan tulisan tangan putihnya sendiri; ternyata bagus.
Dall-E 3 mampu dengan patuh mewujudkan semua pahlawan prompt dalam satu gambar sekali lagi. Midjourney berusaha sangat keras dan bahkan nyaris berhasil.
Pada pandangan pertama, tampak bahwa keduanya baik, namun pemeriksaan lebih dekat mengungkapkan bahwa Dall-E 3 tidak memiliki volume fotorealistik dan itu Midjourney menangani sambungan dengan garpu dengan keras.
Kedua generator tersebut mahir di bidangnya masing-masing, dengan Dall-E 3 unggul dalam bidang teks dan Midjourney unggul dalam fotorealisme.
Fisika dan geometri pengering rambut sulit dilakukan Midjourney. Anda dapat menghabiskan banyak waktu berjuang dengan percobaan dan referensi, dan terkadang hasilnya menyerupai pengering rambut, tetapi Dall-E 3 menghasilkan hasil yang dapat diterima pada percobaan pertama dan bahkan menulis teksnya.
Satu-satunya mata yang bagus, tapi itu lain cerita. Di dalam Midjourney, kami menulis prompt negatif – tidak ada kartun, ilustrasi, datar, dua mata. Dall-E 3 segera menurutinya dan melepaskan satu matanya, tersenyum, dan melepas topinya, namun ia dengan tegas menolak membiarkan siapa pun mengambil fotonya.
Midjourney membuat generasinya tidak seperti Brad, jadi kami menggunakan layanan ekstra Insight Swap Wajah untuk menampilkan wajah Brad pada generasi tersebut; ada postingan tentang itu di sini. Dall-E 3 mengetahui siapa Brad Pitt dan dapat menggambar bintang tanpa perangkat lunak tambahan apa pun.
Kedua jaringnya bagus, tapi Dall-E 3 bisa membuat tanduk unicorn Midjourney biasanya tidak bisa.
Dall-E 3 berhasil mewujudkan karakter-karakternya dengan baik; kita bisa melihat orc dan elf dengan telinga elf. Ada juga yang pakai baju olahraga Nike, tapi matanya luntur. Telinga elf yang runcing sebagian besar diabaikan oleh Midjourney, dan Nike juga diabaikan.
Ketika “ilustrasi” tambahan pada awalnya tidak disertakan dalam prompt, Dall-E 3 membuat satu. Kami kemudian memutuskan untuk membandingkannya Midjourneyilustrasinya. Ketika Midjourney lebih mirip ilustrasi era Soviet dan tidak menyertakan sayap peri, Dall-E 3 melakukan pekerjaan luar biasa dalam menggambar palu dan arit. Contoh di sebelah kanan menunjukkan bagaimana Dall-E 3 mungkin muncul dalam teks.
Namun, Midjourney masuk ke fotorealisme; tidak ada karakter utama dalam gambar, hanya lingkungan sekitar, tapi tetap keren. Dall-E 3 tidak ingin difoto lagi.
Dall-E 3 vs. Midjourney: Pro dan kontra
Saat pengguna menjelajahi teknologi ini, beberapa kekuatan dan keterbatasan penting terungkap, sehingga menambah wawasan tentang fungsinya.
Pro:
- Ketaatan Segera: Salah satu fitur menonjol dari Dall-E 3 adalah kemampuannya yang luar biasa untuk mengikuti petunjuk secara akurat. Pengguna telah melaporkan bahwa model AI merespons secara efektif berbagai masukan, menjadikannya alat serbaguna untuk berbagai tugas.
- Kreativitas Beragam: Dall-E 3 menunjukkan kemampuan untuk menggambarkan banyak karakter dalam satu gambar, memperluas potensinya untuk proyek bercerita dan kreatif. Pendekatan multifaset ini meningkatkan kegunaannya di berbagai domain.
- Integrasi Teks: Pengguna telah mencatat kemahiran Dall-E 3 dalam mengintegrasikan teks ke dalam gambar dengan mulus. Fitur ini memfasilitasi pembuatan konten yang menarik secara visual dengan elemen tekstual yang disematkan.
Cons:
- Kejelasan Gambar: Keterbatasan penting adalah kecenderungan AI untuk menghasilkan gambar dengan wajah dan mata kabur. Meskipun unggul dalam kreativitas, terkadang kejelasan dan ketepatannya kurang seperti yang terlihat pada konten buatan manusia.
- Konsistensi Gaya: Dall-E 3 tidak secara konsisten meniru gaya artis tertentu, yang mungkin menjadi kelemahan bagi mereka yang mencari emulasi artistik yang tepat.
- Persyaratan VPN: Akses ke Dall-E 3 saat ini memerlukan penggunaan VPN, yang mungkin menimbulkan tantangan aksesibilitas bagi sebagian pengguna.
- Manajemen Gambar: Pengguna mengalami keterbatasan saat mengelola gambar yang dihasilkan di situs web Microsoft Bing. Khususnya, tidak ada fungsi orientasi format, dan riwayat gambar dibatasi pada unggahan terbaru, sehingga memerlukan penyalinan segera untuk digunakan nanti.
- Kecepatan Generasi: Dalam beberapa kasus, proses pembangkitan di Dall-E 3 dilaporkan lebih lambat dibandingkan model AI lainnya.
Terlepas dari keterbatasan ini, Dall-E 3 memiliki potensi yang besar. Pengguna dan pakar sama-sama menyadari potensinya untuk merevolusi pembuatan konten dan penyampaian cerita. Sebagai OpenAI terus menyempurnakan dan memperluas penawarannya, diharapkan kekuatan Dall-E 3 akan semakin bersinar, menjadikannya alat yang berharga di berbagai bidang.
Pertanyaan Umum (FAQ)
Baik Dall-E 3 dan Midjourney mempunyai kekuatan dan kelemahan masing-masing. Dall-E 3 sangat patuh terhadap perintah dan dapat mengintegrasikan teks dengan mulus ke dalam gambar. Namun, terkadang menghasilkan gambar dengan wajah dan mata buram dan mungkin tidak secara konsisten meniru gaya artis tertentu. Di samping itu, Midjourney unggul dalam fotorealisme tetapi mungkin tidak selalu menangkap esensi dari petunjuk tertentu seakurat Dall-E 3.
Artikel ini memberikan petunjuk teks-ke-gambar, menampilkan hasil dari Dall-E 3 dan Midjourney, dan menjelaskan perbedaan antara kedua generator seni tersebut.
Kedua model AI memiliki kelebihan dan kelemahan masing-masing. Misalnya, dalam sebuah prompt tentang angkasawan di Jupiter, Midjourney sedikit mengungguli Dall-E 3. Namun, pada prompt lain tentang Wonder Woman, Dall-E 3 lebih akurat dalam menangkap esensi dari prompt tersebut.
- Ketaatan yang Cepat: Dall-E 3 secara akurat mengikuti petunjuknya.
- Kreativitas Beraneka Ragam: Dapat menggambarkan banyak karakter dalam satu gambar.
- Integrasi Teks: Dall-E 3 dapat mengintegrasikan teks ke dalam gambar dengan mulus.
- Kejelasan Gambar: Terkadang menghasilkan gambar dengan wajah dan mata buram.
- Konsistensi Gaya: Dall-E 3 tidak secara konsisten meniru gaya artis tertentu.
- Manajemen Gambar: Ada batasan saat mengelola gambar yang dihasilkan di situs web Microsoft Bing.
- Kecepatan Generasi: Proses pembuatan Dall-E 3 mungkin lebih lambat dibandingkan model AI lainnya.
Penolakan tanggung jawab
Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.
Tentang Penulis
Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.
lebih artikelDamir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.