Dall-E 3 lwn. Midjourney: Perbandingan Besar Penjana Seni AI Termaju
Sertai kami dalam perjalanan yang mendebarkan ini sambil kami meneroka Dall-E 3 dan Midjourneykehalusan, kerumitan dan potensi yang belum diterokai. Artikel ini menyerlahkan perbandingan yang paling menarik berdasarkan penyelidikan yang dilakukan oleh Atachkina peminat AI; jika anda berminat untuk mengetahui lebih lanjut, klik pada pautan.
Tips Pro |
---|
1. Membongkar 50 Gesaan Teks-ke-Imej Teratas untuk Penjana Seni AI Midjourney dan DALL-E. |
2. Semarakkan Kreativiti Anda dengan 20 Penjana Seni Teks-ke-Imej AI Teratas daripada 2023. |
Artikel ini menyediakan gesaan teks-ke-imej, imej yang menunjukkan hasil daripada Dall-E 3 dan Midjourney, dan penjelasan tentang perbezaan antara keduanya penjana seni. Mari kita mulakan.
Kedua-dua rangkaian saraf menunjukkan prestasi yang mengagumkan dalam kes ini, dengan Midjourney sedikit mengatasi prestasi yang lain.
Dall-E 3 melakukan kerja yang lebih teruk di sini; ia mendapat warna-warna terang gaya, tetapi bukan kejelasan butiran; badan yang cacat muncul di latar belakang, dan wajah tidak berjaya sama sekali.
Ia ternyata menarik kedua-dua tempat, tetapi Dall-E 3 sekali lagi bergelut dengan wajah. Sebaliknya, ia membuat beg kuning air mewah seperti yang diarahkan dalam gesaan, dan Midjourney tidak menghiraukannya. Dalam hal ini, Dall-E 3 sangat patuh dalam melaksanakan gesaan.
Dan sekali lagi, sementara kedua-dua grid menghasilkan kolaj yang sangat baik, Dall-E 3 lebih setia kepada gesaan; ia menambah hanya wira yang kami nyatakan, ia tidak boleh berubah menjadi pelawak, dan ia melintasi kapten dengan Batman.
Midjourney dapat menggabungkan gaya masing-masing dua artis dari gesaan, manakala Dall-E 3 hanya menambah banyak butiran sibuk dan warna-warna terang ke latar belakang.
Sekali lagi, kucing berada dalam bentuk terbaik, dan kedua-dua rangkaian saraf memahami kamera filem dengan sempurna. Walau bagaimanapun, Dall-E 3 malah menambah butiran pada gambar.
Dall-E 3 mencipta Leonardo DiCaprio muda dengan tekstur pelompat yang sejuk, menambah butiran filem dan skema warna dan dengan sangat sejuk mencerminkan rasa dacha Rusia. Midjourney adalah pemantul warna yang baik untuk filem itu, dan DiCaprio memberikan penampilan yang lebih matang.
Walaupun kedua-duanya rangkaian saraf mahir mencipta kolaj, jika anda melihat dengan teliti, Midjourney memesongkan muka dan beberapa bentuk objek, manakala Dall-E 3 lebih tepat dalam pelaksanaan watak-watak itu sendiri-bahkan ternyata Chewbacca.
Apabila anda mengezum masuk pada gambar, anda akan dapati bahawa Dall-E 3 mempunyai mata yang kabur; Midjourney, sebaliknya, adalah sempurna. Dall-E 3 juga menetapkan jenama; ular di kepala kelihatan lebih hidup dan bergerak; Midjourney selalu membuat mereka berbaring, bukannya di atas kepala.
Kedua-duanya keren, tetapi Midjourney menganggap gaya artis serta kesan kamera filem, sedangkan Dall-E 3 mengabaikan syot penuh dan tidak menganggapnya.
Kami juga membuat keputusan untuk menguji gambar dengan pari-pari, tetapi Dall-E 3 dengan keras enggan bekerjasama. Midjourney tidak mengabaikan sayap kerana rujukan dengan sayap telah ditambah. Apabila Dall-E 3 mengambil gambar, ia menawarkan beberapa kemungkinan yang menarik, tetapi dengan seorang wanita Amerika.
Midjourney melakukan kerja yang hebat, tetapi kami ingin menarik perhatian khusus kepada bagaimana Dall-E 3 mencipta kesan filem dalam gambar kanan atas dan menambah tulisan tangan putih sendiri; ternyata hebat.
Dall-E 3 dapat dengan sangat patuh menyedari semua wira gesaan dalam satu imej sekali lagi. Midjourney berusaha bersungguh-sungguh malah hampir berjaya.
Pada pandangan pertama, nampaknya kedua-duanya bagus, tetapi pemeriksaan lebih dekat mendedahkan bahawa Dall-E 3 tidak mempunyai volum fotorealistik dan itu Midjourney mengendalikan sendi dengan garpu dengan dentuman.
Kedua-dua penjana mahir dalam bidang masing-masing, dengan Dall-E 3 cemerlang dalam teks dan Midjourney cemerlang dalam fotorealisme.
Fizik dan geometri pengering rambut adalah sukar Midjourney. Anda boleh menghabiskan banyak masa bergelut dengan percubaan dan rujukan, dan kadangkala hasilnya menyerupai pengering rambut, tetapi Dall-E 3 menghasilkan hasil yang boleh diterima pada percubaan pertama dan juga menulis teks.
Satu-satunya mata yang baik, tetapi itu cerita lain. Dalam Midjourney, kami menulis gesaan negatif – tiada kartun, ilustrasi, rata, dua mata. Dall-E 3 serta-merta mematuhi dan melepaskan sebelah mata, senyuman dan topi, tetapi ia menolak untuk membenarkan sesiapa mengambil gambarnya.
Midjourney menjadikan generasi tidak seperti Brad, jadi kami menggunakan perkhidmatan tambahan Insight Bertukar Wajah untuk meletakkan wajah Brad pada generasi; ada catatan mengenainya di sini. Dall-E 3 tahu siapa Brad Pitt dan boleh melukis bintang tanpa sebarang perisian tambahan.
Kedua-dua jerat adalah baik, tetapi Dall-E 3 boleh mencipta tanduk unicorn sementara Midjourney biasanya tidak boleh.
Dall-E 3 melakukan kerja yang baik untuk meletakkan watak-watak itu ke dalam tindakan; kita boleh melihat orc dan elf dengan telinga bunian. Ada juga yang memakai tracksuit Nike, tetapi matanya comot. Telinga runcing bunian kebanyakannya diabaikan oleh Midjourney, dan Nike juga tidak diendahkan.
Apabila postskrip "ilustrasi" pada mulanya ditinggalkan daripada gesaan, Dall-E 3 mencipta satu. Kami kemudian memutuskan untuk membandingkannya Midjourneyilustrasi. manakala Midjourney lebih menyerupai ilustrasi era Soviet dan tidak termasuk sayap dongeng, Dall-E 3 melakukan kerja yang hebat melukis tukul dan sabit. Contoh di sebelah kanan menunjukkan bagaimana Dall-E 3 mungkin muncul dalam teks.
Walau bagaimanapun, Midjourney pergi ke fotorealisme; tiada watak utama dalam imej, hanya persekitaran, tetapi masih sejuk. Dall-E 3 tidak mahu berada dalam foto itu lagi.
Dall-E 3 lwn. Midjourney: Kebaikan dan keburukan
Semasa pengguna meneroka teknologi ini, beberapa kekuatan dan batasan yang ketara telah terserlah, memberikan gambaran lanjut tentang fungsinya.
Kelebihan:
- Ketaatan segera: Salah satu ciri menonjol Dall-E 3 ialah keupayaannya yang luar biasa untuk mengikut gesaan dengan tepat. Pengguna telah melaporkan bahawa model AI bertindak balas dengan berkesan kepada pelbagai input, menjadikannya alat serba boleh untuk pelbagai tugas.
- Kreativiti pelbagai rupa: Dall-E 3 mempamerkan keupayaan untuk menggambarkan berbilang watak dalam satu imej, mengembangkan potensinya untuk projek bercerita dan kreatif. Pendekatan pelbagai rupa ini meningkatkan utilitinya merentas domain yang berbeza.
- Penyepaduan Teks: Pengguna telah melihat kecekapan Dall-E 3 dalam menyepadukan teks dengan lancar ke dalam imej. Ciri ini memudahkan penciptaan kandungan yang menarik secara visual dengan elemen teks terbenam.
Cons:
- Kejelasan Imej: Had yang ketara ialah kecenderungan AI untuk menghasilkan imej dengan muka dan mata yang kabur. Walaupun ia cemerlang dalam kreativiti, ia kadangkala tidak mempunyai kejelasan dan ketepatan yang dilihat dalam kandungan yang dihasilkan manusia.
- Ketekalan Gaya: Dall-E 3 tidak secara konsisten meniru gaya artis tertentu, yang mungkin menjadi kelemahan bagi mereka yang mencari emulasi artistik yang tepat.
- Keperluan VPN: Akses kepada Dall-E 3 pada masa ini memerlukan penggunaan VPN, yang mungkin menimbulkan cabaran kebolehaksesan untuk sesetengah pengguna.
- Pengurusan Imej: Pengguna telah menghadapi had semasa menguruskan imej yang dijana pada tapak web Microsoft Bing. Terutamanya, tiada fungsi orientasi format dan sejarah imej terhad kepada muat naik terbaharu, yang memerlukan penyalinan segera untuk kegunaan kemudian.
- Kelajuan Penjanaan: Dalam sesetengah kes, proses penjanaan dalam Dall-E 3 telah dilaporkan lebih perlahan berbanding model AI yang lain.
Walaupun had ini, Dall-E 3 memegang janji yang besar. Pengguna dan pakar sama-sama mengiktiraf potensinya untuk merevolusikan penciptaan kandungan dan penceritaan. Sebagai OpenAI terus memperhalusi dan mengembangkan penawarannya, dijangkakan kekuatan Dall-E 3 akan lebih bersinar, menjadikannya alat yang berharga dalam pelbagai bidang.
Soalan Lazim
Kedua-dua Dall-E 3 dan Midjourney mempunyai kekuatan dan kelemahan mereka. Dall-E 3 amat mematuhi gesaan dan boleh menyepadukan teks dengan lancar ke dalam imej. Walau bagaimanapun, ia kadangkala menghasilkan imej dengan muka dan mata yang kabur dan mungkin tidak secara konsisten meniru gaya artis tertentu. Sebaliknya, Midjourney cemerlang dalam fotorealisme tetapi mungkin tidak selalu menangkap intipati gesaan tertentu setepat Dall-E 3.
Artikel itu menyediakan gesaan teks-ke-imej, mempamerkan hasil daripada kedua-dua Dall-E 3 dan Midjourney, dan menerangkan perbezaan antara dua penjana seni.
Kedua-dua model AI mempunyai kekuatan dan kelemahan mereka. Sebagai contoh, dalam gesaan tentang seorang angkasawan di Musytari, Midjourney sedikit mengatasi prestasi Dall-E 3. Walau bagaimanapun, dalam gesaan lain tentang Wonder Woman, Dall-E 3 lebih tepat dalam menangkap intipati gesaan itu.
- Ketaatan Segera: Dall-E 3 mengikut gesaan dengan tepat.
- Kreativiti Pelbagai Rupa: Ia boleh menggambarkan berbilang aksara dalam satu imej.
- Integrasi Teks: Dall-E 3 boleh menyepadukan teks ke dalam imej dengan lancar.
- Kejelasan Imej: Ia kadangkala menghasilkan imej dengan muka dan mata kabur.
- Ketekalan Gaya: Dall-E 3 tidak secara konsisten meniru gaya artis tertentu.
- Pengurusan Imej: Terdapat had semasa menguruskan imej yang dijana pada tapak web Microsoft Bing.
- Kelajuan Penjanaan: Proses penjanaan Dall-E 3 boleh menjadi lebih perlahan berbanding model AI yang lain.
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.
lebih banyak artikelDamir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.