Rilis DALL-E 3 Menguat OpenAIPengaruhnya, Meninggalkan Midjourney dan Stable Diffusion di belakang
Singkatnya
DALL-E 3 diatur untuk diintegrasikan secara mulus GPT-4, dirancang khusus untuk ChatGPT+ pelanggan.
DALL-E 3 menahan diri untuk tidak membuat ulang gambar tokoh masyarakat ketika nama mereka disebutkan secara eksplisit.
Garis waktu untuk akses ke DALL-E 3 ditetapkan untuk bulan Oktober.
OpenAI telah meluncurkan kreasi terbarunya: DALL-E3. Berbeda dengan pendahulunya, DALL-E 3 berfokus pada penyempurnaan hal-hal kecil, mengatasi masalah seperti tulisan dan detail tubuh yang rumit, seperti jari. Hasil? Serangkaian gambar yang estetis tanpa memerlukan perintah atau solusi yang rumit.
Penting untuk diperhatikan bahwa rilis ini tidak dilengkapi dengan serangkaian detail implementasi, artikel, atau API yang komprehensif. Sebaliknya, DALL-E 3 diatur untuk diintegrasikan secara mulus GPT-4, dirancang khusus untuk ChatGPT+ pelanggan.
Perkembangan ini mungkin bukan merupakan perubahan besar dalam lanskap AI, melainkan sebuah langkah maju dalam kolaborasi antar model. Banyak yang mengantisipasi hal berikutnya Stable Diffusion model akan menawarkan kecanggihan dan daya tarik artistik yang lebih besar.
Untuk menempatkannya dalam konteks, OpenAIPerjalanan kami melalui pembuatan gambar AI merupakan perjalanan yang cukup panjang:
- 2021: DALL-E 1, model parameter 12 miliar, diperkenalkan dengan informasi terbatas.
- 2021: GLIDE, model parameter 2 miliar, diluncurkan bersama dengan model parameter sumber terbuka 300 juta.
- 2022: DALL-E 2 hadir, dengan 2 miliar parameter, disertai dengan kertas unCLIP dan API.
- 2023: DALL-E 3 telah hadir, dan meskipun detailnya mungkin agak samar, satu hal yang jelas—ia akan berintegrasi dengan GPT-4 untuk ChatGPT+ pelanggan.
Sampai sekarang, visual DALL-E 3 masih langka. Tidak ada basis kode, postingan blog, atau perbandingan mendetail dengan yang canggih (SOTA). OpenAI tampaknya menyimpan kartu mereka dekat dengan dada mereka.

Model ini disebut-sebut memiliki pemahaman nuansa dan detail yang lebih dalam dibandingkan pendahulunya. Ini berarti menerjemahkan konsep kreatif Anda menjadi gambar yang sangat presisi diharapkan menjadi proses yang lebih lancar.
Salah satu janji menarik dari DALL-E 3 adalah integrasinya dengan ChatGPT. Artinya, pengguna tidak perlu bersusah payah membuat perintah yang rumit; deskripsi singkat saja sudah cukup, dengan ChatGPT dengan mahir menghasilkan petunjuk terperinci atas nama Anda.
OpenAI juga telah menekankan pentingnya konteks dalam petunjuk yang panjang. DALL-E 3 dirancang untuk mencakup verbositas, membuatnya lebih selaras dengan konteks yang dijelaskan dalam petunjuk ekstensif.
Namun, seperti halnya model AI baru lainnya, ada elemen yang belum diketahui. Meskipun sekilas terlihat menjanjikan, tes lakmus yang sebenarnya akan muncul jika digunakan dalam jangka waktu yang lama. Masih banyak pertanyaan mengenai efisiensi dan kecepatan pengoperasiannya.
Kemungkinan besar DALL-E 3 akan menjadi proses difusi multi-tahap, dengan GPT-4 berfungsi sebagai pembuat enkode teks. Mekanisme rumit dari pengaturan ini mungkin masih diselimuti kerahasiaan.
Garis waktu untuk akses ke DALL-E 3 ditetapkan untuk bulan Oktober, awalnya untuk ChatGPT Plus dan ChatGPT Pengguna perusahaans, dengan kemungkinan akses yang lebih luas bagi peneliti setelahnya.






Nuansa dan Sensor dari DALL-E 3
Titik fokus utama pengembangan DALL-E 3 adalah proses yang cermat dalam membatasi kemampuannya. Hal ini melibatkan penyelarasan ketat dan filter yang dirancang untuk mengecualikan jenis konten tertentu. Misalnya, model tersebut dengan tegas menolak untuk membuat gambar tokoh terkenal, mereplikasi karya seni dengan gaya seniman terkenal, atau membuat konten apa pun yang dianggap tidak aman oleh OpenAIstandar yang cerdas. Pendekatan strategis ini bukan hanya tentang keterbatasan; ini adalah tindakan proaktif yang bertujuan melindungi perusahaan dari potensi keterikatan hukum.
Namun, di luar filter dan penyelarasan ini, beberapa observasi menarik terungkap. DALL-E 3 tampaknya menunjukkan kelemahan tertentu dalam menghasilkan konten fotorealistik. Alih-alih menghasilkan gambar yang meniru foto asli dengan sempurna, outputnya memiliki kualitas gaya yang berbeda. Gambar-gambar yang dibuat dengan AI ini memancarkan tampilan yang hampir dibuat dan sedikit plastik. Bahkan ketika secara eksplisit diberi kata “foto”, hasilnya tetap melekat pada stilisasi khasnya.
Perlu dicatat bahwa meskipun terdapat keistimewaan ini, DALL-E 3 menawarkan sekilas potensi yang luar biasa. Di antara kreasinya, beberapa contoh menunjukkan kemiripan yang mencolok dengan foto. Perlu diingat bahwa simulasi realisme gambar-gambar ini tidak selalu sejalan dengan tampilan foto asli dari subjek yang sama, terutama jika terendam di bawah air.
| terkait: Microsoft meluncurkan Designer, alat Text-to-Image profesional pertama berdasarkan DALL-E 2 |
Fitur dan Detail DALL-E 3
Mari luangkan waktu sejenak untuk menyaring piksel dan membaca yang tersirat untuk memahami apa yang sebenarnya ditawarkan model baru ini.
Seni Stilisasi: Melihat sekilas OpenAIakun Instagram, Anda akan melihat banyak sekali karya seni yang ditandai dengan stilisasi yang sangat indah. Meskipun terdapat serangkaian komposisi dan desain abstrak yang mengesankan, model tersebut tampaknya menghindari produksi konten fotorealistik. Penekanannya di sini adalah pada estetika dan kreativitas, bukan meniru kenyataan.
Batasan Artistik: DALL-E 3 mengambil jalur yang berbeda dari pendahulunya. Ia dengan tegas menolak untuk membuat gambar dengan gaya seniman yang masih hidup, sangat berbeda dengan DALL-E 2, yang dapat meniru gaya seniman tertentu. Hal ini mungkin menimbulkan keheranan di komunitas kreatif, serupa dengan sambutan hangat Stable Diffusion 2.0.
Memberdayakan Seniman: Sebagai upaya untuk menghormati hak artis, OpenAI memungkinkan seniman untuk mengecualikan karya mereka dari versi DALL-E yang akan datang. Dengan mengirimkan gambar yang haknya mereka miliki, artis dapat meminta pengecualian gambar tersebut dari keluaran model. Iterasi DALL-E di masa mendatang akan menghindari pembuatan konten yang menyerupai gaya artis.
Keamanan dan Sensor: OpenAIParanoia terhadap keamanan terlihat jelas. Mereka berkolaborasi dengan “tim merah” eksternal untuk menguji keamanan model dan menggunakan pengklasifikasi masukan untuk mengajarkan model mengabaikan kata-kata tertentu yang dapat mengarah ke konten eksplisit atau berbahaya. DALL-E 3 menahan diri untuk tidak membuat ulang gambar tokoh masyarakat ketika nama mereka disebutkan secara eksplisit. Apakah selebriti termasuk dalam kategori ini masih belum pasti, dan berpotensi berdampak pada kualitas wajah yang dihasilkan.
Tanda Air dan Pelacakan: Ada petunjuk mengenai penyematan tag untuk melacak “gambar yang dihasilkan AI”, yang menunjukkan adanya pergerakan menuju pemantauan yang lebih baik dan berpotensi memberi watermark pada konten yang dihasilkan.
Teks dan Tangan Ditingkatkan: OpenAI memuji peningkatan pembuatan teks dan rendering tangan, klaim umum di antara para pesaing. Ujian sebenarnya terletak pada keluaran aktual di luar contoh yang dipilih.
Pemahaman Spasial: DALL-E 3 unggul dalam memahami hubungan spasial yang dijelaskan dalam petunjuknya. Hal ini meningkatkan kemampuan model untuk membangun sudut dan komposisi yang kompleks, meskipun pengguna menunggu bukti yang lebih konkrit mengenai janji ini.
Kekuatan Anjuran: Inti dari DALL-E3 terletak pada kemampuan cepat dan integrasinya dengan ChatGPT. Ini menjanjikan otomatisasi, kecepatan, dan penyederhanaan desain yang cepat. Tren di sini mengarah chatGPT menghasilkan petunjuk, menerjemahkan ide-ide yang samar-samar atau petunjuk yang belum sempurna menjadi ide yang fasih. Pemahaman kontekstual DALL-E 3 yang lebih baik menyederhanakan proses, memungkinkan pengguna untuk fokus pada niat daripada verbositas.
Wilayah yang Belum Dipetakan: Yang paling tidak dibahas dalam diskusi adalah aspek-aspek seperti inpainting, outpainting, generative fill, dan 3D modeling. Ketiadaan fitur-fitur ini mungkin menjadi batasan, terutama bagi pengguna yang terbiasa dengan model yang lebih serbaguna.
Detail Akses: DALL-E 3 diatur agar tersedia untuk ChatGPT Pelanggan Plus dan Enterprise pada awal Oktober. Namun secara spesifik mengenai alokasi kredit untuk ChatGPT Ditambah lagi pengguna dan biaya terkait masih belum jelas. Akses akan diberikan melalui API dan OpenAI Platform Labs “di musim gugur nanti.”
Kecakapan Integrasi: DALL-E diatur untuk diintegrasikan secara mulus ke dalam produk mitra dan Microsoft. Berharap untuk menyaksikan pembuatan presentasi, ilustrasi, desain, logo, semuanya dalam konteks dan diperkuat dengan bantuan dari ChatGPT. Integrasi ini akan menjadi arus utama, sehingga menimbulkan tantangan signifikan bagi pesaing sejenisnya Google dengan Bard-nya dan Ideogram.
Konvergensi LLM dan Konten Visual: Aspek yang paling menarik terletak pada konvergensi Model Bahasa Besar (LLM) dan model pembuatan konten visual. Hal ini menandakan peralihan dari rekayasa cepat yang kompleks ke pengungkapan ide dalam bahasa yang lebih mudah diakses. AI akan mengumpulkan konteks dan ide dari ekspresi-ekspresi ini, menawarkan kemungkinan-kemungkinan kreatif yang sulit ditolak.
DALL-E 3: Menjadi Pemimpin Baru dalam Generasi Citra AI
OpenAIkeputusan untuk mengintegrasikan DALL-E 3 ke dalam ChatGPT ekosistem adalah langkah strategis. Integrasi ini memberikan DALL-E 3 akses ke database pengguna yang luas dengan 100 juta pengguna aktif. Langkah ini secara signifikan meningkatkan aksesibilitas DALL-E 3 dan berpotensi melambungkan popularitasnya.
Saat ini, Midjourney dan Stable Diffusion bermegah 15 juta pengguna terdaftar. Namun, dengan integrasi ini, DALL-E 3 diatur untuk mendapatkan akses ke basis pengguna sepuluh kali lebih besar—100 juta pengguna. Hal ini membuat ChatGPT Ditambah berlangganan rencana menjadi lebih menarik, karena menawarkan akses ke chatbot, alat analisis, dan pembuatan gambar, semuanya dengan harga terjangkau.
Integrasi ini tidak hanya menguntungkan bagi pengguna lama tetapi juga menjadi magnet yang kuat bagi pengguna baru. Ini memperluas OpenAI jangkauan dan popularitas ekosistem, menarik individu yang mencari solusi konten yang dihasilkan AI.
Langkah strategis ini siap untuk ditingkatkan OpenAIpendapatan dan metrik utama lainnya. Investor perusahaan kemungkinan besar akan memandang positif perkembangan ini, terutama mengingat perkembangan yang terjadi baru-baru ini Penurunan volume lalu lintas sebesar 20%. selama musim panas.
Baca topik terkait lainnya:
Penolakan tanggung jawab
Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.
Tentang Penulis
Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.
lebih artikel
Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.



