Stability AI Luncurkan Stable Diffusion XL 1.0 untuk Menghasilkan Gambar 1-Megapiksel dengan Cepat
Singkatnya
Stability AI telah merilis produk terbarunya, SDXL 1.0, alat penghasil teks ke gambar dengan kualitas gambar yang lebih baik dan antarmuka yang mudah digunakan.
Dengan 3.5 miliar parameter, kamera ini dapat menghasilkan gambar 1 megapiksel dengan rasio aspek yang berbeda.
Model ini dirancang untuk merampingkan teks-ke-gambar proses generasi dan termasuk fitur fine-tuning, seperti ControlNet, berasal dari penelitian Stanford University.
SDXL 1.0 dioptimalkan untuk GPU konsumen dengan kapasitas VRAM 8 GB dan sama efisiennya pada instans cloud dengan harga terjangkau.
Perangkat lunak ini menawarkan penyetelan halus yang ditingkatkan, memungkinkan pembuatan LoRA Kustom atau pos pemeriksaan dengan pengurangan overhead data.
Komunitas AI dapat mengharapkan pembaruan dalam waktu dekat, dan SDXL 1.0 dapat menghasilkan konsep lanjutan, seperti detail yang rumit atau komposisi spasial yang rumit.
Alat ini bersumber terbuka yang dapat diakses di GitHub, mempromosikan transparansi dan kolaborasi dalam komunitas.
Stable Diffusion XL 1.0 (SDXL 1.0), produk terbaru dari Stability AI, telah akhirnya dirilis. Alat ini, yang diposisikan sebagai pengembangan terbaru dalam pembuatan teks-ke-gambar, menonjol karena kualitas gambarnya yang ditingkatkan dan antarmuka yang ramah pengguna.
Sementara banyak industri AI terus meningkatkan platform mereka, Stability AIRilis SDXL 1.0 baru-baru ini menunjukkan kemajuan yang menjanjikan. 3.5 miliar parameter model yang mengesankan memungkinkannya untuk berproduksi dengan cepat Gambar 1 megapiksel dalam rasio aspek yang berbeda. Joe Penna, direktur pembelajaran mesin terapan di Stability AI, menekankan kemampuan model dalam percakapan dengan TechCrunch. Dia menekankan bagaimana itu dapat dikustomisasi dan bagaimana Anda dapat menyesuaikan konsep dan gaya gambar dengan menggunakan isyarat pemrosesan bahasa alami dasar. Dengan bantuan fitur-fitur tersebut, tugas pengguna dapat dipermudah dengan tetap mengikuti petunjuk yang jelas untuk membuat desain yang rumit.
Stability AI tampaknya telah mengatasi tantangan umum di sektor AI, khususnya terkait pembuatan teks. Khususnya, banyak model teks-ke-gambar mutakhir sering gagal saat ditugaskan menghasilkan teks yang dapat dibaca, terutama dalam gaya rumit seperti kaligrafi. Namun, SDXL 1.0 telah menunjukkan kemahiran dalam pembuatan teks tingkat lanjut.
Apa yang membedakan SDXL 1.0 lebih jauh adalah posisi kompetitifnya terhadap pesaing utama lainnya seperti Midjourney dan Firefly Adobe melayani. Model baru menggarisbawahi proses penyempurnaan gambar yang lebih baik, menghasilkan warna yang lebih kaya, pencahayaan superior, dan peningkatan kontras. Selain itu, penyertaan fitur fine-tuning memfasilitasi pembuatan gambar yang dibuat khusus.
Pengembangan SDXL 1.0 memanfaatkan pendekatan pelatihan yang disederhanakan, memanfaatkan basis parameternya yang besar, memposisikannya sebagai landasan ideal untuk berbagai alat dan kemampuan. Menguraikan atributnya, Emad Mostaque, CEO of Stability AI, menyatakan bahwa SDXL 1.0 dibuat dengan cermat untuk merampingkan generasi teks-ke-gambar proses. Ini telah diperkaya lebih lanjut dengan ControlNet, yang berasal dari penelitian Stanford University, yang memfasilitasi peningkatan kemampuan penyempurnaan dan komposisi.
Fitur penting dari model SDXL 1.0 adalah desainnya yang berpusat pada pengguna. Berlawanan dengan permintaan yang panjang untuk menghasilkan hasil yang diinginkan, model ini memungkinkan pengguna untuk mengeluarkan arahan multi-bagian yang kompleks, secara ringkas menangkap maksud dengan kata-kata yang lebih sedikit daripada model sebelumnya. Saat ini, model inovatif ini dapat diakses melalui berbagai platform, termasuk layanan Amazon Bedrock dan Amazon SageMaker Jumpstart.
Performa yang Ditingkatkan pada GPU Konsumen dan Fitur Penyempurnaan Lanjutan
Dirancang dengan mempertimbangkan kompatibilitas, SDXL 1.0 dioptimalkan untuk GPU konsumen dengan kapasitas VRAM 8GB dan sama efisiennya pada instans cloud dengan harga terjangkau.
Fitur dan Kompatibilitas:
Peluncuran SDXL 1.0 menunjukkan komitmen Stability untuk memastikan solusi AI yang efisien dan dapat diakses oleh pengguna. Salah satu poin utama dari pengumuman tersebut adalah kemampuan perangkat lunak untuk beroperasi dengan mulus pada GPU konsumen standar. Bagi pengguna, ini berarti potensi performa optimal tanpa memerlukan perangkat keras kelas atas atau khusus.
Penyempurnaan dalam Penyempurnaan:
Stabilitas telah memasukkan fitur dalam SDXL 1.0 yang menyederhanakan proses pelatihan ulang model untuk kumpulan data unik. Model saat ini memungkinkan pembuatan LoRA Kustom atau pos pemeriksaan dengan pengurangan overhead data, yang membuka jalan untuk adaptasi model yang lebih efisien dan lebih cepat untuk kebutuhan khusus. Selain itu, ada petunjuk menuju masa depan sebagai Stability AI tim sedang mengembangkan kontrol lanjutan untuk struktur, gaya, dan komposisi khusus tugas. Secara khusus, T2I/ControlNet, yang dikhususkan untuk SDXL, akan segera hadir. Meskipun kemajuan ini masih dalam tahap pra-beta, komunitas AI dan pengguna dapat mengantisipasi pembaruan dalam waktu dekat.
Rendering Konsep Lanjutan:
SDXL 1.0 memamerkan kemampuannya untuk menghasilkan konsep yang sebelumnya menantang untuk model gambar. Ini termasuk merender detail rumit seperti tangan dan teks, atau bahkan komposisi spasial yang lebih kompleks, seperti adegan yang menggambarkan seorang wanita di latar belakang sedang mengejar seekor anjing di latar depan. Fitur ini sangat signifikan karena menunjukkan lompatan dalam kemampuan perangkat lunak untuk menginterpretasikan dan merender skenario bernuansa dan multifaset.
Aksesibilitas Sumber Terbuka:
Bagi pengembang dan penggemar yang tertarik mempelajari lebih dalam, Stabilitas telah membuat bobot dan kode untuk SDXL 1.0 tersedia di GitHub. Langkah ini tidak hanya mempromosikan transparansi tetapi juga mendorong pengembangan kolaboratif dan inovasi dalam masyarakat.
Cobalah:
Bagi mereka yang ingin menguji kemampuan SDXL 1.0, Stability telah mengintegrasikannya ke dalam platform seperti DreamStudio dan ClipDrop. Selain itu, sesi interaktif dan demonstrasi potensial tersedia melalui Discord, memungkinkan pengguna untuk merasakan fitur alat secara langsung.
Baca lebih lanjut tentang AI:
Penolakan tanggung jawab
Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.
Tentang Penulis
Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.
lebih artikelDamir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.