Laporan Berita Teknologi
Julai 27, 2023

Stability AI Lancar Stable Diffusion XL 1.0 untuk Menghasilkan Imej 1-Megapiksel dengan Pantas

Secara ringkas

Stability AI telah mengeluarkan produk terbaharunya, SDXL 1.0, alat penjanaan teks ke imej dengan kualiti imej yang lebih baik dan antara muka yang mesra pengguna.

Dengan 3.5 bilion parameter, ia boleh menghasilkan imej 1 megapiksel dalam nisbah aspek yang berbeza.

Model ini direka untuk menyelaraskan teks ke imej proses penjanaan dan termasuk ciri penalaan halus, seperti ControlNet, yang diperoleh daripada penyelidikan Universiti Stanford.

SDXL 1.0 dioptimumkan untuk GPU pengguna dengan kapasiti VRAM 8GB dan sama cekap pada contoh awan yang berharga berpatutan.

Perisian ini menawarkan penalaan halus yang dipertingkatkan, membolehkan penjanaan LoRA Tersuai atau pusat pemeriksaan dengan overhed data yang dikurangkan.

Komuniti AI boleh menjangkakan kemas kini dalam masa terdekat, dan SDXL 1.0 boleh menjana konsep lanjutan, seperti butiran rumit atau gubahan spatial yang kompleks.

Alat ini boleh diakses sumber terbuka di GitHub, mempromosikan ketelusan dan kerjasama dalam komuniti.

Stable Diffusion XL 1.0 (SDXL 1.0), produk terbaru dari Stability AI, akhirnya telah dikeluarkan. Alat ini, yang diletakkan sebagai pembangunan terbaharu dalam penjanaan teks-ke-imej, menonjol untuk kualiti imej yang dipertingkatkan dan antara muka mesra pengguna.

Stability AI Lancar Stable Diffusion XL 1.0 untuk Menghasilkan Imej 1-Megapiksel dengan Pantas
Kredit: kestabilan.ai
Berkaitan: Saham NVIDIA Meningkat 26% Selepas Perolehan S1 Kukuh Diterajui oleh Permintaan yang Meningkat untuk GPU AI

Walaupun ramai dalam industri AI terus meningkatkan platform mereka, Stability AIPengeluaran SDXL 1.0 baru-baru ini menunjukkan kemajuan yang memberangsangkan. 3.5 bilion parameter model yang mengagumkan membolehkannya menghasilkan dengan cepat Imej 1 megapiksel dalam nisbah aspek yang berbeza. Joe Penna, pengarah pembelajaran mesin gunaan di Stability AI, menekankan keupayaan model dalam perbualan dengan TechCrunch. Beliau menekankan cara ia boleh disesuaikan dan cara anda boleh melaraskan konsep dan gaya imej dengan menggunakan isyarat pemprosesan bahasa semula jadi asas. Dengan bantuan ciri-ciri ini, tugas pengguna boleh dipermudahkan sambil tetap mengikut arahan yang jelas untuk mencipta reka bentuk yang kompleks.

Stability AI nampaknya telah menangani cabaran yang lazim dalam sektor AI, terutamanya berkaitan penjanaan teks. Terutama, banyak model teks-ke-imej yang canggih sering gagal apabila ditugaskan untuk menjana teks yang boleh dibaca, terutamanya dalam gaya rumit seperti kaligrafi. Walau bagaimanapun, SDXL 1.0 telah mempamerkan kecekapan dalam penjanaan teks lanjutan.

Apa yang membezakan SDXL 1.0 lagi ialah kedudukan kompetitifnya berbanding pesaing utama lain seperti Midjourney and Firefly Adobe perkhidmatan. Model baharu menggariskan proses penapisan imej yang dipertingkatkan, menghasilkan warna yang lebih kaya, pencahayaan yang unggul dan kontras yang dipertingkatkan. Selain itu, kemasukan ciri penalaan halus memudahkan penjanaan imej yang dibuat khusus.

Pembangunan SDXL 1.0 memanfaatkan pendekatan latihan yang diperkemas, mendapat manfaat daripada asas parameternya yang besar, meletakkannya sebagai asas yang ideal untuk pelbagai alatan dan keupayaan. Menghuraikan sifat-sifatnya, Emad Mostaque, Ketua Pegawai Eksekutif Stability AI, menyatakan bahawa SDXL 1.0 telah direka dengan teliti untuk menyelaraskan penjanaan teks ke imej proses. Ini telah diperkayakan lagi dengan ControlNet, yang diperoleh daripada penyelidikan Universiti Stanford, memudahkan penalaan halus dan keupayaan gubahan yang dipertingkatkan.

Ciri penting model SDXL 1.0 ialah reka bentuknya yang mengutamakan pengguna. Bertentangan dengan memerlukan gesaan yang panjang untuk menghasilkan hasil yang diingini, model ini membenarkan pengguna mengeluarkan arahan berbilang bahagian yang kompleks, secara ringkas menangkap maksud dengan perkataan yang lebih sedikit daripada model terdahulu. Sehingga kini, model inovatif ini boleh diakses melalui pelbagai platform, termasuk perkhidmatan Amazon Bedrock dan Amazon SageMaker Jumpstart.

Prestasi Dipertingkat pada GPU Pengguna dan Ciri Penalaan Halus Lanjutan

Imej Dijana SDXL 1.0
Imej Dijana SDXL 1.0
Berkaitan: Stability AI mengumpul $101 juta, menutup penilaian pada $1 bilion

Direka bentuk dengan mengambil kira keserasian, SDXL 1.0 dioptimumkan untuk GPU pengguna dengan kapasiti VRAM 8GB dan sama cekap pada kejadian awan yang berharga berpatutan.

Ciri dan Keserasian:

Pelancaran SDXL 1.0 menunjukkan komitmen Kestabilan untuk memastikan penyelesaian AI yang cekap dan boleh diakses untuk pengguna. Salah satu perkara penting daripada pengumuman itu ialah keupayaan perisian untuk beroperasi dengan lancar pada GPU pengguna standard. Bagi pengguna, ini bermakna potensi untuk prestasi optimum tanpa memerlukan perkakasan mewah atau khusus.

Penambahbaikan dalam Penalaan Halus:

Kestabilan telah menggabungkan ciri dalam SDXL 1.0 yang memudahkan proses latihan semula model untuk set data unik. Model semasa membenarkan penjanaan LoRA Tersuai atau pusat pemeriksaan dengan overhed data yang berkurangan, yang membuka jalan untuk penyesuaian model yang lebih cekap dan lebih pantas kepada keperluan khusus. Tambahan pula, terdapat petunjuk ke arah masa depan sebagai Stability AI pasukan sedang membangunkan kawalan lanjutan untuk struktur, gaya dan gubahan khusus tugasan. Khususnya, T2I/ControlNet, yang khusus untuk SDXL, berada di kaki langit. Walaupun kemajuan ini kekal dalam fasa pra-beta, komuniti AI dan pengguna boleh menjangkakan kemas kini dalam masa terdekat.

Memaparkan Konsep Lanjutan:

SDXL 1.0 mempamerkan keupayaannya untuk menjana konsep yang sebelum ini mencabar untuk model imej. Ini termasuk memberikan butiran rumit seperti tangan dan teks, atau bahkan gubahan spatial yang lebih kompleks, seperti adegan yang menggambarkan seorang wanita di latar belakang mengejar seekor anjing di latar depan. Ciri ini amat penting kerana ia menunjukkan lonjakan dalam keupayaan perisian untuk mentafsir dan menghasilkan senario bernuansa dan pelbagai rupa.

Kebolehcapaian Sumber Terbuka:

Bagi pembangun dan peminat yang berminat untuk menyelidiki lebih mendalam, Stability telah menjadikan pemberat dan kod untuk SDXL 1.0 tersedia di GitHub. Langkah ini bukan sahaja menggalakkan ketelusan tetapi juga menggalakkan pembangunan kolaboratif dan inovasi dalam komuniti.

Cubalah:

Bagi mereka yang ingin menguji keupayaan SDXL 1.0, Stability telah menyepadukannya ke dalam platform seperti DreamStudio dan ClipDrop. Selain itu, sesi interaktif dan demonstrasi yang berpotensi tersedia melalui Discord, yang membolehkan pengguna mengalami sendiri ciri alat tersebut.

Baca lebih lanjut mengenai AI:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Lebih Lanjut
Maklumat Lanjut
Peralihan Donald Trump kepada Kripto: Daripada Lawan kepada Peguambela, dan Apa Maknanya untuk Pasaran Mata Wang Kripto AS
Perniagaan pasaran Cerita dan Ulasan Teknologi
Peralihan Donald Trump kepada Kripto: Daripada Lawan kepada Peguambela, dan Apa Maknanya untuk Pasaran Mata Wang Kripto AS
Semoga 10, 2024
Layer3 Untuk Melancarkan Token L3 Musim Panas Ini, Memperuntukkan 51% Daripada Jumlah Bekalan Kepada Komuniti
pasaran Laporan Berita Teknologi
Layer3 Untuk Melancarkan Token L3 Musim Panas Ini, Memperuntukkan 51% Daripada Jumlah Bekalan Kepada Komuniti
Semoga 10, 2024
Amaran Terakhir Edward Snowden kepada Pemaju Bitcoin: “Jadikan Privasi sebagai Keutamaan Tahap Protokol atau Risiko Kehilangannya
pasaran Keselamatan Wiki perisian Cerita dan Ulasan Teknologi
Amaran Terakhir Edward Snowden kepada Pemaju Bitcoin: “Jadikan Privasi sebagai Keutamaan Tahap Protokol atau Risiko Kehilangannya
Semoga 10, 2024
Pudina Rangkaian Lapisan 2 Ethereum Dikuasakan Optimisme Untuk Melancarkan Mainnetnya Pada 15 Mei
Laporan Berita Teknologi
Pudina Rangkaian Lapisan 2 Ethereum Dikuasakan Optimisme Untuk Melancarkan Mainnetnya Pada 15 Mei
Semoga 10, 2024