Laporan berita Teknologi
10 April, 2023

Stability AI Merilis Model Baru Bernama SDXL Beta

Singkatnya

Stability AI telah merilis model baru bernama SDXL Beta (Stable Diffusion XL Beta). Ini adalah model yang lebih besar dengan lebih banyak parameter dan beberapa peningkatan yang tidak diketahui. Ini tersedia di DreamStudio, Stability AIgenerator gambar resmi, dan menggunakan algoritma canggih dan teknik pembelajaran mendalam untuk menciptakan visual yang menakjubkan.

Stability AI telah meluncurkan pratinjau model baru yang disebut SDXL Beta, kependekan dari Stable Diffusion XLBeta. Sejauh ini, perusahaan belum membagikan banyak informasi tentang model tersebut, tetapi model tersebut tersedia untuk pengujian bagi siapa saja yang ingin melakukannya. Untuk apa yang baru tentang model SDXL ini stable diffusion? Apa kelebihan dan kekurangannya? Mari selidiki.

Baca lebih lanjut: Midjourney dan Dall-E Artist Styles Dump dengan Contoh: 130 Teknik Lukisan AI Terkenal

Apa sebenarnya model SDXL itu?

Model SDXL adalah model baru yang ada saat ini sedang dilatih. Itu masih jauh dari selesai, dan pada saat dirilis, banyak detail tentangnya mungkin berubah; sejauh yang kami tahu, ini bahkan mungkin tidak disebut model SDXL. Yang kami tahu adalah bahwa ini adalah model yang lebih besar dengan lebih banyak parameter dan beberapa perangkat tambahan yang tidak diketahui. Ini adalah model v2, bukan model v3 (apapun artinya). Ada kemungkinan bahwa peningkatan dalam model v2 dapat meningkatkan kinerja sistem, tetapi tanpa informasi lebih lanjut, sulit untuk menentukan seberapa signifikan peningkatan tersebut. Selain itu, akan sangat membantu untuk mengetahui parameter spesifik apa yang telah ditambahkan atau disesuaikan dalam versi ini.

Model SDXL saat ini tersedia di DreamStudio, Stability AIgenerator gambar resmi. Pilih SDXL Beta dari menu model untuk memeriksanya. Tampaknya menggunakan algoritma canggih dan teknik belajar yang mendalam untuk membuat visual menakjubkan yang sempurna untuk berbagai aplikasi.

Apa sebenarnya model SDXL itu?

Perbaikan

Teks yang dapat dibaca. SDXL mampu menghasilkan teks yang dapat dibaca dan mungkin merupakan fitur yang paling mencolok karena tidak mungkin dilakukan pada model v1 dan v2.1 yang ada. Teks yang dihasilkan SDXL tidak selalu akurat seperti yang Anda lihat di Stable Diffusion Teks di bawah. Namun, jauh lebih unggul dari v2.1, apalagi model v1. Ini karena SDXL menggunakan algoritme pembelajaran mendalam yang lebih canggih yang memungkinkannya memahami dan menghasilkan struktur bahasa yang lebih kompleks. Dengan pengembangan lebih lanjut, ini berpotensi menjadi lebih akurat dan andal.

Prompt: foto seorang pria yang memegang kertas putih bertuliskan "No Fakes"
Prompt: foto seorang pria yang memegang kertas putih bertuliskan "No Fakes"
Foto seorang wanita berambut merah memegang tanda hitam dengan huruf putih bertuliskan "No Jokes"
Prompt: Foto seorang wanita berambut merah memegang tanda hitam dengan font putih bertuliskan "No Jokes"
Prompt: Foto seorang wanita Cina yang duduk di bioskop memegang piring dengan tulisan "Pain and Plane" tertulis di atasnya.
Prompt: Foto seorang wanita Tionghoa yang duduk di bioskop memegang piring dengan tulisan "Pain and Plane" di atasnya.

Anatomi manusia. Generasi akurat dari sosok manusia yang benar secara anatomis telah lama menjadi tantangan stable diffusion. Kehadiran anggota badan tambahan atau hilang adalah hal biasa. Inpainting biasanya digunakan untuk memperbaikinya, atau, baru-baru ini, Anda dapat menggunakan fitur Pose Terbuka ControlNet untuk menduplikasi pose dari gambar referensi. Kami senang mengetahui bahwa di sinilah model Beta SDXL telah ditingkatkan. Model Beta SDXL telah menunjukkan peningkatan yang signifikan dalam menduplikasi pose secara akurat dari gambar referensi. Ini bisa menjadi alat yang berharga untuk berbagai aplikasi seperti animasi dan realitas virtual.

Foto seorang wanita dengan pakaian olahraga memutar bola di tangan kanan
Cepat: Foto seorang wanita dalam pakaian olahraga memutar bola di tangan kanan
Foto seorang anak laki-laki duduk di bawah bulan merah
Cepat: Foto seorang anak laki-laki duduk di bawah bulan merah
Cepat: Sebuah foto menunjukkan seorang lelaki tua berlari di hutan.

Gaya potret. SDXL Beta menghasilkan potret luar biasa yang terlihat seperti foto – ini merupakan peningkatan dibandingkan versi 1.5. Algoritme SDXL Beta yang ditingkatkan meningkatkan detail dan akurasi warna potret, menghasilkan tampilan yang lebih alami dan realistis. Pengguna juga dapat menyesuaikan tingkat ketajaman dan saturasi untuk mendapatkan efek yang diinginkan.

Prompt: gambar anak laki-laki dan perempuan
Prompt: gambar anak laki-laki dan perempuan
Prompt: foto potret seorang pria gemuk
Prompt: foto potret seorang pria gemuk
Prompt: bidikan foto seorang wanita dari tahun 80-an
Prompt: bidikan foto seorang wanita dari tahun 80-an

Duonada. Kata kunci duotone selalu menghasilkan foto hitam putih pada model v1.5. Namun kini, gambar duotone yang dihasilkan SDXL Beta hadir dalam berbagai warna. Jelas bahwa dibandingkan dengan model v1, kemampuannya untuk menafsirkan prompt telah meningkat, menghasilkan respons yang lebih akurat dan relevan dari model v2, menjadikannya alat yang lebih andal untuk tugas pemrosesan bahasa alami.

potret gaya duotone seekor anjing
Prompt: potret anjing dengan gaya duotone
lanskap duotone pulau
Prompt: lanskap duotone pulau
potret duotone wanita muda afrika
Prompt: potret duotone wanita muda Afrika

Gaya artistik. Ada beberapa penyesuaian kecil, namun sulit untuk menentukan apakah model baru ini memberikan hasil yang lebih baik karena unik. Ada kemungkinan bahwa penyesuaian ini mungkin merupakan masalah preferensi pribadi atau opini subjektif, sehingga sulit untuk membuat keputusan defipenilaian negatif terhadap kualitasnya. Meskipun demikian, keunikan penyesuaian tersebut mungkin patut diperhatikan dan perlu ditelusuri lebih lanjut.

New York oleh Ivan Aivazovsky
v 1.5: New York oleh Ivan Aivazovsky
New York oleh Ivan Aivazovsky
SDXL: New York oleh Ivan Aivazovsky
Hutan Tua oleh Christopher Balaskas
v 1.5: Hutan Tua oleh Christopher Balaskas
Hutan Tua oleh Christopher Balaskas
SDXL: Hutan Tua oleh Christopher Balaskas

Kesimpulan

  • Stable Diffusion akhirnya bisa menghasilkan teks yang masuk akal.
  • SDXL memberikan gambar yang lebih estetis daripada model v2.1 dan (pada tingkat yang lebih rendah) model v1.5.
  • Model baru menghasilkan gambar yang lebih akurat.
  • Anatomi manusia telah membaik.
  • Permintaan negatif tidak diperlukan seperti di v2.1.
  • Itu dapat membuat potret realistis.
  • Beberapa keanehan dalam model akan diperbaiki sebelum dirilis.

Baca artikel terkait lainnya:

Penolakan tanggung jawab

Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.

Tentang Penulis

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

lebih artikel
Damir Yalalov
Damir Yalalov

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

Hot Stories

Solusi Perdagangan Stablecoin Mata Bangsa BRICS

by Viktoriia Palchik
01 Mei 2024
Bergabunglah dengan Buletin Kami.
Berita Terkini

Hari Hukuman Tiba: Nasib CZ Digantung Saat Pengadilan AS Mempertimbangkan Permohonan DOJ

Changpeng Zhao siap menghadapi hukuman di pengadilan AS di Seattle hari ini.

Tahu lebih banyak

Pendiri Dompet Samourai Dituduh Memfasilitasi $2 Miliar dalam Penawaran Darknet

Kekhawatiran para pendiri Samourai Wallet menunjukkan kemunduran besar bagi industri ini, yang menggarisbawahi ...

Tahu lebih banyak
Bergabunglah dengan Komunitas Teknologi Inovatif Kami
Baca Selengkapnya
Baca lebih lanjut
Ankr Berkolaborasi Dengan Platform AI Blockchain Jaringan Talus Untuk Membuka Likuiditas Bitcoin Untuk AI
Bisnis Laporan berita Teknologi
Ankr Berkolaborasi Dengan Platform AI Blockchain Jaringan Talus Untuk Membuka Likuiditas Bitcoin Untuk AI
1 Mei 2024
Binance Labs Mendukung Lab Pergerakan Untuk Memfasilitasi Integrasi Pergerakan Facebook di Seluruh Blockchain
Bisnis Laporan berita Teknologi
Binance Labs Mendukung Lab Pergerakan Untuk Memfasilitasi Integrasi Pergerakan Facebook di Seluruh Blockchain
1 Mei 2024
Solusi Perdagangan Stablecoin Mata Bangsa BRICS
Bisnis pasar Cerita dan Ulasan Teknologi
Solusi Perdagangan Stablecoin Mata Bangsa BRICS
1 Mei 2024
Bitcoin L2 Network BOB Terintegrasi Dengan LayerZero Untuk Peningkatan Fungsi
Bisnis Laporan berita Teknologi
Bitcoin L2 Network BOB Terintegrasi Dengan LayerZero Untuk Peningkatan Fungsi
1 Mei 2024