Laporan Berita Teknologi
April 10, 2023

Stability AI Mengeluarkan Model Baharu Dipanggil SDXL Beta

Secara ringkas

Stability AI telah mengeluarkan model baharu yang dipanggil SDXL Beta (Stable Diffusion XL Beta). Ia adalah model yang lebih besar dengan lebih banyak parameter dan beberapa peningkatan yang tidak diketahui. Ia boleh didapati di DreamStudio, Stability AIpenjana imej rasmi, dan menggunakan algoritma lanjutan dan teknik pembelajaran mendalam untuk mencipta visual yang menakjubkan.

Stability AI telah melancarkan pratonton model baharu yang dipanggil SDXL Beta, singkatan daripada Stable Diffusion XL Beta. Setakat ini, syarikat itu tidak berkongsi banyak maklumat tentang model itu, tetapi ia tersedia untuk ujian bagi sesiapa sahaja yang ingin berbuat demikian. Untuk apa novel tentang model SDXL ini stable diffusion? Apakah kelebihan dan kekurangannya? Mari kita siasat.

Baca lebih lanjut: Midjourney dan Dall-E Artist Styles Dump dengan Contoh: 130 Teknik Lukisan AI Terkenal

Apakah sebenarnya model SDXL?

Model SDXL ialah model baharu yang kini sedang dilatih. Ia masih jauh dari selesai, dan pada masa ia dikeluarkan, banyak butiran mengenainya mungkin berubah; untuk pengetahuan semua, ia mungkin tidak dipanggil model SDXL. Apa yang kita tahu ialah ia adalah model yang lebih besar dengan lebih banyak parameter dan beberapa peningkatan yang tidak diketahui. Ia adalah model v2, bukan model v3 (apa pun maksudnya). Ada kemungkinan peningkatan dalam model v2 boleh meningkatkan prestasi sistem, tetapi tanpa maklumat lanjut, adalah sukar untuk menentukan betapa ketara peningkatan ini. Selain itu, adalah berguna untuk mengetahui parameter khusus yang telah ditambah atau dilaraskan dalam versi ini.

Model SDXL kini boleh didapati di DreamStudio, Stability AIpenjana imej rasmi. Pilih SDXL Beta daripada menu model untuk menyemaknya. Nampaknya menggunakan algoritma lanjutan dan teknik pembelajaran mendalam untuk mencipta visual yang menakjubkan yang sesuai untuk pelbagai aplikasi.

Apakah sebenarnya model SDXL?

Penambahbaikan

Teks boleh dibaca. SDXL mampu menjana teks yang boleh dibaca dan ia mungkin merupakan ciri yang paling menarik kerana ia tidak mungkin dalam model v1 dan v2.1 sedia ada. Teks yang dijana SDXL tidak selalu tepat seperti yang anda lihat dalam Stable Diffusion Teks di bawah. Walau bagaimanapun, ia jauh lebih baik daripada v2.1, apatah lagi model v1. Ini kerana SDXL menggunakan algoritma pembelajaran mendalam yang lebih maju yang membolehkannya memahami dan menjana struktur bahasa yang lebih kompleks. Dengan pembangunan selanjutnya, ia berpotensi untuk menjadi lebih tepat dan boleh dipercayai.

Prompt: foto seorang lelaki yang memegang kertas putih bertulis "No Fakes"
Prompt: foto seorang lelaki yang memegang kertas putih bertulis "No Fakes"
Foto seorang wanita berambut merah memegang papan tanda hitam dengan fon putih bertulis "No Jokes"
Gesaan: Foto seorang wanita berambut merah memegang papan tanda hitam dengan fon putih bertulis "No Jokes"
Prompt: Foto seorang wanita cina duduk di pawagam memegang pinggan dengan perkataan "Pain and Plane" tertulis di atasnya.
Gesaan: Foto seorang wanita Cina duduk di pawagam sambil memegang pinggan dengan perkataan "Sakit dan Pesawat" di atasnya.

Anatomi manusia. Penjanaan angka manusia yang betul secara anatomi telah lama menjadi cabaran stable diffusion. Kehadiran anggota badan tambahan atau hilang adalah perkara biasa. Inpainting biasanya digunakan untuk membetulkannya, atau, lebih baru-baru ini, anda boleh menggunakan ciri Open Pose ControlNet untuk menduplikasi pose daripada imej rujukan. Kami gembira untuk ambil perhatian bahawa di sinilah model Beta SDXL telah bertambah baik. Model Beta SDXL telah menunjukkan peningkatan yang ketara dalam menduplikasi pose secara tepat daripada imej rujukan. Ini boleh menjadi alat yang berharga untuk pelbagai aplikasi seperti animasi dan realiti maya.

Foto seorang wanita dalam pakaian sukan memutar bola di tangan kanan
Gesaan: Foto seorang wanita dalam pakaian sukan sedang memutar bola di tangan kanan
Foto seorang budak lelaki duduk di bawah bulan merah
Gesaan: Foto seorang budak lelaki duduk di bawah bulan merah
Gesaan: Foto menunjukkan seorang lelaki tua berlari di dalam hutan.

Gaya potret. SDXL Beta menghasilkan potret yang sangat baik yang kelihatan seperti foto - ia adalah peningkatan berbanding versi 1.5. Algoritma yang dipertingkatkan dalam SDXL Beta meningkatkan perincian dan ketepatan warna potret, menghasilkan rupa yang lebih semula jadi dan realistik. Pengguna juga boleh melaraskan tahap ketajaman dan ketepuan untuk mencapai kesan yang diingini.

Prompt: gambar lelaki dan perempuan
Prompt: gambar lelaki dan perempuan
Prompt: foto potret seorang lelaki gemuk
Prompt: foto potret seorang lelaki gemuk
Prompt: tangkapan foto seorang wanita dari 80-an
Prompt: tangkapan foto seorang wanita dari 80-an

Duotone. Kata kunci duotone sentiasa menghasilkan foto hitam-putih dalam model v1.5. Namun, kini, imej duotone yang dihasilkan oleh SDXL Beta hadir dalam pelbagai warna. Adalah jelas bahawa berbanding dengan model v1, keupayaan untuk mentafsir gesaan telah bertambah baik, menghasilkan respons yang lebih tepat dan relevan daripada model v2, menjadikannya alat yang lebih dipercayai untuk tugas pemprosesan bahasa semula jadi.

potret gaya duotone seekor anjing
Prompt: potret gaya duotone seekor anjing
landskap duotone pulau
Prompt: landskap duotone pulau
potret duotone wanita muda afrika
Prompt: potret duotone wanita muda afrika

Gaya artistik. Terdapat beberapa pelarasan kecil, tetapi sukar untuk menentukan sama ada model baharu memberikan hasil yang lebih baik kerana ia unik. Ada kemungkinan pelarasan ini boleh menjadi soal keutamaan peribadi atau pendapat subjektif, menjadikannya sukar untuk membuat a defipertimbangan nitive terhadap kualiti mereka. Walau bagaimanapun, keunikan pelarasan mungkin perlu diberi perhatian dan patut diterokai dengan lebih lanjut.

New York oleh Ivan Aivazovsky
v 1.5: New York oleh Ivan Aivazovsky
New York oleh Ivan Aivazovsky
SDXL: New York oleh Ivan Aivazovsky
Hutan Lama oleh Christopher Balaskas
v 1.5: Hutan Lama oleh Christopher Balaskas
Hutan Lama oleh Christopher Balaskas
SDXL: Old Forest oleh Christopher Balaskas

Kesimpulan

  • Stable Diffusion akhirnya dapat menghasilkan teks yang masuk akal.
  • SDXL menyediakan imej yang lebih estetik daripada model v2.1 dan (sedikit sebanyak) model v1.5.
  • Model baharu menghasilkan imej yang lebih tepat.
  • Anatomi manusia telah bertambah baik.
  • Gesaan negatif tidak diperlukan seperti dalam v2.1.
  • Ia boleh mencipta potret realistik.
  • Beberapa keanehan dalam model akan diperbaiki sebelum dikeluarkan.

Baca lebih banyak artikel berkaitan:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Hot Stories

Penyelesaian Perdagangan Stablecoin Mata BRICS Nations

by Viktoriia Palchik
Semoga 01, 2024
Sertai Surat Berita Kami.
Berita Terkini

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut

Pengasas Samourai Wallet Dituduh Memudahkan $2B dalam Tawaran Darknet

Kebimbangan pengasas Samourai Wallet mewakili kemunduran yang ketara bagi industri, menekankan ...

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Untuk Lebih Lanjut
Baca lagi
Ankr Bekerjasama Dengan AI Blockchain Platform Talus Network Untuk Membuka Kunci Kecairan Bitcoin Untuk AI
Perniagaan Laporan Berita Teknologi
Ankr Bekerjasama Dengan AI Blockchain Platform Talus Network Untuk Membuka Kunci Kecairan Bitcoin Untuk AI
Semoga 1, 2024
Binance Labs Menyokong Makmal Pergerakan Untuk Memudahkan Penyepaduan Pergerakan Facebook Merentasi Blockchain
Perniagaan Laporan Berita Teknologi
Binance Labs Menyokong Makmal Pergerakan Untuk Memudahkan Penyepaduan Pergerakan Facebook Merentasi Blockchain
Semoga 1, 2024
Penyelesaian Perdagangan Stablecoin Mata BRICS Nations
Perniagaan pasaran Cerita dan Ulasan Teknologi
Penyelesaian Perdagangan Stablecoin Mata BRICS Nations
Semoga 1, 2024
Rangkaian Bitcoin L2 BOB Bersepadu Dengan LayerZero Untuk Kefungsian Yang Dipertingkatkan
Perniagaan Laporan Berita Teknologi
Rangkaian Bitcoin L2 BOB Bersepadu Dengan LayerZero Untuk Kefungsian Yang Dipertingkatkan
Semoga 1, 2024