Laporan Berita Teknologi
November 24, 2022

Stability AI's Stable Diffusion 2 Algoritma Akhirnya Terbuka: model depth2img baharu, penaik tinggi resolusi super, tiada kandungan dewasa

Secara ringkas

Stable Diffusion Model 2.0 lebih pantas, sumber terbuka, berskala, lebih teguh daripada model sebelumnya

Stable Diffusion menyediakan GPU dengan ciri baharu untuk pemaparan masa nyata

Berpandukan kedalaman stable diffusion model – Imej-ke-imej dengan idea baharu untuk aplikasi kreatif

Stability AI mempunyai dikeluarkan kertas kerja baru di blognya tentang Stable Diffusion 2. Di dalamnya, Stability AI mencadangkan algoritma baharu yang lebih cekap dan teguh daripada yang sebelumnya sambil menanda arasnya dengan kaedah terkini yang lain.

Buka AI Stable Diffusion 2 Algoritma Akhirnya Terbuka: model depth2img baharu, penaik tinggi resolusi super, tiada kandungan dewasa

Asal CompVis Stable Diffusion Model V1 merevolusikan sifat sumber terbuka model AI dan menghasilkan ratusan model dan kemajuan yang berbeza di seluruh dunia. Ia menyaksikan salah satu peningkatan terpantas kepada 10,000 bintang Github, mengumpul 33,000 bintang dalam masa kurang daripada dua bulan, lebih pantas daripada lebih banyak program di Github.

Asal Stable Diffusion Keluaran V1 diketuai oleh pasukan dinamik Robin Rombach (Stability AI) dan Patrick Esser (Runway ML) daripada Kumpulan CompVis di LMU Munich, diketuai oleh Prof. Dr. Björn Ommer. Mereka membina kerja makmal sebelumnya dengan Latent Model Penyebaran dan menerima sokongan kritikal daripada LAION dan Eleuther AI.

Buka AI Stable Diffusion 2 Algoritma Akhirnya Terbuka: model depth2img baharu, penaik tinggi resolusi super, tiada kandungan dewasa
Buka AI Stable Diffusion 2 Algoritma Akhirnya Terbuka: model depth2img baharu, penaik tinggi resolusi super, tiada kandungan dewasa

Apa yang membuat Stable Diffusion v1 berbeza daripada Stable Diffusion v2? 

Stable Diffusion 2.0 termasuk beberapa peningkatan dan ciri yang ketara berbanding versi sebelumnya, jadi mari kita lihat mereka.

. Stable Diffusion Keluaran 2.0 menampilkan model teks-ke-imej yang mantap yang dilatih dengan pengekod teks baharu baharu (OpenCLIP) yang dibangunkan oleh LAION dengan bantuan daripada Stability AI, yang meningkatkan kualiti dengan ketara imej yang dihasilkan berbanding keluaran V1 sebelumnya. Model teks-ke-imej keluaran ini boleh mengeluarkan imej dengan resolusi lalai 512×512 piksel dan 768×768 piksel.

Model ini dilatih menggunakan subset estetik set data LAION-5B yang dijana oleh Stability AIPasukan DeepFloyd, yang kemudiannya ditapis untuk mengecualikan kandungan dewasa menggunakan penapis NSFW LAION.

Penilaian menggunakan 50 langkah sampel DDIM, 50 skala panduan bebas pengelas, dan 1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0 dan 8.0 menunjukkan peningkatan relatif bagi pusat pemeriksaan:

Apa yang membuat Stable Diffusion v1 berbeza daripada Stable Diffusion v2?

Stable Diffusion 2.0 kini menggabungkan model Penyebaran Upscaler, yang meningkatkan resolusi imej dengan faktor empat. Contoh model kami upscaling imej yang dihasilkan berkualiti rendah (128×128) ke dalam imej peleraian yang lebih tinggi ditunjukkan di bawah (512×512). Stable Diffusion 2.0, apabila digabungkan dengan model teks ke imej kami, kini boleh menjana imej dengan resolusi 2048×2048 atau lebih tinggi.

Baru berpandukan kedalaman stable diffusion model, depth2img, memanjangkan ciri imej-ke-imej terdahulu daripada V1 dengan kemungkinan kreatif yang baharu sepenuhnya. Depth2img menentukan kedalaman imej input (menggunakan model sedia ada) dan kemudian menjana baharu imej berdasarkan kedua-dua teks dan maklumat kedalaman. Kedalaman-ke-Imej boleh menyediakan pelbagai aplikasi kreatif baharu, menawarkan perubahan yang kelihatan jauh berbeza daripada yang asal sambil mengekalkan keselarasan dan kedalaman imej.

Apa yang baru dalam Stable Diffusion 2?

  • Baru stable diffusion model menawarkan resolusi 768×768.
  • U-Net mempunyai jumlah parameter yang sama seperti versi 1.5, tetapi ia dilatih dari awal dan menggunakan OpenCLIP-ViT/H sebagai pengekod teksnya. Model ramalan v yang dipanggil ialah SD 2.0-v.
  • Model yang dinyatakan di atas telah dilaraskan daripada SD 2.0-base, yang turut disediakan dan dilatih sebagai model ramalan hingar biasa pada imej 512×512.
  • Model resapan berpandukan teks terpendam dengan penskalaan x4 telah ditambahkan.
  • Berpandukan kedalaman asas SD 2.0 yang diperhalusi stable diffusion model. Model ini boleh digunakan untuk memelihara struktur img2img dan sintesis bersyarat bentuk dan dikondisikan pada anggaran kedalaman monokular yang disimpulkan oleh MiDaS.
  • Model lukisan berpandukan teks yang dipertingkat yang dibina di atas asas SD 2.0.

Pembangun bekerja keras, sama seperti lelaran awal Stable Diffusion, untuk mengoptimumkan model untuk dijalankan pada satu GPU—mereka mahu menjadikannya boleh diakses oleh seramai mungkin orang dari awal lagi. Mereka telah pun melihat apa yang berlaku apabila berjuta-juta individu mendapatkan model ini dan bekerjasama untuk membina perkara yang benar-benar luar biasa. Inilah kuasa sumber terbuka: memanfaatkan potensi besar berjuta-juta orang berbakat yang mungkin tidak mempunyai sumber untuk melatih model canggih tetapi mempunyai keupayaan untuk melakukan perkara yang luar biasa dengan model tersebut.

Apa yang baru dalam Stable Diffusion 2?

Kemas kini baharu ini, digabungkan dengan ciri baharu yang berkuasa seperti depth2img dan keupayaan peningkatan resolusi yang lebih baik, akan berfungsi sebagai asas untuk sejumlah besar aplikasi baharu dan membolehkan ledakan potensi kreatif baharu.

Baca lebih lanjut mengenai Stable Diffusion:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Untuk Lebih Lanjut
Baca lagi
Injektif Menyertai Pasukan Dengan AltLayer Untuk Membawa Keselamatan Restaking Kepada inEVM
Perniagaan Laporan Berita Teknologi
Injektif Menyertai Pasukan Dengan AltLayer Untuk Membawa Keselamatan Restaking Kepada inEVM
Semoga 3, 2024
Masa Bekerjasama Dengan Juruwang Untuk Memperkenalkan Kumpulan Pinjaman MASA, Membolehkan Pinjaman USDC Di Pangkalan
pasaran Laporan Berita Teknologi
Masa Bekerjasama Dengan Juruwang Untuk Memperkenalkan Kumpulan Pinjaman MASA, Membolehkan Pinjaman USDC Di Pangkalan
Semoga 3, 2024
Velodrome Melancarkan Versi Beta Superchain Dalam Minggu Akan Datang Dan Berkembang Merentasi OP Stack Layer 2 Blockchains
pasaran Laporan Berita Teknologi
Velodrome Melancarkan Versi Beta Superchain Dalam Minggu Akan Datang Dan Berkembang Merentasi OP Stack Layer 2 Blockchains
Semoga 3, 2024
CARV Mengumumkan Perkongsian Dengan Aethir Untuk Memusnahkan Lapisan Datanya Dan Mengedarkan Ganjaran
Perniagaan Laporan Berita Teknologi
CARV Mengumumkan Perkongsian Dengan Aethir Untuk Memusnahkan Lapisan Datanya Dan Mengedarkan Ganjaran
Semoga 3, 2024