StyleGAN-T: Penjanaan teks-ke-imej terpantas yang menghasilkan keputusan dalam masa kurang daripada 0.1 saat
Secara ringkas
StyleGAN-T ialah GAN baharu untuk penjanaan tex2image.
GAN ini menghasilkan hasil yang baik malah agak pantas (0.1 saat untuk imej 512×512).
Seni bina baharu adalah berdasarkan StyleGAN-XL, tetapi ia menilai semula reka bentuk penjana dan diskriminasi.
Anda pasti perasan bahawa GAN tidak lagi dibincangkan apabila topik penjanaan imej muncul. Selepas model penyebaran seperti Stable Diffusion muncul, GAN entah bagaimana berundur ke latar belakang. Ini kerana mereka mencabar untuk berlatih dan kerap tersandung. Satu-satunya faedah GAN ialah, tidak seperti model resapan, mereka menghasilkan imej dalam satu larian ("hantaran ke hadapan") dan bukannya banyak larian.
Tetapi kini pemain baru dari GAN telah memasuki padang: StyleGAN-T. GAN untuk penjanaan teks-ke-imej ini menghasilkan hasil yang baik dengan pantas, kerana ia hanya mengambil masa 0.1 saat untuk imej 512×512. Seni bina baharu adalah berdasarkan StyleGAN-XL, tetapi ia menilai semula reka bentuk penjana dan diskriminator dan menggunakan CLIP untuk penjajaran segera teks dan grafik yang dihasilkan.
Artikel berkaitan: VToonify: Model AI masa nyata untuk menjana video potret artistik |
Secara umum, StyleGAN-T kini mencipta teks ke imej dengan lebih pantas dan lebih tepat berbanding GAN lain. Walau bagaimanapun, GAN masih teruk dan kualiti model SD bersaiz penuh jelas tidak dapat dipertikaikan. Tetapi itu semua bergantung pada keupayaan untuk menghasilkan imej yang sangat berkualiti tinggi daripada teks dalam masa kurang daripada satu saat dalam setahun. Selain itu, ia akan jatuh di suatu tempat antara GAN dan model penyebaran.
Baca lebih lanjut mengenai AI:
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.
lebih banyak artikelDamir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.