Laporan Berita Teknologi
Januari 24, 2023

StyleGAN-T: Penjanaan teks-ke-imej terpantas yang menghasilkan keputusan dalam masa kurang daripada 0.1 saat

Secara ringkas

StyleGAN-T ialah GAN baharu untuk penjanaan tex2image.

GAN ini menghasilkan hasil yang baik malah agak pantas (0.1 saat untuk imej 512×512).

Seni bina baharu adalah berdasarkan StyleGAN-XL, tetapi ia menilai semula reka bentuk penjana dan diskriminasi.

Anda pasti perasan bahawa GAN tidak lagi dibincangkan apabila topik penjanaan imej muncul. Selepas model penyebaran seperti Stable Diffusion muncul, GAN entah bagaimana berundur ke latar belakang. Ini kerana mereka mencabar untuk berlatih dan kerap tersandung. Satu-satunya faedah GAN ialah, tidak seperti model resapan, mereka menghasilkan imej dalam satu larian ("hantaran ke hadapan") dan bukannya banyak larian.

StyleGAN-T: Penjanaan teks-ke-imej terpantas dalam masa kurang daripada 0.1 saat

Tetapi kini pemain baru dari GAN telah memasuki padang: StyleGAN-T. GAN untuk penjanaan teks-ke-imej ini menghasilkan hasil yang baik dengan pantas, kerana ia hanya mengambil masa 0.1 saat untuk imej 512×512. Seni bina baharu adalah berdasarkan StyleGAN-XL, tetapi ia menilai semula reka bentuk penjana dan diskriminator dan menggunakan CLIP untuk penjajaran segera teks dan grafik yang dihasilkan.

Artikel berkaitan: VToonify: Model AI masa nyata untuk menjana video potret artistik

Secara umum, StyleGAN-T kini mencipta teks ke imej dengan lebih pantas dan lebih tepat berbanding GAN lain. Walau bagaimanapun, GAN masih teruk dan kualiti model SD bersaiz penuh jelas tidak dapat dipertikaikan. Tetapi itu semua bergantung pada keupayaan untuk menghasilkan imej yang sangat berkualiti tinggi daripada teks dalam masa kurang daripada satu saat dalam setahun. Selain itu, ia akan jatuh di suatu tempat antara GAN dan model penyebaran.

Seni bina StyleGAN-T
Seni bina StyleGAN-T

Baca lebih lanjut mengenai AI:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut

Pengasas Samourai Wallet Dituduh Memudahkan $2B dalam Tawaran Darknet

Kebimbangan pengasas Samourai Wallet mewakili kemunduran yang ketara bagi industri, menekankan ...

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Untuk Lebih Lanjut
Baca lagi
Pantera Capital Melabur Dalam TON Blockchain, Menyatakan Keyakinan Terhadap Potensi Telegram Untuk Meluaskan Kebolehcapaian Kripto
Perniagaan Laporan Berita Teknologi
Pantera Capital Melabur Dalam TON Blockchain, Menyatakan Keyakinan Terhadap Potensi Telegram Untuk Meluaskan Kebolehcapaian Kripto
Semoga 2, 2024
Mitosis Meningkatkan $7 juta Dalam Pembiayaan Daripada Amber Group Dan Foresight Ventures Untuk Memajukan Protokol Kecairan Modularnya
Perniagaan Laporan Berita Teknologi
Mitosis Meningkatkan $7 juta Dalam Pembiayaan Daripada Amber Group Dan Foresight Ventures Untuk Memajukan Protokol Kecairan Modularnya
Semoga 2, 2024
Galxe Bekerjasama Dengan Jambo Untuk Meluaskan Kebolehcapaian Global Kepada Web3
Perniagaan Laporan Berita Teknologi
Galxe Bekerjasama Dengan Jambo Untuk Meluaskan Kebolehcapaian Global Kepada Web3
Semoga 2, 2024
Med-Gemini Google Bersedia untuk Memberi Permulaan kepada GPT-4 Dengan Prestasi Unggulnya dalam Penjagaan Kesihatan
AI Wiki Berita perisian Teknologi
Med-Gemini Google Bersedia untuk Memberi Permulaan kepada GPT-4 Dengan Prestasi Unggulnya dalam Penjagaan Kesihatan
Semoga 2, 2024