Teks-ke-SVG: Berkeley mengumumkan model resapan berasaskan piksel yang mengabstraksi
Secara ringkas
Sintesis teks-ke-imej - Penyelidik UC Berkeley menunjukkan grafik vektor dengan keadaan teks model penyebaran
Dalam sintesis teks-ke-imej, model resapan mempunyai menunjukkan hasil yang cemerlang. Model resapan belajar menghasilkan imej raster bagi objek dan situasi yang sangat pelbagai menggunakan pangkalan data gambar beranotasi yang besar. Walau bagaimanapun, untuk ikon digital, grafik dan pelekat, pereka bentuk biasanya menggunakan perwakilan vektor bagi imej seperti Grafik Vektor Boleh Skala (SVG). Grafik vektor adalah kecil dan boleh diskalakan kepada sebarang saiz.
UC Berkeley menunjukkan cara untuk menghasilkan grafik vektor yang boleh dieksport sebagai SVG menggunakan model resapan berhawa dingin yang dilatih mengenai perwakilan piksel gambar. Ia mencapai ini tanpa menggunakan koleksi SVG yang banyak dengan kapsyen. Sebaliknya, penyelidik Berkeley membuat vektor a penyebaran teks ke imej sampel dan memperhalusinya dengan kehilangan Pensampelan Penyulingan Skor, didorong oleh kerja terbaru tentang sintesis teks-ke-3D.
Contoh vektor yang dihasilkan
Lihat galeri SVG yang baru dijana disini.
Grafik vektor adalah kecil tetapi mengekalkan ketajamannya apabila diskalakan kepada sebarang saiz. Penyelidik di Berkeley menambah baik kehilangan teks imej berdasarkan Pensampelan Penyulingan Skor untuk mengoptimumkan grafik vektor. Penyampai SVG yang boleh dibezakan DiffVG, yang digunakan oleh VectorFusion, membolehkan visual songsang.
Selain itu, VectorFusion membenarkan konfigurasi berbilang peringkat yang lebih berkesan dan berkualiti tinggi. Kaedah ini bermula dengan mengambil sampel raster daripada model penyebaran teks ke imej dipanggil Stable Diffusion. Sampel kemudian dikesan secara automatik oleh VectorFusion menggunakan LIVE. Sampel ini, walau bagaimanapun, sering kurang terperinci, membosankan, atau sukar untuk menyesuaikan diri dengan grafik vektor. Meningkatkan kerancakan dan ketekalan teks melalui Pensampelan Penyulingan Skor.
VectorFusion boleh menghasilkan seni piksel dalam gaya permainan video lama dengan mengehadkan laluan SVG kepada petak pada grid.
Pendekatan ini mudah dikembangkan untuk menyokong penjanaan teks-ke-lakaran. Untuk mempelajari lukisan garisan abstrak yang mewakili teks yang dibekalkan pengguna dengan tepat, kami mula-mula melukis 16 sebatan yang dipilih secara rawak. Kemudian, kami mengoptimumkan kehilangan Pensampelan Penyulingan Skor terpendam kami.
Baca artikel berkaitan:
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.
lebih banyak artikelDamir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.