Laporan Berita Teknologi
November 23, 2022

Teks-ke-SVG: Berkeley mengumumkan model resapan berasaskan piksel yang mengabstraksi

Secara ringkas

Sintesis teks-ke-imej - Penyelidik UC Berkeley menunjukkan grafik vektor dengan keadaan teks model penyebaran

Dalam sintesis teks-ke-imej, model resapan mempunyai menunjukkan hasil yang cemerlang. Model resapan belajar menghasilkan imej raster bagi objek dan situasi yang sangat pelbagai menggunakan pangkalan data gambar beranotasi yang besar. Walau bagaimanapun, untuk ikon digital, grafik dan pelekat, pereka bentuk biasanya menggunakan perwakilan vektor bagi imej seperti Grafik Vektor Boleh Skala (SVG). Grafik vektor adalah kecil dan boleh diskalakan kepada sebarang saiz.

Teks-ke-SVG: Berkeley mengumumkan model resapan berasaskan piksel yang mengabstraksi

UC Berkeley menunjukkan cara untuk menghasilkan grafik vektor yang boleh dieksport sebagai SVG menggunakan model resapan berhawa dingin yang dilatih mengenai perwakilan piksel gambar. Ia mencapai ini tanpa menggunakan koleksi SVG yang banyak dengan kapsyen. Sebaliknya, penyelidik Berkeley membuat vektor a penyebaran teks ke imej sampel dan memperhalusinya dengan kehilangan Pensampelan Penyulingan Skor, didorong oleh kerja terbaru tentang sintesis teks-ke-3D.

Contoh vektor yang dihasilkan

Lihat galeri SVG yang baru dijana disini.

Grafik vektor adalah kecil tetapi mengekalkan ketajamannya apabila diskalakan kepada sebarang saiz. Penyelidik di Berkeley menambah baik kehilangan teks imej berdasarkan Pensampelan Penyulingan Skor untuk mengoptimumkan grafik vektor. Penyampai SVG yang boleh dibezakan DiffVG, yang digunakan oleh VectorFusion, membolehkan visual songsang.

Selain itu, VectorFusion membenarkan konfigurasi berbilang peringkat yang lebih berkesan dan berkualiti tinggi. Kaedah ini bermula dengan mengambil sampel raster daripada model penyebaran teks ke imej dipanggil Stable Diffusion. Sampel kemudian dikesan secara automatik oleh VectorFusion menggunakan LIVE. Sampel ini, walau bagaimanapun, sering kurang terperinci, membosankan, atau sukar untuk menyesuaikan diri dengan grafik vektor. Meningkatkan kerancakan dan ketekalan teks melalui Pensampelan Penyulingan Skor.

VectorFusion boleh menghasilkan seni piksel dalam gaya permainan video lama dengan mengehadkan laluan SVG kepada petak pada grid.

Pendekatan ini mudah dikembangkan untuk menyokong penjanaan teks-ke-lakaran. Untuk mempelajari lukisan garisan abstrak yang mewakili teks yang dibekalkan pengguna dengan tepat, kami mula-mula melukis 16 sebatan yang dipilih secara rawak. Kemudian, kami mengoptimumkan kehilangan Pensampelan Penyulingan Skor terpendam kami.

Baca artikel berkaitan:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut

Pengasas Samourai Wallet Dituduh Memudahkan $2B dalam Tawaran Darknet

Kebimbangan pengasas Samourai Wallet mewakili kemunduran yang ketara bagi industri, menekankan ...

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Untuk Lebih Lanjut
Baca lagi
Pantera Capital Melabur Dalam TON Blockchain, Menyatakan Keyakinan Terhadap Potensi Telegram Untuk Meluaskan Kebolehcapaian Kripto
Perniagaan Laporan Berita Teknologi
Pantera Capital Melabur Dalam TON Blockchain, Menyatakan Keyakinan Terhadap Potensi Telegram Untuk Meluaskan Kebolehcapaian Kripto
Semoga 2, 2024
Mitosis Meningkatkan $7 juta Dalam Pembiayaan Daripada Amber Group Dan Foresight Ventures Untuk Memajukan Protokol Kecairan Modularnya
Perniagaan Laporan Berita Teknologi
Mitosis Meningkatkan $7 juta Dalam Pembiayaan Daripada Amber Group Dan Foresight Ventures Untuk Memajukan Protokol Kecairan Modularnya
Semoga 2, 2024
Galxe Bekerjasama Dengan Jambo Untuk Meluaskan Kebolehcapaian Global Kepada Web3
Perniagaan Laporan Berita Teknologi
Galxe Bekerjasama Dengan Jambo Untuk Meluaskan Kebolehcapaian Global Kepada Web3
Semoga 2, 2024
Med-Gemini Google Bersedia untuk Memberi Permulaan kepada GPT-4 Dengan Prestasi Unggulnya dalam Penjagaan Kesihatan
AI Wiki Berita perisian Teknologi
Med-Gemini Google Bersedia untuk Memberi Permulaan kepada GPT-4 Dengan Prestasi Unggulnya dalam Penjagaan Kesihatan
Semoga 2, 2024