Laporan berita
September 30, 2022

Text-to-3D: Google telah mengembangkan jaringan saraf yang menghasilkan model 3D dari deskripsi teks

Singkatnya

Teks-ke-3D jaringan saraf dapat menghasilkan model 3D dari teks

DreamFusion mengoptimalkan adegan 3D berdasarkan Imagen text-to-image

Model difusi 2D dapat digunakan untuk sintesis teks-ke-gambar

Google membuat a saraf jaringan mampu membuat model 3D dari deskripsi teks. Bagian terbaiknya adalah aspek yang paling sulit bahkan tidak perlu diajarkan. Imagen digunakan sebagai dasar untuk Text-to-3D.

Text-to-3D: Google telah mengembangkan jaringan saraf yang menghasilkan model 3D dari deskripsi teks

Apa yang harus Anda ketahui tentang Penggabungan Mimpi?

Model difusi yang dilatih pada miliaran pasangan gambar-teks telah menghasilkan kemajuan terbaru dalam sintesis teks-ke-gambar. Mengadaptasi pendekatan ini ke sintesis 3D akan memerlukan kumpulan data berskala besar dari aset 3D berlabel serta arsitektur data 3D denoising yang efisien, yang keduanya tidak tersedia saat ini. Dalam makalah ini, kami mengatasi batasan ini dengan melakukan sintesis teks-ke-3D dengan 2D yang telah dilatih sebelumnya difusi teks-ke-gambar model. Kami menyajikan kerugian berdasarkan distilasi kepadatan probabilitas yang memungkinkan model difusi 2D digunakan sebagai prioritas untuk mengoptimalkan parameter parametrik. pembuat gambar. Dengan menggunakan kerugian ini, kami menggunakan penurunan gradien untuk mengoptimalkan model 3D yang diinisialisasi secara acak (Neural Radiance Field atau NeRF) sehingga rendering 2D dari sudut acak memiliki kerugian minimal.

Model 3D yang dihasilkan dari teks yang ditentukan dapat dilihat dari sudut mana pun, diterangi dengan pencahayaan variabel, dan digabungkan menjadi lingkungan 3D apa pun. Metodenya tidak memerlukan data pelatihan 3D dan tidak ada perubahan pada model difusi gambar, menggambarkan kemanjuran menggunakan model difusi gambar yang telah dilatih sebelumnya seperti sebelumnya.

DreamFusion membuat model 3D yang dapat menyala ulang dengan tampilan, kedalaman, dan normal dengan fidelitas tinggi berdasarkan keterangan. Objek direpresentasikan sebagai Neural Radiance Field, dengan pretrained difusi teks-ke-gambar sebelumnya seperti Imagen yang digunakan.

Contoh 3D yang Dihasilkan Dari Teks

Prompt: foto seekor tupai yang mengenakan baju zirah abad pertengahan memainkan saksofon
Cepat: foto seekor tupai yang mengenakan gaun pesta elegan duduk di roda tembikar membentuk mangkuk tanah liat
Prompt: patung logam tupai yang sangat detail mengenakan hoodie ungu mengendarai sepeda motor
Prompt: ukiran kayu tupai yang rumit mengenakan baju zirah abad pertengahan yang memegang katana

Menyatukan objek untuk membuat heboh

Bagaimana cara kerjanya?

DreamFusion mengoptimalkan adegan 3D berdasarkan keterangan menggunakan model generatif teks-ke-gambar Imagen. Ini menyarankan Score Distillation Sampling (SDS), yang melibatkan pengoptimalan fungsi kerugian untuk menghasilkan sampel dari model difusi. Selama kita dapat memetakan kembali ke gambar secara berbeda, SDS memungkinkan kita mengoptimalkan sampel di ruang parameter apa pun, seperti ruang 3D. Ke defiDalam pemetaan yang dapat dibedakan ini, ia menggunakan parameterisasi pemandangan 3D yang mirip dengan Neural Radiance Fields atau NeRFs. SDS sendiri menciptakan tampilan pemandangan yang lumayan, namun DreamFusion menyempurnakan geometri dengan pengatur tambahan dan teknik pengoptimalan. NeRF terlatih yang dihasilkan bersifat koheren, memiliki normal, geometri permukaan, dan kedalaman yang sangat baik, serta dapat ditampilkan kembali menggunakan model bayangan Lambertian.

Baca artikel terkait:

Penolakan tanggung jawab

Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.

Tentang Penulis

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

lebih artikel
Damir Yalalov
Damir Yalalov

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

Selera Institusional Tumbuh Terhadap ETF Bitcoin Di Tengah Volatilitas

Pengungkapan melalui pengajuan 13F mengungkapkan investor institusi terkemuka yang mencoba-coba ETF Bitcoin, menggarisbawahi semakin besarnya penerimaan ...

Tahu lebih banyak

Hari Hukuman Tiba: Nasib CZ Digantung Saat Pengadilan AS Mempertimbangkan Permohonan DOJ

Changpeng Zhao siap menghadapi hukuman di pengadilan AS di Seattle hari ini.

Tahu lebih banyak
Bergabunglah dengan Komunitas Teknologi Inovatif Kami
Baca Selengkapnya
Baca lebih lanjut
Injective Bergabung Dengan AltLayer Untuk Membawa Keamanan Ulang ke inEVM
Bisnis Laporan berita Teknologi
Injective Bergabung Dengan AltLayer Untuk Membawa Keamanan Ulang ke inEVM
3 Mei 2024
Masa Bekerja Sama Dengan Teller Untuk Memperkenalkan MASA Lending Pool, Memungkinkan Pinjaman USDC Di Pangkalan
pasar Laporan berita Teknologi
Masa Bekerja Sama Dengan Teller Untuk Memperkenalkan MASA Lending Pool, Memungkinkan Pinjaman USDC Di Pangkalan
3 Mei 2024
Velodrome Meluncurkan Versi Beta Superchain Dalam Beberapa Minggu Mendatang Dan Memperluas Di Seluruh Blockchain OP Stack Layer 2
pasar Laporan berita Teknologi
Velodrome Meluncurkan Versi Beta Superchain Dalam Beberapa Minggu Mendatang Dan Memperluas Di Seluruh Blockchain OP Stack Layer 2
3 Mei 2024
CARV Mengumumkan Kemitraan Dengan Aethir Untuk Mendesentralisasikan Lapisan Datanya Dan Mendistribusikan Hadiah
Bisnis Laporan berita Teknologi
CARV Mengumumkan Kemitraan Dengan Aethir Untuk Mendesentralisasikan Lapisan Datanya Dan Mendistribusikan Hadiah
3 Mei 2024