Laporan berita
September 30, 2022

Text-to-3D: Google telah mengembangkan jaringan saraf yang menghasilkan model 3D dari deskripsi teks

Singkatnya

Teks-ke-3D jaringan saraf dapat menghasilkan model 3D dari teks

DreamFusion mengoptimalkan adegan 3D berdasarkan Imagen text-to-image

Model difusi 2D dapat digunakan untuk sintesis teks-ke-gambar

Google membuat a saraf jaringan mampu membuat model 3D dari deskripsi teks. Bagian terbaiknya adalah aspek yang paling sulit bahkan tidak perlu diajarkan. Imagen digunakan sebagai dasar untuk Text-to-3D.

Text-to-3D: Google telah mengembangkan jaringan saraf yang menghasilkan model 3D dari deskripsi teks

Apa yang harus Anda ketahui tentang Penggabungan Mimpi?

Model difusi yang dilatih pada miliaran pasangan gambar-teks telah menghasilkan kemajuan terbaru dalam sintesis teks-ke-gambar. Mengadaptasi pendekatan ini ke sintesis 3D akan memerlukan kumpulan data berskala besar dari aset 3D berlabel serta arsitektur data 3D denoising yang efisien, yang keduanya tidak tersedia saat ini. Dalam makalah ini, kami mengatasi batasan ini dengan melakukan sintesis teks-ke-3D dengan 2D yang telah dilatih sebelumnya difusi teks-ke-gambar model. Kami menyajikan kerugian berdasarkan distilasi kepadatan probabilitas yang memungkinkan model difusi 2D digunakan sebagai prioritas untuk mengoptimalkan parameter parametrik. pembuat gambar. Dengan menggunakan kerugian ini, kami menggunakan penurunan gradien untuk mengoptimalkan model 3D yang diinisialisasi secara acak (Neural Radiance Field atau NeRF) sehingga rendering 2D dari sudut acak memiliki kerugian minimal.

Model 3D yang dihasilkan dari teks yang ditentukan dapat dilihat dari sudut mana pun, diterangi dengan pencahayaan variabel, dan digabungkan menjadi lingkungan 3D apa pun. Metodenya tidak memerlukan data pelatihan 3D dan tidak ada perubahan pada model difusi gambar, menggambarkan kemanjuran menggunakan model difusi gambar yang telah dilatih sebelumnya seperti sebelumnya.

DreamFusion membuat model 3D yang dapat menyala ulang dengan tampilan, kedalaman, dan normal dengan fidelitas tinggi berdasarkan keterangan. Objek direpresentasikan sebagai Neural Radiance Field, dengan pretrained difusi teks-ke-gambar sebelumnya seperti Imagen yang digunakan.

Contoh 3D yang Dihasilkan Dari Teks

Prompt: foto seekor tupai yang mengenakan baju zirah abad pertengahan memainkan saksofon
Cepat: foto seekor tupai yang mengenakan gaun pesta elegan duduk di roda tembikar membentuk mangkuk tanah liat
Prompt: patung logam tupai yang sangat detail mengenakan hoodie ungu mengendarai sepeda motor
Prompt: ukiran kayu tupai yang rumit mengenakan baju zirah abad pertengahan yang memegang katana

Menyatukan objek untuk membuat heboh

Bagaimana cara kerjanya?

DreamFusion mengoptimalkan adegan 3D berdasarkan keterangan menggunakan model generatif teks-ke-gambar Imagen. Ini menyarankan Score Distillation Sampling (SDS), yang melibatkan pengoptimalan fungsi kerugian untuk menghasilkan sampel dari model difusi. Selama kita dapat memetakan kembali ke gambar secara berbeda, SDS memungkinkan kita mengoptimalkan sampel di ruang parameter apa pun, seperti ruang 3D. Ke defiDalam pemetaan yang dapat dibedakan ini, ia menggunakan parameterisasi pemandangan 3D yang mirip dengan Neural Radiance Fields atau NeRFs. SDS sendiri menciptakan tampilan pemandangan yang lumayan, namun DreamFusion menyempurnakan geometri dengan pengatur tambahan dan teknik pengoptimalan. NeRF terlatih yang dihasilkan bersifat koheren, memiliki normal, geometri permukaan, dan kedalaman yang sangat baik, serta dapat ditampilkan kembali menggunakan model bayangan Lambertian.

Baca artikel terkait:

Penolakan tanggung jawab

Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.

Tentang Penulis

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

lebih artikel
Damir Yalalov
Damir Yalalov

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

Hot Stories
Bergabunglah dengan Buletin Kami.
Berita Terkini

Ketenangan Sebelum Badai Solana: Apa yang Diungkapkan Grafik, Paus, dan Sinyal On-Chain Saat Ini

Solana telah menunjukkan kinerja yang kuat, didorong oleh meningkatnya adopsi, minat kelembagaan, dan kemitraan utama, sambil menghadapi potensi ...

Tahu lebih banyak

Kripto di bulan April 2025: Tren Utama, Perubahan, dan Apa yang Akan Terjadi Selanjutnya

Pada bulan April 2025, ruang kripto berfokus pada penguatan infrastruktur inti, dengan Ethereum mempersiapkan Pectra ...

Tahu lebih banyak
Baca Selengkapnya
Baca lebih lanjut
Dari Crypto.com Hingga StraitsX: Pemain Besar Meluncurkan Kesepakatan Baru di Awal Desember
Bisnis Laporan berita Teknologi
Dari Crypto.com Hingga StraitsX: Pemain Besar Meluncurkan Kesepakatan Baru di Awal Desember
Desember 5, 2025
Blockchain yang Berfokus pada Privasi, Dusk Meluncurkan DuskEVM Testnet, Memungkinkan Pengembang untuk Menjelajahi dan Menguji
Laporan berita Teknologi
Blockchain yang Berfokus pada Privasi, Dusk Meluncurkan DuskEVM Testnet, Memungkinkan Pengembang untuk Menjelajahi dan Menguji
Desember 5, 2025
Solv Foundation Berintegrasi dengan Stellar untuk Membuka Hasil $200 Juta dalam USDC
Bisnis Laporan berita Teknologi
Solv Foundation Berintegrasi dengan Stellar untuk Membuka Hasil $200 Juta dalam USDC
Desember 5, 2025
Laporan Visa Menemukan Hampir Setengah Konsumen AS Menggunakan AI untuk Belanja Liburan Musim Ini
Laporan berita Teknologi
Laporan Visa Menemukan Hampir Setengah Konsumen AS Menggunakan AI untuk Belanja Liburan Musim Ini
Desember 5, 2025