Laporan Berita
September 30, 2022

Text-to-3D: Google telah membangunkan rangkaian saraf yang menjana model 3D daripada penerangan teks

Secara ringkas

Teks-ke-3D rangkaian saraf boleh menjana model 3D daripada teks

DreamFusion mengoptimumkan pemandangan 3D berdasarkan teks-ke-imej Imagen

Model resapan 2D boleh digunakan untuk sintesis teks ke imej

Google mencipta a rangkaian neural mampu mencipta model 3D daripada penerangan teks. Bahagian yang terbaik ialah aspek yang paling sukar tidak perlu diajar. Imagen digunakan sebagai asas untuk Text-to-3D.

Text-to-3D: Google telah membangunkan rangkaian saraf yang menjana model 3D daripada penerangan teks

Apa yang mesti anda ketahui DreamFusion?

Model resapan yang dilatih pada berbilion pasangan teks imej telah membawa kepada kemajuan terkini dalam sintesis teks ke imej. Menyesuaikan pendekatan ini kepada sintesis 3D akan memerlukan set data berskala besar bagi aset 3D berlabel serta seni bina data 3D yang cekap, kedua-duanya tidak tersedia pada masa ini. Dalam kertas kerja ini, kami mengatasi sekatan ini dengan melakukan sintesis teks-ke-3D dengan 2D terlatih penyebaran teks ke imej model. Kami membentangkan kerugian berdasarkan penyulingan ketumpatan kebarangkalian yang membolehkan model resapan 2D digunakan sebagai pendahuluan untuk mengoptimumkan parametrik penjana gambar. Menggunakan kehilangan ini, kami menggunakan keturunan kecerunan untuk mengoptimumkan model 3D yang dimulakan secara rawak (Medan Sinaran Neural atau NeRF) supaya pemaparan 2Dnya dari sudut rawak mempunyai kerugian yang minimum.

Model 3D yang dijana bagi teks yang ditentukan boleh dilihat dari mana-mana sudut, diterangi dengan pencahayaan berubah-ubah dan digabungkan ke dalam mana-mana persekitaran 3D. Kaedahnya tidak memerlukan data latihan 3D dan tiada perubahan pada model penyebaran imej, menggambarkan keberkesanan menggunakan model penyebaran imej terlatih seperti sebelum ini.

DreamFusion membuat model 3D yang boleh dicerminkan dengan penampilan, kedalaman dan normal yang tinggi berdasarkan kapsyen. Objek diwakili sebagai Medan Sinaran Neural, dengan pralatihan penyebaran teks ke imej sebelum seperti Imagen yang digunakan.

Contoh 3D Dihasilkan Daripada Teks

Prompt: foto seekor tupai memakai baju perisai zaman pertengahan bermain saksofon
Prompt: foto tupai memakai gaun pesta yang elegan duduk di roda tembikar membentuk mangkuk tanah liat
Prompt: arca logam sangat terperinci tupai memakai hoodie ungu menunggang motosikal
Prompt: ukiran kayu yang rumit dari tupai memakai baju perisai zaman pertengahan yang menggunakan katana

Menyatukan objek untuk membuat pemandangan

Bagaimana ia berfungsi?

DreamFusion mengoptimumkan pemandangan 3D berdasarkan kapsyen menggunakan model generatif teks-ke-imej Imagen. Ia mencadangkan Pensampelan Penyulingan Skor (SDS), yang melibatkan pengoptimuman fungsi kehilangan untuk menghasilkan sampel daripada model resapan. Selagi kami boleh memetakan kembali kepada imej secara berbeza, SDS membolehkan kami mengoptimumkan sampel dalam mana-mana ruang parameter, seperti ruang 3D. Kepada defiDalam pemetaan yang boleh dibezakan ini, ia menggunakan parameterisasi pemandangan 3D yang serupa dengan Medan Sinaran Neural atau NeRF. SDS sahaja mencipta penampilan pemandangan yang boleh dilalui, tetapi DreamFusion meningkatkan geometri dengan penyelaras tambahan dan teknik pengoptimuman. NeRF terlatih yang dihasilkan adalah koheren, mempunyai normal yang sangat baik, geometri permukaan dan kedalaman, dan boleh dinyalakan semula menggunakan model lorekan Lambertian.

Baca artikel berkaitan:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Untuk Lebih Lanjut
Baca lagi
Injektif Menyertai Pasukan Dengan AltLayer Untuk Membawa Keselamatan Restaking Kepada inEVM
Perniagaan Laporan Berita Teknologi
Injektif Menyertai Pasukan Dengan AltLayer Untuk Membawa Keselamatan Restaking Kepada inEVM
Semoga 3, 2024
Masa Bekerjasama Dengan Juruwang Untuk Memperkenalkan Kumpulan Pinjaman MASA, Membolehkan Pinjaman USDC Di Pangkalan
pasaran Laporan Berita Teknologi
Masa Bekerjasama Dengan Juruwang Untuk Memperkenalkan Kumpulan Pinjaman MASA, Membolehkan Pinjaman USDC Di Pangkalan
Semoga 3, 2024
Velodrome Melancarkan Versi Beta Superchain Dalam Minggu Akan Datang Dan Berkembang Merentasi OP Stack Layer 2 Blockchains
pasaran Laporan Berita Teknologi
Velodrome Melancarkan Versi Beta Superchain Dalam Minggu Akan Datang Dan Berkembang Merentasi OP Stack Layer 2 Blockchains
Semoga 3, 2024
CARV Mengumumkan Perkongsian Dengan Aethir Untuk Memusnahkan Lapisan Datanya Dan Mengedarkan Ganjaran
Perniagaan Laporan Berita Teknologi
CARV Mengumumkan Perkongsian Dengan Aethir Untuk Memusnahkan Lapisan Datanya Dan Mengedarkan Ganjaran
Semoga 3, 2024