Stability AI Melancarkan Model 'Stable Zero123' yang Boleh Menjana Objek 3D daripada Imej Tunggal
Secara ringkas
Stability AI mengumumkan Stable Zero123, model AI generatif yang boleh mencipta imej 3D daripada gambar biasa.
Stability AI — permulaan di sebalik sistem AI penjanaan imej Stable Diffusion, memperkenalkan inovasi terbarunya – Stable Zero123. Model AI generatif yang dilatih secara dalaman, boleh mencipta imej 3D daripada gambar biasa dengan kualiti dan kecekapan yang dipertingkatkan.
Menurut syarikat itu, model yang baru dilancarkan itu menandakan peningkatan berbanding pendahulunya Zero1-to-3 dan Zero123-XL, disebabkan set data dan teknik latihan lanjutan. Tidak seperti rakan sejawatannya, Stable Zero123 menunjukkan pemahaman yang mendalam tentang objek, menghasilkan paparan novel dengan kualiti dari pelbagai sudut.
Syarikat blog post mengatakan bahawa Stable Zero123 adalah berdasarkan Stable Diffusion 1.5, menggunakan jumlah Memori Akses Rawak Video (VRAM) yang sama untuk menjana satu paparan baharu. Walau bagaimanapun, Stability AI menjelaskan bahawa menjana objek 3D dengan model ini memerlukan lebih banyak masa dan memori, mengesyorkan VRAM 24GB yang besar untuk prestasi optimum.
Perkara penting yang perlu diambil perhatian daripada pengumuman itu ialah model itu telah disediakan hanya untuk tujuan bukan komersial dan penyelidikan, kerana syarikat itu bertujuan untuk mempromosikan inovasi dalam komuniti saintifik.
Syarikat itu mengumumkan bahawa penyelidik dan peminat kini boleh mengakses Stable Zero123 pada Memeluk Muka, memudahkan percubaan dan penerokaan keupayaannya.
Menetapkan Piawaian Baharu dalam 3D penjanaan imej
Dengan Zero123 Stabil, Stability AI bertujuan untuk memajukan bidang imejan janaan komputer, menyediakan penyelidik dengan alat untuk meneroka kemungkinan penjanaan imej 3D. Untuk itu, ia telah meningkatkan set data latihan untuk Stabile Zero123. Ia menggunakan set data latihan yang ditapis yang diperoleh daripada Objaverse, memfokuskan semata-mata pada memelihara objek 3D berkualiti tinggi.
Syarikat itu menjadikan objek ini dengan realisme, untuk mengatasi kaedah sebelumnya.
Semasa latihan dan inferens, model AI generatif mendapat manfaat daripada pelaziman ketinggian. Dengan menyediakan model dengan anggaran sudut kamera, ia membuat ramalan yang lebih termaklum dan berkualiti tinggi, menghasilkan hasil visual yang unggul.
Selain itu, penggabungan pra-pengiraan dataset (pendaman pra-pengiraan) dan pemuat data yang dipertingkatkan, digabungkan dengan dua yang pertama, membawa kepada peningkatan kecekapan latihan sebanyak 40 kali ganda berbanding pendahulunya, Zero123-XL.
Untuk menggalakkan penyelidikan terbuka dalam penjanaan objek 3D, Stability AI telah menambah baik kod sumber terbuka projek threestudio untuk menyokong Zero123 dan Stable Zero123. Versi ringkas proses 3D Stabil sedang dalam pratonton peribadi, menggunakan Pensampelan Penyulingan Skor (SDS) untuk mengoptimumkan Medan Sinaran Neural (NeRF) menggunakan Stable Zero123.
Walau bagaimanapun, ia tidak bertujuan untuk kegunaan komersial. Syarikat itu menekankan ini untuk dikeluarkan secara eksklusif untuk tujuan penyelidikan.
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Kumar ialah seorang Wartawan Teknologi berpengalaman dengan pengkhususan dalam persimpangan dinamik AI/ML, teknologi pemasaran dan bidang baru muncul seperti crypto, blockchain dan NFTs. Dengan lebih 3 tahun pengalaman dalam industri, Kumar telah mencipta rekod prestasi yang terbukti dalam mencipta naratif yang menarik, menjalankan temu bual yang berwawasan dan menyampaikan pandangan yang komprehensif. Kepakaran Kumar terletak dalam menghasilkan kandungan berimpak tinggi, termasuk artikel, laporan dan penerbitan penyelidikan untuk platform industri terkemuka. Dengan set kemahiran unik yang menggabungkan pengetahuan teknikal dan penceritaan, Kumar cemerlang dalam menyampaikan konsep teknologi yang kompleks kepada khalayak yang pelbagai dengan cara yang jelas dan menarik.
lebih banyak artikel
Kumar ialah seorang Wartawan Teknologi berpengalaman dengan pengkhususan dalam persimpangan dinamik AI/ML, teknologi pemasaran dan bidang baru muncul seperti crypto, blockchain dan NFTs. Dengan lebih 3 tahun pengalaman dalam industri, Kumar telah mencipta rekod prestasi yang terbukti dalam mencipta naratif yang menarik, menjalankan temu bual yang berwawasan dan menyampaikan pandangan yang komprehensif. Kepakaran Kumar terletak dalam menghasilkan kandungan berimpak tinggi, termasuk artikel, laporan dan penerbitan penyelidikan untuk platform industri terkemuka. Dengan set kemahiran unik yang menggabungkan pengetahuan teknikal dan penceritaan, Kumar cemerlang dalam menyampaikan konsep teknologi yang kompleks kepada khalayak yang pelbagai dengan cara yang jelas dan menarik.



