Meta Memperkenalkan Apa-apa Segmen, Model AI Baharunya untuk Pembahagian Imej
Secara ringkas
Meta telah memperkenalkan Segment Anything, model asas baharunya untuk pembahagian imej.
Syarikat itu menggunakan sumber terbuka dua set data besar yang digunakan untuk melatih model AI.
Meta mengatakan bahawa Segmen Anything boleh menjadi komponen dalam sistem AI yang lebih besar untuk memahami kedua-dua kandungan visual dan teks daripada halaman web.
Meta telah memperkenalkan Segment Anything, model asas baharunya untuk pembahagian imej. Proses mengenal pasti piksel imej yang mana kepunyaan objek adalah tugas penting dalam penglihatan komputer dan digunakan dalam pelbagai aplikasi, daripada menganalisis imejan saintifik kepada mengedit foto.
Dalam pengenalannya blog post, syarikat itu menetapkan tempat kejadian dengan mengatakan bahawa mencipta model pembahagian yang tepat untuk tugas tertentu dalam penglihatan komputer biasanya memerlukan kerja khusus oleh pakar teknikal dengan akses kepada infrastruktur latihan AI dan jumlah besar data dalam domain yang diberi penjelasan dengan teliti.
Walau bagaimanapun, ini mungkin berubah tidak lama lagi dengan projek Segment Anything kerana set data dan model baharunya dijangka menjadikan model segmentasi yang tepat lebih mudah diakses oleh khalayak yang lebih luas, menghapuskan keperluan untuk kepakaran teknikal dan infrastruktur khusus. Untuk mencapai itu, para penyelidik membina model yang pantas yang dilatih mengenai data yang pelbagai dan boleh menyesuaikan diri dengan tugas tertentu, sama seperti cara gesaan digunakan dalam model pemprosesan bahasa semula jadi atau chatbots.
Untuk mendemokrasikan lagi segmentasi, Meta menyediakan set data besar-besaran SA-1B untuk tujuan penyelidikan, dan Model Apa-apa Segmen tersedia di bawah lesen terbuka yang permisif (Apache 2.0). Selain itu, syarikat telah membangunkan a demo yang membolehkan pengguna mencuba SAM dengan imej mereka sendiri.
Meta melihat kemungkinan kes penggunaan untuk SAM dalam AI, AR/VR dan domain pencipta. SAM berpotensi untuk menjadi elemen kritikal dalam sistem AI yang lebih besar yang bertujuan untuk mencapai pemahaman multimodal yang lebih umum tentang dunia. Sebagai contoh, ia boleh memudahkan pemahaman kedua-dua kandungan visual dan teks pada halaman web.
Selain itu, dalam domain AR/VR, SAM boleh mendayakan pemilihan objek berdasarkan pandangan pengguna dan membenarkan objek "diangkat" ke dalam 3D. Selain itu, pencipta kandungan boleh menggunakan SAM untuk meningkatkan aplikasi kreatif seperti mengekstrak kawasan imej untuk kolaj atau penyuntingan video.
Meta telah meningkatkan usaha AInya di tengah-tengah ledakan AI generatif dan minat yang semakin berkurangan terhadap metaverse. Walaupun syarikat itu membuat pertaruhan $70 bilion pada metaverse, bahagian metaverse Reality Labs mengalami kerugian sebanyak AS$13.7 bilion tahun lepas. Baru-baru ini, Meta juga membentangkannya NFT operasi di Facebook dan Instagram.
Dalam temu bual dengan Nikkei Asia pada hari Rabu, Meta CTO Chris Bosworth berkata bahawa eksekutif tertinggi Meta telah menghabiskan sebahagian besar masa mereka pada AI. Ketua Pegawai Eksekutif Meta Mark Zuckerberg mengumumkan pada bulan Februari kumpulan produk baharu memfokuskan pada AI generatif selepas melepaskan model bahasa besar baharunya yang dipanggil LLaMA (Model Bahasa Besar Meta AI).
Syarikat itu dijangka membuat debut beberapa aplikasi AI yang mencipta iklan tahun ini, kata Bosworth kepada Nikkei.
Baca lebih lanjut:
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Cindy ialah seorang wartawan di Metaverse Post, meliputi topik yang berkaitan dengan web3, NFT, metaverse dan AI, dengan tumpuan pada temu bual dengan Web3 pemain industri. Dia telah bercakap dengan lebih 30 eksekutif peringkat C dan masih lagi, membawa cerapan berharga mereka kepada pembaca. Berasal dari Singapura, Cindy kini berpangkalan di Tbilisi, Georgia. Beliau memegang ijazah Sarjana Muda dalam Komunikasi & Pengajian Media dari University of South Australia dan mempunyai pengalaman sedekad dalam kewartawanan dan penulisan. Hubungi dia melalui [e-mel dilindungi] dengan padang akhbar, pengumuman dan peluang temu duga.
lebih banyak artikelCindy ialah seorang wartawan di Metaverse Post, meliputi topik yang berkaitan dengan web3, NFT, metaverse dan AI, dengan tumpuan pada temu bual dengan Web3 pemain industri. Dia telah bercakap dengan lebih 30 eksekutif peringkat C dan masih lagi, membawa cerapan berharga mereka kepada pembaca. Berasal dari Singapura, Cindy kini berpangkalan di Tbilisi, Georgia. Beliau memegang ijazah Sarjana Muda dalam Komunikasi & Pengajian Media dari University of South Australia dan mempunyai pengalaman sedekad dalam kewartawanan dan penulisan. Hubungi dia melalui [e-mel dilindungi] dengan padang akhbar, pengumuman dan peluang temu duga.