Peneliti MIT dan Google Memperkenalkan StableRep, Model AI untuk Mendukung Produksi Gambar
Singkatnya
Ilmuwan komputer MIT dan Google meluncurkan StableRep, model AI yang mengubah perintah teks menjadi gambar akurat menggunakan Stable Diffusion.
MIT dan Google ilmuwan komputer telah meluncurkan StableRep, model AI yang dirancang untuk mengubah teks deskriptif menjadi gambar yang sesuai dan akurat menggunakan gambar yang dihasilkan oleh Stable Diffusion. Alat ini diarahkan untuk meningkatkan kemampuan jaringan saraf untuk menghasilkan gambar berdasarkan deskripsi tekstual.
Menurut para peneliti, gambar sintetis dapat membantu model AI mempelajari representasi visual dengan lebih akurat dibandingkan dengan foto asli.
StableRep bertujuan untuk memberdayakan peneliti dalam mengelola proses algoritmik pembelajaran mesin dengan melatih model pada banyak gambar yang dihasilkan oleh Stable Diffusion sebagai respons terhadap prompt yang sama. Dengan demikian, model akan mempelajari representasi visual yang lebih luas, defining gambar mana yang paling selaras dengan petunjuk yang diberikan.
Para peneliti membayangkan munculnya ekosistem model AI, beberapa di antaranya akan dilatih pada data nyata atau sintetis. Saat ini, upaya difokuskan pada pengajaran model untuk mempelajari lebih lanjut konsep tingkat tinggi melalui pemahaman kontekstual dan variabilitas, bukan sekadar memberikan data.
StableRep Akan Membantu Pengembang dan Mesin AI
Inti dari model teks-ke-gambar terletak pada kemampuan mereka untuk menghubungkan objek dengan kata-kata. Saat disajikan dengan perintah masukan teks, model ini harus menghasilkan gambar yang sangat cocok dengan deskripsi yang diberikan. Untuk mencapai hal ini, mereka harus memperoleh pemahaman tentang representasi visual objek dunia nyata.
Menurut laporan terbaru dari kertas pra-cetak di arXiv, StableRep mengungguli SimCLR dan CLIP dalam hal representasi yang dipelajari menggunakan kumpulan perintah teks yang sama dan gambar nyata yang sesuai pada kumpulan data skala besar, hanya mengandalkan gambar sintetis.
Makalah ini melanjutkan, “Saat kami memperkenalkan lebih lanjut pengawasan bahasa, StableRep yang dilatih dengan 20 juta gambar sintetis mencapai akurasi yang lebih baik daripada CLIP yang dilatih dengan 50 juta gambar nyata.”
SimCLR dan CLIP adalah algoritma pembelajaran mesin yang digunakan untuk menghasilkan gambar dari perintah teks.
Pendekatan inovatif ini memungkinkan pengembang AI untuk melatih jaringan saraf dengan gambar sintetis yang lebih sedikit dibandingkan gambar asli sekaligus mencapai hasil yang lebih baik. Munculnya metode seperti StableRep menunjukkan masa depan di mana model teks-ke-gambar dapat dilatih terutama pada data sintetis, sehingga mengurangi ketergantungan pada gambar nyata dan mendukung mesin AI ketika menghadapi keterbatasan sumber daya online yang tersedia.
Penolakan tanggung jawab
Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.
Tentang Penulis
Alisa, seorang jurnalis yang berdedikasi di MPost, berspesialisasi dalam mata uang kripto, bukti tanpa pengetahuan, investasi, dan bidang yang luas Web3. Dengan ketertarikannya terhadap tren dan teknologi yang sedang berkembang, ia memberikan liputan komprehensif untuk memberikan informasi dan melibatkan pembaca dalam lanskap keuangan digital yang terus berkembang.
lebih artikel
Alisa, seorang jurnalis yang berdedikasi di MPost, berspesialisasi dalam mata uang kripto, bukti tanpa pengetahuan, investasi, dan bidang yang luas Web3. Dengan ketertarikannya terhadap tren dan teknologi yang sedang berkembang, ia memberikan liputan komprehensif untuk memberikan informasi dan melibatkan pembaca dalam lanskap keuangan digital yang terus berkembang.



