Stability AIStableVicuna adalah Chatbot Pertama yang Dilatih dengan Umpan Balik Manusia
Singkatnya
Stability AI merilis StableVicuna, chatbot open-source skala besar pertama, yang menggunakan Reinforcement Learning with Human Feedback (RLHF).
StableVicuna didasarkan pada chatbot Vicuna dan menggunakan parameter 13 miliar LLaMA Model.
Stability AI memiliki diperkenalkan terobosan terbarunya dalam AI, StableVicuna, chatbot open-source skala besar pertama yang dilatih dengan umpan balik manusia. Chatbot inovatif adalah gagasan dari Stability AI, perusahaan yang menciptakan model gambar sumber terbuka yang populer, Stable Diffusion, dan algoritme pembuatan gambar AI terbaru, DeepFloyd.
StableVicuna didasarkan pada chatbot Vicuna yang dirilis pada bulan April, yang menggunakan parameter 13 miliar LLaMA model. Apa yang menentukan varian Vicuna Stability AI dan Carper AI selain penggunaan Reinforcement Learning with Human Feedback (RLHF). Metode ini memungkinkan model untuk meningkatkan terus menerus.
Stability AI menyarankan bahwa chatbots berhasil karena dua jenis metode pelatihan: penyesuaian instruksi dan pembelajaran penguatan melalui umpan balik manusia. Namun, sebagian besar model chatbot yang ada hanya menggunakan salah satu metode ini dan tidak keduanya. Baru-baru ini, kumpulan data untuk pelatihan RLHF telah tersedia untuk umum. Oleh karena itu, bersama dengan alat pelatihan yang mudah digunakan, hal ini memungkinkan terciptanya StableVicuna, yang merupakan pelatihan skala besar pertama. model chatbot yang menggabungkan kedua jenis pelatihan.
StableVicuna menggabungkan pembuatan teks, fungsi matematika sederhana, dan kemampuan untuk menulis kode. Ini sebanding dengan chatbot sumber terbuka lainnya di tolok ukur umum.
Menurut Dekoder, chatbot sumber terbuka yang disesuaikan dengan data dari chatbot lain berisiko memperbesar kesalahan dan bias yang ada melalui pelatihan berulang, menyebabkan efek ruang gema. Penyesuaian data juga dapat memperburuk halusinasi dengan memperkenalkan informasi yang tidak ada dalam model aslinya.
Pengguna dapat mengakses demo chatbot di MemelukWajah. Perusahaan juga mengungkapkan rencana untuk menyediakan StableVicuna melalui antarmuka obrolan di masa mendatang.
Baca lebih lanjut:
Penolakan tanggung jawab
Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.
Tentang Penulis
Agne adalah jurnalis yang meliput tren dan perkembangan terbaru di metaverse, AI, dan Web3 industri untuk Metaverse Post. Kecintaannya pada bercerita telah membawanya melakukan banyak wawancara dengan para ahli di bidang tersebut, selalu berusaha mengungkap cerita yang menarik dan memikat. Agne memegang gelar Sarjana Sastra dan memiliki latar belakang luas dalam menulis tentang berbagai topik termasuk perjalanan, seni, dan budaya. Dia juga menjadi sukarelawan sebagai editor di organisasi hak-hak hewan, di mana dia membantu meningkatkan kesadaran tentang masalah kesejahteraan hewan. Hubungi dia di [email dilindungi].
lebih artikelAgne adalah jurnalis yang meliput tren dan perkembangan terbaru di metaverse, AI, dan Web3 industri untuk Metaverse Post. Kecintaannya pada bercerita telah membawanya melakukan banyak wawancara dengan para ahli di bidang tersebut, selalu berusaha mengungkap cerita yang menarik dan memikat. Agne memegang gelar Sarjana Sastra dan memiliki latar belakang luas dalam menulis tentang berbagai topik termasuk perjalanan, seni, dan budaya. Dia juga menjadi sukarelawan sebagai editor di organisasi hak-hak hewan, di mana dia membantu meningkatkan kesadaran tentang masalah kesejahteraan hewan. Hubungi dia di [email dilindungi].