Laporan berita Teknologi
01 Mei 2023

Stability AIStableVicuna adalah Chatbot Pertama yang Dilatih dengan Umpan Balik Manusia

Singkatnya

Stability AI merilis StableVicuna, chatbot open-source skala besar pertama, yang menggunakan Reinforcement Learning with Human Feedback (RLHF).

StableVicuna didasarkan pada chatbot Vicuna dan menggunakan parameter 13 miliar LLaMA Model.

stablevicuna.dll

Stability AI memiliki diperkenalkan terobosan terbarunya dalam AI, StableVicuna, chatbot open-source skala besar pertama yang dilatih dengan umpan balik manusia. Chatbot inovatif adalah gagasan dari Stability AI, perusahaan yang menciptakan model gambar sumber terbuka yang populer, Stable Diffusion, dan algoritme pembuatan gambar AI terbaru, DeepFloyd

StableVicuna didasarkan pada chatbot Vicuna yang dirilis pada bulan April, yang menggunakan parameter 13 miliar LLaMA model. Apa yang menentukan varian Vicuna Stability AI dan Carper AI selain penggunaan Reinforcement Learning with Human Feedback (RLHF). Metode ini memungkinkan model untuk meningkatkan terus menerus.

Stability AI menyarankan bahwa chatbots berhasil karena dua jenis metode pelatihan: penyesuaian instruksi dan pembelajaran penguatan melalui umpan balik manusia. Namun, sebagian besar model chatbot yang ada hanya menggunakan salah satu metode ini dan tidak keduanya. Baru-baru ini, kumpulan data untuk pelatihan RLHF telah tersedia untuk umum. Oleh karena itu, bersama dengan alat pelatihan yang mudah digunakan, hal ini memungkinkan terciptanya StableVicuna, yang merupakan pelatihan skala besar pertama. model chatbot yang menggabungkan kedua jenis pelatihan.

StableVicuna menggabungkan pembuatan teks, fungsi matematika sederhana, dan kemampuan untuk menulis kode. Ini sebanding dengan chatbot sumber terbuka lainnya di tolok ukur umum. 

stablevicuna.dll
Sumber: Stability AI

Menurut Dekoder, chatbot sumber terbuka yang disesuaikan dengan data dari chatbot lain berisiko memperbesar kesalahan dan bias yang ada melalui pelatihan berulang, menyebabkan efek ruang gema. Penyesuaian data juga dapat memperburuk halusinasi dengan memperkenalkan informasi yang tidak ada dalam model aslinya.

Pengguna dapat mengakses demo chatbot di MemelukWajah. Perusahaan juga mengungkapkan rencana untuk menyediakan StableVicuna melalui antarmuka obrolan di masa mendatang.

Baca lebih lanjut:

Penolakan tanggung jawab

Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.

Tentang Penulis

Agne adalah jurnalis yang meliput tren dan perkembangan terbaru di metaverse, AI, dan Web3 industri untuk Metaverse Post. Kecintaannya pada bercerita telah membawanya melakukan banyak wawancara dengan para ahli di bidang tersebut, selalu berusaha mengungkap cerita yang menarik dan memikat. Agne memegang gelar Sarjana Sastra dan memiliki latar belakang luas dalam menulis tentang berbagai topik termasuk perjalanan, seni, dan budaya. Dia juga menjadi sukarelawan sebagai editor di organisasi hak-hak hewan, di mana dia membantu meningkatkan kesadaran tentang masalah kesejahteraan hewan. Hubungi dia di [email dilindungi].

lebih artikel
Agne Cimerman
Agne Cimerman

Agne adalah jurnalis yang meliput tren dan perkembangan terbaru di metaverse, AI, dan Web3 industri untuk Metaverse Post. Kecintaannya pada bercerita telah membawanya melakukan banyak wawancara dengan para ahli di bidang tersebut, selalu berusaha mengungkap cerita yang menarik dan memikat. Agne memegang gelar Sarjana Sastra dan memiliki latar belakang luas dalam menulis tentang berbagai topik termasuk perjalanan, seni, dan budaya. Dia juga menjadi sukarelawan sebagai editor di organisasi hak-hak hewan, di mana dia membantu meningkatkan kesadaran tentang masalah kesejahteraan hewan. Hubungi dia di [email dilindungi].

Hari Hukuman Tiba: Nasib CZ Digantung Saat Pengadilan AS Mempertimbangkan Permohonan DOJ

Changpeng Zhao siap menghadapi hukuman di pengadilan AS di Seattle hari ini.

Tahu lebih banyak

Pendiri Dompet Samourai Dituduh Memfasilitasi $2 Miliar dalam Penawaran Darknet

Kekhawatiran para pendiri Samourai Wallet menunjukkan kemunduran besar bagi industri ini, yang menggarisbawahi ...

Tahu lebih banyak
Bergabunglah dengan Komunitas Teknologi Inovatif Kami
Baca Selengkapnya
Baca lebih lanjut
Galxe Bermitra Dengan Jambo Untuk Memperluas Aksesibilitas Global Ke Web3
Bisnis Laporan berita Teknologi
Galxe Bermitra Dengan Jambo Untuk Memperluas Aksesibilitas Global Ke Web3
2 Mei 2024
Med-Gemini Google Siap Memberikan Keunggulan GPT-4 Dengan Kinerja Unggul dalam Pelayanan Kesehatan
AI Wiki Berita Perangkat lunak Teknologi
Med-Gemini Google Siap Memberikan Keunggulan GPT-4 Dengan Kinerja Unggul dalam Pelayanan Kesehatan
2 Mei 2024
Anggota Dewan Legislatif Hong Kong Wu Jiezhuang Memberi Sinyal Gugatan Perdata Terhadap Pertukaran Kripto JPEX
Bisnis Laporan berita Teknologi
Anggota Dewan Legislatif Hong Kong Wu Jiezhuang Memberi Sinyal Gugatan Perdata Terhadap Pertukaran Kripto JPEX
2 Mei 2024
AltLayer Memasuki Tahap Kedua Inisiatif Stakingnya, Memperkenalkan Token realT
pasar Laporan berita Teknologi
AltLayer Memasuki Tahap Kedua Inisiatif Stakingnya, Memperkenalkan Token realT
2 Mei 2024