OpenAI Merakit Tim yang terdiri dari 50+ Pakar untuk Ditingkatkan GPT-4Keselamatan
Singkatnya
OpenAI telah mempekerjakan tim yang terdiri lebih dari 50 ahli untuk memastikan yang terbaru model bahasa, GPT-4, aman untuk digunakan.
Tim tersebut terdiri dari peneliti dan insinyur yang berspesialisasi dalam keamanan, etika, dan kebijakan AI.
Tujuannya adalah untuk mencegah GPT-4 dari menghasilkan konten yang berbahaya atau bias dan untuk memastikan bahwa konten tersebut selaras dengan nilai-nilai kemanusiaan.
OpenAI telah mempekerjakan lebih dari 50 ahli dari berbagai domain untuk membuatnya GPT-4 lebih aman. Para ahli telah melakukan pengujian model yang berlawanan untuk mengidentifikasi potensi risiko dan kerentanan. Mereka adalah pakar dari berbagai bidang: risiko penyelarasan AI jangka panjang, keamanan siber, risiko biologis, dan keamanan internasional. Temuan mereka telah membantu OpenAI mengevaluasi perilaku model di area berisiko tinggi yang memerlukan keahlian khusus.
Meskipun model bahasa terbaru memiliki risiko yang sama dengan model bahasa yang lebih kecil, kemampuan tambahannya GPT-4 menimbulkan ancaman baru. Oleh karena itu, keterlibatan para ahli telah dilakukan penting dalam memastikan keamanan teknologi.
OpenAI telah menerapkan serangkaian tambahan pembelajaran penguatan yang relevan dengan keselamatan dari petunjuk pelatihan preferensi manusia (RLHF) dan model penghargaan berbasis aturan (RBRM) untuk meningkatkan keselamatan GPT-4 model. RBRM adalah zero-shot GPT-4 pengklasifikasi yang berfungsi sebagai sinyal hadiah tambahan untuk GPT-4 model kebijakan selama penyesuaian RLHF. Tujuannya adalah untuk memberi insentif pada perilaku yang pantas, seperti menolak membuat konten berbahaya atau tidak menolak permintaan yang tidak berbahaya.
Untuk menjamin keamanan GPT-4 model, OpenAI mulai merekrut ahli eksternal pada bulan Agustus 2022 untuk melakukan latihan “tim merah”, termasuk pengujian stres, pengujian batas, dan pengujian permusuhan. Mereka memiliki akses ke versi awal GPT-4 model dan mengidentifikasi risiko awal yang memotivasi penelitian keselamatan lebih lanjut.
Umpan balik para ahli mengarah pada mitigasi teknis dan langkah-langkah penegakan kebijakan untuk mengurangi risiko. Namun, masih banyak ancaman, dan evaluasi lebih lanjut diperlukan.
Berbicara tentang karyawan di OpenAI, ChatGPT awalnya dikembangkan dengan bantuan dari individu di beberapa wilayah termiskin di dunia melalui OpenAIKemitraan dengan perusahaan bernama Sama, yang mempekerjakan jutaan pekerja dari daerah miskin. Beberapa pakar etika AI telah mengkritiknya OpenAIkeputusan untuk melakukan outsourcing pelatihannya ChatGPT model ke Sama, menuduh perusahaan mengeksploitasi tenaga kerja murah.
Baca lebih lanjut:
Penolakan tanggung jawab
Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.
Tentang Penulis
Agne adalah jurnalis yang meliput tren dan perkembangan terbaru di metaverse, AI, dan Web3 industri untuk Metaverse Post. Kecintaannya pada bercerita telah membawanya melakukan banyak wawancara dengan para ahli di bidang tersebut, selalu berusaha mengungkap cerita yang menarik dan memikat. Agne memegang gelar Sarjana Sastra dan memiliki latar belakang luas dalam menulis tentang berbagai topik termasuk perjalanan, seni, dan budaya. Dia juga menjadi sukarelawan sebagai editor di organisasi hak-hak hewan, di mana dia membantu meningkatkan kesadaran tentang masalah kesejahteraan hewan. Hubungi dia di [email dilindungi].
lebih artikelAgne adalah jurnalis yang meliput tren dan perkembangan terbaru di metaverse, AI, dan Web3 industri untuk Metaverse Post. Kecintaannya pada bercerita telah membawanya melakukan banyak wawancara dengan para ahli di bidang tersebut, selalu berusaha mengungkap cerita yang menarik dan memikat. Agne memegang gelar Sarjana Sastra dan memiliki latar belakang luas dalam menulis tentang berbagai topik termasuk perjalanan, seni, dan budaya. Dia juga menjadi sukarelawan sebagai editor di organisasi hak-hak hewan, di mana dia membantu meningkatkan kesadaran tentang masalah kesejahteraan hewan. Hubungi dia di [email dilindungi].