OpenAI Kumpulkan Pasukan 50+ Pakar untuk Meningkatkan GPT-4Keselamatan
Secara ringkas
OpenAI telah mengupah pasukan lebih 50 pakar untuk memastikan yang terbaru model bahasa, GPT-4, selamat digunakan.
Pasukan ini termasuk penyelidik dan jurutera yang pakar dalam keselamatan, etika dan dasar AI.
Tujuannya adalah untuk mencegah GPT-4 daripada menjana kandungan berbahaya atau berat sebelah dan untuk memastikan ia sejajar dengan nilai kemanusiaan.
OpenAI telah mengupah lebih 50 pakar dari pelbagai domain untuk membuat GPT-4 lebih selamat. Pakar telah bekerja dengan ujian musuh model untuk mengenal pasti potensi risiko dan kelemahan. Mereka adalah pakar dari pelbagai bidang: risiko penjajaran AI jangka panjang, keselamatan siber, biorisiko dan keselamatan antarabangsa. Penemuan mereka telah membantu OpenAI menilai tingkah laku model dalam bidang berisiko tinggi yang memerlukan kepakaran khusus.
Walaupun model bahasa terbaharu menimbulkan risiko yang sama seperti model bahasa yang lebih kecil, keupayaan tambahan untuk GPT-4 membawa kepada ancaman baru. Oleh itu, penglibatan pakar telah penting dalam memastikan keselamatan teknologi.
OpenAI telah melaksanakan satu set tambahan pembelajaran pengukuhan berkaitan keselamatan daripada gesaan latihan keutamaan manusia (RLHF) dan model ganjaran berasaskan peraturan (RBRM) untuk meningkatkan keselamatan GPT-4 model. RBRM adalah sifar pukulan GPT-4 pengelas yang berfungsi sebagai isyarat ganjaran tambahan untuk GPT-4 model dasar semasa penalaan halus RLHF. Tujuan mereka adalah untuk memberi insentif kepada tingkah laku yang sesuai, seperti enggan menjana kandungan berbahaya atau tidak menolak permintaan yang tidak berbahaya.
Untuk memastikan keselamatan GPT-4 model, OpenAI mula merekrut pakar luar pada Ogos 2022 untuk menjalankan latihan "berpasukan merah", termasuk ujian tekanan, ujian sempadan dan ujian lawan. Mereka mempunyai akses kepada versi awal GPT-4 model dan mengenal pasti risiko awal yang mendorong penyelidikan keselamatan selanjutnya.
Maklum balas pakar membawa kepada mitigasi teknikal dan langkah penguatkuasaan dasar untuk mengurangkan risiko. Walau bagaimanapun, banyak ancaman kekal, dan penilaian lanjut diperlukan.
Bercakap tentang pekerja di OpenAI, ChatGPT pada mulanya maju dengan bantuan daripada individu di beberapa wilayah termiskin di dunia melalui OpenAIPerkongsian dengan sebuah syarikat bernama Sama, yang menggaji berjuta-juta pekerja dari kawasan miskin. Beberapa pakar dalam etika AI telah mengkritik OpenAIkeputusan untuk menyumber luar latihannya ChatGPT model kepada Sama, menuduh syarikat itu mengeksploitasi buruh kos rendah.
Baca lebih lanjut:
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Agne ialah seorang wartawan yang membuat liputan tentang trend dan perkembangan terkini dalam metaverse, AI, dan Web3 industri untuk Metaverse Post. Keghairahannya untuk bercerita telah menyebabkan dia menjalankan banyak temu bual dengan pakar dalam bidang ini, sentiasa berusaha untuk mendedahkan cerita yang menarik dan menarik. Agne memegang ijazah Sarjana Muda dalam kesusasteraan dan mempunyai latar belakang yang luas dalam penulisan tentang pelbagai topik termasuk perjalanan, seni dan budaya. Dia juga menawarkan diri sebagai editor untuk organisasi hak haiwan, di mana dia membantu meningkatkan kesedaran tentang isu kebajikan haiwan. Hubungi dia [e-mel dilindungi].
lebih banyak artikelAgne ialah seorang wartawan yang membuat liputan tentang trend dan perkembangan terkini dalam metaverse, AI, dan Web3 industri untuk Metaverse Post. Keghairahannya untuk bercerita telah menyebabkan dia menjalankan banyak temu bual dengan pakar dalam bidang ini, sentiasa berusaha untuk mendedahkan cerita yang menarik dan menarik. Agne memegang ijazah Sarjana Muda dalam kesusasteraan dan mempunyai latar belakang yang luas dalam penulisan tentang pelbagai topik termasuk perjalanan, seni dan budaya. Dia juga menawarkan diri sebagai editor untuk organisasi hak haiwan, di mana dia membantu meningkatkan kesedaran tentang isu kebajikan haiwan. Hubungi dia [e-mel dilindungi].