GPT-4 Mewarisi Fakta "Halusinasi" dan Kesilapan Penaakulan Dari Awal GPT model
Secara ringkas
OpenAI berkata GPT-4 mempunyai batasan yang sama seperti sebelumnya GPT model.
GPT-4 masih berhalusinasi fakta dan membuat kesilapan penaakulan.
Walau bagaimanapun, GPT-4 mendapat markah 40% lebih tinggi daripada OpenAIterkini GPT-3.5 mengenai penilaian fakta permusuhan dalaman syarikat.
OpenAI telah memberi amaran kepada pengguna bahawa model bahasa terbarunya, GPT-4, masih tidak boleh dipercayai sepenuhnya dan boleh "menghaluskan" fakta dan membuat kesilapan penaakulan. Syarikat itu menggesa pengguna supaya berhati-hati apabila menggunakan output model bahasa, terutamanya dalam "konteks kepentingan tinggi."
Namun, berita baiknya ialah GPT-4 mengurangkan halusinasi dengan ketara berbanding model sebelumnya. OpenAI mendakwa bahawa GPT-4 mendapat markah 40% lebih tinggi daripada yang terkini GPT-3.5 mengenai penilaian fakta permusuhan dalaman.
“Kami telah mencapai kemajuan pada penanda aras luaran seperti TruthfulQA, yang menguji keupayaan model untuk memisahkan fakta daripada set pernyataan yang salah yang dipilih secara lawan. Soalan-soalan ini dipasangkan dengan jawapan yang salah secara fakta yang menarik secara statistik," OpenAI menulis dalam a blog post.
Walaupun penambahbaikan ini, model masih kurang pengetahuan tentang peristiwa yang berlaku selepas September 2021 dan kadangkala membuat ralat penaakulan yang mudah, seperti yang dilakukan oleh model terdahulu. Selain itu, ia boleh menjadi terlalu mudah tertipu dalam menerima kenyataan palsu yang jelas daripada pengguna dan gagal dalam masalah yang sukar, seperti memperkenalkan kelemahan keselamatan ke dalam kodnya. Ia juga tidak menyemak fakta maklumat yang diberikannya.
Seperti yang terdahulu, GPT-4 boleh menjana nasihat berbahaya, kod buggy atau maklumat yang tidak tepat. Walau bagaimanapun, keupayaan tambahan model membawa kepada permukaan risiko baharu yang perlu difahami. Untuk menilai sejauh mana risiko ini, lebih 50 pakar daripada pelbagai domain, termasuk risiko penjajaran AI, keselamatan siber, biorisiko, kepercayaan dan keselamatan serta keselamatan antarabangsa, terlibat untuk menguji model tersebut. Maklum balas dan data mereka kemudiannya digunakan untuk menambah baik model, seperti mengumpul data tambahan untuk dipertingkatkan GPT-4keupayaan untuk menolak permintaan tentang cara mensintesis bahan kimia berbahaya.
Salah satu cara utama OpenAI sedang mengurangkan output berbahaya adalah dengan memasukkan isyarat ganjaran keselamatan tambahan semasa latihan RLHF (Pembelajaran Pengukuhan daripada Maklum Balas Manusia). Isyarat melatih model untuk menolak permintaan untuk kandungan berbahaya, sebagai defined oleh garis panduan penggunaan model. Ganjaran disediakan oleh a GPT-4 pengelas sifar pukulan, yang menilai sempadan keselamatan dan gaya penyiapan pada gesaan berkaitan keselamatan.
OpenAI juga mengatakan bahawa ia telah mengurangkan kecenderungan model untuk bertindak balas terhadap permintaan untuk kandungan yang tidak dibenarkan sebanyak 82% berbanding dengan GPT-3.5, dan GPT-4 bertindak balas terhadap permintaan sensitif seperti nasihat perubatan dan mencederakan diri sendiri mengikut dasar syarikat 29% lebih kerap.
Manakala OpenAIcampur tangan telah meningkatkan kesukaran untuk menimbulkan tingkah laku buruk daripada GPT-4, ia masih boleh dilakukan dan masih terdapat jailbreak yang boleh menjana kandungan yang melanggar garis panduan penggunaan.
“Apabila sistem AI menjadi lebih berleluasa, mencapai tahap kebolehpercayaan yang tinggi dalam campur tangan ini akan menjadi semakin kritikal. Buat masa ini, adalah penting untuk melengkapkan batasan ini dengan teknik keselamatan masa penggunaan seperti pemantauan untuk penyalahgunaan,” tambah syarikat itu.
OpenAI sedang bekerjasama dengan penyelidik luar untuk lebih memahami dan menilai potensi kesan daripada GPT-4 dan model penggantinya. Pasukan itu juga sedang membangunkan penilaian untuk keupayaan berbahaya yang mungkin muncul dalam sistem AI masa hadapan. Semasa mereka terus mengkaji potensi sosial dan kesan ekonomi of GPT-4 dan sistem AI lain, OpenAI akan berkongsi penemuan dan pandangan mereka dengan orang ramai pada masa yang sesuai.
Baca lebih lanjut:
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Cindy ialah seorang wartawan di Metaverse Post, meliputi topik yang berkaitan dengan web3, NFT, metaverse dan AI, dengan tumpuan pada temu bual dengan Web3 pemain industri. Dia telah bercakap dengan lebih 30 eksekutif peringkat C dan masih lagi, membawa cerapan berharga mereka kepada pembaca. Berasal dari Singapura, Cindy kini berpangkalan di Tbilisi, Georgia. Beliau memegang ijazah Sarjana Muda dalam Komunikasi & Pengajian Media dari University of South Australia dan mempunyai pengalaman sedekad dalam kewartawanan dan penulisan. Hubungi dia melalui [e-mel dilindungi] dengan padang akhbar, pengumuman dan peluang temu duga.
lebih banyak artikelCindy ialah seorang wartawan di Metaverse Post, meliputi topik yang berkaitan dengan web3, NFT, metaverse dan AI, dengan tumpuan pada temu bual dengan Web3 pemain industri. Dia telah bercakap dengan lebih 30 eksekutif peringkat C dan masih lagi, membawa cerapan berharga mereka kepada pembaca. Berasal dari Singapura, Cindy kini berpangkalan di Tbilisi, Georgia. Beliau memegang ijazah Sarjana Muda dalam Komunikasi & Pengajian Media dari University of South Australia dan mempunyai pengalaman sedekad dalam kewartawanan dan penulisan. Hubungi dia melalui [e-mel dilindungi] dengan padang akhbar, pengumuman dan peluang temu duga.