Laporan Berita Teknologi
Mac 16, 2023

GPT-4 Mewarisi Fakta "Halusinasi" dan Kesilapan Penaakulan Dari Awal GPT model

Secara ringkas

OpenAI berkata GPT-4 mempunyai batasan yang sama seperti sebelumnya GPT model.

GPT-4 masih berhalusinasi fakta dan membuat kesilapan penaakulan.

Walau bagaimanapun, GPT-4 mendapat markah 40% lebih tinggi daripada OpenAIterkini GPT-3.5 mengenai penilaian fakta permusuhan dalaman syarikat.

GPT-4 Mewarisi Fakta "Halusinasi" dan Kesilapan Penaakulan Dari Awal GPT model

OpenAI telah memberi amaran kepada pengguna bahawa model bahasa terbarunya, GPT-4, masih tidak boleh dipercayai sepenuhnya dan boleh "menghaluskan" fakta dan membuat kesilapan penaakulan. Syarikat itu menggesa pengguna supaya berhati-hati apabila menggunakan output model bahasa, terutamanya dalam "konteks kepentingan tinggi."

Namun, berita baiknya ialah GPT-4 mengurangkan halusinasi dengan ketara berbanding model sebelumnya. OpenAI mendakwa bahawa GPT-4 mendapat markah 40% lebih tinggi daripada yang terkini GPT-3.5 mengenai penilaian fakta permusuhan dalaman. 

melalui OpenAI

“Kami telah mencapai kemajuan pada penanda aras luaran seperti TruthfulQA, yang menguji keupayaan model untuk memisahkan fakta daripada set pernyataan yang salah yang dipilih secara lawan. Soalan-soalan ini dipasangkan dengan jawapan yang salah secara fakta yang menarik secara statistik," OpenAI menulis dalam a blog post.

Walaupun penambahbaikan ini, model masih kurang pengetahuan tentang peristiwa yang berlaku selepas September 2021 dan kadangkala membuat ralat penaakulan yang mudah, seperti yang dilakukan oleh model terdahulu. Selain itu, ia boleh menjadi terlalu mudah tertipu dalam menerima kenyataan palsu yang jelas daripada pengguna dan gagal dalam masalah yang sukar, seperti memperkenalkan kelemahan keselamatan ke dalam kodnya. Ia juga tidak menyemak fakta maklumat yang diberikannya.

Seperti yang terdahulu, GPT-4 boleh menjana nasihat berbahaya, kod buggy atau maklumat yang tidak tepat. Walau bagaimanapun, keupayaan tambahan model membawa kepada permukaan risiko baharu yang perlu difahami. Untuk menilai sejauh mana risiko ini, lebih 50 pakar daripada pelbagai domain, termasuk risiko penjajaran AI, keselamatan siber, biorisiko, kepercayaan dan keselamatan serta keselamatan antarabangsa, terlibat untuk menguji model tersebut. Maklum balas dan data mereka kemudiannya digunakan untuk menambah baik model, seperti mengumpul data tambahan untuk dipertingkatkan GPT-4keupayaan untuk menolak permintaan tentang cara mensintesis bahan kimia berbahaya.

Salah satu cara utama OpenAI sedang mengurangkan output berbahaya adalah dengan memasukkan isyarat ganjaran keselamatan tambahan semasa latihan RLHF (Pembelajaran Pengukuhan daripada Maklum Balas Manusia). Isyarat melatih model untuk menolak permintaan untuk kandungan berbahaya, sebagai defined oleh garis panduan penggunaan model. Ganjaran disediakan oleh a GPT-4 pengelas sifar pukulan, yang menilai sempadan keselamatan dan gaya penyiapan pada gesaan berkaitan keselamatan.

OpenAI juga mengatakan bahawa ia telah mengurangkan kecenderungan model untuk bertindak balas terhadap permintaan untuk kandungan yang tidak dibenarkan sebanyak 82% berbanding dengan GPT-3.5, dan GPT-4 bertindak balas terhadap permintaan sensitif seperti nasihat perubatan dan mencederakan diri sendiri mengikut dasar syarikat 29% lebih kerap.

melalui OpenAI

Manakala OpenAIcampur tangan telah meningkatkan kesukaran untuk menimbulkan tingkah laku buruk daripada GPT-4, ia masih boleh dilakukan dan masih terdapat jailbreak yang boleh menjana kandungan yang melanggar garis panduan penggunaan. 

“Apabila sistem AI menjadi lebih berleluasa, mencapai tahap kebolehpercayaan yang tinggi dalam campur tangan ini akan menjadi semakin kritikal. Buat masa ini, adalah penting untuk melengkapkan batasan ini dengan teknik keselamatan masa penggunaan seperti pemantauan untuk penyalahgunaan,” tambah syarikat itu.

OpenAI sedang bekerjasama dengan penyelidik luar untuk lebih memahami dan menilai potensi kesan daripada GPT-4 dan model penggantinya. Pasukan itu juga sedang membangunkan penilaian untuk keupayaan berbahaya yang mungkin muncul dalam sistem AI masa hadapan. Semasa mereka terus mengkaji potensi sosial dan kesan ekonomi of GPT-4 dan sistem AI lain, OpenAI akan berkongsi penemuan dan pandangan mereka dengan orang ramai pada masa yang sesuai.

Baca lebih lanjut:

Tags:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Cindy ialah seorang wartawan di Metaverse Post, meliputi topik yang berkaitan dengan web3, NFT, metaverse dan AI, dengan tumpuan pada temu bual dengan Web3 pemain industri. Dia telah bercakap dengan lebih 30 eksekutif peringkat C dan masih lagi, membawa cerapan berharga mereka kepada pembaca. Berasal dari Singapura, Cindy kini berpangkalan di Tbilisi, Georgia. Beliau memegang ijazah Sarjana Muda dalam Komunikasi & Pengajian Media dari University of South Australia dan mempunyai pengalaman sedekad dalam kewartawanan dan penulisan. Hubungi dia melalui [e-mel dilindungi] dengan padang akhbar, pengumuman dan peluang temu duga.

lebih banyak artikel
Cindy Tan
Cindy Tan

Cindy ialah seorang wartawan di Metaverse Post, meliputi topik yang berkaitan dengan web3, NFT, metaverse dan AI, dengan tumpuan pada temu bual dengan Web3 pemain industri. Dia telah bercakap dengan lebih 30 eksekutif peringkat C dan masih lagi, membawa cerapan berharga mereka kepada pembaca. Berasal dari Singapura, Cindy kini berpangkalan di Tbilisi, Georgia. Beliau memegang ijazah Sarjana Muda dalam Komunikasi & Pengajian Media dari University of South Australia dan mempunyai pengalaman sedekad dalam kewartawanan dan penulisan. Hubungi dia melalui [e-mel dilindungi] dengan padang akhbar, pengumuman dan peluang temu duga.

Hot Stories
Sertai Surat Berita Kami.
Berita Terkini

Kegilaan DOGE: Menganalisis Lonjakan Nilai Terkini Dogecoin (DOGE).

Industri mata wang kripto berkembang pesat, dan syiling meme sedang bersedia untuk peningkatan yang ketara. Dogecoin (DOGE), ...

Mengetahui lebih lanjut

Evolusi Kandungan Dijana AI dalam Metaverse

Kemunculan kandungan AI generatif adalah salah satu perkembangan yang paling menarik dalam persekitaran maya ...

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Untuk Lebih Lanjut
Baca lagi
Tatal Selesai Naik Taraf Bernoulli Mainnet, Menjangkakan Penurunan 10x ganda Dalam Kos Transaksi
Laporan Berita Teknologi
Tatal Selesai Naik Taraf Bernoulli Mainnet, Menjangkakan Penurunan 10x ganda Dalam Kos Transaksi
April 29, 2024
OKX Jumpstart Menyenaraikan Runecoin, Membolehkan BTC Staking Untuk Mendapat Token RUNE
pasaran Laporan Berita Teknologi
OKX Jumpstart Menyenaraikan Runecoin, Membolehkan BTC Staking Untuk Mendapat Token RUNE
April 29, 2024
Tawaran Teratas Minggu Ini, Pelaburan Utama dalam AI, IT, Web3, dan Kripto (22-26.04)
Digest Perniagaan pasaran Teknologi
Tawaran Teratas Minggu Ini, Pelaburan Utama dalam AI, IT, Web3, dan Kripto (22-26.04)
April 26, 2024
Vitalik Buterin Mengulas Mengenai Pemusatan PoW, Perhatikan Ia Adalah Peringkat Sementara Sehingga PoS
Laporan Berita Teknologi
Vitalik Buterin Mengulas Mengenai Pemusatan PoW, Perhatikan Ia Adalah Peringkat Sementara Sehingga PoS
April 26, 2024