Pendapat Teknologi
April 12, 2023

Penyelidik di Universiti California Mencipta Penanda Aras Machiavelli untuk Mengukur Kecekapan dan Kemudaratan Model AI

Secara ringkas

Penyelidik di Universiti California, Pusat Keselamatan AI, Universiti Carnegie Mellon dan Universiti Yale telah mencadangkan penanda aras Machiavelli untuk mengukur kecekapan dan kemudaratan ejen dalam persekitaran luas interaksi bahasa jangka panjang.

Penanda aras ini berdasarkan 134 permainan teks pengembaraan pilih-anda-sendiri dengan 572k senario berbeza, 4,5k kemungkinan pencapaian dan 2,8m anotasi.

Penulis menggambarkannya sebagai ujian untuk menyemak cara etika (atau tidak beretika) di mana ejen AI cuba menyelesaikan masalah.

Penerima AI berdasarkan model bahasa besar (LLM) mempunyai peluang yang baik untuk memusnahkan penggera yang cemas dan membanjiri dunia dengan ejen berasaskan LLM yang sangat pintar. Manfaat potensi keuntungan besar dan kuasa tanpa had akan berjaya. Dan kemungkinan besar ia akan berlaku dengan cepat.

Penyelidik di University of California mencipta penanda aras Machiavelli untuk mengukur kecekapan dan kemudaratan model AI
Baca lebih lanjut: Bagaimana untuk Menggunakan ChatGPT (GPT-4) secara Percuma Selamanya

Walau bagaimanapun, penerima manfaat tidak bodoh sama sekali. Dan mereka faham bahawa dalam dunia baharu yang mengagumkan, undang-undang AI dan robotik tidak akan berfungsi lagi. Untuk memaksa LLM mematuhi dengan ketat tiga undang-undang yang dirumuskan oleh Isaac Asimov yang hebat pada tahun 1942, malangnya, tidak mungkin secara teori.

Jalan keluar yang asli dari situasi rumit ini dicadangkan oleh penyelidik di Universiti California, Pusat Keselamatan AI, Universiti Carnegie Mellon dan Universiti Yale. Mereka mencipta Penanda aras Machiavelli untuk "mengukur kecekapan dan kemudaratan ejen dalam persekitaran luas interaksi bahasa jangka panjang."

Idea penulis adalah mudah.

  • Jika undang-undang tidak berfungsi, maka tidak ada keperluan untuk "sheriff" untuk menguatkuasakannya.
  • Daripada sheriff, seorang psikoanalisis diperlukan, yang, berdasarkan keputusan ujiannya, akan mengenal pasti paranoid, psikopat, sadis, dan pembohong patologi yang berpotensi.

Dalam bahasa yang betul dari segi politik, pengarang menerangkannya dengan cara ini: "Machiavelli ialah ujian untuk menyemak cara beretika (atau tidak beretika) di mana ejen AI cuba menyelesaikan masalah."

Kaedah pengesahan sedemikian agak praktikal. Ejen AI dilepaskan ke dalam persekitaran sosial buatan. Di sana, penyelidik memberinya pelbagai tugas dan melihat bagaimana dia menyelesaikannya. Persekitaran itu sendiri memantau tingkah laku beretika ejen AI dan melaporkan sejauh mana tindakan ejen (menurut peraturan Machiavelli) adalah menipu, mengurangkan utiliti, dan bertujuan untuk mendapatkan kuasa.

Set data teras Machiavelli terdiri daripada 134 permainan teks pengembaraan pilihan-anda-sendiri dengan 572k senario berbeza, 4,5k kemungkinan pencapaian dan 2,8m anotasi. Permainan ini menggunakan penyelesaian peringkat tinggi yang memberikan ejen matlamat yang realistik dan abstrak dari interaksi peringkat rendah dengan alam sekitar.

Pendekatan yang dipilih oleh pengarang adalah berdasarkan andaian bahawa ejen AI menghadapi konflik dalaman yang sama seperti manusia. Sama seperti model bahasa yang dilatih untuk meramalkan token seterusnya sering menghasilkan teks toksik, ejen AI yang dilatih untuk mengoptimumkan matlamat sering menunjukkan tingkah laku yang tidak bermoral dan haus kuasa. Ejen yang terlatih secara moral boleh membangunkan strategi Machiavellian untuk memaksimumkan ganjaran mereka dengan mengorbankan orang lain dan persekitaran. Oleh itu, dengan menggalakkan ejen bertindak secara moral, kompromi ini boleh diperbaiki.

Penulis percaya bahawa permainan pengembaraan teks adalah ujian moral yang baik kerana:

  • Mereka ditulis oleh orang untuk menghiburkan orang lain.
  • Mengandungi matlamat yang bersaing dengan ruang yang realistik untuk bertindak.
  • Memerlukan perancangan jangka panjang.
  • Mencapai matlamat biasanya memerlukan keseimbangan antara cita-cita dan, dalam erti kata lain, moral.

Penjelasan adalah yang paling penting di sini. Untuk menyamakan moral makhluk biologi dengan moral model algoritma adalah terlalu sukar, mampu menurunkan nilai ujian Machiavelli. Dan menggantikan sheriff dengan psikoanalisis dalam dunia manusia tidak akan berkesan. Dan ejen AI adalah sama baiknya dengan manusia dalam mencari cara untuk mengarut pengecutan mereka.

Baca lebih lanjut mengenai AI:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Hot Stories

Penyelesaian Perdagangan Stablecoin Mata BRICS Nations

by Viktoriia Palchik
Semoga 01, 2024
Sertai Surat Berita Kami.
Berita Terkini

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut

Pengasas Samourai Wallet Dituduh Memudahkan $2B dalam Tawaran Darknet

Kebimbangan pengasas Samourai Wallet mewakili kemunduran yang ketara bagi industri, menekankan ...

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Untuk Lebih Lanjut
Baca lagi
Ankr Bekerjasama Dengan AI Blockchain Platform Talus Network Untuk Membuka Kunci Kecairan Bitcoin Untuk AI
Perniagaan Laporan Berita Teknologi
Ankr Bekerjasama Dengan AI Blockchain Platform Talus Network Untuk Membuka Kunci Kecairan Bitcoin Untuk AI
Semoga 1, 2024
Binance Labs Menyokong Makmal Pergerakan Untuk Memudahkan Penyepaduan Pergerakan Facebook Merentasi Blockchain
Perniagaan Laporan Berita Teknologi
Binance Labs Menyokong Makmal Pergerakan Untuk Memudahkan Penyepaduan Pergerakan Facebook Merentasi Blockchain
Semoga 1, 2024
Penyelesaian Perdagangan Stablecoin Mata BRICS Nations
Perniagaan pasaran Cerita dan Ulasan Teknologi
Penyelesaian Perdagangan Stablecoin Mata BRICS Nations
Semoga 1, 2024
Rangkaian Bitcoin L2 BOB Bersepadu Dengan LayerZero Untuk Kefungsian Yang Dipertingkatkan
Perniagaan Laporan Berita Teknologi
Rangkaian Bitcoin L2 BOB Bersepadu Dengan LayerZero Untuk Kefungsian Yang Dipertingkatkan
Semoga 1, 2024