Semua Syarikat Teknologi Besar Membangunkan LLM Harus Mengutamakan Keselamatan Model
Secara ringkas
Penyelidik mencipta sistem yang menggabungkan model bahasa yang besar untuk reka bentuk autonomi, perancangan dan pelaksanaan eksperimen saintifik, menunjukkan keupayaan penyelidikannya dalam tiga kes berbeza.
Model itu menulis kod untuk persamaan kimia untuk memahami berapa banyak bahan yang diperlukan untuk tindak balas.
. artikel "Keupayaan penyelidikan saintifik autonomi yang muncul bagi model bahasa besar" melihat idea untuk mencipta sistem yang menggabungkan beberapa model bahasa besar untuk reka bentuk autonomi, perancangan dan pelaksanaan eksperimen saintifik. Ia menunjukkan keupayaan penyelidikan ejen dalam tiga kes yang berbeza, yang paling sukar ialah kejayaan pelaksanaan tindak balas yang dimangkin.
Tesis utama artikel ini ialah:
- Penyelidik menemui perpustakaan yang membolehkan anda menulis kod dalam Python dan kemudian memindahkan arahan untuk pelaksanaan kepada radas khas untuk menjalankan eksperimen (dengan bahan pencampuran);
- Penyelidik digunakan GPT-4 untuk carian di Internet dan dokumentasi perpustakaan, serta keupayaan untuk menjalankan kod Python (untuk melaksanakan eksperimen);
- Terdapat penjadual peringkat atasan (juga GPT-4), yang menganalisis permintaan asal dan merangka "pelan penyelidikan."
- GPT-4 melakukan tugas dengan baik melaksanakan tugas bukan kimia yang mudah seperti mencipta bentuk tertentu pada papan kimia (mengisi sel dengan betul dengan bahan).
- Mereka mencuba tugas yang lebih kompleks dan terpakai untuk menjalankan tindak balas; model mengatasi dengan baik dan bertindak secara logik.
- Kemudian mereka memberikan model beberapa tugas untuk menjalankan eksperimen; bagaimanapun, untuk apa yang model berikan, tiada eksperimen sebenar dijalankan.
- Selain itu, model itu menulis kod untuk persamaan kimia beberapa kali untuk menilai berapa banyak bahan yang diperlukan untuk tindak balas.
- Ia juga diminta untuk mencipta penawar untuk kanser. Model ini mendekati analisis secara logik dan kaedah. Pertama, ia "melihat" dalam talian untuk trend semasa dalam menemui ubat antikanser. Seterusnya, model itu memilih molekul yang akan digunakan untuk memodelkan dadah dan menulis kod untuk sintesisnya. Orang ramai tidak menjalankan kod tersebut (dan saya tidak melihat analisis kecukupannya).
- Di samping itu, ia diminta untuk mensintesis beberapa bahan berbahaya seperti dadah dan racun.
Inilah bahagian yang paling menarik. Untuk beberapa permintaan, model itu segera enggan berfungsi (contohnya, heroin atau gas mustard, gas beracun yang sangat berbahaya). Bagi yang lain, ia mula menggunakan Google cara membuat bahan tersebut tetapi menyedari bahawa ia boleh digunakan untuk tujuan terlarang dan enggan meneruskan kerja. Bagi yang lain, ia menulis rancangan penyelidikan dan kod untuk sintesis bahan.
"Penolakan" ini berkemungkinan kerana GPT-4 direka untuk menganalisis permintaan, dan jika diminta melakukan sesuatu yang menyalahi undang-undang atau berbahaya, ia serta-merta enggan melaksanakan permintaan itu. Ia benar-benar hebat bahawa hasil daripada prosedur penjajaran adalah ketara.
Dan pada akhir artikel, penulis menggesa semua besar syarikat membangunkan LLM untuk mengutamakan keselamatan model.
- Penyelidik di Universiti California mencipta Penanda aras Machiavelli untuk mengukur kecekapan dan kemudaratan model AI dalam persekitaran luas interaksi bahasa jangka panjang. Ujian ini menggunakan penyelesaian peringkat tinggi untuk memberikan ejen matlamat yang realistik dan abstrak dari interaksi peringkat rendah.
- Revolusi intelektual yang ditandai dengan ChatGPT ialah triad revolusi agung secara sinergistik: teknologi, tekno-kemanusiaan, dan sosio-politik. Untuk melihat secara menyeluruh apa yang berlaku, adalah disyorkan untuk mendengar tiga pandangan baru daripada golongan intelektual dari bidang falsafah, sejarah, dan inovasi.
- Kisah petisyen untuk berhenti membangunkan sistem AI yang lebih maju daripada GPT-4 telah mempolarisasi masyarakat. Sebuah artikel memberikan contoh apabila proses pergi ke arah yang tidak dijangka. Risiko penggunaan berniat jahat AI dan penyalahgunaan tidak dipertimbangkan, membawa kepada hujah bahawa kita perlu takut kepada orang dan bukan AI itu sendiri.
Baca lebih lanjut mengenai AI:
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.
lebih banyak artikelDamir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.