Laporan Berita Teknologi
Semoga 10, 2023

Pakar Berhati-hati Terhadap 'Sisipan Berniat Hasad' ke dalam Set Data AI dalam ChatGPT

Secara ringkas

ChatGPT berpotensi terdedah disebabkan oleh data latihan.

Menurut penyelidik, dengan hanya $60 di AS, kami boleh meracuni 0.01% daripada set data LAION-400 atau COYO-700 pada tahun 2022.

ChatGPT teknologi menjadi semakin popular, tetapi baru-baru ini penyelidikan mencadangkan bahawa teknologi ini mungkin terdedah disebabkan oleh data latihan yang digunakannya. Apabila model menjadi lebih kompleks dan set data menjadi lebih besar dan lebih kompleks, pelaku berniat jahat boleh mengeksploitasi kelemahan ini untuk memanipulasi set data dan menyebabkan model pembelajaran mesin menghasilkan hasil yang tidak tepat.

Pakar Berhati-hati Terhadap 'Sisipan Berniat Hasad' ke dalam Set Data AI dalam ChatGPT
@Midjourney / TataMatalata#9861
Lawatan: Top 10 Saham Paling Menjanjikan Diramalkan oleh ChatGPT (AI) untuk Mengungguli Dana Dunia Terkemuka pada 2023

Kebimbangan utama ialah pangkalan data chatbot selalunya merupakan set data "disahkan secara bersyarat", bermakna terdapat tahap kepercayaan tertentu yang dimasukkan ke dalam data tanpa pengesahan yang meluas. Dalam erti kata lain, set data ini selalunya boleh mempunyai isu asas yang belum dipertimbangkan. Walaupun pengesahan set data selalunya tidak dilakukan kerana saiznya yang besar, terdapat potensi untuk pelakon berniat jahat untuk memanipulasi data ini.

Malah, penyelidik telah mencadangkan bahawa menjelang 2022, penyerang boleh membelanjakan anggaran $60 untuk meracuni 0.01% daripada set data LAION-400 atau COYO-700. Walaupun ini tidak kelihatan seperti banyak, pelakon berniat jahat boleh menggunakan data beracun ini untuk keuntungan mereka sendiri jika dibiarkan. Data berniat jahat akhirnya boleh bocor ke dalam set data yang lebih besar, merosakkan kualiti data dan membawa kepada model pembelajaran mesin yang tidak boleh dipercayai.

Adalah perlu untuk mengambil langkah untuk melindungi pangkalan data daripada data berniat jahat. Mengagregatkan beberapa sumber data harus menjadi standard untuk chatbot set data latihan untuk memastikan data boleh dipercayai dan tepat. Selain itu, syarikat harus bereksperimen dengan set data untuk memastikan mereka tidak terdedah kepada pelakon yang berniat jahat.

AI Chatbots dengan Kod Hasad Boleh Terdedah kepada Penggodaman

Ancaman kod berniat jahat dalam chatbots boleh menjadi agak serius; kod berniat jahat boleh digunakan untuk mencuri data pengguna, membolehkan akses berniat jahat kepada pelayan, dan membolehkan aktiviti berniat jahat seperti pengubahan wang haram atau exfiltration data. Jika chatbot AI dilatih mengenai data dengan sisipan berniat jahat, ia secara tidak sedar boleh menyuntik kod hasad ke dalam responsnya dan tanpa disedari digunakan sebagai alat untuk keuntungan hasad.

Pelakon yang berniat jahat boleh mengambil kesempatan daripada kelemahan ini dengan sama ada secara sengaja atau tidak sengaja memperkenalkan kod berniat jahat ke dalam data latihan. Di samping itu, kerana chatbots AI belajar daripada data yang dipersembahkan, ini juga berpotensi menyebabkan mereka mempelajari respons yang salah atau malah tingkah laku berniat jahat.

@Midjourney / TataMatalata#9861

Bahaya lain yang mungkin dihadapi oleh chatbot AI ialah "overfitting." Ini adalah apabila model ramalan dilatih terlalu rapat pada data yang diberikan, sekali gus membawa kepada ramalan yang lemah apabila dibentangkan dengan data baharu. Ini boleh menjadi masalah tertentu seperti Bot sembang AI terlatih mengenai kod hasad berpotensi menjadi lebih berkesan untuk menyuntik kod hasad ke dalam respons mereka apabila mereka menjadi lebih biasa dengan data.

Adalah penting untuk mengetahui risiko dan mengambil langkah berjaga-jaga untuk menjamin data latihan yang digunakan untuk mengajar ChatGPT adalah selamat dan boleh dipercayai untuk mengelakkan potensi kelemahan ini. Data awal yang digunakan untuk latihan juga mesti disimpan berasingan dan unik; promosi "sisipan berniat jahat" tidak boleh bercanggah atau bertindih dengan sumber lain. Ia harus diperiksa dan dibandingkan dengan domain lain jika "menangkap" berbilang domain yang disahkan boleh dilaksanakan untuk mengesahkan data.

Teknologi Chatbot berjanji untuk mengubah cara orang menjalankan perbincangan manusia. Tetapi sebelum ia dapat merealisasikan potensi sepenuhnya, ia perlu diperbaiki dan dilindungi. Set data untuk chatbots perlu disemak dengan baik dan bersedia untuk menangkis pelakon yang berniat jahat. Dengan melakukan ini, kami boleh memastikan bahawa kami menggunakan sepenuhnya potensi teknologi dan terus mendorong had kecerdasan buatan.

Baca lebih lanjut mengenai AI:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Pengasas Samourai Wallet Dituduh Memudahkan $2B dalam Tawaran Darknet

Kebimbangan pengasas Samourai Wallet mewakili kemunduran yang ketara bagi industri, menekankan ...

Mengetahui lebih lanjut

Kegilaan DOGE: Menganalisis Lonjakan Nilai Terkini Dogecoin (DOGE).

Industri mata wang kripto berkembang pesat, dan syiling meme sedang bersedia untuk peningkatan yang ketara. Dogecoin (DOGE), ...

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Untuk Lebih Lanjut
Baca lagi
Minggu Fesyen Metaverse 2024: Tadbir Urus Terdesentralisasi dan Peluang Pelaburan dalam Fesyen Maya
Art Gaya hidup Cerita dan Ulasan Teknologi
Minggu Fesyen Metaverse 2024: Tadbir Urus Terdesentralisasi dan Peluang Pelaburan dalam Fesyen Maya
April 29, 2024
Dari Konsep kepada Realiti: Cara Persediaan Auto Avatar dan Penjana Tekstur Roblox Mempercepatkan Kreativiti dan Inovasi
perisian Cerita dan Ulasan Teknologi
Dari Konsep kepada Realiti: Cara Persediaan Auto Avatar dan Penjana Tekstur Roblox Mempercepatkan Kreativiti dan Inovasi
April 29, 2024
Blok Jack Dorsey Memperkenalkan Sistem Perlombongan Bitcoin Pecah Tanah dengan Cip Tiga Nanometer Termaju
perisian Cerita dan Ulasan Teknologi
Blok Jack Dorsey Memperkenalkan Sistem Perlombongan Bitcoin Pecah Tanah dengan Cip Tiga Nanometer Termaju
April 29, 2024
Friend.Tech Menangguhkan Keluaran V2 Hingga 3 Mei Untuk Melaksanakan Token FRIEND Airdrop Perkongsian Untuk Pemegang 'Kunci'
pasaran Laporan Berita Teknologi
Friend.Tech Menangguhkan Keluaran V2 Hingga 3 Mei Untuk Melaksanakan Token FRIEND Airdrop Perkongsian Untuk Pemegang 'Kunci'
April 29, 2024