Anthropic Mengusulkan 'AI Kontekstual' untuk Model Obrolan Berdasarkan 60 Prinsip
Singkatnya
OpenAI menggunakan pembelajaran penguatan dari umpan balik manusia (RLHF) untuk menyelaraskan model bahasa dengan prinsip kemanusiaan, keamanan, dan kemanfaatan.
Antropik mengusulkan pendekatan alternatif: AI kontekstual, yang melibatkan orang-orang yang menulis konstitusi yang harus diikuti oleh model tersebut.
Konstitusi ini didasarkan pada Deklarasi Hak Asasi Manusia PBB, Ketentuan Layanan Apple, Prinsip Mendorong Pertimbangan Perspektif Non-Barat.
Antropik telah mengusulkan pendekatan baru untuk melatih model obrolan menggunakan 'AI konstitusional'. Metode ini dibangun OpenAI'S penguatan pembelajaran dari umpan balik manusia tetapi membangunnya dengan menghindari kebutuhan untuk menulis sampel pelatihan yang mendalam. Sebaliknya, model dilatih untuk menanggapi masukan melalui penggunaan konstitusi yang dimaksudkan untuk bertindak sebagai seperangkat undang-undang untuk diikuti oleh model.
Rekomendasi: ex-OpenAI karyawan mendirikan Anthropic, sebuah bisnis yang telah menarik pembiayaan lebih dari $700 juta |
Melalui metode ini, AI dapat menghasilkan sampel pelatihannya sendiri dengan mengevaluasi apa yang telah dikatakannya versus seperangkat prinsip yang diterima secara hukum. Teknik menghemat waktu ini dapat dilihat sebagai Isaac Asimov's Hukum Robotika dipraktekkan.
Prinsip-prinsip yang menjadi dasar model terlalu banyak untuk dibahas secara rinci. Namun, mereka mencakup banyak topik, seperti moralitas, penghindaran risiko, ekonomi, dan kecerdasan buatan. Masing-masing telah dikembangkan untuk membantu memandu keputusan AI saat harus merespons petunjuk percakapan.
Anthropic telah berhasil melatih model AI bernama Claude secara efektif, yang berhasil bersaing dengan OpenAI'S ChatGPT. Menggunakan Metode Konstitusi-AI, Claude dapat menanggapi petunjuk percakapan dengan tingkat akurasi yang mengesankan, tetapi peningkatan tambahan diharapkan karena Anthropic terus mengembangkan teknologi yang mengubah permainan ini.
Memang, pendekatan baru ini berpotensi menghemat waktu dan uang bagi perusahaan yang tidak perlu lagi membuat sampel pelatihan mereka sendiri. Sebaliknya, metode 'siap pakai' ini dapat digunakan sebagai dasar untuk membuat model sesuai pesanan - tidak diperlukan pengetahuan pemrograman. Penting juga untuk diperhatikan bagaimana teknologi ini juga menjanjikan untuk meningkatkan keamanan dalam hal bot percakapan. Membuat seperangkat prinsip yang diterima secara hukum memitigasi risiko dari AI menjadi nakal.
Oleh karena itu, Constituation AI tidak hanya menjanjikan pengembangan model obrolan yang lebih mudah dan cepat, tetapi juga membuatnya lebih aman. Situasi win-win untuk dunia Artificial Intelligence dan ChatBots.
Tinjauan Analitik pada "AI Kontekstual" Antropik untuk Chatbots
AI Kontekstual Anthropic didasarkan pada penggabungan lebih dari 60 prinsip yang berasal dari Deklarasi Hak Asasi Manusia Perserikatan Bangsa-Bangsa, Ketentuan Layanan Apple, Prinsip Mendorong Pertimbangan Perspektif Non-Barat, milik Deepmind Aturan Sparrow, dan Riset Antropik Set 1 dan Set 2.
Fakta bahwa AI kini dapat diajarkan untuk berperilaku sesuai dengan prinsip-prinsip yang diperoleh dari berbagai sumber yang luas dan beragam sungguh luar biasa. Dengan memasukkan prinsip-prinsip Deklarasi Hak Asasi Manusia Perserikatan Bangsa-Bangsa, misalnya, respons chatbot kini mencerminkan pentingnya melestarikan gagasan kebebasan, kesetaraan, dan persaudaraan. Prinsip-prinsip tersebut merupakan komponen penting untuk memastikan hal tersebut percakapan chatbot tetap etis dan penuh hormat. Demikian pula, penggabungan Ketentuan Layanan Apple memastikan hal tersebut ChatBot mempertimbangkan kepentingan privasi penggunanya.
Prinsip Mendorong Pertimbangan Perspektif Non-Barat juga memainkan peran penting dalam model "AI Kontekstual". Prinsip-prinsip ini mencerminkan perlunya AI untuk menghormati budaya lain dan memastikan bahwa respons chatbot tidak dianggap berbahaya atau menyinggung. Demikian pula, Aturan Sparrow Deepmind menentukan bahwa chatbot merespons dengan respons yang dimaksudkan untuk membangun hubungan dengan pengguna.
Penggabungan Anthropic Research Set 1 dan Set 2 memberikan jaminan akhir bahwa percakapan AI tetap beradab dan terhormat. AI dilatih untuk memastikan bahwa ia menjawab pertanyaan dengan bijaksana dan sopan.
Secara keseluruhan, model "AI Kontekstual" Anthropic adalah terobosan yang sangat penting di bidang ini penelitian AI. Dengan mengizinkan AI untuk diajarkan sesuai dengan prinsip-prinsip yang berasal dari beragam sumber, implikasi etis dari percakapan otomatis menjadi sangat meningkat.
Baca lebih lanjut tentang AI:
Penolakan tanggung jawab
Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.
Tentang Penulis
Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.
lebih artikelDamir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.