Yangiliklar hisoboti texnologiya
Mart 15, 2023

OpenAI Yaxshilash uchun 50 dan ortiq ekspertlar guruhini yig'adi GPT-4ning xavfsizligi

Qisqacha

OpenAI eng yangi bo'lishini ta'minlash uchun 50 dan ortiq ekspertlar guruhini yolladi til modeli, GPT-4, foydalanish uchun xavfsiz.

Jamoa tarkibiga AI xavfsizligi, axloqi va siyosatiga ixtisoslashgan tadqiqotchilar va muhandislar kiradi.

Maqsad - oldini olish GPT-4 zararli yoki noxolis kontent yaratishdan va uning insoniy qadriyatlarga mos kelishini taʼminlashdan.

OpenAI Yaxshilash uchun 50 dan ortiq ekspertlar guruhini yig'adi GPT-4ning xavfsizligi

OpenAI qilish uchun turli sohalardagi 50 dan ortiq mutaxassislarni yollagan GPT-4 xavfsizroq. Mutaxassislar potentsial xavf va zaifliklarni aniqlash uchun modelning qarama-qarshi sinovlari bilan ishladilar. Ular turli sohalardagi mutaxassislar: uzoq muddatli AIni moslashtirish xavflari, kiberxavfsizlik, biorisk va xalqaro xavfsizlik. Ularning topilmalari yordam berdi OpenAI maxsus tajriba talab qiladigan yuqori xavfli sohalarda namunaviy xatti-harakatlarni baholash. 

Eng yangi til modeli kichikroq til modellari kabi xavf tug'dirsa-da, qo'shimcha imkoniyatlar GPT-4 yangi tahdidlarga olib keladi. Shunday qilib, mutaxassislar jalb qilindi texnologiya xavfsizligini ta'minlashda hal qiluvchi ahamiyatga ega.

OpenAI xavfsizligini yaxshilash uchun inson imtiyozlari (RLHF) o'quv ko'rsatmalari va qoidalarga asoslangan mukofot modellari (RBRMs) dan xavfsizlikka tegishli mustahkamlashni o'rganishning qo'shimcha to'plamini amalga oshirdi. GPT-4 model. RBRMlar nolga teng GPT-4 uchun qo'shimcha mukofot signali sifatida ishlaydigan tasniflagichlar GPT-4 RLHF nozik sozlash paytida siyosat modeli. Ularning maqsadi zararli kontent yaratishdan bosh tortish yoki zararsiz so'rovlarni rad etmaslik kabi tegishli xatti-harakatlarni rag'batlantirishdir.

Xavfsizligini ta'minlash uchun GPT-4 modellar, OpenAI 2022-yil avgust oyida “qizil jamoa” mashqlarini o‘tkazish uchun tashqi ekspertlarni jalb qilishni boshladi, jumladan, stress testi, chegara testi va raqib testi. Ularning dastlabki versiyalariga kirish imkoni bor edi GPT-4 model va xavfsizlik bo'yicha keyingi tadqiqotlarni rag'batlantiradigan dastlabki xavflarni aniqladi.

Mutaxassislarning fikr-mulohazalari xavflarni kamaytirish uchun texnik yumshatish va siyosatni qo'llash choralarini ko'rishga olib keldi. Biroq, ko'plab tahdidlar saqlanib qolmoqda va qo'shimcha baholash kerak.

Xodimlar haqida gapirish OpenAI, ChatGPT dastlab edi rivojlangan orqali dunyoning eng qashshoq mintaqalaridagi shaxslarning yordami bilan OpenAIning qashshoq hududlardan millionlab ishchilarni ish bilan ta'minlovchi Sama nomli kompaniyasi bilan hamkorligi. AI etikasi bo'yicha ba'zi mutaxassislar tanqid qilishdi OpenAIning o'qitishni autsorsingga topshirish qarori ChatGPT kompaniyani arzon mehnatni ekspluatatsiya qilishda ayblab, Sama uchun namuna.

Ko'proq o'qing:

Masʼuliyatdan voz kechish

Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.

Muallif haqida

Agne - bu metaverse, AI va eng so'nggi tendentsiyalari va ishlanmalarini yorituvchi jurnalist Web3 uchun sanoatlar Metaverse Post. Uning hikoya qilishga bo'lgan ishtiyoqi uni har doim hayajonli va qiziqarli voqealarni ochishga intilib, ushbu sohadagi mutaxassislar bilan ko'plab intervyular o'tkazishga undadi. Agne adabiyot bo'yicha bakalavr darajasiga ega va sayohat, san'at va madaniyat kabi keng ko'lamli mavzular haqida yozishda keng ma'lumotga ega. U, shuningdek, hayvonlar huquqlarini himoya qilish tashkilotining muharriri sifatida ko'ngilli bo'lib, u erda hayvonlar farovonligi muammolari haqida xabardorlikni oshirishga yordam berdi. U bilan bog'laning [elektron pochta bilan himoyalangan].

Boshqa maqolalar
Agne Cimerman
Agne Cimerman

Agne - bu metaverse, AI va eng so'nggi tendentsiyalari va ishlanmalarini yorituvchi jurnalist Web3 uchun sanoatlar Metaverse Post. Uning hikoya qilishga bo'lgan ishtiyoqi uni har doim hayajonli va qiziqarli voqealarni ochishga intilib, ushbu sohadagi mutaxassislar bilan ko'plab intervyular o'tkazishga undadi. Agne adabiyot bo'yicha bakalavr darajasiga ega va sayohat, san'at va madaniyat kabi keng ko'lamli mavzular haqida yozishda keng ma'lumotga ega. U, shuningdek, hayvonlar huquqlarini himoya qilish tashkilotining muharriri sifatida ko'ngilli bo'lib, u erda hayvonlar farovonligi muammolari haqida xabardorlikni oshirishga yordam berdi. U bilan bog'laning [elektron pochta bilan himoyalangan].

Institutsional ishtaha o'zgaruvchanlik sharoitida Bitcoin ETFlariga nisbatan o'sib bormoqda

13F arizalari orqali oshkor qilish Bitcoin ETFs bilan shug'ullanadigan taniqli institutsional investorlarni ochib beradi, bu esa tobora ortib borayotgan qabul qilinishini ta'kidlaydi ...

Ko'proq ma'lumot oling

Hukm chiqarish kuni keldi: AQSh sudi DOJning iltimosini ko'rib chiqayotgani sababli CZ taqdiri muvozanatda.

Changpeng Chjao bugun AQShning Sietldagi sudida hukm chiqarilishiga tayyor.

Ko'proq ma'lumot oling
Innovatsion texnologiyalar hamjamiyatimizga qo'shiling
Ko'proq o'qing
Ko'proq o'qing
Injective inEVM-ga qayta tiklash xavfsizligini olib kelish uchun AltLayer bilan kuchlarni birlashtiradi
ish Yangiliklar hisoboti texnologiya
Injective inEVM-ga qayta tiklash xavfsizligini olib kelish uchun AltLayer bilan kuchlarni birlashtiradi
, 3 2024 mumkin
Masa, MASA kreditlash pulini joriy qilish uchun kassa bilan hamkorlik qiladi, USDC asosida qarz olishga imkon beradi
Birja Yangiliklar hisoboti texnologiya
Masa, MASA kreditlash pulini joriy qilish uchun kassa bilan hamkorlik qiladi, USDC asosida qarz olishga imkon beradi
, 3 2024 mumkin
Velodrome kelgusi haftalarda Superchain beta-versiyasini ishga tushiradi va OP Stack Layer 2 blokcheynlarida kengayadi
Birja Yangiliklar hisoboti texnologiya
Velodrome kelgusi haftalarda Superchain beta-versiyasini ishga tushiradi va OP Stack Layer 2 blokcheynlarida kengayadi
, 3 2024 mumkin
CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi
ish Yangiliklar hisoboti texnologiya
CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi
, 3 2024 mumkin
CRYPTOMERIA LABS PTE. LTD.