GPT-4 Əvvəlkilərdən "Hallüsinasiya" Faktları və Mühakimə Səhvlərini Miras edir GPT Models
Qısaca
OpenAI deyir GPT-4 əvvəlki kimi məhdudiyyətlərə malikdir GPT modelləri.
GPT-4 hələ də faktları hallüsinasiya edir və əsaslandırma səhvlərinə yol verir.
Lakin, GPT-4 -dən 40% yüksək bal toplayır OpenAIən son GPT-3.5 şirkətin daxili rəqib faktiki qiymətləndirmələri haqqında.
OpenAI istifadəçilərə xəbərdarlıq etdi ki, onun ən son dil modeli, GPT-4, hələ də tam etibarlı deyil və faktları "halüsinasiya" edə və əsaslandırma səhvləri edə bilər. Şirkət istifadəçiləri dil modeli çıxışlarından, xüsusən də “yüksək riskli kontekstlərdə” istifadə edərkən diqqətli olmağa çağırır.
Ancaq yaxşı xəbər budur GPT-4 əvvəlki modellərə nisbətən halüsinasiyaları əhəmiyyətli dərəcədə azaldır. OpenAI iddia edir GPT-4 ən sondan 40% yüksək bal toplayır GPT-3.5 daxili çəkişmə faktlarının qiymətləndirilməsi haqqında.
“Biz TruthfulQA kimi xarici meyarlar üzrə irəliləyiş əldə etdik, bu modelin faktı mübahisəli şəkildə seçilmiş yanlış ifadələr dəstindən ayırmaq qabiliyyətini yoxlayır. Bu suallar statistik cəhətdən cəlbedici olan faktiki olaraq yanlış cavablarla birləşdirilib”. OpenAI yazdı blog.
Bu təkmilləşdirməyə baxmayaraq, model hələ də 2021-ci ilin sentyabrından sonra baş verən hadisələr haqqında məlumatsızdır və əvvəlki modellərdə olduğu kimi bəzən sadə əsaslandırma xətalarına yol verir. Bundan əlavə, o, istifadəçilərdən açıq-aydın yalan ifadələri qəbul etməkdə hədsiz dərəcədə inandırıcı ola bilər və koduna təhlükəsizlik zəiflikləri daxil etmək kimi çətin problemlərdə uğursuz ola bilər. O, həmçinin təqdim etdiyi məlumatları fakt yoxlayır.
Sələflər kimi, GPT-4 zərərli məsləhət, səhv kodu və ya qeyri-dəqiq məlumat yarada bilər. Bununla belə, modelin əlavə imkanları başa düşülməli olan yeni risk səthlərinə gətirib çıxarır. Bu risklərin dərəcəsini qiymətləndirmək üçün, 50-dən çox mütəxəssis Müxtəlif domenlərdən, o cümlədən süni intellektlə uyğunlaşma riskləri, kibertəhlükəsizlik, biorisk, inam və təhlükəsizlik və beynəlxalq təhlükəsizlik, modeli ziddiyyətli şəkildə sınaqdan keçirmək üçün cəlb edilmişdir. Onların rəyləri və məlumatları daha sonra modeli təkmilləşdirmək üçün istifadə edilib, məsələn, təkmilləşdirmək üçün əlavə məlumatların toplanması GPT-4təhlükəli kimyəvi maddələrin sintezi ilə bağlı sorğulardan imtina etmək qabiliyyəti.
Əsas yollardan biri OpenAI RLHF (İnsan Rəyindən Gücləndirici Öyrənmə) təlimi zamanı əlavə təhlükəsizlik mükafatı siqnalını daxil etməklə zərərli nəticələrin azaldılmasıdır. Siqnal, modeli zərərli məzmun üçün sorğulardan imtina etməyə öyrədir defimodelin istifadə qaydaları ilə müəyyən edilir. Mükafat a tərəfindən təmin edilir GPT-4 təhlükəsizliklə bağlı göstərişlərdə təhlükəsizlik sərhədlərini və tamamlama tərzini qiymətləndirən sıfır atış təsnifatı.
OpenAI həmçinin modelin icazə verilməyən məzmun üçün sorğulara cavab vermək meylini əvvəlki ilə müqayisədə 82% azaltdığını söylədi. GPT-3.5 və GPT-4 şirkətin siyasətlərinə uyğun olaraq tibbi məsləhət və özünə zərər vermə kimi həssas sorğulara 29% daha tez cavab verir.
Isə OpenAI'nin müdaxilələri pis davranışları ortaya çıxarmağın çətinliyini artırdı GPT-4, hələ də mümkündür və istifadə qaydalarını pozan məzmun yarada bilən jailbreaks hələ də mövcuddur.
“AI sistemləri daha çox yayıldıqca, bu müdaxilələrdə yüksək dərəcədə etibarlılığa nail olmaq getdikcə daha vacib olacaq. Hələlik bu məhdudiyyətləri sui-istifadə hallarının monitorinqi kimi yerləşdirmə zamanı təhlükəsizlik texnikaları ilə tamamlamaq vacibdir”, – şirkət əlavə edib.
OpenAI potensial təsirlərini daha yaxşı başa düşmək və qiymətləndirmək üçün kənar tədqiqatçılarla əməkdaşlıq edir GPT-4 və onun davamçı modelləri. Komanda həmçinin gələcək süni intellekt sistemlərində yarana biləcək təhlükəli imkanlar üçün qiymətləndirmələr hazırlayır. Onlar potensial sosial öyrənməyə davam etdikcə və iqtisadi təsirləri of GPT-4 və digər AI sistemləri, OpenAI öz tapıntılarını və fikirlərini vaxtında ictimaiyyətlə bölüşəcəklər.
Daha ətraflı:
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Sindi jurnalistdir Metaverse Postilə bağlı mövzuları əhatə edir web3, NFT, metaverse və AI ilə müsahibələrə diqqət yetirərək Web3 sənaye oyunçuları. O, 30-dan çox C səviyyəli icraçı ilə danışıb və onların dəyərli fikirlərini oxuculara çatdırıb. Əslən Sinqapurdan olan Sindi hazırda Gürcüstanın Tbilisi şəhərində yerləşir. O, Cənubi Avstraliya Universitetində Kommunikasiya və Media Tədqiqatları üzrə bakalavr dərəcəsinə malikdir və jurnalistika və yazı sahəsində onillik təcrübəyə malikdir. vasitəsilə onunla əlaqə saxlayın [e-poçt qorunur] mətbuat meydançaları, elanlar və müsahibə imkanları ilə.
Ətraflı məqalələrSindi jurnalistdir Metaverse Postilə bağlı mövzuları əhatə edir web3, NFT, metaverse və AI ilə müsahibələrə diqqət yetirərək Web3 sənaye oyunçuları. O, 30-dan çox C səviyyəli icraçı ilə danışıb və onların dəyərli fikirlərini oxuculara çatdırıb. Əslən Sinqapurdan olan Sindi hazırda Gürcüstanın Tbilisi şəhərində yerləşir. O, Cənubi Avstraliya Universitetində Kommunikasiya və Media Tədqiqatları üzrə bakalavr dərəcəsinə malikdir və jurnalistika və yazı sahəsində onillik təcrübəyə malikdir. vasitəsilə onunla əlaqə saxlayın [e-poçt qorunur] mətbuat meydançaları, elanlar və müsahibə imkanları ilə.