Xəbər Hesabatı Texnologiya
Mart 16, 2023

GPT-4 Əvvəlkilərdən "Hallüsinasiya" Faktları və Mühakimə Səhvlərini Miras edir GPT Models

Qısaca

OpenAI deyir GPT-4 əvvəlki kimi məhdudiyyətlərə malikdir GPT modelləri.

GPT-4 hələ də faktları hallüsinasiya edir və əsaslandırma səhvlərinə yol verir.

Lakin, GPT-4 -dən 40% yüksək bal toplayır OpenAIən son GPT-3.5 şirkətin daxili rəqib faktiki qiymətləndirmələri haqqında.

GPT-4 Əvvəlkilərdən "Halüsinasiya edən" Faktları və Mühakimə Səhvlərini Miras edir GPT Models

OpenAI istifadəçilərə xəbərdarlıq etdi ki, onun ən son dil modeli, GPT-4, hələ də tam etibarlı deyil və faktları "halüsinasiya" edə və əsaslandırma səhvləri edə bilər. Şirkət istifadəçiləri dil modeli çıxışlarından, xüsusən də “yüksək riskli kontekstlərdə” istifadə edərkən diqqətli olmağa çağırır.

Ancaq yaxşı xəbər budur GPT-4 əvvəlki modellərə nisbətən halüsinasiyaları əhəmiyyətli dərəcədə azaldır. OpenAI iddia edir GPT-4 ən sondan 40% yüksək bal toplayır GPT-3.5 daxili çəkişmə faktlarının qiymətləndirilməsi haqqında. 

vasitəsilə OpenAI

“Biz TruthfulQA kimi xarici meyarlar üzrə irəliləyiş əldə etdik, bu modelin faktı mübahisəli şəkildə seçilmiş yanlış ifadələr dəstindən ayırmaq qabiliyyətini yoxlayır. Bu suallar statistik cəhətdən cəlbedici olan faktiki olaraq yanlış cavablarla birləşdirilib”. OpenAI yazdı blog.

Bu təkmilləşdirməyə baxmayaraq, model hələ də 2021-ci ilin sentyabrından sonra baş verən hadisələr haqqında məlumatsızdır və əvvəlki modellərdə olduğu kimi bəzən sadə əsaslandırma xətalarına yol verir. Bundan əlavə, o, istifadəçilərdən açıq-aydın yalan ifadələri qəbul etməkdə hədsiz dərəcədə inandırıcı ola bilər və koduna təhlükəsizlik zəiflikləri daxil etmək kimi çətin problemlərdə uğursuz ola bilər. O, həmçinin təqdim etdiyi məlumatları fakt yoxlayır.

Sələflər kimi, GPT-4 zərərli məsləhət, səhv kodu və ya qeyri-dəqiq məlumat yarada bilər. Bununla belə, modelin əlavə imkanları başa düşülməli olan yeni risk səthlərinə gətirib çıxarır. Bu risklərin dərəcəsini qiymətləndirmək üçün, 50-dən çox mütəxəssis Müxtəlif domenlərdən, o cümlədən süni intellektlə uyğunlaşma riskləri, kibertəhlükəsizlik, biorisk, inam və təhlükəsizlik və beynəlxalq təhlükəsizlik, modeli ziddiyyətli şəkildə sınaqdan keçirmək üçün cəlb edilmişdir. Onların rəyləri və məlumatları daha sonra modeli təkmilləşdirmək üçün istifadə edilib, məsələn, təkmilləşdirmək üçün əlavə məlumatların toplanması GPT-4təhlükəli kimyəvi maddələrin sintezi ilə bağlı sorğulardan imtina etmək qabiliyyəti.

Əsas yollardan biri OpenAI RLHF (İnsan Rəyindən Gücləndirici Öyrənmə) təlimi zamanı əlavə təhlükəsizlik mükafatı siqnalını daxil etməklə zərərli nəticələrin azaldılmasıdır. Siqnal, modeli zərərli məzmun üçün sorğulardan imtina etməyə öyrədir defimodelin istifadə qaydaları ilə müəyyən edilir. Mükafat a tərəfindən təmin edilir GPT-4 təhlükəsizliklə bağlı göstərişlərdə təhlükəsizlik sərhədlərini və tamamlama tərzini qiymətləndirən sıfır atış təsnifatı.

OpenAI həmçinin modelin icazə verilməyən məzmun üçün sorğulara cavab vermək meylini əvvəlki ilə müqayisədə 82% azaltdığını söylədi. GPT-3.5 və GPT-4 şirkətin siyasətlərinə uyğun olaraq tibbi məsləhət və özünə zərər vermə kimi həssas sorğulara 29% daha tez cavab verir.

vasitəsilə OpenAI

Isə OpenAI'nin müdaxilələri pis davranışları ortaya çıxarmağın çətinliyini artırdı GPT-4, hələ də mümkündür və istifadə qaydalarını pozan məzmun yarada bilən jailbreaks hələ də mövcuddur. 

“AI sistemləri daha çox yayıldıqca, bu müdaxilələrdə yüksək dərəcədə etibarlılığa nail olmaq getdikcə daha vacib olacaq. Hələlik bu məhdudiyyətləri sui-istifadə hallarının monitorinqi kimi yerləşdirmə zamanı təhlükəsizlik texnikaları ilə tamamlamaq vacibdir”, – şirkət əlavə edib.

OpenAI potensial təsirlərini daha yaxşı başa düşmək və qiymətləndirmək üçün kənar tədqiqatçılarla əməkdaşlıq edir GPT-4 və onun davamçı modelləri. Komanda həmçinin gələcək süni intellekt sistemlərində yarana biləcək təhlükəli imkanlar üçün qiymətləndirmələr hazırlayır. Onlar potensial sosial öyrənməyə davam etdikcə və iqtisadi təsirləri of GPT-4 və digər AI sistemləri, OpenAI öz tapıntılarını və fikirlərini vaxtında ictimaiyyətlə bölüşəcəklər.

Daha ətraflı:

Tags:

Məsuliyyətdən imtina

uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.

Müəllif haqqında

Sindi jurnalistdir Metaverse Postilə bağlı mövzuları əhatə edir web3, NFT, metaverse və AI ilə müsahibələrə diqqət yetirərək Web3 sənaye oyunçuları. O, 30-dan çox C səviyyəli icraçı ilə danışıb və onların dəyərli fikirlərini oxuculara çatdırıb. Əslən Sinqapurdan olan Sindi hazırda Gürcüstanın Tbilisi şəhərində yerləşir. O, Cənubi Avstraliya Universitetində Kommunikasiya və Media Tədqiqatları üzrə bakalavr dərəcəsinə malikdir və jurnalistika və yazı sahəsində onillik təcrübəyə malikdir. vasitəsilə onunla əlaqə saxlayın [e-poçt qorunur] mətbuat meydançaları, elanlar və müsahibə imkanları ilə.

Ətraflı məqalələr
Sindi Tan
Sindi Tan

Sindi jurnalistdir Metaverse Postilə bağlı mövzuları əhatə edir web3, NFT, metaverse və AI ilə müsahibələrə diqqət yetirərək Web3 sənaye oyunçuları. O, 30-dan çox C səviyyəli icraçı ilə danışıb və onların dəyərli fikirlərini oxuculara çatdırıb. Əslən Sinqapurdan olan Sindi hazırda Gürcüstanın Tbilisi şəhərində yerləşir. O, Cənubi Avstraliya Universitetində Kommunikasiya və Media Tədqiqatları üzrə bakalavr dərəcəsinə malikdir və jurnalistika və yazı sahəsində onillik təcrübəyə malikdir. vasitəsilə onunla əlaqə saxlayın [e-poçt qorunur] mətbuat meydançaları, elanlar və müsahibə imkanları ilə.

DOGE Frenzy: Dogecoin-in (DOGE) son dəyər artımının təhlili

Kriptovalyuta sənayesi sürətlə genişlənir və mem sikkələri əhəmiyyətli bir yüksəlişə hazırlaşır. Dogecoin (DOGE), ...

Daha çox məlumat

Metaversedə AI tərəfindən yaradılan məzmunun təkamülü

Generativ AI məzmununun ortaya çıxması virtual mühitdə ən maraqlı inkişaflardan biridir ...

Daha çox məlumat
İnnovativ Texniki İcmamıza Qoşulun
Daha çox oxu
Daha çox oxu
Scroll Bernoulli Mainnet Təkmilləşdirməsini Tamamlayır, Tranzaksiya Xərclərində 10 dəfə azalma gözləyir
Xəbər Hesabatı Texnologiya
Scroll Bernoulli Mainnet Təkmilləşdirməsini Tamamlayır, Tranzaksiya Xərclərində 10 dəfə azalma gözləyir
April 29, 2024
OKX Jumpstart Runecoin-i siyahıya alır, RUNE Tokenləri qazanmaq üçün BTC Stakinginə imkan verir
Markets Xəbər Hesabatı Texnologiya
OKX Jumpstart Runecoin-i siyahıya alır, RUNE Tokenləri qazanmaq üçün BTC Stakinginə imkan verir
April 29, 2024
Bu həftənin ən yaxşı sövdələşmələri, AI, IT-yə əsas investisiyalar, Web3, və Kripto (22-26.04)
Həzm Biznes Markets Texnologiya
Bu həftənin ən yaxşı sövdələşmələri, AI, IT-yə əsas investisiyalar, Web3, və Kripto (22-26.04)
April 26, 2024
Vitalik Buterin PoW-nin Mərkəzləşdirilməsini Şərh edir, PoS-a qədər bunun müvəqqəti mərhələ olduğunu qeyd edir
Xəbər Hesabatı Texnologiya
Vitalik Buterin PoW-nin Mərkəzləşdirilməsini Şərh edir, PoS-a qədər bunun müvəqqəti mərhələ olduğunu qeyd edir
April 26, 2024
CRYPTOMERIA LABS PTE. LTD.