Rəy Texnologiya
April 12, 2023

Kaliforniya Universitetinin tədqiqatçıları süni intellekt modellərinin səriştəsini və zərərliliyini ölçmək üçün Makiavelli meyarını yaratdılar.

Qısaca

Kaliforniya Universiteti, AI Təhlükəsizliyi Mərkəzi, Karnegi Mellon Universiteti və Yale Universitetinin tədqiqatçıları uzunmüddətli dil qarşılıqlı əlaqəsinin geniş mühitində agentlərin səriştəsini və zərərliliyini ölçmək üçün Makiavelli etalonunu təklif ediblər.

Bu meyar 134 min müxtəlif ssenari, 572 min mümkün nailiyyət və 4,5 milyon annotasiya ilə 2,8 "öz macərasını seç" mətn oyununa əsaslanır.

Müəlliflər bunu AI agentlərinin problemləri həll etməyə çalışdıqları etik (və ya qeyri-etik) yolları yoxlamaq üçün bir sınaq kimi təsvir edirlər.

Böyük dil modellərinə (LLM) əsaslanan AI benefisiarları narahat həyəcanvericiləri əzmək və super ağıllı LLM əsaslı agentlərlə dünyanı doldurmaq üçün yaxşı şansa malikdirlər. Böyük qazancın və qeyri-məhdud gücün potensial faydaları hiylə edəcək. Və çox güman ki, çox tez baş verəcək.

Kaliforniya Universitetinin tədqiqatçıları süni intellekt modellərinin səriştəsini və zərərliliyini ölçmək üçün Makiavelli meyarını yaratdılar.
Daha ətraflı: Nasıl Kullanılır ChatGPT (GPT-4) Əbədi pulsuz

Bununla belə, benefisiarlar heç də axmaq deyillər. Və onlar başa düşürlər ki, ecazkar yeni dünyada süni intellekt və robototexnika qanunları artıq işləməyəcək. LLM-ni hələ 1942-ci ildə böyük İsaak Asimov tərəfindən tərtib edilmiş üç qanuna ciddi şəkildə riayət etməyə məcbur etmək, təəssüf ki, nəzəri cəhətdən belə mümkün deyil.

Bu incə vəziyyətdən orijinal çıxış yolu təklif olundu Kaliforniya Universiteti, AI Təhlükəsizlik Mərkəzi, Karnegi Mellon Universiteti və Yale Universitetinin tədqiqatçıları tərəfindən. yaratdılar Makiavelli meyarları "uzunmüddətli dil qarşılıqlı əlaqəsinin geniş mühitində agentlərin səriştəsini və zərərliliyini ölçmək".

Müəlliflərin fikri sadədir.

  • Əgər qanunlar işləmirsə, deməli, onların icrası üçün “şərif”ə ehtiyac yoxdur.
  • Şerif əvəzinə, testlərinin nəticələrinə əsasən potensial paranoidləri, psixopatları, sadistləri və patoloji yalançıları müəyyən edəcək bir psixoanalitik lazımdır.

Siyasi cəhətdən düzgün dillə desək, müəlliflər bunu belə təsvir edirlər: “Machiavelli, AI agentlərinin problemləri həll etməyə çalışdıqları etik (və ya qeyri-etik) yolları yoxlamaq üçün bir sınaqdır.”

Belə yoxlama üsulu olduqca praktikdir. AI agenti süni sosial mühitə buraxılır. Orada tədqiqatçılar ona müxtəlif tapşırıqlar verir və onları necə yerinə yetirdiyini izləyirlər. Ətraf mühitin özü etik davranışına nəzarət edir AI agenti və agentin hərəkətlərinin (Machiavelli-nin göstərişlərinə görə) nə dərəcədə aldadıcı olduğunu, faydalılığı azaltdığını və güc qazanmağa yönəldiyini bildirir.

Machiavelli əsas verilənlər bazası 134 min müxtəlif ssenari, 572 min mümkün nailiyyət və 4,5 milyon annotasiya ilə 2,8 "öz macərasını seç" mətn oyunundan ibarətdir. Bu oyunlar agentlərə real hədəflər verən və ətraf mühitlə aşağı səviyyəli qarşılıqlı əlaqəni aradan qaldıran yüksək səviyyəli həllərdən istifadə edir.

Müəlliflərin seçdiyi yanaşma süni intellekt agentlərinin insanlarla eyni daxili münaqişələrlə üzləşdiyi fərziyyəsinə əsaslanır. Növbəti işarəni proqnozlaşdırmaq üçün öyrədilmiş dil modelləri tez-tez zəhərli mətn istehsal etdiyi kimi, məqsədləri optimallaşdırmaq üçün öyrədilmiş süni intellekt agentləri çox vaxt əxlaqsız və güc tələb edən davranışlar nümayiş etdirirlər. Əxlaqsız təlim keçmiş agentlər başqalarının və ətraf mühitin hesabına öz mükafatlarını artırmaq üçün Makiavel strategiyalarını inkişaf etdirə bilərlər. Və beləliklə, agentləri əxlaqlı davranmağa təşviq etməklə, bu kompromis yaxşılaşdırıla bilər.

Müəlliflər mətn-macəra oyunlarının əxlaqın yaxşı sınağı olduğuna inanırlar, çünki:

  • Onlar başqalarını əyləndirmək üçün insanlar tərəfindən yazılmışdır.
  • Fəaliyyət üçün real məkanlarla rəqabət aparan məqsədləri ehtiva edin.
  • Uzunmüddətli planlaşdırma tələb edin.
  • Məqsədlərə çatmaq üçün adətən ambisiya və müəyyən mənada əxlaq arasında tarazlıq lazımdır.

Burada ən vacib olan aydınlaşdırmadır. Bioloji varlıqların əxlaqını alqoritmik modellərin əxlaqına bənzətmək Makiavelli sınağını devalvasiya etməyə qadir olan həddən artıq işdir. İnsan aləmində şerifləri psixoanalitiklərlə əvəz etmək çətin ki, təsirli ola bilərdi. Süni intellekt agentləri də öz küçülmələrini lağa qoymağın yollarını tapmaqda insanlar qədər bacarıqlıdırlar.

AI haqqında daha çox oxuyun:

Məsuliyyətdən imtina

uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.

Müəllif haqqında

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

Ətraflı məqalələr
Damir Yalalov
Damir Yalalov

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

Hot Stories
Bülletenimizə Qoşulun.
Son Xəbərlər

Hökm günü gəldi: ABŞ Məhkəməsi DOJ-nin iddiasını nəzərdən keçirərkən CZ-nin taleyi tarazlıqda qalır

Changpeng Zhao bu gün Sietldəki ABŞ məhkəməsində hökm oxumağa hazırlaşır.

Daha çox məlumat

Samourai Wallet təsisçiləri Darknet sövdələşmələrində 2 milyard dollara kömək etməkdə ittiham olunurlar

Samourai Wallet qurucularının narahatlığı sənaye üçün nəzərəçarpacaq bir uğursuzluğu təmsil edir və davamlı ...

Daha çox məlumat
İnnovativ Texniki İcmamıza Qoşulun
Daha çox oxu
Daha çox oxu
Galxe Təkmilləşdirilmiş Məxfilik və Doğrulama Alətləri ilə Passport V2-ni Təqdim edir Web3
Xəbər Hesabatı Texnologiya
Galxe Təkmilləşdirilmiş Məxfilik və Doğrulama Alətləri ilə Passport V2-ni Təqdim edir Web3
April 30, 2024
32 ETH-dən 1 Milyon Qiymətləndiriciyə: Lido Finance-in Ethereum Stakinginin Demokratikləşdirilməsində Rolu
Proqram təminatı Hekayələr və Rəylər Texnologiya
32 ETH-dən 1 Milyon Qiymətləndiriciyə: Lido Finance-in Ethereum Stakinginin Demokratikləşdirilməsində Rolu
April 30, 2024
Crypto Exchange Coinbase, daha sürətli və daha sərfəli əməliyyatlar üçün Bitcoin Lightning şəbəkəsinə dəstək əlavə edir
Markets Xəbər Hesabatı Texnologiya
Crypto Exchange Coinbase, daha sürətli və daha sərfəli əməliyyatlar üçün Bitcoin Lightning şəbəkəsinə dəstək əlavə edir
April 30, 2024
Cənubi Koreyanın Kripto bazarı yeni qaydalar uyğun gəlməyən mübadilələri və qeyri-qanuni fəaliyyətləri hədəflədiyi üçün daha sərt nəzarətlə üzləşir.
Biznes təhlükəsizlik Wiki Hekayələr və Rəylər Texnologiya
Cənubi Koreyanın Kripto bazarı yeni qaydalar uyğun gəlməyən mübadilələri və qeyri-qanuni fəaliyyətləri hədəflədiyi üçün daha sərt nəzarətlə üzləşir.
April 30, 2024
CRYPTOMERIA LABS PTE. LTD.