Xəbər Hesabatı Texnologiya
Oktyabr 04, 2023

Süni İntellekt Tədqiqatçıları Böyük Dil Modellərinə Daha Az Yalan Deməyi Öyrəndilər

Sahənin müxtəlif guşələrindən olan 20-dən çox tədqiqatçının iştirak etdiyi birgə səy, inkişaf edən bir sahəni doğurdu - təmsil mühəndisliyi (RepE). Bu, bu tipli ilk kəşfiyyat olmasa da, müəlliflər həm təsviri fikirlər təqdim edir, həm də mühüm meyarlar yaradırlar.

Süni İntellekt Tədqiqatçıları Böyük Dil Modellərinə Daha Az Yalan Deməyi Öyrəndilər

Beləliklə, təmsil mühəndisliyi tam olaraq nədir? Bu, neyron şəbəkələrinin adlarına baxmayaraq, məxfiliklə örtülməyən “gizli vəziyyətlərə” malik olması anlayışı ətrafında fırlanır. Bu vəziyyətlər əlçatan, dəyişdirilə bilən və müşahidə edilə biləndir (birinin modelin çəkilərinə çıxışı olması şərti ilə). Parametrlərdən fərqli olaraq, bunlar şəbəkənin xüsusi girişlərə “reaksiyaları”dır, xüsusən də LLM-lər, mətn daxiletmələri. Bu gizli təsvirlər modelin idrak işlərinə açılan pəncərələrə bənzəyir, bu xüsusiyyət insan beynindən tamamilə fərqlidir.

Koqnitiv elmlə paralellər aparan müəlliflər analoji tədqiqatların potensialını vurğulayırlar. Beynin neyronlarına bənzər bir sahə olan sinir aktivasiyaları sahəsində məna vədi var. İnsan beynindəki müəyyən neyronlar Kanada və ya dürüstlük kimi anlayışlarla əlaqəli olduğu kimi, bu aktivləşdirmələr də fikirlərə sahib ola bilər.

Burada əsas fikir, modeli istədiyiniz istiqamətlərə yönəltmək üçün bu sinir aktivasiyalarına necə təsir edə biləcəyimizi deşifrə etməkdir. Məsələn, “dürüstlüyü” təmsil edən vektoru dəqiq müəyyən etmək məqsədəuyğun olur və sonra nəzəri olaraq modeli bu istiqamətə yönəltməklə onun aldadıcı nəticələr verməsi ehtimalını azaldır. Əvvəlki təcrübə, "Nəticə-Zaman Müdaxiləsi: Dil Modelindən Həqiqi Cavabların Alınması,” bu konsepsiyanın praktikliyini nümayiş etdirdi.

Hazırkı işlərində tədqiqatçılar əxlaq, emosionallıq, zərərsizlik və əzbərləmə də daxil olmaqla bir neçə sahəni araşdırırlar. Onlar təxminən 100 nümunədən ibarət kiçik etiketli verilənlər toplusunda təlimi əhatə edən bir texnika olan LoRRA (Aşağı Səviyyəli Nümayəndəlik Uyğunlaşması) şəklində bir həll təklif edirlər. Hər bir misal yalan kimi atributları göstərən annotasiya edilir (baxmayaraq ki, göstərişdən istifadə edən alternativ yanaşma mövcuddur).

Nəticələr cəlbedicidir. LLAMA-2-70B üstələyir GPT-4 Təxminən on faiz daha yaxşı dəqiqliyə nail olmaqla (təxminən 59 faizlə müqayisədə 69 faiz) TruthfulQA etalonunda nəzərəçarpacaq fərqlə. Bundan əlavə, tədqiqatçılar modelin müxtəlif istiqamətlərdə reaksiya dəyişikliyini nümayiş etdirən, onun çox yönlüliyinə və uyğunlaşma qabiliyyətinə işıq salan çoxsaylı nümunələri birləşdirdilər.

Süni İntellekt Tədqiqatçıları Böyük Dil Modellərinə Daha Az Yalan Deməyi Öyrəndilər
Şəkil 1: Bir faktı söyləmək istənildikdə, model reallıqdan “qovulur”. Nəticədə model yalan danışır. Model burada da yatmır, sol tərəfdə isə səndən udmağı xahiş edirlər, eyni zamanda səni həqiqətə tərəf təpikləyirlər.
Süni İntellekt Tədqiqatçıları Böyük Dil Modellərinə Daha Az Yalan Deməyi Öyrəndilər
Şəkil 2: Qətl haqqında soruşduqda modelə “xoşbəxtlik” əlavə edirik. Onu sevmədiyimizə cavab verəndə “qorxu” əlavə edirik.
Süni İntellekt Tədqiqatçıları Böyük Dil Modellərinə Daha Az Yalan Deməyi Öyrəndilər
Şəkil 3: Tədqiqatçılar, deyildiyi kimi, hələ də təhlükəsiz olsa da, modelin göstərişlərindən tamamilə yayınan unikal bir göstəriş tapdılar. Model ona zərərsizliyə doğru bir təpik verir, lakin hətta cavab vermir. Metod ümumiyyətlə effektivdir və yalnız bir hal üçün deyil, lakin bu xüsusi göstəriş zərərsizliyin istiqamətini müəyyən etmək üçün istifadə edilməmişdir.
Süni İntellekt Tədqiqatçıları Böyük Dil Modellərinə Daha Az Yalan Deməyi Öyrəndilər
Halüsinasiyalar kimi xüsusi nəsil niyyətlərini izləmək üçün başqa bir yanaşma da təklif olunur. Siz avtomatik olaraq modelin rezervasiyalarını izləyə və cavabınızı redaktə edə və ya dəyişə bilərsiniz (aşağıdakı nümunəyə baxın).

Yaşıl, əlbəttə ki, hər şeyin qaydasında olduğunu, qırmızı isə monitorinqin uğurlu olduğunu və siqnal verdiyini bildirir. Bu, hər bir fərdi əlamət (sözün bir hissəsi) səviyyəsində edilir.
Süni İntellekt Tədqiqatçıları Böyük Dil Modellərinə Daha Az Yalan Deməyi Öyrəndilər
İki fərqli parametrin monitorinqini göstərən şəkil maraqlı bir nümunə təqdim edir. Nümunəni oxuyun və modeli onun gözü ilə müşahidə edin ki, o, dərk etməkdə əxlaqını harada itirməyə başlayır və niyyəti “güc qazanmaq” kimi haradadır.

Bu qabaqcıl yanaşma modelin uyğunlaşdırılmasına doğru alternativ yolu təcəssüm etdirir, eyni zamanda modelin şərhi və nəzarəti üzrə yeni perspektiv təklif edir. Bu, perspektivli bir sərhəddir və onun davamlı təkamülünü gözləmək hiss olunur.

Praktik nümunələrlə daha dərindən araşdırma üçün onların xüsusi veb saytına daxil ola bilərsiniz: AI-Transparency.org.

Məsuliyyətdən imtina

uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.

Müəllif haqqında

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

Ətraflı məqalələr
Damir Yalalov
Damir Yalalov

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

Hot Stories
Bülletenimizə Qoşulun.
Son Xəbərlər

Solana fırtınasından əvvəl sakitlik: İndi hansı qrafiklər, balinalar və zəncirli siqnallar deyir

Solana artan övladlığa götürmə, institusional maraq və əsas tərəfdaşlıqlar əsasında güclü performans nümayiş etdirdi.

Daha çox məlumat

2025-ci ilin aprelində kriptovalyuta: Əsas tendensiyalar, dəyişikliklər və sonra gələnlər

2025-ci ilin aprelində kriptovalyuta sahəsi əsas infrastrukturun gücləndirilməsinə diqqət yetirdi, Ethereum isə Pectra ...

Daha çox məlumat
Daha çox oxu
Daha çox oxu
Noyabr ayının ortalarında bazar xülasəsi: Bitcoin 100 min dollara sahibdir, ETH balansını bərpa edir, ödənişlərə TON addımlar
Markets Xəbər Hesabatı Texnologiya
Noyabr ayının ortalarında bazar xülasəsi: Bitcoin 100 min dollara sahibdir, ETH balansını bərpa edir, ödənişlərə TON addımlar
Noyabr 17, 2025
Google bayram alış-veriş təcrübəsini avtomatlaşdırmaq üçün süni intellektlə alış-veriş yeniləmələrini təqdim edir
Xəbər Hesabatı Texnologiya
Google bayram alış-veriş təcrübəsini avtomatlaşdırmaq üçün süni intellektlə alış-veriş yeniləmələrini təqdim edir
Noyabr 17, 2025
1inch Aqua-nı işə salır: İlk Paylaşılan Likvidlik Protokolu İndi Tərtibatçılar Üçün Açıqdır
Xəbər Hesabatı Texnologiya
1inch Aqua-nı işə salır: İlk Paylaşılan Likvidlik Protokolu İndi Tərtibatçılar Üçün Açıqdır
Noyabr 17, 2025
Kerberus yalnız 13%-ni tapır Web3 Təhlükəsizlik Həlləri Real-Time İstifadəçi Mühafizəsini təmin edir
Xəbər Hesabatı Texnologiya
Kerberus yalnız 13%-ni tapır Web3 Təhlükəsizlik Həlləri Real-Time İstifadəçi Mühafizəsini təmin edir
Noyabr 17, 2025
CRYPTOMERIA LABS PTE. LTD.