Tədqiqatçılar süni intellektlə yaradılan mətni aşkar etməyin yeni üsulunu kəşf edirlər
Qısaca
Tədqiqatçılar RoBERTa modelindən istifadə edərək süni intellekt tərəfindən yaradılan mətni aşkar etmək üçün bir üsul işləyib hazırlayıblar ki, bu da mətn işarələrinin daxiletmələrini çıxarır və onları çoxölçülü məkanda nöqtələr kimi vizuallaşdırır.
tərəfindən yaradılan mətni kəşf etdilər GPT-3kimi .5 modelləri ChatGPT və Davinci, insan tərəfindən yazılmış mətndən əhəmiyyətli dərəcədə aşağı orta ölçülərə sahib idi.
Tədqiqatçılar ümumi yayınma üsullarına davamlı olan möhkəm ölçü əsaslı detektor yaratdılar.
Domenlər və modellər dəyişdirilərkən detektorun dəqiqliyi sabit həddi və DIPPER texnikası ilə qarşılaşdıqda 40% dəqiqlik azalması ilə davamlı olaraq yüksək olaraq qaldı.
Tədqiqatçılar süni intellekt tərəfindən yaradılan mətn və sahəni araşdırıblar süni intellekt tərəfindən yaradılan məzmunu aşkar etmək üçün bir üsul hazırladı kimi modellər GPT və Llama. Onlar fraksiya ölçüsü anlayışından istifadə etməklə yaradılan mətnin təbiəti haqqında maraqlı fikirlər kəşf etdilər. Onların tapıntıları insanlar tərəfindən yazılmış mətnlə AI modelləri tərəfindən yaradılan mətn arasındakı xas fərqlərə işıq salır.
Təbii dil mətnindən alınan nöqtə buludunun ölçüsü onun mənşəyi haqqında faydalı məlumat verə bilərmi? Tədqiqatçılar mətn işarələrinin yerləşdirilməsini çıxarmaq və bunu araşdırmaq üçün onları çoxölçülü məkanda nöqtələr kimi vizuallaşdırmaq üçün RoBERTa modelindən istifadə ediblər. Onlar əvvəlki işlərdən ilhamlanan mürəkkəb texnikalardan istifadə edərək bu nöqtə buludlarının fraksiya ölçüsünü təxmin etdilər.
Tədqiqatçılar tərəfindən yaradılan mətni kəşf edəndə heyrətləndilər GPT-3kimi .5 modelləri ChatGPT və Davinci, insan tərəfindən yazılmış mətndən əhəmiyyətli dərəcədə aşağı orta ölçülərə sahib idi. Bu maraqlı nümunə bütün domenlərdə və hətta alternativ modellər kimi mövcud olduqda da davam etdi GPT-2 və ya OPT istifadə edilmişdir. Xüsusilə aşkarlanmamaq üçün nəzərdə tutulmuş DIPPER parafrazasından istifadə edərkən belə ölçü yalnız təxminən 3% dəyişdi. Bu kəşflər tədqiqatçılara ümumi yayınma üsullarına davamlı, ölçüyə əsaslanan möhkəm detektor yaratmağa imkan verdi.
Xüsusilə, domenlər və modellər dəyişdirildikdə detektorun dəqiqliyi davamlı olaraq yüksək olaraq qalırdı. Sabit hədd ilə aşkarlama dəqiqliyi (əsl müsbət nisbət) 75%-dən yuxarı, yalançı müsbət nisbət (FPR) isə 1%-dən az qaldı. Hətta aşkarlama sistemi DIPPER texnikası ilə sınaqdan keçirildikdə belə, dəqiqlik 40%-ə enərək, mövcud detektorları, o cümlədən tərəfindən hazırlanmış detektorları üstələdi. OpenAI.
Bundan əlavə, tədqiqatçılar çoxdilli RoBERTa kimi çoxdilli modellərin tətbiqini araşdırdılar. Bu onlara ingilis dilindən başqa dillər üçün oxşar detektorlar hazırlamağa imkan verdi. Yerləşdirmələrin orta daxili ölçüsü müxtəlif dillərdə fərqli olsa da, yaradılan mətnlərin ölçüsü hər bir xüsusi dil üçün insan tərəfindən yazılmış mətndən ardıcıl olaraq aşağı qaldı.
Bununla belə, detektor bəzi zəifliklər nümayiş etdirdi, xüsusən də yüksək nəsil temperaturları və primitivlərlə qarşılaşdıqda generator modelləri. Daha yüksək temperaturda yaradılan mətnlərin daxili ölçüsü insan tərəfindən yazılmış mətnin ölçüsünü üstələyə bilər və bu, detektoru təsirsiz hala gətirir. Xoşbəxtlikdən, bu cür generator modelləri artıq alternativ üsullardan istifadə etməklə aşkar edilə bilər. Bundan əlavə, tədqiqatçılar etiraf etdilər ki, RoBERTa-dan kənar mətn daxiletmələrini çıxarmaq üçün alternativ modelləri araşdırmaq üçün yer var.
İnsan və AI-Yazılı Mətni Arasında Fərqləndirmə
Yanvar ayında, OpenAI elan insanlar tərəfindən yazılmış mətnlə süni intellekt sistemləri tərəfindən yaradılan mətni ayırd etmək üçün nəzərdə tutulmuş yeni təsnifatçının işə salınması. Bu təsnifatçı dezinformasiya kampaniyaları və akademik vicdansızlıq kimi süni intellektlə yaradılan məzmunun artan yayılmasının yaratdığı problemləri həll etmək məqsədi daşıyır.
Bütün süni intellektlə yazılmış mətni aşkar etmək mürəkkəb bir iş olsa da, bu təsnifatlandırıcı saxta iddiaları azaltmaq üçün dəyərli bir vasitə kimi xidmət edir. AI tərəfindən yaradılan mətndə insan müəllifliyi. Bir sıra ingilis mətnləri üzərində ciddi qiymətləndirmələr apararaq, tərtibatçılar tapdılar ki, bu təsnifat süni intellektlə yazılmış mətnin 26%-ni “ehtimal ki, süni intellektlə yazılmış mətn” (əsl pozitivlər) kimi dəqiq müəyyən edir, eyni zamanda bəzən insan tərəfindən yazılmış mətni süni intellekt tərəfindən yaradılan (yanlış) kimi yanlış etiketləyir. müsbət) 9%. Qeyd etmək vacibdir ki, daxil edilmiş mətnin uzunluğu artdıqca təsnifatçının etibarlılığı yaxşılaşır. Əvvəlki təsnifatçılarla müqayisədə bu yeni versiya daha yeni AI sistemləri tərəfindən yaradılan mətndə əhəmiyyətli dərəcədə yüksək etibarlılıq nümayiş etdirir.
Bu təsnifatçı kimi qeyri-kamil alətlərin faydalılığı haqqında dəyərli rəy toplamaq üçün tərtibatçılar bunu etdilər ictimaiyyətə açıqdır. Davam etməkdə olan klassifikatorumuzu pulsuz sınaqdan keçirə bilərsiniz. Bununla belə, onun məhdudiyyətlərini başa düşmək vacibdir. Təsnifatdan mətnin mənbəyini təyin etmək üçün əsas qərar qəbuletmə resursu deyil, əlavə vasitə kimi istifadə edilməlidir. Qısa mətnlərdə yüksək etibarsızlıq nümayiş etdirir və insan tərəfindən yazılmış mətnin süni intellekt tərəfindən yaradılan kimi yanlış etiketləndiyi hallar var.
Qeyd etmək lazımdır ki, yüksək proqnozlaşdırıla bilən mətnlər ardıcıl olaraq müəyyən edilə bilməz, məsələn, ilk 1,000 sadə rəqəmin siyahısı. Süni intellekt tərəfindən yaradılan mətnin redaktə edilməsi də təsnifatçıdan yayınmağa kömək edə bilər və biz uğurlu hücumlar əsasında təsnifatı yeniləyə və yenidən hazırlaya bilsək də, aşkarlamanın uzunmüddətli üstünlüyü qeyri-müəyyən olaraq qalır. Bundan əlavə, təsnifatçılar əsaslanır sinir şəbəkələri tez-tez təlim məlumatlarından kənarda zəif kalibrlənir, bu da təlim dəstindən əhəmiyyətli dərəcədə fərqli olan girişlər üçün yanlış proqnozlara həddindən artıq etibara səbəb olur.
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.