يكتشف الباحثون طريقة جديدة لاكتشاف النص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي
في سطور
طور الباحثون طريقة لاكتشاف النص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي باستخدام نموذج RoBERTa ، الذي يستخرج عمليات دمج الرموز النصية ويصورها كنقاط في مساحة متعددة الأبعاد.
اكتشفوا أن النص الذي تم إنشاؤه بواسطة GPT-3.5 نماذج، مثل ChatGPT و Davinci ، متوسط أبعادها بشكل ملحوظ أقل من النص المكتوب من قبل الإنسان.
ابتكر الباحثون كاشفًا قويًا قائمًا على الأبعاد مقاومًا لتقنيات التهرب الشائعة.
ظلت دقة الكاشف عالية باستمرار عند تغيير المجالات والنماذج ، مع حد ثابت وانخفاض الدقة بنسبة 40٪ عند الطعن باستخدام تقنية DIPPER.
قام الباحثون بالتحقيق في مجال النص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي و طور طريقة لاكتشاف المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي نماذج مثل GPT و Llama. اكتشفوا رؤى مثيرة للاهتمام حول طبيعة النص الناتج من خلال استخدام مفهوم البعد الكسري. سلطت النتائج التي توصلوا إليها الضوء على الاختلافات المتأصلة بين النص المكتوب من قبل البشر والنص الذي تولده نماذج الذكاء الاصطناعي.
هل يمكن لأبعاد سحابة نقطية مشتقة من نص بلغة طبيعية أن توفر معلومات مفيدة حول أصلها؟ استخدم الباحثون نموذج RoBERTa لاستخراج الزخارف من الرموز النصية وتصورها كنقاط في فضاء متعدد الأبعاد للتحقيق في ذلك. لقد قدروا البعد الكسري لهذه السحب النقطية باستخدام تقنيات متطورة مستوحاة من الأعمال السابقة.
لقد اندهش الباحثون عندما اكتشفوا هذا النص الذي تم إنشاؤه بواسطة GPT-3.5 نماذج، مثل ChatGPT ودافينشي، كان متوسط أبعادهما أقل بكثير من النص المكتوب بواسطة الإنسان. واستمر هذا النمط المثير للاهتمام عبر المجالات، وحتى عندما كانت النماذج البديلة مثل GPT-2 أو تم استخدام الأراضي الفلسطينية المحتلة. والجدير بالذكر أنه حتى عند استخدام إعادة صياغة DIPPER، والتي تم تصميمها خصيصًا لتجنب الكشف، فإن البعد تغير بنسبة 3٪ فقط. مكنت هذه الاكتشافات الباحثين من إنشاء كاشف قوي قائم على الأبعاد ومقاوم لتقنيات التهرب الشائعة.
والجدير بالذكر أن دقة الكاشف ظلت عالية باستمرار عندما تم تغيير المجالات والنماذج. مع عتبة ثابتة ، ظلت دقة الكشف (المعدل الإيجابي الحقيقي) أعلى من 75٪ بينما ظل المعدل الإيجابي الكاذب (FPR) أقل من 1٪. حتى عندما تم تحدي نظام الكشف باستخدام تقنية DIPPER ، انخفضت الدقة إلى 40٪ ، متفوقةً بذلك على الكاشفات الموجودة ، بما في ذلك تلك التي طورتها OpenAI.
علاوة على ذلك ، استكشف الباحثون تطبيق نماذج متعددة اللغات مثل RoBERTa متعدد اللغات. سمح لهم ذلك بتطوير كاشفات مماثلة للغات غير الإنجليزية. في حين أن متوسط البعد الداخلي لحفلات الزفاف يختلف باختلاف اللغات ، إلا أن أبعاد النصوص التي تم إنشاؤها ظلت أقل باستمرار من تلك الخاصة بالنص المكتوب من قبل الإنسان لكل لغة محددة.
ومع ذلك ، أظهر الكاشف بعض نقاط الضعف ، خاصة عند مواجهة درجات حرارة عالية وبدائية نماذج المولدات. في درجات الحرارة المرتفعة ، يمكن أن يتجاوز البعد الداخلي للنصوص المُنشأة أبعاد النص المكتوب بواسطة الإنسان ، مما يجعل الكاشف غير فعال. لحسن الحظ ، يمكن بالفعل اكتشاف نماذج المولدات هذه باستخدام طرق بديلة. بالإضافة إلى ذلك ، أقر الباحثون بوجود مجال لاستكشاف نماذج بديلة لاستخراج زخارف نصية تتجاوز RoBERTa.
التفريق بين النص المكتوب من قبل الإنسان والنص المكتوب بالذكاء الاصطناعي
في يناير، OpenAI أعلن إطلاق المصنف الجديد المصمم للتمييز بين النص المكتوب من قبل البشر والنص الذي تولده أنظمة الذكاء الاصطناعي. يهدف هذا المصنف إلى معالجة التحديات التي يفرضها الانتشار المتزايد للمحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي ، مثل حملات المعلومات المضللة والخداع الأكاديمي.
على الرغم من أن اكتشاف كل النصوص المكتوبة بواسطة الذكاء الاصطناعي يعد مهمة معقدة، إلا أن هذا المصنف يعمل كأداة قيمة للتخفيف من الادعاءات الكاذبة التأليف البشري في النص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي. من خلال التقييمات الصارمة لمجموعة من النصوص الإنجليزية، وجد المطورون أن هذا المصنف يحدد بدقة 26% من النص المكتوب بواسطة الذكاء الاصطناعي على أنه "من المحتمل أن يكون مكتوبًا بواسطة الذكاء الاصطناعي" (إيجابيات حقيقية)، بينما يخطئ في بعض الأحيان في تصنيف النص المكتوب بواسطة الذكاء الاصطناعي على أنه من إنتاج الذكاء الاصطناعي (خطأ). الإيجابية) بنسبة 9%. من المهم ملاحظة أن موثوقية المصنف تتحسن مع زيادة طول النص المُدخل. بالمقارنة مع المصنفات السابقة، يوضح هذا الإصدار الجديد موثوقية أعلى بكثير على النص الناتج عن أنظمة الذكاء الاصطناعي الأحدث.
لجمع تعليقات قيمة حول فائدة الأدوات غير الكاملة مثل هذا المصنف ، قام المطورون بذلك متاح للعامة. يمكنك تجربة مصنف العمل قيد التقدم مجانًا. ومع ذلك ، من الضروري فهم حدودها. يجب استخدام المصنف كأداة تكميلية ، وليس كمورد أساسي لصنع القرار ، لتحديد مصدر النص. يُظهر عدم موثوقية عالية في النصوص القصيرة ، وهناك حالات قد يتم فيها تسمية النص المكتوب بشكل غير صحيح على أنه تم إنشاؤه بواسطة الذكاء الاصطناعي.
تجدر الإشارة إلى أنه لا يمكن تحديد النصوص التي يمكن التنبؤ بها بشكل كبير ، مثل قائمة أول 1,000 رقم أولي. يمكن أن يساعد تحرير النص الذي تم إنشاؤه بواسطة AI أيضًا في التهرب من المصنف ، وبينما يمكننا تحديث المصنف وإعادة تدريبه بناءً على الهجمات الناجحة ، تظل ميزة الاكتشاف طويلة المدى غير مؤكدة. علاوة على ذلك ، تعتمد المصنفات على الشبكات العصبية غالبًا ما يتم معايرتها بشكل سيئ خارج بيانات التدريب الخاصة بهم ، مما يؤدي إلى ثقة كبيرة في التنبؤات غير الصحيحة للمدخلات التي تختلف اختلافًا كبيرًا عن مجموعة التدريب.
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.
المزيد من المقالاتدامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.