أنثروبيك يقترح "ذكاء إصطناعي سياقي" لنماذج الدردشة على أساس 60 مبدأ
في سطور
OpenAI يستخدم التعلم المعزز من ردود الفعل البشرية (RLHF) للمواءمة نماذج اللغة بمبادئ الإنسان وسلامته وفائدته.
اقترح أنثروبيك نهجًا بديلاً: الذكاء الاصطناعي السياقي ، والذي يتضمن أشخاصًا يكتبون دستورًا يجب أن يتبعه النموذج.
يستند هذا الدستور إلى إعلان الأمم المتحدة لحقوق الإنسان ، وشروط خدمة Apple ، والمبادئ التي تشجع على مراعاة وجهات النظر غير الغربية.
اقترحت Anthropic طريقة جديدة لتدريب نماذج الدردشة باستخدام "الذكاء الاصطناعي الدستوري". هذه الطريقة مبنية على OpenAIالصورة تعزيز التعلم من ردود الفعل البشرية ولكن يبني عليها من خلال تجنب الحاجة إلى كتابة عينات تدريب عميقة. بدلاً من ذلك ، يتم تدريب النموذج على الاستجابة للمدخلات من خلال استخدام دستور يُقصد به العمل كمجموعة من القوانين للنموذج الذي يجب اتباعه.
من خلال هذه الطريقة ، يمكن للذكاء الاصطناعي إنشاء عينات تدريبية خاصة به من خلال تقييم ما قاله مقابل مجموعة المبادئ المقبولة قانونًا. يمكن رؤية هذه التقنية الموفرة للوقت على أنها اسحاق اسيموفالصورة قوانين الروبوتات وضعه موضع التنفيذ.
المبادئ التي تشكل أساس النموذج كثيرة جدًا بحيث لا يمكن مناقشتها بالتفصيل. ومع ذلك ، فهي تغطي العديد من الموضوعات ، مثل الأخلاق والنفور من المخاطرة والاقتصاد والذكاء الاصطناعي. تم تطوير كل منها للمساعدة في توجيه قرارات الذكاء الاصطناعي عندما يتعلق الأمر بالاستجابة مطالبات المحادثة.
تمكنت Anthropic من تدريب نموذج ذكاء اصطناعي يُدعى Claude بشكل فعال، والذي يتنافس معه بنجاح OpenAIالصورة ChatGPT. باستخدام طريقة الدستور والذكاء الاصطناعي، يمكن أن يستجيب كلود لمطالبات المحادثة بمستوى مذهل من الدقة ، ولكن من المتوقع حدوث تحسينات إضافية مع استمرار Anthropic في البناء على هذه التكنولوجيا التي تغير قواعد اللعبة.
في الواقع ، هذا النهج الجديد لديه القدرة على توفير الوقت والمال للشركات التي لم تعد بحاجة إلى بناء عينات التدريب الخاصة بها. بدلاً من ذلك ، يمكن استخدام هذه الطريقة "الجاهزة" كأساس لإنشاء نماذج مناسبة - لا يلزم معرفة البرمجة. من المهم أيضًا ملاحظة كيف تعد هذه التقنية أيضًا بزيادة الأمان عندما يتعلق الأمر بروبوتات المحادثة. إنشاء مجموعة من المبادئ المقبولة قانونًا يخفف من المخاطر من منظمة العفو الدولية المارقة.
لذلك ، لا يعد Constituation AI بجعل تطوير نموذج الدردشة أسهل وأسرع فحسب ، بل سيجعله أيضًا أكثر أمانًا. وضع مربح للجانبين لعالم الذكاء الاصطناعي وروبوتات الدردشة على حدٍ سواء.
نظرة تحليلية على "سياقية الذكاء الاصطناعي" للأنثروبيك لروبوتات الدردشة
يعتمد الذكاء الاصطناعي السياقي في Anthropic على دمج أكثر من 60 مبدأ مستمدة من إعلان الأمم المتحدة لحقوق الإنسان ، وشروط خدمة Apple ، والمبادئ التي تشجع على مراعاة وجهات النظر غير الغربية ، ديب مايند قواعد العصفور ومجموعة البحوث البشرية 1 والمجموعة 2.
إن حقيقة إمكانية تعليم الذكاء الاصطناعي الآن كيفية التصرف وفقًا للمبادئ المستمدة من هذه المجموعة الواسعة والمتنوعة من المصادر أمر رائع حقًا. ومن خلال دمج مبادئ إعلان الأمم المتحدة لحقوق الإنسان، على سبيل المثال، تعكس استجابات برامج الدردشة الآلية الآن أهمية الحفاظ على مفهوم الحرية والمساواة والأخوة. وتشكل هذه المبادئ عنصرا حيويا لضمان ذلك محادثات chatbot تبقى أخلاقية ومحترمة. وبالمثل، فإن دمج شروط خدمة Apple يضمن chatbot تراعي مصالح الخصوصية لمستخدميها.
تلعب المبادئ التي تشجع على مراعاة وجهات النظر غير الغربية أيضًا دورًا مهمًا في نموذج "الذكاء الاصطناعي السياقي". تعكس هذه المبادئ الحاجة إلى أن يحترم الذكاء الاصطناعي الثقافات الأخرى ويضمن عدم اعتبار استجابات روبوتات الدردشة ضارة أو مسيئة. وبالمثل ، تملي قواعد Sparrow الخاصة بـ Deepmind أن يستجيب روبوت المحادثة باستجابات تهدف إلى بناء علاقة مع المستخدم.
يوفر دمج مجموعة الأبحاث البشرية 1 والمجموعة 2 الضمان النهائي بأن تظل محادثات الذكاء الاصطناعي حضارية ومحترمة. تم تدريب الذكاء الاصطناعي للتأكد من أنه يجيب على الأسئلة بطريقة مدروسة ومهذبة.
بشكل عام ، يعد نموذج "الذكاء الاصطناعي السياقي" الخاص بأنثروبيك إنجازًا مهمًا للغاية في مجال أبحاث الذكاء الاصطناعي. من خلال السماح بتدريس الذكاء الاصطناعي وفقًا للمبادئ المستمدة من مجموعة متنوعة من المصادر ، يتم تحسين الآثار الأخلاقية للمحادثات الآلية بشكل كبير.
اقرأ المزيد عن الذكاء الاصطناعي:
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.
المزيد من المقالاتدامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.