OpenAI يجمع فريقًا يضم أكثر من 50 خبيرًا لتعزيزه GPT-4سلامة
في سطور
OpenAI قامت بتعيين فريق يضم أكثر من 50 خبيرًا للتأكد من أن أحدث منتجاتها نموذج اللغة, GPT-4، آمن للاستخدام.
يضم الفريق باحثين ومهندسين متخصصين في سلامة وأخلاقيات وسياسات الذكاء الاصطناعي.
الهدف هو منع GPT-4 من إنشاء محتوى ضار أو متحيز والتأكد من توافقه مع القيم الإنسانية.
OpenAI قامت بتعيين أكثر من 50 خبيرًا من مختلف المجالات للقيام بذلك GPT-4 أكثر أمانا. لقد عمل الخبراء على إجراء اختبارات عدائية للنموذج لتحديد المخاطر ونقاط الضعف المحتملة. وهم خبراء من مجالات مختلفة: مخاطر محاذاة الذكاء الاصطناعي على المدى الطويل، والأمن السيبراني، والمخاطر البيولوجية، والأمن الدولي. وقد ساعدت النتائج التي توصلوا إليها OpenAI تقييم السلوك النموذجي في المجالات عالية المخاطر التي تتطلب خبرة متخصصة.
في حين أن أحدث نموذج لغة يشكل مخاطر مماثلة لنماذج اللغة الأصغر، إلا أن القدرات الإضافية لـ GPT-4 يؤدي إلى تهديدات جديدة. وهكذا، تم إشراك الخبراء حاسمة في ضمان سلامة التكنولوجيا.
OpenAI نفذت مجموعة إضافية من التعلم المعزز المتعلق بالسلامة من خلال مطالبات تدريب التفضيلات البشرية (RLHF) ونماذج المكافآت القائمة على القواعد (RBRMs) لتحسين سلامة GPT-4 نموذج. إن RBRMs خالية من الطلقات GPT-4 المصنفات التي تعمل كإشارة مكافأة إضافية لـ GPT-4 نموذج السياسة أثناء ضبط RLHF. والغرض منها هو تحفيز السلوك المناسب، مثل رفض إنشاء محتوى ضار أو عدم رفض الطلبات غير الضارة.
لضمان سلامة GPT-4 النماذج، OpenAI بدأت في تعيين خبراء خارجيين في أغسطس 2022 لإجراء تمارين "الفريق الأحمر"، بما في ذلك اختبار الإجهاد، واختبار الحدود، واختبار الخصومة. كان لديهم إمكانية الوصول إلى الإصدارات المبكرة من GPT-4 نموذج وتحديد المخاطر الأولية التي حفزت على إجراء المزيد من أبحاث السلامة.
أدت تعليقات الخبراء إلى إجراءات التخفيف الفنية وتدابير إنفاذ السياسات لتقليل المخاطر. ومع ذلك ، لا تزال هناك العديد من التهديدات ، وهناك حاجة إلى مزيد من التقييم.
الحديث عن الموظفين في OpenAI, ChatGPT كان في البداية المتقدمة بمساعدة الأفراد في بعض أفقر مناطق العالم من خلال OpenAIشراكة مع شركة تدعى سما، والتي توظف ملايين العمال من المناطق الفقيرة. انتقد بعض الخبراء في أخلاقيات الذكاء الاصطناعي OpenAIقرار الاستعانة بمصادر خارجية لتدريب لها ChatGPT نموذج لسما متهما الشركة باستغلال العمالة منخفضة التكلفة.
اقرأ أكثر:
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
Agne هي صحفية تغطي أحدث الاتجاهات والتطورات في metaverse و AI و Web3 صناعات ل Metaverse Post. دفعها شغفها بسرد القصص إلى إجراء العديد من المقابلات مع خبراء في هذه المجالات، وتسعى دائمًا للكشف عن قصص مثيرة وجذابة. حصلت أغني على درجة البكالوريوس في الأدب ولديها خلفية واسعة في الكتابة حول مجموعة واسعة من المواضيع بما في ذلك السفر والفن والثقافة. كما تطوعت كمحررة في منظمة حقوق الحيوان، حيث ساعدت في رفع مستوى الوعي حول قضايا رعاية الحيوان. اتصل بها على [البريد الإلكتروني محمي].
المزيد من المقالاتAgne هي صحفية تغطي أحدث الاتجاهات والتطورات في metaverse و AI و Web3 صناعات ل Metaverse Post. دفعها شغفها بسرد القصص إلى إجراء العديد من المقابلات مع خبراء في هذه المجالات، وتسعى دائمًا للكشف عن قصص مثيرة وجذابة. حصلت أغني على درجة البكالوريوس في الأدب ولديها خلفية واسعة في الكتابة حول مجموعة واسعة من المواضيع بما في ذلك السفر والفن والثقافة. كما تطوعت كمحررة في منظمة حقوق الحيوان، حيث ساعدت في رفع مستوى الوعي حول قضايا رعاية الحيوان. اتصل بها على [البريد الإلكتروني محمي].