تقرير الأخبار تكنولوجيا
16 آذار، 2023

GPT-4 يرث حقائق "مهلوسة" وأخطاء في التفكير من وقت سابق GPT الموديلات

في سطور

OpenAI يقول GPT-4 لديه قيود مماثلة كما في وقت سابق GPT عارضات ازياء.

GPT-4 لا يزال يهلوس الحقائق ويرتكب أخطاء في الاستدلال.

ومع ذلك، GPT-4 درجات أعلى بنسبة 40٪ من OpenAIأحدث GPT-3.5 بشأن تقييمات واقع الخصومة الداخلية للشركة.

GPT-4 يرث حقائق "مهلوسة" وأخطاء في التفكير من وقت سابق GPT الموديلات

OpenAI حذرت المستخدمين من أن أحدث نموذج لغوي لها، GPT-4، لا يزال غير موثوق به بشكل كامل ويمكن أن "يهلوس" الحقائق ويرتكب أخطاء في الاستدلال. وتحث الشركة المستخدمين على توخي الحذر عند استخدام مخرجات نماذج اللغة، خاصة في "السياقات عالية المخاطر".

ومع ذلك ، فإن الخبر السار هو أن GPT-4 يقلل بشكل كبير من الهلوسة مقارنة بالنماذج السابقة. OpenAI يدعي ذلك GPT-4 درجات أعلى بنسبة 40٪ من الأحدث GPT-3.5 بشأن تقييمات واقع الخصومة الداخلية. 

بواسطة OpenAI

"لقد أحرزنا تقدمًا في المعايير الخارجية مثل TruthfulQA، الذي يختبر قدرة النموذج على فصل الحقيقة عن مجموعة مختارة بشكل عدائي من البيانات غير الصحيحة. يتم ربط هذه الأسئلة بإجابات غير صحيحة في الواقع وتكون جذابة إحصائيًا. OpenAI كتب في بلوق وظيفة.

على الرغم من هذا التحسن ، لا يزال النموذج يفتقر إلى المعرفة بالأحداث التي حدثت بعد سبتمبر 2021 وأحيانًا يرتكب أخطاء منطقية بسيطة ، تمامًا مثل النماذج السابقة. بالإضافة إلى ذلك ، يمكن أن يكون ساذجًا بشكل مفرط في قبول بيانات خاطئة واضحة من المستخدمين ويفشل في المشكلات الصعبة ، مثل إدخال ثغرات أمنية في التعليمات البرمجية الخاصة به. كما أنها لا تتحقق من صحة المعلومات التي تقدمها.

مثل سابقاتها ، GPT-4 يمكن أن تولد نصائح ضارة أو تعليمات برمجية بها أخطاء أو معلومات غير دقيقة. ومع ذلك، فإن القدرات الإضافية للنموذج تؤدي إلى ظهور أسطح مخاطر جديدة يجب فهمها. ولتقييم مدى هذه المخاطر، أكثر من 50 خبير من مختلف المجالات، بما في ذلك مخاطر محاذاة الذكاء الاصطناعي، والأمن السيبراني، والمخاطر البيولوجية، والثقة والسلامة، والأمن الدولي، تم إشراكهم لاختبار النموذج بشكل عدائي. ثم تم استخدام ملاحظاتهم وبياناتهم لتحسين النموذج، مثل جمع بيانات إضافية لتحسينه GPT-4القدرة على رفض الطلبات المتعلقة بكيفية تصنيع المواد الكيميائية الخطرة.

إحدى الطرق الرئيسية OpenAI يتم تقليل المخرجات الضارة من خلال دمج إشارة مكافأة أمان إضافية أثناء تدريب RLHF (التعلم المعزز من ردود الفعل البشرية). تقوم الإشارة بتدريب النموذج على رفض طلبات المحتوى الضار، مثل defiوفقًا لإرشادات استخدام النموذج. المكافأة مقدمة من أ GPT-4 مصنف صفر شوت، الذي يحكم على حدود السلامة وأسلوب الإنجاز بناءً على المطالبات المتعلقة بالسلامة.

OpenAI قال أيضًا إنه قلل من ميل النموذج للاستجابة لطلبات المحتوى غير المسموح به بنسبة 82٪ مقارنة بـ GPT-3.5 و GPT-4 يستجيب للطلبات الحساسة مثل الاستشارة الطبية وإيذاء النفس وفقًا لسياسات الشركة بنسبة 29% في كثير من الأحيان.

بواسطة OpenAI

بينما OpenAIلقد أدت تدخلات "الأطفال" إلى زيادة صعوبة استنباط السلوك السيئ منهم GPT-4، فلا يزال ذلك ممكنًا، ولا تزال هناك عمليات كسر حماية يمكنها إنشاء محتوى ينتهك إرشادات الاستخدام. 

"نظرًا لأن أنظمة الذكاء الاصطناعي أصبحت أكثر انتشارًا ، فإن تحقيق درجات عالية من الموثوقية في هذه التدخلات سيصبح أمرًا بالغ الأهمية بشكل متزايد. في الوقت الحالي ، من الضروري استكمال هذه القيود بتقنيات الأمان في وقت النشر مثل مراقبة إساءة الاستخدام "، أضافت الشركة.

OpenAI تتعاون مع باحثين خارجيين لفهم وتقييم التأثيرات المحتملة بشكل أفضل GPT-4 والنماذج اللاحقة لها. ويعمل الفريق أيضًا على تطوير تقييمات للقدرات الخطيرة التي قد تظهر في أنظمة الذكاء الاصطناعي المستقبلية. بينما يواصلون دراسة الإمكانات الاجتماعية و الآثار الاقتصادية of GPT-4 وأنظمة الذكاء الاصطناعي الأخرى، OpenAI وسوف يشاركون نتائجهم وأفكارهم مع الجمهور في الوقت المناسب.

اقرأ أكثر:

الوسوم (تاج):

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

سيندي صحفية في Metaverse Post، تغطي الموضوعات المتعلقة بـ web3, NFT، metaverse و AI ، مع التركيز على المقابلات مع Web3 لاعبين الصناعة. لقد تحدثت إلى أكثر من 30 مديرًا تنفيذيًا على مستوى C وما زال العدد في ازدياد، حيث قدمت أفكارهم القيمة للقراء. أصلها من سنغافورة، وتقيم سيندي الآن في تبليسي، جورجيا. حصلت على درجة البكالوريوس في الاتصالات والدراسات الإعلامية من جامعة جنوب أستراليا ولديها عشر سنوات من الخبرة في الصحافة والكتابة. تواصل معها عبر [البريد الإلكتروني محمي] مع المداخلات الصحفية والإعلانات وفرص المقابلات.

المزيد من المقالات
سيندي تان
سيندي تان

سيندي صحفية في Metaverse Post، تغطي الموضوعات المتعلقة بـ web3, NFT، metaverse و AI ، مع التركيز على المقابلات مع Web3 لاعبين الصناعة. لقد تحدثت إلى أكثر من 30 مديرًا تنفيذيًا على مستوى C وما زال العدد في ازدياد، حيث قدمت أفكارهم القيمة للقراء. أصلها من سنغافورة، وتقيم سيندي الآن في تبليسي، جورجيا. حصلت على درجة البكالوريوس في الاتصالات والدراسات الإعلامية من جامعة جنوب أستراليا ولديها عشر سنوات من الخبرة في الصحافة والكتابة. تواصل معها عبر [البريد الإلكتروني محمي] مع المداخلات الصحفية والإعلانات وفرص المقابلات.

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

جنون DOGE: تحليل الارتفاع الأخير في قيمة Dogecoin (DOGE).

تتوسع صناعة العملات المشفرة بسرعة، وتستعد العملات الميمية لارتفاع كبير. دوجكوين (DOGE)، ...

أعرف المزيد

تطور المحتوى الناتج عن الذكاء الاصطناعي في Metaverse

يعد ظهور محتوى الذكاء الاصطناعي التوليدي أحد أكثر التطورات الرائعة داخل البيئة الافتراضية ...

أعرف المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
Scroll تكمل ترقية Bernoulli Mainnet، وتتوقع انخفاضًا بمقدار 10 أضعاف في تكاليف المعاملات
تقرير الأخبار تكنولوجيا
Scroll تكمل ترقية Bernoulli Mainnet، وتتوقع انخفاضًا بمقدار 10 أضعاف في تكاليف المعاملات
29 نيسان
يسرد OKX Jumpstart عملة Runecoin، ويتيح إمكانية تخزين BTC لكسب رموز RUNE
الأسواق تقرير الأخبار تكنولوجيا
يسرد OKX Jumpstart عملة Runecoin، ويتيح إمكانية تخزين BTC لكسب رموز RUNE
29 نيسان
أفضل الصفقات لهذا الأسبوع، والاستثمارات الكبرى في الذكاء الاصطناعي، وتكنولوجيا المعلومات، Web3و التشفير (22-26.04)
استوعب باقة الأعمال الأسواق تكنولوجيا
أفضل الصفقات لهذا الأسبوع، والاستثمارات الكبرى في الذكاء الاصطناعي، وتكنولوجيا المعلومات، Web3و التشفير (22-26.04)
26 نيسان
يعلق فيتاليك بوتيرين على مركزية إثبات العمل، ويشير إلى أنها كانت مرحلة مؤقتة حتى إثبات الحصة
تقرير الأخبار تكنولوجيا
يعلق فيتاليك بوتيرين على مركزية إثبات العمل، ويشير إلى أنها كانت مرحلة مؤقتة حتى إثبات الحصة
26 نيسان
CRYPTOMERIA LABS PTE. المحدودة.