GPT-4 أداء أفضل من الشخص العادي في اختبار التفكير المنطقي، ادعاءات الدراسة
في سطور
ابتكر إيليا بيستوف ، الباحث الروسي في مجال الذكاء الاصطناعي ، اختبار التفكير المنطقي الذي اجتازه 12 ألف شخص.
حصل مؤخرا على الوصول إلى أكثر ذكاء GPT-4، وأجرت تجربة لمعرفة ما إذا كان الاستعلام الصحيح يمكن أن يؤدي إلى بعض النتائج.
وأظهرت النتائج أن ملف GPT-4 تفوق على الشخص العادي في التفكير المنطقي.
نشر إيليا بيستوف ، الباحث الروسي المعروف في مجال الذكاء الاصطناعي ، رسالة على موقعه قناة برقية حول مدى كفاءة الشبكة العصبية في معالجة الاختبارات المنطقية. قام إيليا بإنشاء ملف تضمين التغريدة اختبار التفكير المنطقي الذي أجراه ما يقرب من 12 ألف شخص. يمكنك التحقق من الإحصائيات بعد إجراء الاختبار.
كتب ذلك ChatGPT تم اختباره أيضًا، لكن النتائج تركت الكثير مما هو مرغوب فيه. لقد تمكن مؤخرًا من الوصول إلى الإصدار الأكثر ذكاءً والأكثر تحديثًا من GPT نموذج-GPT-4- وقررت التحقق مما إذا كانت ستحصل على نتائج مماثلة.
تم إجراء التجربة على النحو التالي: قام الباحث بإنشاء نص يصف المهمة التي كان على الشبكة العصبية أن تكملها. نشرت الباحثة كل شيء في التعليقات: كان الموجه: "سأعطيك لغزًا منطقيًا وأربع إجابات محتملة ؛ اختر الإجابة الصحيحة منهم ". بعد ذلك ، بالنسبة لكل سؤال اختبار ، أنشأ إيليا مربع حوار جديدًا وأرسل ملف GPT-4 وصف مع نص السؤال. تلقى الروبوت الرد دون أي تصحيحات أو تلميحات.
هناك 25 سؤالًا في المجمل، مع منح نقطة واحدة لكل إجابة صحيحة. وفقا للإحصاءات، يسجل المستخدمون 13.6 نقطة في المتوسط، بمتوسط لا يزيد عن 14. كم حصلوا؟ GPT-4 يحصل؟ تمكن من الحصول على 16 نقطة!
مرة أخرى ، تتفوق الشبكة العصبية على الشخص العادي في التفكير المنطقي. أي أنه يتفوق على غالبية الأشخاص الذين تم اختبارهم. وذلك بعد مراعاة:
- تم إجراء الاختبار باللغة الروسية ، بينما تم تعديل النموذج للغة الإنجليزية ؛
- GPT-4، والذي يستخدم في الدردشة، أقل ذكاءً من سابقه (أحد الآثار الجانبية للقيود الأخلاقية).
بشكل منفصل ، سنقوم بنشر إجابة ممتازة للسؤال 22 ، حيث استخدمت الخلية العصبية منطقًا من الدرجة الأولى لاشتقاق النتيجة رياضيًا. على الرغم من أن هذا تم تناوله في الرياضيات التطبيقية ، إلا أنه ليس مقررًا جامعيًا يأخذه الجميع.
ما زلت أعتقد ذلك الشبكات العصبية هي بدعة؟ أولاً، حاول التفوق GPT-4 (وشارك نتائجك في التعليقات).
اقرأ المزيد عن الذكاء الاصطناعي:
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.
المزيد من المقالاتدامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.