تقرير الأخبار تكنولوجيا
29 آذار، 2023

GPT-4 أداء أفضل من الشخص العادي في اختبار التفكير المنطقي، ادعاءات الدراسة

في سطور

ابتكر إيليا بيستوف ، الباحث الروسي في مجال الذكاء الاصطناعي ، اختبار التفكير المنطقي الذي اجتازه 12 ألف شخص.

حصل مؤخرا على الوصول إلى أكثر ذكاء GPT-4، وأجرت تجربة لمعرفة ما إذا كان الاستعلام الصحيح يمكن أن يؤدي إلى بعض النتائج.

وأظهرت النتائج أن ملف GPT-4 تفوق على الشخص العادي في التفكير المنطقي.

نشر إيليا بيستوف ، الباحث الروسي المعروف في مجال الذكاء الاصطناعي ، رسالة على موقعه قناة برقية حول مدى كفاءة الشبكة العصبية في معالجة الاختبارات المنطقية. قام إيليا بإنشاء ملف تضمين التغريدة اختبار التفكير المنطقي الذي أجراه ما يقرب من 12 ألف شخص. يمكنك التحقق من الإحصائيات بعد إجراء الاختبار.

@Midjourney / عبد الله (hamoXX) # 7378
اقرأ أكثر: 20+ أفضل روبوتات دردشة على Telegram AI لعام 2023

كتب ذلك ChatGPT تم اختباره أيضًا، لكن النتائج تركت الكثير مما هو مرغوب فيه. لقد تمكن مؤخرًا من الوصول إلى الإصدار الأكثر ذكاءً والأكثر تحديثًا من GPT نموذج-GPT-4- وقررت التحقق مما إذا كانت ستحصل على نتائج مماثلة.

تم إجراء التجربة على النحو التالي: قام الباحث بإنشاء نص يصف المهمة التي كان على الشبكة العصبية أن تكملها. نشرت الباحثة كل شيء في التعليقات: كان الموجه: "سأعطيك لغزًا منطقيًا وأربع إجابات محتملة ؛ اختر الإجابة الصحيحة منهم ". بعد ذلك ، بالنسبة لكل سؤال اختبار ، أنشأ إيليا مربع حوار جديدًا وأرسل ملف GPT-4 وصف مع نص السؤال. تلقى الروبوت الرد دون أي تصحيحات أو تلميحات.

هناك 25 سؤالًا في المجمل، مع منح نقطة واحدة لكل إجابة صحيحة. وفقا للإحصاءات، يسجل المستخدمون 13.6 نقطة في المتوسط، بمتوسط ​​لا يزيد عن 14. كم حصلوا؟ GPT-4 يحصل؟ تمكن من الحصول على 16 نقطة!

مرة أخرى ، تتفوق الشبكة العصبية على الشخص العادي في التفكير المنطقي. أي أنه يتفوق على غالبية الأشخاص الذين تم اختبارهم. وذلك بعد مراعاة:

  • تم إجراء الاختبار باللغة الروسية ، بينما تم تعديل النموذج للغة الإنجليزية ؛
  • GPT-4، والذي يستخدم في الدردشة، أقل ذكاءً من سابقه (أحد الآثار الجانبية للقيود الأخلاقية).

بشكل منفصل ، سنقوم بنشر إجابة ممتازة للسؤال 22 ، حيث استخدمت الخلية العصبية منطقًا من الدرجة الأولى لاشتقاق النتيجة رياضيًا. على الرغم من أن هذا تم تناوله في الرياضيات التطبيقية ، إلا أنه ليس مقررًا جامعيًا يأخذه الجميع.

بشكل منفصل ، سنقوم بنشر إجابة ممتازة للسؤال 22 حيث استخدمت الخلية العصبية منطقًا من الدرجة الأولى لاشتقاق النتيجة رياضيًا. عرفنا جميعًا كيفية القيام بذلك في الرياضيات التطبيقية أيضًا ، لكنها كانت دورة إضافية في الجامعة.

ما زلت أعتقد ذلك الشبكات العصبية هي بدعة؟ أولاً، حاول التفوق GPT-4 (وشارك نتائجك في التعليقات).

اقرأ المزيد عن الذكاء الاصطناعي:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

تنمو الشهية المؤسسية تجاه صناديق الاستثمار المتداولة في البيتكوين وسط التقلبات

تكشف الإفصاحات من خلال ملفات 13F عن مستثمرين مؤسسيين بارزين يشتغلون بصناديق الاستثمار المتداولة في البيتكوين، مما يؤكد القبول المتزايد لـ ...

لمعرفة المزيد

وصول يوم النطق بالحكم: مصير تشيكوسلوفاكيا معلق في الميزان بينما تنظر المحكمة الأمريكية في التماس وزارة العدل

ومن المقرر أن يواجه Changpeng Zhao الحكم في محكمة أمريكية في سياتل اليوم.

لمعرفة المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
تحول دونالد ترامب إلى العملات المشفرة: من الخصم إلى المدافع، وماذا يعني ذلك بالنسبة لسوق العملات المشفرة في الولايات المتحدة
باقة الأعمال الأسواق قصص ومراجعات تكنولوجيا
تحول دونالد ترامب إلى العملات المشفرة: من الخصم إلى المدافع، وماذا يعني ذلك بالنسبة لسوق العملات المشفرة في الولايات المتحدة
10 مايو 2024
ستطلق Layer3 رمز L3 هذا الصيف، وتخصص 51% من إجمالي العرض للمجتمع
الأسواق تقرير الأخبار تكنولوجيا
ستطلق Layer3 رمز L3 هذا الصيف، وتخصص 51% من إجمالي العرض للمجتمع
10 مايو 2024
التحذير الأخير من إدوارد سنودن لمطوري البيتكوين: "اجعلوا الخصوصية أولوية على مستوى البروتوكول وإلا خاطروا بفقدانها"
الأسواق حماية Wiki تطبيقات الكمبيوتر قصص ومراجعات تكنولوجيا
التحذير الأخير من إدوارد سنودن لمطوري البيتكوين: "اجعلوا الخصوصية أولوية على مستوى البروتوكول وإلا خاطروا بفقدانها"
10 مايو 2024
شبكة إيثريوم من الطبقة الثانية المدعومة بالتفاؤل ستطلق شبكتها الرئيسية في 2 مايو
تقرير الأخبار تكنولوجيا
شبكة إيثريوم من الطبقة الثانية المدعومة بالتفاؤل ستطلق شبكتها الرئيسية في 2 مايو
10 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.