تقرير الأخبار تكنولوجيا
29 آذار، 2023

GPT-4 أداء أفضل من الشخص العادي في اختبار التفكير المنطقي، ادعاءات الدراسة

في سطور

ابتكر إيليا بيستوف ، الباحث الروسي في مجال الذكاء الاصطناعي ، اختبار التفكير المنطقي الذي اجتازه 12 ألف شخص.

حصل مؤخرا على الوصول إلى أكثر ذكاء GPT-4، وأجرت تجربة لمعرفة ما إذا كان الاستعلام الصحيح يمكن أن يؤدي إلى بعض النتائج.

وأظهرت النتائج أن ملف GPT-4 تفوق على الشخص العادي في التفكير المنطقي.

نشر إيليا بيستوف ، الباحث الروسي المعروف في مجال الذكاء الاصطناعي ، رسالة على موقعه قناة برقية حول مدى كفاءة الشبكة العصبية في معالجة الاختبارات المنطقية. قام إيليا بإنشاء ملف تضمين التغريدة اختبار التفكير المنطقي الذي أجراه ما يقرب من 12 ألف شخص. يمكنك التحقق من الإحصائيات بعد إجراء الاختبار.

@Midjourney / عبد الله (hamoXX) # 7378
اقرأ أكثر: 20+ أفضل روبوتات دردشة على Telegram AI لعام 2023

كتب ذلك ChatGPT تم اختباره أيضًا، لكن النتائج تركت الكثير مما هو مرغوب فيه. لقد تمكن مؤخرًا من الوصول إلى الإصدار الأكثر ذكاءً والأكثر تحديثًا من GPT نموذج-GPT-4- وقررت التحقق مما إذا كانت ستحصل على نتائج مماثلة.

تم إجراء التجربة على النحو التالي: قام الباحث بإنشاء نص يصف المهمة التي كان على الشبكة العصبية أن تكملها. نشرت الباحثة كل شيء في التعليقات: كان الموجه: "سأعطيك لغزًا منطقيًا وأربع إجابات محتملة ؛ اختر الإجابة الصحيحة منهم ". بعد ذلك ، بالنسبة لكل سؤال اختبار ، أنشأ إيليا مربع حوار جديدًا وأرسل ملف GPT-4 وصف مع نص السؤال. تلقى الروبوت الرد دون أي تصحيحات أو تلميحات.

هناك 25 سؤالًا في المجمل، مع منح نقطة واحدة لكل إجابة صحيحة. وفقا للإحصاءات، يسجل المستخدمون 13.6 نقطة في المتوسط، بمتوسط ​​لا يزيد عن 14. كم حصلوا؟ GPT-4 يحصل؟ تمكن من الحصول على 16 نقطة!

مرة أخرى ، تتفوق الشبكة العصبية على الشخص العادي في التفكير المنطقي. أي أنه يتفوق على غالبية الأشخاص الذين تم اختبارهم. وذلك بعد مراعاة:

  • تم إجراء الاختبار باللغة الروسية ، بينما تم تعديل النموذج للغة الإنجليزية ؛
  • GPT-4، والذي يستخدم في الدردشة، أقل ذكاءً من سابقه (أحد الآثار الجانبية للقيود الأخلاقية).

بشكل منفصل ، سنقوم بنشر إجابة ممتازة للسؤال 22 ، حيث استخدمت الخلية العصبية منطقًا من الدرجة الأولى لاشتقاق النتيجة رياضيًا. على الرغم من أن هذا تم تناوله في الرياضيات التطبيقية ، إلا أنه ليس مقررًا جامعيًا يأخذه الجميع.

بشكل منفصل ، سنقوم بنشر إجابة ممتازة للسؤال 22 حيث استخدمت الخلية العصبية منطقًا من الدرجة الأولى لاشتقاق النتيجة رياضيًا. عرفنا جميعًا كيفية القيام بذلك في الرياضيات التطبيقية أيضًا ، لكنها كانت دورة إضافية في الجامعة.

ما زلت أعتقد ذلك الشبكات العصبية هي بدعة؟ أولاً، حاول التفوق GPT-4 (وشارك نتائجك في التعليقات).

اقرأ المزيد عن الذكاء الاصطناعي:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

جنون DOGE: تحليل الارتفاع الأخير في قيمة Dogecoin (DOGE).

تتوسع صناعة العملات المشفرة بسرعة، وتستعد العملات الميمية لارتفاع كبير. دوجكوين (DOGE)، ...

أعرف المزيد

تطور المحتوى الناتج عن الذكاء الاصطناعي في Metaverse

يعد ظهور محتوى الذكاء الاصطناعي التوليدي أحد أكثر التطورات الرائعة داخل البيئة الافتراضية ...

أعرف المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
أفضل الصفقات لهذا الأسبوع، والاستثمارات الكبرى في الذكاء الاصطناعي، وتكنولوجيا المعلومات، Web3و التشفير (22-26.04)
استوعب باقة الأعمال الأسواق تكنولوجيا
أفضل الصفقات لهذا الأسبوع، والاستثمارات الكبرى في الذكاء الاصطناعي، وتكنولوجيا المعلومات، Web3و التشفير (22-26.04)
26 نيسان
يعلق فيتاليك بوتيرين على مركزية إثبات العمل، ويشير إلى أنها كانت مرحلة مؤقتة حتى إثبات الحصة
تقرير الأخبار تكنولوجيا
يعلق فيتاليك بوتيرين على مركزية إثبات العمل، ويشير إلى أنها كانت مرحلة مؤقتة حتى إثبات الحصة
26 نيسان
مختبرات Offchain تكشف عن اكتشاف اثنتين من نقاط الضعف الحرجة في أدلة الاحتيال الخاصة بـ OP Stack الخاصة بـ Optimism
تقرير الأخبار تطبيقات الكمبيوتر تكنولوجيا
مختبرات Offchain تكشف عن اكتشاف اثنتين من نقاط الضعف الحرجة في أدلة الاحتيال الخاصة بـ OP Stack الخاصة بـ Optimism
26 نيسان
إطلاق سوق Dymension المفتوح لسد السيولة من RollApps eIBC على الشبكة الرئيسية
تقرير الأخبار تكنولوجيا
إطلاق سوق Dymension المفتوح لسد السيولة من RollApps eIBC على الشبكة الرئيسية 
26 نيسان
CRYPTOMERIA LABS PTE. المحدودة.