گزارش خبری پیشرفته
مارس 29، 2023

GPT-4 عملکرد بهتر از افراد متوسط ​​در آزمون استدلال منطقی، ادعاهای مطالعه

به طور خلاصه

ایلیا پستوف، محقق روسی هوش مصنوعی، آزمون تفکر منطقی را ایجاد کرد که 12 هزار نفر از آن عبور کردند.

او اخیراً به هوشمندتر دسترسی پیدا کرده است GPT-4، و آزمایشی را انجام داد تا ببیند آیا پرس و جوی مناسب می تواند نتایجی را به همراه داشته باشد.

نتایج نشان داد که GPT-4 در استدلال منطقی از افراد معمولی بهتر عمل کرد.

ایلیا پستوف، محقق مشهور هوش مصنوعی روسی، پیامی را در سایت خود منتشر کرد کانال تلگرام در مورد اینکه چگونه شبکه عصبی تست های منطقی را انجام می دهد. ایلیا زمانی ایجاد کرد @psylogicbot آزمون تفکر منطقی که تقریباً 12 هزار نفر در آن شرکت کردند. پس از انجام آزمون می توانید آمار را بررسی کنید.

@Midjourney / عبدالله(hamoXX)#7378
ادامه مطلب: 20+ بهترین چت ربات هوش مصنوعی تلگرام در سال 2023

او آن را نوشت ChatGPT همچنین مورد آزمایش قرار گرفت، اما نتایج بسیار مورد نظر باقی ماند. او اخیراً به نسخه هوشمندتر و به روزتر آن دسترسی پیدا کرده است GPT مدل-GPT-4- و تصمیم گرفت بررسی کند که آیا نتایج مشابهی خواهد داشت یا خیر.

این آزمایش به شرح زیر انجام شد: محقق متنی را ایجاد کرد که وظیفه ای را که شبکه عصبی باید انجام می داد شرح می داد. محقق همه چیز را در کامنت‌ها ارسال کرد: پیام این بود: «من یک معمای منطقی و چهار پاسخ احتمالی به شما می‌دهم. یک پاسخ صحیح را از بین آنها انتخاب کنید." سپس برای هر سوال تستی، ایلیا یک دیالوگ جدید ایجاد کرد و آن را ارسال کرد GPT-4 توضیحات به همراه متن سوال ربات پاسخ را بدون هیچ گونه اصلاح یا اشاره ای دریافت کرد.

در مجموع 25 سوال وجود دارد که به هر پاسخ صحیح یک امتیاز تعلق می گیرد. طبق آمار، کاربران به طور متوسط ​​13.6 امتیاز کسب می کنند که میانگین آن بیش از 14 نیست. GPT-4 گرفتن؟ توانست 16 امتیاز بگیرد!

بار دیگر، شبکه عصبی در استدلال منطقی از افراد معمولی بهتر عمل می کند. یعنی از اکثریت افراد آزمایش شده بهتر عمل می کند. و این پس از در نظر گرفتن:

  • این آزمایش به زبان روسی انجام شد، در حالی که این مدل برای انگلیسی به خوبی تنظیم شده است.
  • GPT-4، که در چت استفاده می شود، نسبت به نسخه قبلی خود از هوش کمتری برخوردار است (عوارض جانبی محدودیت های اخلاقی).

به طور جداگانه، ما یک پاسخ عالی برای سوال 22 ارسال خواهیم کرد که در آن نورون از منطق مرتبه اول برای استخراج نتیجه به صورت ریاضی استفاده می کند. در حالی که این در ریاضیات کاربردی پوشش داده شده بود، این یک دوره دانشگاهی نیست که همه می گذرانند.

به طور جداگانه، ما یک پاسخ عالی برای سوال 22 ارسال خواهیم کرد که در آن نورون از منطق مرتبه اول برای استخراج نتیجه به صورت ریاضی استفاده می کند. همه ما می دانستیم که چگونه آن را در ریاضیات کاربردی نیز انجام دهیم، اما این یک دوره اضافی در دانشگاه بود.

هنوز هم این را باور کنید شبکه های عصبی یک مد هستند؟ ابتدا سعی کنید عملکرد بهتری داشته باشید GPT-4 (و نتایج خود را در نظرات به اشتراک بگذارید).

درباره هوش مصنوعی بیشتر بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
تغییر دونالد ترامپ به رمزارز: از مخالف به طرفدار و معنای آن برای بازار ارزهای دیجیتال ایالات متحده
کسب و کار بازارها داستان ها و نقدها پیشرفته
تغییر دونالد ترامپ به رمزارز: از مخالف به طرفدار و معنای آن برای بازار ارزهای دیجیتال ایالات متحده
ممکن است 10، 2024
Layer3 Token L3 را تابستان امسال راه اندازی می کند و 51٪ از کل عرضه را به انجمن اختصاص می دهد
بازارها گزارش خبری پیشرفته
Layer3 Token L3 را تابستان امسال راه اندازی می کند و 51٪ از کل عرضه را به انجمن اختصاص می دهد
ممکن است 10، 2024
آخرین هشدار ادوارد اسنودن به توسعه دهندگان بیت کوین: «حریم خصوصی را در اولویت پروتکل قرار دهید یا خطر از دست دادن آن را داشته باشید.
بازارها دوربین های مداربسته Wiki نرم افزار داستان ها و نقدها پیشرفته
آخرین هشدار ادوارد اسنودن به توسعه دهندگان بیت کوین: «حریم خصوصی را در اولویت پروتکل قرار دهید یا خطر از دست دادن آن را داشته باشید.
ممکن است 10، 2024
شبکه اتریوم لایه 2 مبتنی بر خوش بینی، شبکه اصلی خود را در 15 می راه اندازی می کند.
گزارش خبری پیشرفته
شبکه اتریوم لایه 2 مبتنی بر خوش بینی، شبکه اصلی خود را در 15 می راه اندازی می کند.
ممکن است 10، 2024
CRYPTOMERIA LABS PTE. محدود