GPT-4 Mantiqiy fikrlash, o'rganish da'volari testida o'rtacha odamdan yaxshiroq ishlaydi
Qisqacha
Rossiyalik AI tadqiqotchisi Ilya Pestov mantiqiy fikrlash testini yaratdi, uni 12 ming kishi topshirdi.
U yaqinda aqlli qurilmaga kirish huquqiga ega bo'ldi GPT-4, va to'g'ri so'rov ba'zi natijalar berishi mumkinligini tekshirish uchun tajriba o'tkazdi.
Natijalar shuni ko'rsatdiki GPT-4 mantiqiy fikrlashda o'rtacha odamdan ustun keldi.
Taniqli rossiyalik AI tadqiqotchisi Ilya Pestov o'z sahifasida xabar joylashtirdi Telegram kanali neyron tarmoq mantiqiy testlarni qanchalik yaxshi bajarishi haqida. Ilya bir marta yaratgan @psylogicbot mantiqiy fikrlash testi, uni taxminan 12 ming kishi topshirgan. Sinovdan o'tganingizdan so'ng statistikani tekshirishingiz mumkin.
Ko'proq o'qing: 20+ 2023-yilning eng yaxshi Telegram AI Chatbotlari |
U buni yozgan ChatGPT ham sinovdan o'tkazildi, ammo natijalar juda ko'p narsani orzu qildi. Yaqinda u aqlliroq va yangilangan versiyasiga kirish huquqiga ega bo'ldi GPT model -GPT-4- va shunga o'xshash natijalarga erishadimi yoki yo'qligini tekshirishga qaror qildi.
Tajriba quyidagicha o'tkazildi: tadqiqotchi neyron tarmoq bajarishi kerak bo'lgan vazifani tavsiflovchi matn yaratdi. Tadqiqotchi sharhlarda hamma narsani joylashtirdi: “Men sizga mantiqiy boshqotirma va to‘rtta mumkin bo‘lgan javobni beraman; ulardan bitta to‘g‘ri javobni tanlang”. Keyin, har bir test savoli uchun Ilya yangi dialog yaratdi va yubordi GPT-4 savol matni bilan birga tavsif. Bot hech qanday tuzatishlar va maslahatlarsiz javob oldi.
Hammasi bo'lib 25 ta savol, har bir to'g'ri javob uchun bir ball beriladi. Statistik ma'lumotlarga ko'ra, foydalanuvchilar o'rtacha 13.6 ball to'playdi, medianasi 14 dan oshmaydi. GPT-4 olish? U 16 ochko olishga muvaffaq bo'ldi!
Yana bir bor, neyron tarmoq mantiqiy fikrlash bo'yicha o'rtacha odamdan ustundir. Ya'ni, u sinovdan o'tgan odamlarning ko'pchiligidan ustundir. Va bu hisobga olingandan keyin:
- Sinov rus tilida o'tkazildi, model ingliz tili uchun yaxshi sozlangan;
- GPT-4, chatda qo'llaniladigan, oldingisiga qaraganda kamroq aqlli (axloqiy cheklovlarning yon ta'siri).
Alohida, biz 22-savolga ajoyib javobni joylashtiramiz, unda neyron birinchi tartibli mantiqdan foydalanib, natijani matematik tarzda chiqargan. Garchi bu amaliy matematikada yoritilgan bo'lsa-da, bu hamma universitet kursi emas.
Hali ham ishoning neyron tarmoqlari modami? Birinchidan, ustunlik qilishga harakat qiling GPT-4 (va natijalaringizni sharhlarda baham ko'ring).
AI haqida ko'proq o'qing:
Masʼuliyatdan voz kechish
Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.
Muallif haqida
Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.
Boshqa maqolalarDamir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.