GPT-4 Виконує кращий результат, ніж середня людина, у тесті на логічне мислення, дослідження тверджень
Коротко
Російський дослідник ШІ Ілля Пестов створив тест на логічне мислення, який пройшли 12 тисяч людей.
Нещодавно він отримав доступ до розумнішого GPT-4і провів експеримент, щоб перевірити, чи правильний запит може дати певні результати.
Результати показали, що GPT-4 перевершив середньостатистичної людини в логічних міркуваннях.
Ілля Пестов, відомий російський дослідник штучного інтелекту, опублікував повідомлення на своєму Telegram-канал про те, наскільки добре нейронна мережа справляється з логічними тестами. Ілля свого часу створив @psylogicbot тест на логічне мислення, який пройшли приблизно 12 тисяч осіб. Ви можете перевірити статистику після проходження тесту.
Детальніше: 20+ найкращих чат-ботів Telegram AI 2023 року |
Він написав це ChatGPT теж пройшла тестування, але результати залишали бажати кращого. Нещодавно він отримав доступ до розумнішої та оновленої версії GPT модель—GPT-4— і вирішив перевірити, чи дадуть подібні результати.
Експеримент проводився наступним чином: дослідник створив текст, який описував завдання, яке повинна була виконати нейронна мережа. Дослідник усе виклав у коментарях: Підказка була: «Я дам вам логічну головоломку та чотири варіанти відповіді; вибрати з них одну правильну відповідь». Потім для кожного тестового питання Ілля створював новий діалог і надсилав GPT-4 опис разом із текстом питання. Бот отримав відповідь без будь-яких виправлень і підказок.
Всього 25 запитань, за кожну правильну відповідь нараховується один бал. За статистикою, користувачі набирають в середньому 13.6 балів, медіана не перевищує 14. Скільки GPT-4 отримати? Вдалось набрати 16 балів!
І знову нейронна мережа перевершує середньостатистичної людини в логічних міркуваннях. Тобто він перевершує більшість протестованих людей. І це з урахуванням:
- Тест проводився російською мовою, а модель налаштована на англійську;
- GPT-4, який використовується в чаті, менш інтелектуальний, ніж його попередник (побічний ефект етичних обмежень).
Окремо ми опублікуємо чудову відповідь на запитання 22, у якому нейрон використовував логіку першого порядку, щоб математично отримати результат. Хоча це розглядалося в прикладній математиці, це не університетський курс, який проходять усі.
Все ще вірю в це нейронні мережі це примха? По-перше, спробуйте перевершити GPT-4 (та поділіться своїми результатами в коментарях).
Докладніше про ШІ:
відмова
Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.
про автора
Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.
інші статтіДамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.