Новостной репортаж Технологии
29 марта 2023

GPT-4 Результаты теста на логическое мышление лучше, чем у среднестатистического человека, утверждает исследование

Коротко

Илья Пестов, российский исследователь искусственного интеллекта, создал тест на логическое мышление, который прошли 12 тысяч человек.

Недавно он получил доступ к более умному GPT-4и провел эксперимент, чтобы увидеть, может ли правильный запрос дать какие-либо результаты.

Результаты показали, что GPT-4 превосходил среднего человека в логическом рассуждении.

Илья Пестов, известный российский исследователь ИИ, разместил сообщение на своей Канал Telegram о том, насколько хорошо нейронная сеть справляется с логическими тестами. Илья когда-то создал @psylogicbot тест на логическое мышление, который прошли около 12 тысяч человек. Вы можете проверить статистику после прохождения теста.

@Midjourney / Абдалла(hamoXX)#7378
Прочитайте больше: 20+ лучших чат-ботов Telegram AI 2023 года

Он написал это ChatGPT тоже сдавала анализы, но результаты оставляли желать лучшего. Недавно он получил доступ к более умной и обновленной версии GPT модель-GPT-4— и решил проверить, получатся ли аналогичные результаты.

Эксперимент проводился следующим образом: исследователь создавал текст, описывающий задачу, которую должна была выполнить нейросеть. Исследователь разместил все в комментариях: Подсказка была: «Я дам вам логическую задачу и четыре варианта ответа; выберите из них один правильный ответ». Затем для каждого тестового вопроса Илья создавал новый диалог и отправлял GPT-4 описание вместе с текстом вопроса. Бот получил ответ без каких-либо исправлений или подсказок.

Всего в игре 25 вопросов, за каждый правильный ответ начисляется один балл. По статистике пользователи в среднем набирают 13.6 баллов при медиане не более 14. Сколько GPT-4 получать? Ему удалось набрать 16 баллов!

И снова нейронная сеть превосходит обычного человека в логических рассуждениях. То есть он превосходит большинство протестированных людей. И это с учетом:

  • Тест проводился на русском языке, при этом модель доработана под английский язык;
  • GPT-4, который используется в чате, менее интеллектуален, чем его предшественник (побочный эффект этических ограничений).

Отдельно выложим отличный ответ на вопрос 22, в котором нейрон использовал логику первого порядка для математического вывода результата. Хотя это было рассмотрено в прикладной математике, это не университетский курс, который изучают все.

Отдельно мы опубликуем отличный ответ на вопрос 22, в котором нейрон использовал логику первого порядка для математического вывода результата. Мы все умели это делать и в прикладной математике, но это был дополнительный курс в университете.

Все еще верю, что нейронные сети это причуда? Во-первых, постарайтесь превзойти GPT-4 (и поделитесь своими результатами в комментариях).

Подробнее об ИИ:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Безумие DOGE: анализ недавнего роста стоимости Dogecoin (DOGE)

Криптовалютная индустрия стремительно расширяется, и мем-монеты готовятся к значительному подъему. Догекоин (DOGE), ...

Узнать больше

Эволюция контента, созданного искусственным интеллектом, в Метавселенной

Появление генеративного ИИ-контента — одно из самых интересных событий в виртуальной среде…

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Лучшие предложения этой недели, крупные инвестиции в искусственный интеллект, информационные технологии, Web3и Крипто (22-26.04)
Digest Бизнес Области применения: Технологии
Лучшие предложения этой недели, крупные инвестиции в искусственный интеллект, информационные технологии, Web3и Крипто (22-26.04)
26 апреля 2024
Виталик Бутерин прокомментировал централизацию PoW, отметив, что это был временный этап до PoS
Новостной репортаж Технологии
Виталик Бутерин прокомментировал централизацию PoW, отметив, что это был временный этап до PoS
26 апреля 2024
Offchain Labs сообщает об обнаружении двух критических уязвимостей в доказательствах мошенничества OP Stack от Optimism
Новостной репортаж Software Технологии
Offchain Labs сообщает об обнаружении двух критических уязвимостей в доказательствах мошенничества OP Stack от Optimism
26 апреля 2024
Открытый рынок Dymension для обеспечения ликвидности от RollApps eIBC запускается в основной сети
Новостной репортаж Технологии
Открытый рынок Dymension для обеспечения ликвидности от RollApps eIBC запускается в основной сети 
26 апреля 2024
CRYPTOMERIA LABS PTE. ООО