Новостной репортаж Технологии
29 марта 2023

GPT-4 Результаты теста на логическое мышление лучше, чем у среднестатистического человека, утверждает исследование

Коротко

Илья Пестов, российский исследователь искусственного интеллекта, создал тест на логическое мышление, который прошли 12 тысяч человек.

Недавно он получил доступ к более умному GPT-4и провел эксперимент, чтобы увидеть, может ли правильный запрос дать какие-либо результаты.

Результаты показали, что GPT-4 превосходил среднего человека в логическом рассуждении.

Илья Пестов, известный российский исследователь ИИ, разместил сообщение на своей Канал Telegram о том, насколько хорошо нейронная сеть справляется с логическими тестами. Илья когда-то создал @psylogicbot тест на логическое мышление, который прошли около 12 тысяч человек. Вы можете проверить статистику после прохождения теста.

@Midjourney / Абдалла(hamoXX)#7378
Прочитайте больше: 20+ лучших чат-ботов Telegram AI 2023 года

Он написал это ChatGPT тоже сдавала анализы, но результаты оставляли желать лучшего. Недавно он получил доступ к более умной и обновленной версии GPT модель-GPT-4— и решил проверить, получатся ли аналогичные результаты.

Эксперимент проводился следующим образом: исследователь создавал текст, описывающий задачу, которую должна была выполнить нейросеть. Исследователь разместил все в комментариях: Подсказка была: «Я дам вам логическую задачу и четыре варианта ответа; выберите из них один правильный ответ». Затем для каждого тестового вопроса Илья создавал новый диалог и отправлял GPT-4 описание вместе с текстом вопроса. Бот получил ответ без каких-либо исправлений или подсказок.

Всего в игре 25 вопросов, за каждый правильный ответ начисляется один балл. По статистике пользователи в среднем набирают 13.6 баллов при медиане не более 14. Сколько GPT-4 получать? Ему удалось набрать 16 баллов!

И снова нейронная сеть превосходит обычного человека в логических рассуждениях. То есть он превосходит большинство протестированных людей. И это с учетом:

  • Тест проводился на русском языке, при этом модель доработана под английский язык;
  • GPT-4, который используется в чате, менее интеллектуален, чем его предшественник (побочный эффект этических ограничений).

Отдельно выложим отличный ответ на вопрос 22, в котором нейрон использовал логику первого порядка для математического вывода результата. Хотя это было рассмотрено в прикладной математике, это не университетский курс, который изучают все.

Отдельно мы опубликуем отличный ответ на вопрос 22, в котором нейрон использовал логику первого порядка для математического вывода результата. Мы все умели это делать и в прикладной математике, но это был дополнительный курс в университете.

Все еще верю, что нейронные сети это причуда? Во-первых, постарайтесь превзойти GPT-4 (и поделитесь своими результатами в комментариях).

Подробнее об ИИ:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Безумие DOGE: анализ недавнего роста стоимости Dogecoin (DOGE)

Криптовалютная индустрия стремительно расширяется, и мем-монеты готовятся к значительному подъему. Догекоин (DOGE), ...

Узнать больше

Эволюция контента, созданного искусственным интеллектом, в Метавселенной

Появление генеративного ИИ-контента — одно из самых интересных событий в виртуальной среде…

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Открытый рынок Dymension для обеспечения ликвидности от RollApps eIBC запускается в основной сети
Новостной репортаж Технологии
Открытый рынок Dymension для обеспечения ликвидности от RollApps eIBC запускается в основной сети 
26 апреля 2024
Молчание правительства по поводу взлома кошелька Chivo вызывает критику и сомнения по поводу эксперимента с биткойнами в Сальвадоре
Безопасность Wiki Software Истории и обзоры Технологии
Молчание правительства по поводу взлома кошелька Chivo вызывает критику и сомнения по поводу эксперимента с биткойнами в Сальвадоре
26 апреля 2024
Десять лучших альткоинов 2024 года: погружение в лучшее 2024 года
Software Истории и обзоры Технологии
Десять лучших альткоинов 2024 года: погружение в лучшее 2024 года
26 апреля 2024
Централизованный контроль или децентрализованное управление? Понимание противоречий в политике ставок Ethereum
Software Истории и обзоры Технологии
Централизованный контроль или децентрализованное управление? Понимание противоречий в политике ставок Ethereum
26 апреля 2024
CRYPTOMERIA LABS PTE. ООО