Звіт про новини Технологія
Березня 29, 2023

GPT-4 Виконує кращий результат, ніж середня людина, у тесті на логічне мислення, дослідження тверджень

Коротко

Російський дослідник ШІ Ілля Пестов створив тест на логічне мислення, який пройшли 12 тисяч людей.

Нещодавно він отримав доступ до розумнішого GPT-4і провів експеримент, щоб перевірити, чи правильний запит може дати певні результати.

Результати показали, що GPT-4 перевершив середньостатистичної людини в логічних міркуваннях.

Ілля Пестов, відомий російський дослідник штучного інтелекту, опублікував повідомлення на своєму Telegram-канал про те, наскільки добре нейронна мережа справляється з логічними тестами. Ілля свого часу створив @psylogicbot тест на логічне мислення, який пройшли приблизно 12 тисяч осіб. Ви можете перевірити статистику після проходження тесту.

@Midjourney / Abdalla(hamoXX)#7378
Детальніше: 20+ найкращих чат-ботів Telegram AI 2023 року

Він написав це ChatGPT теж пройшла тестування, але результати залишали бажати кращого. Нещодавно він отримав доступ до розумнішої та оновленої версії GPT модель—GPT-4— і вирішив перевірити, чи дадуть подібні результати.

Експеримент проводився наступним чином: дослідник створив текст, який описував завдання, яке повинна була виконати нейронна мережа. Дослідник усе виклав у коментарях: Підказка була: «Я дам вам логічну головоломку та чотири варіанти відповіді; вибрати з них одну правильну відповідь». Потім для кожного тестового питання Ілля створював новий діалог і надсилав GPT-4 опис разом із текстом питання. Бот отримав відповідь без будь-яких виправлень і підказок.

Всього 25 запитань, за кожну правильну відповідь нараховується один бал. За статистикою, користувачі набирають в середньому 13.6 балів, медіана не перевищує 14. Скільки GPT-4 отримати? Вдалось набрати 16 балів!

І знову нейронна мережа перевершує середньостатистичної людини в логічних міркуваннях. Тобто він перевершує більшість протестованих людей. І це з урахуванням:

  • Тест проводився російською мовою, а модель налаштована на англійську;
  • GPT-4, який використовується в чаті, менш інтелектуальний, ніж його попередник (побічний ефект етичних обмежень).

Окремо ми опублікуємо чудову відповідь на запитання 22, у якому нейрон використовував логіку першого порядку, щоб математично отримати результат. Хоча це розглядалося в прикладній математиці, це не університетський курс, який проходять усі.

Окремо ми опублікуємо чудову відповідь на запитання 22, у якому нейрон використовував логіку першого порядку, щоб математично отримати результат. Ми всі вміли це робити і на прикладній математиці, але це був додатковий курс в університеті.

Все ще вірю в це нейронні мережі це примха? По-перше, спробуйте перевершити GPT-4 (та поділіться своїми результатами в коментарях).

Докладніше про ШІ:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Інституційний апетит зростає до біткойн ETF на тлі волатильності

Розкриття інформації через документи 13F свідчить про те, що відомі інституційні інвестори займаються біткойн ETF, підкреслюючи зростаюче визнання ...

Дізнайтеся більше

Настав день винесення вироку: суд США розглядає прохання Міністерства юстиції щодо долі CZ.

Changpeng Zhao готовий зіткнутися з вироком у американському суді в Сіетлі сьогодні.

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
NuLink запускається на Bybit Web3 Платформа IDO. Етап підписки продовжено до 13 травня
ринки Звіт про новини Технологія
NuLink запускається на Bybit Web3 Платформа IDO. Етап підписки продовжено до 13 травня
Травень 9, 2024
UXLINK і Binance співпрацюють над новою кампанією, пропонуючи користувачам 20 мільйонів балів UXUY і Airdrop Нагороди
ринки Звіт про новини Технологія
UXLINK і Binance співпрацюють над новою кампанією, пропонуючи користувачам 20 мільйонів балів UXUY і Airdrop Нагороди
Травень 9, 2024
Side Protocol запускає стимульовану тестову мережу та представляє систему інсайдерських балів, що дозволяє користувачам заробляти бали SIDE
ринки Звіт про новини Технологія
Side Protocol запускає стимульовану тестову мережу та представляє систему інсайдерських балів, що дозволяє користувачам заробляти бали SIDE
Травень 9, 2024
Web3 і криптовалютні події в травні 2024 року: вивчення нових технологій і нових тенденцій у блокчейні та DeFi
Digest Business ринки Технологія
Web3 і криптовалютні події в травні 2024 року: вивчення нових технологій і нових тенденцій у блокчейні та DeFi
Травень 9, 2024
CRYPTOMERIA LABS PTE. LTD.