Новини Технологии
Март 29, 2023

GPT-4 Представя се по-добре от средния човек на тест за логическо разсъждение, твърдения на проучването

Накратко

Иля Пестов, руски изследовател на ИИ, създаде теста за логическо мислене, който беше преминат от 12 хиляди души.

Наскоро той получи достъп до по-умния GPT-4и проведе експеримент, за да види дали правилната заявка може да даде резултати.

Резултатите показаха, че GPT-4 превъзхожда средния човек в логическите разсъждения.

Иля Пестов, известен руски изследовател на ИИ, публикува съобщение на своя Телеграм канал за това колко добре невронната мрежа се справя с логически тестове. Иля някога е създал @psylogicbot тест за логическо мислене, който беше взет от около 12 хиляди души. Можете да проверите статистиката след полагане на теста.

@Midjourney / Abdalla(hamoXX)#7378
Чети повече: 20+ най-добри Telegram AI Chatbots за 2023 г

Той го написа ChatGPT също беше тестван, но резултатите оставиха много да се желаят. Наскоро той получи достъп до по-умната и по-актуална версия на GPT модел-GPT-4– и реши да провери дали ще получи подобни резултати.

Експериментът е проведен по следния начин: Изследователят създава текст, който описва задачата, която невронната мрежа трябва да изпълни. Изследователят публикува всичко в коментарите: Подканата беше: „Ще ви дам логически пъзел и четири възможни отговора; изберете един правилен отговор от тях.” След това за всеки тестов въпрос Иля създава нов диалог и изпраща GPT-4 описание заедно с текста на въпроса. Ботът получи отговора без никакви корекции или съвети.

Въпросите са общо 25, като за всеки верен отговор се дава по една точка. Според статистиката потребителите получават средно 13.6 точки, като медианата е не повече от 14. Колко GPT-4 получи? Успя да вземе 16 точки!

Още веднъж, невронната мрежа превъзхожда обикновения човек в логическите разсъждения. Тоест, той превъзхожда мнозинството от тестваните хора. И това е след като се вземат предвид:

  • Тестът е проведен на руски език, докато моделът е фино настроен за английски;
  • GPT-4, който се използва в чата, е по-малко интелигентен от своя предшественик (страничен ефект от етичните ограничения).

Отделно ще публикуваме отличен отговор на въпрос 22, в който невронът използва логика от първи ред, за да извлече резултата математически. Въпреки че това беше разгледано в приложната математика, това не е университетски курс, който всеки взима.

Отделно ще публикуваме отличен отговор на въпрос 22, в който невронът използва логика от първи ред, за да извлече резултата математически. Всички знаехме как се прави и по приложна математика, но това беше допълнителен курс в университета.

Все още вярвам в това невронни мрежи са мода? Първо, опитайте се да надминете GPT-4 (и споделете резултатите си в коментарите).

Прочетете повече за AI:

Отказ от отговорност

В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.

За автора

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Още статии
Дамир Ялалов
Дамир Ялалов

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Hot Stories
Присъединете се към нашия бюлетин.
Последни новини

The DOGE Frenzy: Анализ на скорошния скок на стойността на Dogecoin (DOGE)

Индустрията на криптовалутите се разраства бързо и мем монетите се подготвят за значителен подем. Доджкойн (DOGE), ...

Научете още

Еволюцията на генерираното от изкуствен интелект съдържание в метавселената

Появата на генеративно AI съдържание е едно от най-завладяващите развития във виртуалната среда...

Научете още
Присъединете се към нашата иновативна техническа общност
Вижте повече
Прочети повече
Най-добрите оферти за тази седмица, големи инвестиции в AI, IT, Web3и крипто (22-26.04)
резюме Бизнес пазари Технологии
Най-добрите оферти за тази седмица, големи инвестиции в AI, IT, Web3и крипто (22-26.04)
Април 26, 2024
Виталик Бутерин коментира централизацията на PoW, отбелязва, че това е временен етап до PoS
Новини Технологии
Виталик Бутерин коментира централизацията на PoW, отбелязва, че това е временен етап до PoS
Април 26, 2024
Offchain Labs разкрива откриването на две критични уязвимости в доказателствата за измами на Optimism's OP Stack
Новини Софтуер Технологии
Offchain Labs разкрива откриването на две критични уязвимости в доказателствата за измами на Optimism's OP Stack
Април 26, 2024
Отвореният пазар на Dymension за преодоляване на ликвидност от RollApps eIBC стартира в Mainnet
Новини Технологии
Отвореният пазар на Dymension за преодоляване на ликвидност от RollApps eIBC стартира в Mainnet 
Април 26, 2024
CRYPTOMERIA LABS PTE. LTD.