Март КСНУМКС, КСНУМКС

GPT-4 Постиже бољи учинак од просечне особе на тесту логичког расуђивања, тврдње студије

Објављено: 29. марта 2023. у 3:55 Ажурирано: 29. марта 2023. у 3:55

Укратко

Иља Пестов, руски истраживач вештачке интелигенције, направио је тест логичког размишљања, који је прошло 12 хиљада људи.

Недавно је добио приступ паметнијима GPT-4, и спровео експеримент да види да ли прави упит може дати неке резултате.

Резултати су показали да је GPT-4 надмашио просечну особу у логичком закључивању.

Иља Пестов, познати руски истраживач вештачке интелигенције, објавио је поруку на свом Телеграм канал о томе колико добро неуронска мрежа подноси логичке тестове. Иља је једном створио @псилогицбот тест логичког размишљања, који је полагало приближно 12 хиљада људи. Статистику можете погледати након полагања теста.

Опширније: 20+ најбољих Телеграм АИ четботова 2023

Он је то написао ChatGPT такође је тестиран, али резултати су оставили много да се пожеле. Недавно је добио приступ паметнијој и ажуриранијој верзији GPT модел—GPT-4—и одлучио да провери да ли ће добити сличне резултате.

Експеримент је спроведен на следећи начин: Истраживач је креирао текст који описује задатак који је неуронска мрежа морала да изврши. Истраживач је све објавио у коментарима: Упозорење је било: „Даћу вам логичку загонетку и четири могућа одговора; изаберите један тачан одговор од њих.” Затим, за свако тест питање, Иља је направио нови дијалог и послао GPT-4 опис уз текст питања. Бот је добио одговор без икаквих исправки или наговештаја.

Укупно има 25 питања, са по једним бодом за сваки тачан одговор. Према статистици, корисници у просеку постижу 13.6 поена, са медијаном не већом од 14. Колико су GPT-4 добити? Успело је да добије 16 поена!

Још једном, неуронска мрежа надмашује просечну особу у логичком закључивању. То јест, надмашује већину тестираних људи. А ово је након узимања у обзир:

Тест је обављен на руском језику, док је модел фино подешен за енглески;
GPT-4, који се користи у ћаскању, мање је интелигентан од свог претходника (нуспојава етичких ограничења).

Одвојено, објавићемо одличан одговор на питање 22, у којем је неурон користио логику првог реда да математички изведе резултат. Иако је ово било покривено примењеном математиком, то није универзитетски курс који сви похађају.

Одвојено, објавићемо одличан одговор на питање 22 у којем је неурон користио логику првог реда да математички изведе резултат. Сви смо то знали да урадимо и из примењене математике, али то је био додатни курс на факултету.

И даље веруј у то неуронске мреже су мода? Прво, покушајте да надмашите GPT-4 (и поделите своје резултате у коментарима).

Прочитајте више о АИ:

Ознаке:

Одрицање од одговорности

У складу са Смернице пројекта Труст, имајте на уму да информације дате на овој страници нису намењене и не треба да се тумаче као правни, порески, инвестициони, финансијски или било који други облик савета. Важно је да инвестирате само оно што можете приуштити да изгубите и да тражите независан финансијски савет ако сумњате. За додатне информације, предлажемо да погледате одредбе и услове, као и странице помоћи и подршке које пружа издавач или оглашивач. MetaversePost је посвећен тачном, непристрасном извештавању, али тржишни услови су подложни променама без претходне најаве.

О аутору

Дамир је вођа тима, менаџер производа и уредник у Metaverse Post, покривајући теме као што су АИ/МЛ, АГИ, ЛЛМ, Метаверсе и Web3-сродна поља. Његови чланци привлаче огромну публику од преко милион корисника сваког месеца. Чини се да је стручњак са 10 година искуства у СЕО и дигиталном маркетингу. Дамир се помиње у Масхабле, Виред, Cointelegraph, Тхе Нев Иоркер, Инсиде.цом, Ентрепренеур, БеИнЦрипто и друге публикације. Путује између УАЕ, Турске, Русије и ЗНД као дигитални номад. Дамир је стекао диплому физике, за коју верује да му је дало вештине критичког размишљања које су му потребне да буде успешан у свету интернета који се стално мења.

više чланака

Дамир Иалалов