Новински извештај технологија
Март КСНУМКС, КСНУМКС

GPT-4 Постиже бољи учинак од просечне особе на тесту логичког расуђивања, тврдње студије

Укратко

Иља Пестов, руски истраживач вештачке интелигенције, направио је тест логичког размишљања, који је прошло 12 хиљада људи.

Недавно је добио приступ паметнијима GPT-4, и спровео експеримент да види да ли прави упит може дати неке резултате.

Резултати су показали да је GPT-4 надмашио просечну особу у логичком закључивању.

Иља Пестов, познати руски истраживач вештачке интелигенције, објавио је поруку на свом Телеграм канал о томе колико добро неуронска мрежа подноси логичке тестове. Иља је једном створио @псилогицбот тест логичког размишљања, који је полагало приближно 12 хиљада људи. Статистику можете погледати након полагања теста.

@Midjourney / Абдалла(хамоКСКС)#7378
Опширније: 20+ најбољих Телеграм АИ четботова 2023

Он је то написао ChatGPT такође је тестиран, али резултати су оставили много да се пожеле. Недавно је добио приступ паметнијој и ажуриранијој верзији GPT модел—GPT-4—и одлучио да провери да ли ће добити сличне резултате.

Експеримент је спроведен на следећи начин: Истраживач је креирао текст који описује задатак који је неуронска мрежа морала да изврши. Истраживач је све објавио у коментарима: Упозорење је било: „Даћу вам логичку загонетку и четири могућа одговора; изаберите један тачан одговор од њих.” Затим, за свако тест питање, Иља је направио нови дијалог и послао GPT-4 опис уз текст питања. Бот је добио одговор без икаквих исправки или наговештаја.

Укупно има 25 питања, са по једним бодом за сваки тачан одговор. Према статистици, корисници у просеку постижу 13.6 поена, са медијаном не већом од 14. Колико су GPT-4 добити? Успело је да добије 16 поена!

Још једном, неуронска мрежа надмашује просечну особу у логичком закључивању. То јест, надмашује већину тестираних људи. А ово је након узимања у обзир:

  • Тест је обављен на руском језику, док је модел фино подешен за енглески;
  • GPT-4, који се користи у ћаскању, мање је интелигентан од свог претходника (нуспојава етичких ограничења).

Одвојено, објавићемо одличан одговор на питање 22, у којем је неурон користио логику првог реда да математички изведе резултат. Иако је ово било покривено примењеном математиком, то није универзитетски курс који сви похађају.

Одвојено, објавићемо одличан одговор на питање 22 у којем је неурон користио логику првог реда да математички изведе резултат. Сви смо то знали да урадимо и из примењене математике, али то је био додатни курс на факултету.

И даље веруј у то неуронске мреже су мода? Прво, покушајте да надмашите GPT-4 (и поделите своје резултате у коментарима).

Прочитајте више о АИ:

Одрицање од одговорности

У складу са Смернице пројекта Труст, имајте на уму да информације дате на овој страници нису намењене и не треба да се тумаче као правни, порески, инвестициони, финансијски или било који други облик савета. Важно је да инвестирате само оно што можете приуштити да изгубите и да тражите независан финансијски савет ако сумњате. За додатне информације, предлажемо да погледате одредбе и услове, као и странице помоћи и подршке које пружа издавач или оглашивач. MetaversePost је посвећен тачном, непристрасном извештавању, али тржишни услови су подложни променама без претходне најаве.

О аутору

Дамир је вођа тима, менаџер производа и уредник у Metaverse Post, покривајући теме као што су АИ/МЛ, АГИ, ЛЛМ, Метаверсе и Web3-сродна поља. Његови чланци привлаче огромну публику од преко милион корисника сваког месеца. Чини се да је стручњак са 10 година искуства у СЕО и дигиталном маркетингу. Дамир се помиње у Масхабле, Виред, Cointelegraph, Тхе Нев Иоркер, Инсиде.цом, Ентрепренеур, БеИнЦрипто и друге публикације. Путује између УАЕ, Турске, Русије и ЗНД као дигитални номад. Дамир је стекао диплому физике, за коју верује да му је дало вештине критичког размишљања које су му потребне да буде успешан у свету интернета који се стално мења. 

više чланака
Дамир Иалалов
Дамир Иалалов

Дамир је вођа тима, менаџер производа и уредник у Metaverse Post, покривајући теме као што су АИ/МЛ, АГИ, ЛЛМ, Метаверсе и Web3-сродна поља. Његови чланци привлаче огромну публику од преко милион корисника сваког месеца. Чини се да је стручњак са 10 година искуства у СЕО и дигиталном маркетингу. Дамир се помиње у Масхабле, Виред, Cointelegraph, Тхе Нев Иоркер, Инсиде.цом, Ентрепренеур, БеИнЦрипто и друге публикације. Путује између УАЕ, Турске, Русије и ЗНД као дигитални номад. Дамир је стекао диплому физике, за коју верује да му је дало вештине критичког размишљања које су му потребне да буде успешан у свету интернета који се стално мења. 

Hot Stories
Придружите се нашем билтену.
Најновије вести

Доге Френзи: Анализа недавног пораста вредности Догецоин-а (ДОГЕ)

Индустрија криптовалута се брзо шири, а мем кованице се припремају за значајан успон. Догецоин (ДОГЕ), ...

Знате више

Еволуција садржаја генерисаног вештачком интелигенцијом у метаверзуму

Појава генеративног АИ садржаја је један од најфасцинантнијих развоја у виртуелном окружењу...

Знате више
Придружите се нашој заједници иновативних технологија
Опширније
opširnije
Најбоље понуде ове недеље, велике инвестиције у вештачку интелигенцију, ИТ, Web3, и Црипто (22-26.04)
Дигест Posao tržišta технологија
Најбоље понуде ове недеље, велике инвестиције у вештачку интелигенцију, ИТ, Web3, и Црипто (22-26.04)
Април КСНУМКС, КСНУМКС
Виталик Бутерин коментарише централизацију војног заробљеништва, напомиње да је то била привремена фаза до ПоС-а
Новински извештај технологија
Виталик Бутерин коментарише централизацију војног заробљеништва, напомиње да је то била привремена фаза до ПоС-а
Април КСНУМКС, КСНУМКС
Оффцхаин Лабс открива откриће две критичне рањивости у доказима преваре Оптимисм'с ОП Стацк
Новински извештај софтвер технологија
Оффцхаин Лабс открива откриће две критичне рањивости у доказима преваре Оптимисм'с ОП Стацк
Април КСНУМКС, КСНУМКС
Отворено тржиште Дименсион-а за премошћавање ликвидности из РоллАппс-а еИБЦ покреће на главној мрежи
Новински извештај технологија
Отворено тржиште Дименсион-а за премошћавање ликвидности из РоллАппс-а еИБЦ покреће на главној мрежи 
Април КСНУМКС, КСНУМКС
ЦРИПТОМЕРИА ЛАБС ПТЕ. ЛТД.