GPT-4 Az átlagnál jobban teljesít a logikai érvelés tesztjén, tanulmány állításai
Röviden
Ilya Pestov orosz mesterséges intelligencia-kutató készítette el a logikus gondolkodás tesztjét, amelyet 12 ezren teljesítettek.
Nemrég hozzáférést kapott az okosabbhoz GPT-4, és végzett egy kísérletet, hogy kiderüljön, a megfelelő lekérdezés hoz-e valamilyen eredményt.
Az eredmények azt mutatták, hogy a GPT-4 logikus érvelésben felülmúlta az átlagembert.
Ilja Pestov, az ismert orosz mesterségesintelligencia-kutató üzenetet posztolt a sajátján Távirat csatorna arról, hogy a neurális hálózat milyen jól kezeli a logikai teszteket. Ilya egyszer létrehozta a @psylogicbot logikus gondolkodás teszt, amelyet megközelítőleg 12 ezren töltöttek ki. A statisztikát a teszt elvégzése után tekintheti meg.
Bővebben: 20+ 2023 legjobb Telegram AI Chatbotja |
Azt írta ChatGPT tesztelték is, de az eredmények sok kívánnivalót hagytak maga után. Nemrég hozzáfért az intelligensebb és frissített verzióhoz GPT modell-GPT-4-, és úgy döntött, hogy megvizsgálja, vajon hasonló eredményeket hoz-e.
A kísérlet a következőképpen zajlott: A kutató szöveget készített, amely leírja a feladatot, amelyet a neurális hálózatnak el kellett végeznie. A kutató mindent közzétett a megjegyzésekben: A felszólítás a következő volt: „Adok egy logikai rejtvényt és négy lehetséges választ; válasszon közülük egy helyes választ." Ezután Ilya minden tesztkérdéshez új párbeszédablakot hozott létre, és elküldte a GPT-4 leírást a kérdés szövegével együtt. A bot mindenféle javítás vagy utalás nélkül megkapta a választ.
Összesen 25 kérdés van, minden helyes válaszért egy pont jár. A statisztikák szerint a felhasználók átlagosan 13.6 pontot szereznek, a medián pedig nem haladja meg a 14-et. GPT-4 kap? Sikerült 16 pontot szerezni!
A neurális hálózat ismét felülmúlja az átlagembert a logikai gondolkodásban. Vagyis felülmúlja a tesztelt emberek többségét. És ez azután, hogy figyelembe vettük:
- A tesztet oroszul végezték, míg a modellt angolra finomították;
- GPT-4, amelyet a chatben használnak, kevésbé intelligens, mint elődje (etikai korlátozások mellékhatása).
Külön kitűnő választ adunk a 22. kérdésre, amelyben a neuron elsőrendű logikát használt az eredmény matematikai származtatására. Bár ezt az alkalmazott matematika tárgyalta, ez nem egy egyetemi kurzus, amelyet mindenki elvégez.
Még mindig hidd el neurális hálózatok hóbort? Először is próbáljon felülmúlni GPT-4 (és ossza meg eredményeit a megjegyzésekben).
Tudjon meg többet az AI-ról:
A felelősség megtagadása
Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.
A szerzőről
Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján.
További cikkekDamir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján.