Vijesti Tehnologija
Ožujak 29, 2023

GPT-4 Bolje od prosječne osobe na testu logičkog rasuđivanja, tvrdi studija

Ukratko

Ilya Pestov, ruski istraživač umjetne inteligencije, osmislio je test logičkog razmišljanja koji je položilo 12 tisuća ljudi.

Nedavno je dobio pristup pametnijem GPT-4i proveo eksperiment kako bi vidio može li pravi upit dati neke rezultate.

Rezultati su pokazali da je GPT-4 nadmašio prosječnu osobu u logičkom zaključivanju.

Ilya Pestov, poznati ruski istraživač umjetne inteligencije, objavio je poruku na svom Telegram kanal o tome koliko dobro neuronska mreža rješava logičke testove. Ilya je jednom stvorio @psylogicbot test logičkog razmišljanja na kojem je sudjelovalo oko 12 tisuća ljudi. Nakon polaganja testa možete provjeriti statistiku.

@Midjourney / Abdalla(hamoXX)#7378
Pročitajte više: 20+ najboljih Telegram AI chatbota u 2023

On je to napisao ChatGPT također se testirao, ali rezultati su bili daleko od željenog. Nedavno je dobio pristup pametnijoj i ažuriranijoj verziji GPT model-GPT-4– i odlučio provjeriti hoće li dobiti slične rezultate.

Eksperiment je proveden na sljedeći način: Istraživač je izradio tekst koji opisuje zadatak koji neuronska mreža mora izvršiti. Istraživač je sve objavio u komentarima: Uputa je bila: “Dat ću vam logičku zagonetku i četiri moguća odgovora; odaberite jedan točan odgovor od njih.” Zatim je za svako ispitno pitanje Ilya stvorio novi dijalog i poslao GPT-4 opis uz tekst pitanja. Bot je primio odgovor bez ikakvih ispravaka ili savjeta.

Ukupno ima 25 pitanja, a za svaki točan odgovor dobiva se jedan bod. Prema statistici, korisnici u prosjeku postižu 13.6 bodova, s medijanom ne višim od 14. Koliko je GPT-4 dobiti? Uspio je osvojiti 16 bodova!

Još jednom, neuronska mreža nadmašuje prosječnu osobu u logičkom zaključivanju. Odnosno, nadmašuje većinu testiranih ljudi. I to nakon uzimanja u obzir:

  • Test je proveden na ruskom jeziku, dok je model fino podešen za engleski;
  • GPT-4, koji se koristi u chatu, manje je inteligentan od svog prethodnika (nuspojava etičkih ograničenja).

Zasebno ćemo objaviti izvrstan odgovor na pitanje 22, u kojem je neuron koristio logiku prvog reda da matematički izvede rezultat. Iako je ovo obrađeno u primijenjenoj matematici, to nije sveučilišni kolegij koji svi pohađaju.

Zasebno ćemo objaviti izvrstan odgovor na pitanje 22 u kojem je neuron koristio logiku prvog reda da matematički izvede rezultat. Svi smo to znali raditi i na primijenjenoj matematici, ali to je bio dodatni predmet na fakultetu.

Još uvijek vjeruj u to neuronske mreže su hir? Prvo, pokušajte nadmašiti GPT-4 (i podijelite svoje rezultate u komentarima).

Pročitajte više o AI:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Hot Stories
Pridružite se našem biltenu.
Najnovije vijesti

DOGE Frenzy: analiziranje nedavnog porasta vrijednosti Dogecoina (DOGE)

Industrija kriptovaluta brzo se širi, a meme kovanice se pripremaju za značajan uzlet. Dogecoin (DOGE), ...

Znati više

Evolucija sadržaja generiranog umjetnom inteligencijom u metaverzumu

Pojava generativnog AI sadržaja jedan je od najfascinantnijih razvoja unutar virtualnog okruženja...

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Najbolje ponude ovog tjedna, velika ulaganja u AI, IT, Web3, i Crypto (22-26.04.)
probaviti posao tržišta Tehnologija
Najbolje ponude ovog tjedna, velika ulaganja u AI, IT, Web3, i Crypto (22-26.04.)
Travnja 26, 2024
Vitalik Buterin komentira centralizaciju PoW-a, napominje da je to bila privremena faza do PoS-a
Vijesti Tehnologija
Vitalik Buterin komentira centralizaciju PoW-a, napominje da je to bila privremena faza do PoS-a
Travnja 26, 2024
Offchain Labs otkriva otkriće dviju kritičnih ranjivosti u dokazima prijevare Optimismovog OP Stacka
Vijesti softver Tehnologija
Offchain Labs otkriva otkriće dviju kritičnih ranjivosti u dokazima prijevare Optimismovog OP Stacka
Travnja 26, 2024
Dymensionovo otvoreno tržište za premošćivanje likvidnosti iz RollApps eIBC pokreće na glavnoj mreži
Vijesti Tehnologija
Dymensionovo otvoreno tržište za premošćivanje likvidnosti iz RollApps eIBC pokreće na glavnoj mreži 
Travnja 26, 2024
CRYPTOMERIA LABS PTE. LTD.