GPT-4 Bolje od prosječne osobe na testu logičkog rasuđivanja, tvrdi studija
Ukratko
Ilya Pestov, ruski istraživač umjetne inteligencije, osmislio je test logičkog razmišljanja koji je položilo 12 tisuća ljudi.
Nedavno je dobio pristup pametnijem GPT-4i proveo eksperiment kako bi vidio može li pravi upit dati neke rezultate.
Rezultati su pokazali da je GPT-4 nadmašio prosječnu osobu u logičkom zaključivanju.
Ilya Pestov, poznati ruski istraživač umjetne inteligencije, objavio je poruku na svom Telegram kanal o tome koliko dobro neuronska mreža rješava logičke testove. Ilya je jednom stvorio @psylogicbot test logičkog razmišljanja na kojem je sudjelovalo oko 12 tisuća ljudi. Nakon polaganja testa možete provjeriti statistiku.
Pročitajte više: 20+ najboljih Telegram AI chatbota u 2023 |
On je to napisao ChatGPT također se testirao, ali rezultati su bili daleko od željenog. Nedavno je dobio pristup pametnijoj i ažuriranijoj verziji GPT model-GPT-4– i odlučio provjeriti hoće li dobiti slične rezultate.
Eksperiment je proveden na sljedeći način: Istraživač je izradio tekst koji opisuje zadatak koji neuronska mreža mora izvršiti. Istraživač je sve objavio u komentarima: Uputa je bila: “Dat ću vam logičku zagonetku i četiri moguća odgovora; odaberite jedan točan odgovor od njih.” Zatim je za svako ispitno pitanje Ilya stvorio novi dijalog i poslao GPT-4 opis uz tekst pitanja. Bot je primio odgovor bez ikakvih ispravaka ili savjeta.
Ukupno ima 25 pitanja, a za svaki točan odgovor dobiva se jedan bod. Prema statistici, korisnici u prosjeku postižu 13.6 bodova, s medijanom ne višim od 14. Koliko je GPT-4 dobiti? Uspio je osvojiti 16 bodova!
Još jednom, neuronska mreža nadmašuje prosječnu osobu u logičkom zaključivanju. Odnosno, nadmašuje većinu testiranih ljudi. I to nakon uzimanja u obzir:
- Test je proveden na ruskom jeziku, dok je model fino podešen za engleski;
- GPT-4, koji se koristi u chatu, manje je inteligentan od svog prethodnika (nuspojava etičkih ograničenja).
Zasebno ćemo objaviti izvrstan odgovor na pitanje 22, u kojem je neuron koristio logiku prvog reda da matematički izvede rezultat. Iako je ovo obrađeno u primijenjenoj matematici, to nije sveučilišni kolegij koji svi pohađaju.
Još uvijek vjeruj u to neuronske mreže su hir? Prvo, pokušajte nadmašiti GPT-4 (i podijelite svoje rezultate u komentarima).
Pročitajte više o AI:
Izjava o odricanju od odgovornosti
U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.
O autoru
Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.
Više članakaDamir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.