Buletin de stiri Tehnologia
Martie 29, 2023

GPT-4 Performanțe mai bune decât persoana medie la un test de raționament logic, studiază afirmațiile

Pe scurt

Ilya Pestov, un cercetător rus în domeniul inteligenței artificiale, a creat testul de gândire logică, care a fost trecut de 12 mii de oameni.

Recent a obținut acces la cei mai deștepți GPT-4, și a efectuat un experiment pentru a vedea dacă interogarea corectă ar putea da unele rezultate.

Rezultatele au arătat că GPT-4 a depășit persoana medie în raționament logic.

Ilya Pestov, un cunoscut cercetător rus AI, a postat un mesaj pe el Canalul Telegram despre cât de bine gestionează rețeaua neuronală testele logice. Ilya a creat odată @psylogicbot test de gândire logică, care a fost luat de aproximativ 12 mii de oameni. Puteți verifica statisticile după ce ați luat testul.

@Midjourney / Abdalla(hamoXX)#7378
Citeşte mai mult: Cele mai bune 20 de chatbot-uri Telegram AI din 2023

El a scris asta ChatGPT a fost și testat, dar rezultatele au lăsat de dorit. El a primit recent acces la versiunea mai inteligentă și mai actualizată a GPT model-GPT-4— și a decis să verifice dacă va obține rezultate similare.

Experimentul s-a desfășurat după cum urmează: Cercetătorul a creat un text care a descris sarcina pe care rețeaua neuronală trebuia să o îndeplinească. Cercetătorul a postat totul în comentarii: Solicitarea a fost: „Vă dau un puzzle de logică și patru răspunsuri posibile; alege răspunsul corect dintre ei.” Apoi, pentru fiecare întrebare de test, Ilya a creat un nou dialog și a trimis GPT-4 descrierea împreună cu textul întrebării. Botul a primit răspunsul fără corecții sau indicii.

Sunt 25 de întrebări în total, cu câte un punct pentru fiecare răspuns corect. Conform statisticilor, utilizatorii obțin în medie 13.6 puncte, cu o mediană de cel mult 14. Cât de mult au făcut GPT-4 obține? A reușit să obțină 16 puncte!

Încă o dată, rețeaua neuronală depășește o persoană medie în raționament logic. Adică, depășește majoritatea persoanelor testate. Și asta după ce ținem cont de:

  • Testul a fost realizat în limba rusă, în timp ce modelul este reglat fin pentru engleză;
  • GPT-4, care este folosit în chat, este mai puțin inteligent decât predecesorul său (un efect secundar al restricțiilor etice).

Separat, vom posta un răspuns excelent la întrebarea 22, în care neuronul a folosit logica de ordinul întâi pentru a obține rezultatul matematic. Deși acest lucru a fost acoperit în matematică aplicată, nu este un curs universitar pe care toată lumea îl urmează.

Separat, vom posta un răspuns excelent la întrebarea 22 în care neuronul a folosit logica de ordinul întâi pentru a obține rezultatul matematic. Știam cu toții să o facem și la matematică aplicată, dar a fost un curs suplimentar la universitate.

Încă mai cred asta rețele neuronale sunt un moft? În primul rând, încearcă să depășești GPT-4 (și împărtășește rezultatele în comentarii).

Citiți mai multe despre AI:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Frenezia DOGE: Analizând creșterea recentă a valorii Dogecoin (DOGE).

Industria criptomonedelor se extinde rapid, iar monedele meme se pregătesc pentru o creștere semnificativă. Dogecoin (DOGE),...

Aflați mai multe

Evoluția conținutului generat de AI în metavers

Apariția conținutului AI generativ este una dintre cele mai fascinante dezvoltări din mediul virtual...

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Cele mai bune oferte din această săptămână, investiții majore în AI, IT, Web3și Crypto (22-26.04)
rezumat Afaceri pieţe Tehnologia
Cele mai bune oferte din această săptămână, investiții majore în AI, IT, Web3și Crypto (22-26.04)
Aprilie 26, 2024
Vitalik Buterin comentează despre centralizarea PoW, notează că a fost o etapă temporară până la PoS
Buletin de stiri Tehnologia
Vitalik Buterin comentează despre centralizarea PoW, notează că a fost o etapă temporară până la PoS
Aprilie 26, 2024
Offchain Labs dezvăluie descoperirea a două vulnerabilități critice în probele de fraudă ale Optimism OP Stack
Buletin de stiri Software Tehnologia
Offchain Labs dezvăluie descoperirea a două vulnerabilități critice în probele de fraudă ale Optimism OP Stack
Aprilie 26, 2024
Piața deschisă a Dymension pentru asigurarea lichidității din RollApps eIBC se lansează pe rețeaua principală
Buletin de stiri Tehnologia
Piața deschisă a Dymension pentru asigurarea lichidității din RollApps eIBC se lansează pe rețeaua principală 
Aprilie 26, 2024
CRYPTOMERIA LABS PTE. LTD.