Informe de notícies Tecnologia
Març 29, 2023

GPT-4 Actua millor que la persona mitjana en una prova de raonament lògic, estudien les afirmacions

En breu

Ilya Pestov, un investigador rus d'IA, va crear la prova de pensament lògic, que va ser aprovada per 12 mil persones.

Recentment va obtenir accés als més intel·ligents GPT-4, i va realitzar un experiment per veure si la consulta adequada podia donar alguns resultats.

Els resultats van demostrar que el GPT-4 va superar la persona mitjana en raonament lògic.

Ilya Pestov, un conegut investigador rus d'IA, va publicar un missatge al seu Canal Telegram sobre com de bé la xarxa neuronal gestiona les proves lògiques. Ilya va crear una vegada el @psylogicbot prova de pensament lògic, feta per aproximadament 12 mil persones. Podeu consultar les estadístiques després de fer la prova.

@Midjourney / Abdalla(hamoXX)#7378
Llegir més: Més de 20 millors chatbots d'IA de Telegram del 2023

Ho va escriure ChatGPT També es van provar, però els resultats van deixar molt a desitjar. Recentment va tenir accés a la versió més intel·ligent i actualitzada del GPT model—GPT-4—i va decidir comprovar si obtindria resultats similars.

L'experiment es va dur a terme de la següent manera: L'investigador va crear un text que descrivia la tasca que havia de completar la xarxa neuronal. L'investigador ho va publicar tot als comentaris: El missatge va ser: “Us donaré un trencaclosques de lògica i quatre possibles respostes; escull entre ells la resposta correcta". Aleshores, per a cada pregunta de prova, Ilya va crear un diàleg nou i va enviar el GPT-4 descripció juntament amb el text de la pregunta. El bot va rebre la resposta sense cap mena de correccions ni suggeriments.

Hi ha 25 preguntes en total, amb un punt per cada resposta correcta. Segons les estadístiques, els usuaris puntuen 13.6 punts de mitjana, amb una mediana no superior a 14. Quant va fer? GPT-4 aconseguir? Va aconseguir aconseguir 16 punts!

Una vegada més, la xarxa neuronal supera la persona mitjana en raonament lògic. És a dir, supera la majoria de les persones provades. I això després de tenir en compte:

  • La prova es va fer en rus, mentre que el model està ajustat per a l'anglès;
  • GPT-4, que s'utilitza al xat, és menys intel·ligent que el seu predecessor (un efecte secundari de les restriccions ètiques).

Per separat, publicarem una resposta excel·lent a la pregunta 22, en què la neurona utilitzava la lògica de primer ordre per obtenir el resultat matemàticament. Tot i que això es va tractar en matemàtiques aplicades, no és un curs universitari que tothom fa.

Per separat, publicarem una resposta excel·lent a la pregunta 22 en què la neurona utilitzava la lògica de primer ordre per obtenir el resultat matemàticament. Tots sabíem com fer-ho també en matemàtiques aplicades, però era un curs addicional a la universitat.

Encara creu-ho xarxes neuronals són una moda? Primer, intenta superar-lo GPT-4 (i compartiu els vostres resultats als comentaris).

Llegeix més sobre AI:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

més articles
Damir Yalalov
Damir Yalalov

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

The DOGE Frenzy: anàlisi de l'augment recent del valor de Dogecoin (DOGE).

La indústria de la criptomoneda s'està expandint ràpidament i les monedes memes es preparen per a un augment significatiu. Dogecoin (DOGE),...

saber Més

L'evolució del contingut generat per IA al metavers

L'aparició del contingut generatiu d'IA és un dels desenvolupaments més fascinants dins de l'entorn virtual...

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
Les millors ofertes d'aquesta setmana, les principals inversions en IA, TI, Web3i Crypto (22-26.04)
Resum Negocis mercats Tecnologia
Les millors ofertes d'aquesta setmana, les principals inversions en IA, TI, Web3i Crypto (22-26.04)
Abril 26, 2024
Vitalik Buterin comenta sobre la centralització de PoW, assenyala que va ser una etapa temporal fins a PoS
Informe de notícies Tecnologia
Vitalik Buterin comenta sobre la centralització de PoW, assenyala que va ser una etapa temporal fins a PoS
Abril 26, 2024
Offchain Labs revela el descobriment de dues vulnerabilitats crítiques a les proves de frau de l'OP Stack d'Optimism
Informe de notícies Software Tecnologia
Offchain Labs revela el descobriment de dues vulnerabilitats crítiques a les proves de frau de l'OP Stack d'Optimism
Abril 26, 2024
El mercat obert de Dymension per a la liquiditat de pont de RollApps eIBC es llança a Mainnet
Informe de notícies Tecnologia
El mercat obert de Dymension per a la liquiditat de pont de RollApps eIBC es llança a Mainnet 
Abril 26, 2024
CRYPTOMERIA LABS PTE. LTD.