Informe de noticias Tecnología
Marzo 29, 2023

GPT-4 Se desempeña mejor que la persona promedio en una prueba de razonamiento lógico, afirma un estudio

En Resumen

Ilya Pestov, un investigador ruso de inteligencia artificial, creó la prueba de pensamiento lógico, que fue aprobada por 12 mil personas.

Recientemente obtuvo acceso a los más inteligentes. GPT-4y realizó un experimento para ver si la consulta correcta podía producir algunos resultados.

Los resultados mostraron que la GPT-4 superó a la persona promedio en razonamiento lógico.

Ilya Pestov, un conocido investigador ruso de inteligencia artificial, publicó un mensaje en su Canal de Telegram sobre qué tan bien la red neuronal maneja las pruebas lógicas. Ilya una vez creó el @psylogicbot prueba de pensamiento lógico, que fue realizada por aproximadamente 12 mil personas. Puede consultar las estadísticas después de realizar la prueba.

@Midjourney / Abdalla(hamoXX)#7378
Más información: Más de 20 mejores chatbots con IA de Telegram de 2023

Él escribió eso ChatGPT También me hice la prueba, pero los resultados dejaron mucho que desear. Recientemente obtuvo acceso a la versión más inteligente y actualizada del GPT modelo-GPT-4—Y decidió comprobar si obtendría resultados similares.

El experimento se llevó a cabo de la siguiente manera: el investigador creó un texto que describía la tarea que debía completar la red neuronal. El investigador publicó todo en los comentarios: El aviso fue: “Te daré un acertijo lógico y cuatro posibles respuestas; elige la única respuesta correcta de ellos.” Luego, para cada pregunta de la prueba, Ilya creó un nuevo diálogo y envió el GPT-4 descripción junto con el texto de la pregunta. El bot recibió la respuesta sin correcciones ni pistas.

Hay 25 preguntas en total, y se otorga un punto por cada respuesta correcta. Según las estadísticas, los usuarios obtienen una media de 13.6 puntos, con una media no superior a 14. ¿Cuánto obtuvieron GPT-4 ¿conseguir? ¡Logró conseguir 16 puntos!

Una vez más, la red neuronal supera a la persona promedio en razonamiento lógico. Es decir, supera a la mayoría de las personas probadas. Y esto es después de tener en cuenta:

  • La prueba se realizó en ruso, mientras que el modelo está ajustado para inglés;
  • GPT-4, que se utiliza en el chat, es menos inteligente que su predecesor (un efecto secundario de las restricciones éticas).

Por separado, publicaremos una excelente respuesta a la pregunta 22, en la que la neurona usó lógica de primer orden para obtener el resultado matemáticamente. Si bien esto se cubrió en matemáticas aplicadas, no es un curso universitario que todos tomen.

Por separado, publicaremos una excelente respuesta a la pregunta 22 en la que la neurona usó lógica de primer orden para obtener el resultado matemáticamente. Todos sabíamos cómo hacerlo también en matemáticas aplicadas, pero era un curso adicional en la universidad.

Todavía creo que redes neuronales son una moda pasajera? Primero, intenta superar GPT-4 (y comparte tus resultados en los comentarios).

Lea más sobre la IA:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

El frenesí de DOGE: análisis del reciente aumento de valor de Dogecoin (DOGE)

La industria de las criptomonedas se está expandiendo rápidamente y las monedas meme se están preparando para un repunte significativo. Dogecoin (DOGE),...

Para saber más

La evolución del contenido generado por IA en el metaverso

La aparición del contenido de IA generativa es uno de los desarrollos más fascinantes dentro del entorno virtual...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Las principales ofertas de esta semana, importantes inversiones en inteligencia artificial, TI, Web3y Cripto (22-26.04)
Digest Empresa Industrias Tecnología
Las principales ofertas de esta semana, importantes inversiones en inteligencia artificial, TI, Web3y Cripto (22-26.04)
Abril 26, 2024
Vitalik Buterin comenta sobre la centralización de PoW y señala que fue una etapa temporal hasta PoS
Informe de noticias Tecnología
Vitalik Buterin comenta sobre la centralización de PoW y señala que fue una etapa temporal hasta PoS
Abril 26, 2024
Offchain Labs revela el descubrimiento de dos vulnerabilidades críticas en las pruebas de fraude de OP Stack de Optimism
Informe de noticias Software Tecnología
Offchain Labs revela el descubrimiento de dos vulnerabilidades críticas en las pruebas de fraude de OP Stack de Optimism
Abril 26, 2024
El mercado abierto de Dymension para puentear la liquidez de RollApps eIBC se lanza en Mainnet
Informe de noticias Tecnología
El mercado abierto de Dymension para puentear la liquidez de RollApps eIBC se lanza en Mainnet 
Abril 26, 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.