Informe de noticias Tecnología
Marzo 16, 2023

GPT-4 Hereda hechos “alucinantes” y errores de razonamiento de antes GPT fexibles

En Resumen

OpenAI dice GPT-4 tiene limitaciones similares a las anteriores GPT modelos.

GPT-4 Todavía alucina hechos y comete errores de razonamiento.

Sin embargo, GPT-4 puntuaciones 40% más altas que OpenAIla última GPT-3.5 sobre las evaluaciones de factibilidad internas contradictorias de la empresa.

GPT-4 Hereda hechos "alucinantes" y errores de razonamiento de antes GPT fexibles

OpenAI ha advertido a los usuarios que su último modelo de lenguaje, GPT-4, todavía no es totalmente fiable y puede “alucinar” hechos y cometer errores de razonamiento. La compañía insta a los usuarios a tener cuidado al utilizar los resultados del modelo de lenguaje, especialmente en "contextos de alto riesgo".

Sin embargo, la buena noticia es que GPT-4 Reduce significativamente las alucinaciones en comparación con los modelos anteriores. OpenAI reclama eso GPT-4 puntuaciones un 40% más altas que la última GPT-3.5 sobre evaluaciones internas contradictorias de los hechos. 

vía OpenAI

“Hemos progresado en puntos de referencia externos como TruthfulQA, que prueba la capacidad del modelo para separar los hechos de un conjunto de declaraciones incorrectas seleccionadas por el adversario. Estas preguntas se combinan con respuestas objetivamente incorrectas que son estadísticamente atractivas”, OpenAI escribió en un del blog.

A pesar de esta mejora, el modelo aún carece de conocimiento de los eventos que ocurrieron después de septiembre de 2021 y, a veces, comete errores de razonamiento simples, al igual que los modelos anteriores. Además, puede ser demasiado crédulo al aceptar declaraciones falsas obvias de los usuarios y fallar en problemas difíciles, como introducir vulnerabilidades de seguridad en su código. Tampoco verifica la información que proporciona.

Al igual que sus predecesores, GPT-4 puede generar consejos dañinos, códigos con errores o información inexacta. Sin embargo, las capacidades adicionales del modelo conducen a nuevas superficies de riesgo que es necesario comprender. Para evaluar el alcance de estos riesgos, más de 50 expertos de varios dominios, incluidos los riesgos de alineación de la IA, la ciberseguridad, el riesgo biológico, la confianza y la seguridad, y la seguridad internacional, se comprometieron a probar el modelo de manera adversa. Sus comentarios y datos se utilizaron luego para mejorar el modelo, como la recopilación de datos adicionales para mejorar GPT-4la capacidad de rechazar solicitudes sobre cómo sintetizar sustancias químicas peligrosas.

Una de las principales formas OpenAI está reduciendo los resultados dañinos mediante la incorporación de una señal de recompensa de seguridad adicional durante el entrenamiento RLHF (Aprendizaje de refuerzo a partir de la retroalimentación humana). La señal entrena al modelo para rechazar solicitudes de contenido dañino, como defisegún las pautas de uso del modelo. La recompensa es proporcionada por un GPT-4 Clasificador de tiro cero, que juzga los límites de seguridad y el estilo de finalización según indicaciones relacionadas con la seguridad.

OpenAI También dijo que había disminuido la tendencia del modelo a responder a solicitudes de contenido no permitido en un 82% en comparación con GPT-3.5 y GPT-4 responde a solicitudes sensibles como asesoramiento médico y autolesiones de acuerdo con las políticas de la empresa con un 29% más de frecuencia.

vía OpenAI

Aunque la OpenAILas intervenciones han aumentado la dificultad de provocar un mal comportamiento en GPT-4, todavía es posible y todavía existen jailbreaks que pueden generar contenido que viole las pautas de uso. 

“A medida que los sistemas de IA se vuelvan más frecuentes, lograr altos grados de confiabilidad en estas intervenciones será cada vez más crítico. Por ahora, es esencial complementar estas limitaciones con técnicas de seguridad en tiempo de implementación, como el monitoreo de abuso”, agregó la compañía.

OpenAI está colaborando con investigadores externos para comprender y evaluar mejor los impactos potenciales de GPT-4 y sus modelos sucesores. El equipo también está desarrollando evaluaciones de capacidades peligrosas que pueden surgir en futuros sistemas de IA. Mientras continúan estudiando el potencial social y los impactos económicos of GPT-4 y otros sistemas de IA, OpenAI compartirá sus hallazgos y puntos de vista con el público a su debido tiempo.

Más información:

Tags:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Cindy es periodista en Metaverse Post, cubriendo temas relacionados con web3, NFT, metaverso e IA, con un enfoque en entrevistas con Web3 actores de la industria. Ha hablado con más de 30 ejecutivos de nivel C y contando, aportando sus valiosos conocimientos a los lectores. Originaria de Singapur, Cindy ahora reside en Tbilisi, Georgia. Tiene una licenciatura en Comunicaciones y Estudios de Medios de la Universidad de Australia del Sur y tiene una década de experiencia en periodismo y escritura. Ponte en contacto con ella a través de [email protected] con lanzamientos de prensa, anuncios y oportunidades de entrevistas.

Más artículos
cindy bronceado
cindy bronceado

Cindy es periodista en Metaverse Post, cubriendo temas relacionados con web3, NFT, metaverso e IA, con un enfoque en entrevistas con Web3 actores de la industria. Ha hablado con más de 30 ejecutivos de nivel C y contando, aportando sus valiosos conocimientos a los lectores. Originaria de Singapur, Cindy ahora reside en Tbilisi, Georgia. Tiene una licenciatura en Comunicaciones y Estudios de Medios de la Universidad de Australia del Sur y tiene una década de experiencia en periodismo y escritura. Ponte en contacto con ella a través de [email protected] con lanzamientos de prensa, anuncios y oportunidades de entrevistas.

El frenesí de DOGE: análisis del reciente aumento de valor de Dogecoin (DOGE)

La industria de las criptomonedas se está expandiendo rápidamente y las monedas meme se están preparando para un repunte significativo. Dogecoin (DOGE),...

Para saber más

La evolución del contenido generado por IA en el metaverso

La aparición del contenido de IA generativa es uno de los desarrollos más fascinantes dentro del entorno virtual...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Las principales ofertas de esta semana, importantes inversiones en inteligencia artificial, TI, Web3y Cripto (22-26.04)
Digest Empresa Industrias Tecnología
Las principales ofertas de esta semana, importantes inversiones en inteligencia artificial, TI, Web3y Cripto (22-26.04)
Abril 26, 2024
Vitalik Buterin comenta sobre la centralización de PoW y señala que fue una etapa temporal hasta PoS
Informe de noticias Tecnología
Vitalik Buterin comenta sobre la centralización de PoW y señala que fue una etapa temporal hasta PoS
Abril 26, 2024
Offchain Labs revela el descubrimiento de dos vulnerabilidades críticas en las pruebas de fraude de OP Stack de Optimism
Informe de noticias Software Tecnología
Offchain Labs revela el descubrimiento de dos vulnerabilidades críticas en las pruebas de fraude de OP Stack de Optimism
Abril 26, 2024
El mercado abierto de Dymension para puentear la liquidez de RollApps eIBC se lanza en Mainnet
Informe de noticias Tecnología
El mercado abierto de Dymension para puentear la liquidez de RollApps eIBC se lanza en Mainnet 
Abril 26, 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.