GPT-4 Hereda hechos “alucinantes” y errores de razonamiento de antes GPT fexibles
En Resumen
OpenAI dice GPT-4 tiene limitaciones similares a las anteriores GPT modelos.
GPT-4 Todavía alucina hechos y comete errores de razonamiento.
Sin embargo, GPT-4 puntuaciones 40% más altas que OpenAIla última GPT-3.5 sobre las evaluaciones de factibilidad internas contradictorias de la empresa.
OpenAI ha advertido a los usuarios que su último modelo de lenguaje, GPT-4, todavía no es totalmente fiable y puede “alucinar” hechos y cometer errores de razonamiento. La compañía insta a los usuarios a tener cuidado al utilizar los resultados del modelo de lenguaje, especialmente en "contextos de alto riesgo".
Sin embargo, la buena noticia es que GPT-4 Reduce significativamente las alucinaciones en comparación con los modelos anteriores. OpenAI reclama eso GPT-4 puntuaciones un 40% más altas que la última GPT-3.5 sobre evaluaciones internas contradictorias de los hechos.
“Hemos progresado en puntos de referencia externos como TruthfulQA, que prueba la capacidad del modelo para separar los hechos de un conjunto de declaraciones incorrectas seleccionadas por el adversario. Estas preguntas se combinan con respuestas objetivamente incorrectas que son estadísticamente atractivas”, OpenAI escribió en un del blog.
A pesar de esta mejora, el modelo aún carece de conocimiento de los eventos que ocurrieron después de septiembre de 2021 y, a veces, comete errores de razonamiento simples, al igual que los modelos anteriores. Además, puede ser demasiado crédulo al aceptar declaraciones falsas obvias de los usuarios y fallar en problemas difíciles, como introducir vulnerabilidades de seguridad en su código. Tampoco verifica la información que proporciona.
Al igual que sus predecesores, GPT-4 puede generar consejos dañinos, códigos con errores o información inexacta. Sin embargo, las capacidades adicionales del modelo conducen a nuevas superficies de riesgo que es necesario comprender. Para evaluar el alcance de estos riesgos, más de 50 expertos de varios dominios, incluidos los riesgos de alineación de la IA, la ciberseguridad, el riesgo biológico, la confianza y la seguridad, y la seguridad internacional, se comprometieron a probar el modelo de manera adversa. Sus comentarios y datos se utilizaron luego para mejorar el modelo, como la recopilación de datos adicionales para mejorar GPT-4la capacidad de rechazar solicitudes sobre cómo sintetizar sustancias químicas peligrosas.
Una de las principales formas OpenAI está reduciendo los resultados dañinos mediante la incorporación de una señal de recompensa de seguridad adicional durante el entrenamiento RLHF (Aprendizaje de refuerzo a partir de la retroalimentación humana). La señal entrena al modelo para rechazar solicitudes de contenido dañino, como defisegún las pautas de uso del modelo. La recompensa es proporcionada por un GPT-4 Clasificador de tiro cero, que juzga los límites de seguridad y el estilo de finalización según indicaciones relacionadas con la seguridad.
OpenAI También dijo que había disminuido la tendencia del modelo a responder a solicitudes de contenido no permitido en un 82% en comparación con GPT-3.5 y GPT-4 responde a solicitudes sensibles como asesoramiento médico y autolesiones de acuerdo con las políticas de la empresa con un 29% más de frecuencia.
Aunque la OpenAILas intervenciones han aumentado la dificultad de provocar un mal comportamiento en GPT-4, todavía es posible y todavía existen jailbreaks que pueden generar contenido que viole las pautas de uso.
“A medida que los sistemas de IA se vuelvan más frecuentes, lograr altos grados de confiabilidad en estas intervenciones será cada vez más crítico. Por ahora, es esencial complementar estas limitaciones con técnicas de seguridad en tiempo de implementación, como el monitoreo de abuso”, agregó la compañía.
OpenAI está colaborando con investigadores externos para comprender y evaluar mejor los impactos potenciales de GPT-4 y sus modelos sucesores. El equipo también está desarrollando evaluaciones de capacidades peligrosas que pueden surgir en futuros sistemas de IA. Mientras continúan estudiando el potencial social y los impactos económicos of GPT-4 y otros sistemas de IA, OpenAI compartirá sus hallazgos y puntos de vista con el público a su debido tiempo.
Más información:
Observación
En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.
Sobre el Autor
Cindy es periodista en Metaverse Post, cubriendo temas relacionados con web3, NFT, metaverso e IA, con un enfoque en entrevistas con Web3 actores de la industria. Ha hablado con más de 30 ejecutivos de nivel C y contando, aportando sus valiosos conocimientos a los lectores. Originaria de Singapur, Cindy ahora reside en Tbilisi, Georgia. Tiene una licenciatura en Comunicaciones y Estudios de Medios de la Universidad de Australia del Sur y tiene una década de experiencia en periodismo y escritura. Ponte en contacto con ella a través de [email protected] con lanzamientos de prensa, anuncios y oportunidades de entrevistas.
Más artículosCindy es periodista en Metaverse Post, cubriendo temas relacionados con web3, NFT, metaverso e IA, con un enfoque en entrevistas con Web3 actores de la industria. Ha hablado con más de 30 ejecutivos de nivel C y contando, aportando sus valiosos conocimientos a los lectores. Originaria de Singapur, Cindy ahora reside en Tbilisi, Georgia. Tiene una licenciatura en Comunicaciones y Estudios de Medios de la Universidad de Australia del Sur y tiene una década de experiencia en periodismo y escritura. Ponte en contacto con ella a través de [email protected] con lanzamientos de prensa, anuncios y oportunidades de entrevistas.