Informe de noticias SMW Tecnología
10 de mayo de 2023

Anthropic propone una 'IA contextual' para modelos de chat basada en 60 principios

En Resumen

OpenAI utiliza el aprendizaje de refuerzo a partir de la retroalimentación humana (RLHF) para alinear modelos de lenguaje con principios humanos, seguridad y utilidad.

Anthropic propuso un enfoque alternativo: la IA contextual, que implica que las personas escriban una constitución que debería seguir el modelo.

Esta constitución se basa en la Declaración de derechos humanos de las Naciones Unidas, los Términos de servicio de Apple y los Principios que alientan la consideración de perspectivas no occidentales.

Anthropic ha propuesto un nuevo enfoque para entrenar modelos de chat usando 'IA constitucional'. Este método se basa OpenAI, aprendizaje reforzado de la retroalimentación humana, pero se basa en ella al evitar la necesidad de escribir muestras de capacitación profunda. En cambio, el modelo está entrenado para responder a la entrada mediante el uso de una constitución que debe actuar como un conjunto de leyes para que el modelo siga.

Anthropic propone una 'IA contextual' para modelos de chat basada en 60 principios
antrópico.com
Recomendado: ex-OpenAI empleados fundaron Anthropic, un negocio que ha atraído más de $700 millones en financiamiento

A través de este método, la IA puede generar sus propias muestras de entrenamiento evaluando lo que ha dicho frente a su conjunto de principios legalmente aceptados. Esta técnica de ahorro de tiempo puede verse como Isaac Asimoves Leyes de robótica poner en práctica.

Los principios que forman la base del modelo son demasiado numerosos para discutirlos en detalle. Sin embargo, cubren muchos temas, como la moralidad, la aversión al riesgo, la economía y la inteligencia artificial. Cada uno ha sido desarrollado para ayudar a guiar las decisiones de la IA cuando se trata de responder a indicaciones conversacionales.

Anthropic ha logrado entrenar efectivamente a un modelo de IA llamado Claude, que compite con éxito con OpenAI, ChatGPT. Utilizando el Método Constitución-IA, Claude podía responder a indicaciones conversacionales con un nivel impresionante de precisión, pero se esperan mejoras adicionales a medida que Anthropic continúa desarrollando esta tecnología revolucionaria.

Usando el conjunto de principios y algunos ejemplos de procesos, se le enseña al modelo cómo evaluar y revisar sus propias respuestas a lo largo de la primera fase. La segunda etapa consiste en entrenar un modelo mediante el aprendizaje por refuerzo, pero en lugar de utilizar la información de los humanos, utiliza la retroalimentación generada por IA basada en un conjunto de principios para seleccionar la salida más benigna.

De hecho, este nuevo enfoque tiene el potencial de ahorrar tiempo y dinero a las empresas que ya no necesitarán construir sus propias muestras de capacitación. Más bien, este método 'prefabricado' se puede utilizar como base para crear modelos personalizados, sin necesidad de conocimientos de programación. También es importante tener en cuenta cómo esta tecnología también promete aumentar la seguridad cuando se trata de bots conversacionales. Crear un conjunto de principios legalmente aceptados mitiga el riesgo de la IA volviéndose rebelde.

Por lo tanto, Constitución AI no solo promete hacer que el desarrollo del modelo de chat sea más fácil y rápido, sino que también lo hará más seguro. Una situación de ganar-ganar tanto para el mundo de la Inteligencia Artificial como para los ChatBots.

Una mirada analítica a la "IA contextual" de Anthropic para chatbots

La IA contextual de Anthropic se basa en la incorporación de más de 60 principios derivados de la Declaración de derechos humanos de las Naciones Unidas, los Términos de servicio de Apple, los Principios que alientan la consideración de perspectivas no occidentales, de mente profunda Sparrow Rules y Anthropic Research Set 1 y Set 2.

El hecho de que ahora se pueda enseñar a la IA a comportarse de acuerdo con principios derivados de una gama tan amplia y diversa de fuentes es realmente notable. Al incorporar principios de la Declaración de Derechos Humanos de las Naciones Unidas, por ejemplo, las respuestas de los chatbots ahora reflejan la importancia de preservar la noción de libertad, igualdad y hermandad. Estos principios son un componente vital para garantizar que conversaciones de chatbots ser ético y respetuoso. Asimismo, la incorporación de los Términos de Servicio de Apple asegura la chatterbot considera los intereses de privacidad de sus usuarios.

Los principios que fomentan la consideración de las perspectivas no occidentales también juegan un papel importante en el modelo de "IA contextual". Estos principios reflejan la necesidad de que la IA sea respetuosa con otras culturas y garantice que las respuestas de los chatbots no se perciban como dañinas u ofensivas. De manera similar, las Reglas Sparrow de Deepmind dictan que el chatbot responde con respuestas destinadas a construir una relación con el usuario.

La incorporación de Anthropic Research Set 1 y Set 2 proporciona la garantía final de que las conversaciones de IA siguen siendo civilizadas y respetuosas. La IA está capacitada para garantizar que responda las preguntas de manera atenta y cortés.

Con todo, el modelo de "IA contextual" de Anthropic es un avance increíblemente importante en el campo de la Investigación de IA. Al permitir que la IA se enseñe de acuerdo con los principios derivados de una gama tan diversa de fuentes, las implicaciones éticas de las conversaciones automatizadas mejoran considerablemente.

Lea más sobre la IA:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Crece el apetito institucional por los ETF de Bitcoin en medio de la volatilidad

Las divulgaciones a través de presentaciones 13F revelan que notables inversores institucionales incursionan en los ETF de Bitcoin, lo que subraya una creciente aceptación de...

Para saber más

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Injective une fuerzas con AltLayer para llevar la seguridad de recuperación a inEVM
Empresa Informe de noticias Tecnología
Injective une fuerzas con AltLayer para llevar la seguridad de recuperación a inEVM
3 de mayo de 2024
Masa se asocia con Teller para presentar el fondo de préstamos MASA y permite pedir prestado al USDC en base
Industrias Informe de noticias Tecnología
Masa se asocia con Teller para presentar el fondo de préstamos MASA y permite pedir prestado al USDC en base
3 de mayo de 2024
Velodrome lanza la versión Beta de Superchain en las próximas semanas y se expande a través de las cadenas de bloques OP Stack Layer 2
Industrias Informe de noticias Tecnología
Velodrome lanza la versión Beta de Superchain en las próximas semanas y se expande a través de las cadenas de bloques OP Stack Layer 2
3 de mayo de 2024
CARV anuncia asociación con Aethir para descentralizar su capa de datos y distribuir recompensas
Empresa Informe de noticias Tecnología
CARV anuncia asociación con Aethir para descentralizar su capa de datos y distribuir recompensas
3 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.