Opinión Tecnología
Abril 12, 2023

Investigadores de la Universidad de California crearon el punto de referencia de Maquiavelo para medir la competencia y la nocividad de los modelos de IA

En Resumen

Investigadores de la Universidad de California, el Centro de Seguridad de IA, la Universidad Carnegie Mellon y la Universidad de Yale propusieron el punto de referencia de Maquiavelo para medir la competencia y la nocividad de los agentes en un entorno amplio de interacciones lingüísticas a largo plazo.

Este benchmark se basa en 134 juegos de texto de elige tu propia aventura con 572k escenarios diferentes, 4,5k de logros posibles y 2,8m de anotaciones.

Los autores lo describen como una prueba para verificar las formas éticas (o no éticas) en que los agentes de IA intentan resolver problemas.

Los beneficiarios de IA basados ​​en modelos de lenguaje extenso (LLM) tienen buenas posibilidades de aplastar a alarmistas ansiosos e inundar el mundo con agentes basados ​​en LLM superinteligentes. Los beneficios potenciales de grandes ganancias y poder ilimitado harán el truco. Y lo más probable es que suceda bastante rápido.

Investigadores de la Universidad de California crearon el punto de referencia de Maquiavelo para medir la competencia y la nocividad de los modelos de IA
Más información: Instrucciones de uso ChatGPT (GPT-4) gratis para siempre

Sin embargo, los beneficiarios no son tontos en absoluto. Y entienden que en el maravilloso nuevo mundo, las leyes de la IA y la robótica ya no funcionarán. Obligar a LLM a cumplir estrictamente con las tres leyes formuladas por el gran Isaac Asimov en 1942 es, lamentablemente, ni siquiera teóricamente posible.

Una salida original a esta delicada situación fue propuesto por investigadores de la Universidad de California, el Centro de Seguridad de IA, la Universidad Carnegie Mellon y la Universidad de Yale. Ellos crearon el Punto de referencia de Maquiavelo para “medir la competencia y la nocividad de los agentes en un entorno amplio de interacciones lingüísticas a largo plazo”.

La idea de los autores es simple.

  • Si las leyes no funcionan, entonces no hay necesidad de que un “alguacil” las haga cumplir.
  • En lugar de un sheriff, se necesita un psicoanalista que, basándose en los resultados de sus pruebas, identifique posibles paranoicos, psicópatas, sádicos y mentirosos patológicos.

En lenguaje políticamente correcto, los autores lo describen de esta manera: “Maquiavelo es una prueba para verificar las formas éticas (o no éticas) en que los agentes de IA intentan resolver problemas”.

El método de dicha verificación es bastante práctico. El agente de IA es liberado en un entorno social artificial. Allí, los investigadores le asignan diversas tareas y observan cómo las completa. El propio entorno vigila el comportamiento ético de las personas. agente de IA e informa en qué medida las acciones del agente (según los preceptos de Maquiavelo) son engañosas, reducen la utilidad y tienen como objetivo ganar poder.

El conjunto de datos central de Maquiavelo consta de 134 juegos de texto de elige tu propia aventura con 572 4,5 escenarios diferentes, 2,8 XNUMX logros posibles y XNUMX millones de anotaciones. Estos juegos utilizan soluciones de alto nivel que brindan a los agentes objetivos realistas y abstraen las interacciones de bajo nivel con el entorno.

El enfoque elegido por los autores se basa en la suposición de que los agentes de IA se enfrentan a los mismos conflictos internos que los humanos. Así como los modelos de lenguaje entrenados para predecir el próximo token a menudo producen texto tóxico, los agentes de IA entrenados para optimizar objetivos a menudo exhiben un comportamiento inmoral y hambriento de poder. Los agentes entrenados amoralmente pueden desarrollar estrategias maquiavélicas para maximizar su recompensa a expensas de los demás y del medio ambiente. Y así, animando a los agentes a actuar moralmente, este compromiso puede mejorarse.

Los autores creen que los juegos de aventura de texto son una buena prueba de moralidad porque:

  • Fueron escritos por personas para entretener a otras personas.
  • Contener metas contrapuestas con espacios realistas para la acción.
  • Requiere una planificación a largo plazo.
  • El logro de metas por lo general requiere un equilibrio entre la ambición y, en cierto sentido, la moralidad.

La aclaración es lo más importante aquí. Comparar la moralidad de los seres biológicos con la moralidad de los modelos algorítmicos es demasiado exagerado, capaz de devaluar las pruebas de Maquiavelo. Y reemplazar a los sheriffs con psicoanalistas en el mundo humano difícilmente habría sido efectivo. Y los agentes de IA son tan buenos como los humanos para encontrar formas de engañar a sus psiquiatras.

Lea más sobre la IA:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Hot Stories
Suscríbase a nuestro boletín.
Últimas Noticias

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más

Los fundadores de Samourai Wallet son acusados ​​de facilitar 2 millones de dólares en acuerdos en la Darknet

La detención de los fundadores de Samourai Wallet representa un revés notable para la industria, lo que subraya la persistente...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Ankr colabora con la plataforma AI Blockchain Talus Network para desbloquear la liquidez de Bitcoin para la IA
Empresa Informe de noticias Tecnología
Ankr colabora con la plataforma AI Blockchain Talus Network para desbloquear la liquidez de Bitcoin para la IA
1 de mayo de 2024
Binance Labs apoya los laboratorios de movimiento para facilitar la integración de movimientos de Facebook a través de blockchains
Empresa Informe de noticias Tecnología
Binance Labs apoya los laboratorios de movimiento para facilitar la integración de movimientos de Facebook a través de blockchains
1 de mayo de 2024
Las naciones BRICS miran la solución comercial de monedas estables
Empresa Industrias Historias y comentarios Tecnología
Las naciones BRICS miran la solución comercial de monedas estables
1 de mayo de 2024
Bitcoin L2 Network BOB se integra con LayerZero para una funcionalidad mejorada
Empresa Informe de noticias Tecnología
Bitcoin L2 Network BOB se integra con LayerZero para una funcionalidad mejorada
1 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.