Sábado, Junio 20, 2023

AlphaZero de DeepMind aprende algoritmos de clasificación eficientes en la optimización de redes neuronales

Publicado: 20 de junio de 2023 a las 2:50 am Actualizado: 20 de junio de 2023 a las 2:50 am

Editado y verificado: 20 de junio de 2023 a las 2:50 am

En Resumen

AlphaZero de DeepMind aprende algoritmos de clasificación eficientes jugando un juego de clasificación utilizando técnicas de aprendizaje por refuerzo.

DeepMind una vez más ha hecho un avance en el aprendizaje automático. Tras su éxito en el uso del aprendizaje por refuerzo (RL) para enseñar a AlphaZero de manera más eficiente algoritmos de multiplicación de matrices, ahora han centrado su atención en algoritmos de clasificacióncon resultados prometedores

AlphaZero de DeepMind aprende algoritmos de clasificación eficientes en la optimización de redes neuronales — menteprofunda.com

La clasificación es una operación fundamental utilizada en numerosos programas informáticos. La eficiencia de la clasificación de matrices, realizando la tarea en el menor número de operaciones posible, tiene una gran importancia. Tradicionalmente, los investigadores han ideado varios algoritmos de clasificación eficientes para diferentes escenarios en función del tamaño de las matrices y las características de los datos. Sin embargo, DeepMind decidió explorar un enfoque novedoso: enseñar un red neural para resolver este problema.

Para lograr esto, DeepMind introdujo la tarea de clasificar una matriz como un juego en AlphaZero. A través de técnicas de RL, entrenaron a AlphaZero para jugar este juego de clasificación. El modelo resultante, conocido como AlphaDev, mostró capacidades notables en el aprendizaje de algoritmos de clasificación eficientes.

El juego de clasificación opera representando el estado del entorno como un par, donde P denota el algoritmo de clasificación actual generado en lenguaje ensamblador y Z representa el estado de la memoria y los registros. En cada paso de tiempo, el agente AlphaZero toma el estado actual como entrada y realiza una acción, que implica agregar una nueva instrucción al algoritmo del lenguaje ensamblador, como mov.

Paso a paso, AlphaZero construye el algoritmo de clasificación final en lenguaje ensamblador. La recompensa del modelo en cada paso está determinada por dos factores: la corrección del algoritmo obtenido y su latencia. La corrección se evalúa basándose en predefipares de entrada-salida, donde la entrada representa una matriz sin ordenar y la salida representa la misma matriz pero ordenada.

El proceso de generar el algoritmo de clasificación continúa durante un número predeterminado de pasos. Si no se obtiene un algoritmo de trabajo final dentro de este plazo, el proceso de generación comienza de nuevo.

El modelo entrenado se encargó de producir algoritmos de clasificación para secuencias de longitud 3, 4 y 5. Vale la pena señalar que hay dos tipos de algoritmos de clasificación: clasificación fija, que clasifica matrices de una longitud específica y clasificación variable, que puede manejar matrices de diferentes longitudes. En ambos casos, AlphaZero superó los algoritmos existentes comúnmente utilizados en los programas. AlphaZero logró mejoras en la clasificación de matrices de longitud 3 y 5 para clasificación fija, y descubrió un enfoque intrigante para clasificar matrices de longitud 4 para clasificación variable.

Para una comprensión más completa de los algoritmos de clasificación descubiertos por AlphaDev, consulte el artículo de Nature titulado "AlphaDev: AlphaZero's Journey into Efficient Sorting Algorithms".

Lea más sobre la IA:

Tags:

Aviso

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.

Más artículos

Damir Yalalov

Hot Stories

La Comisión de Valores de Hong Kong advierte sobre estafas deepfake dirigidas a la criptoindustria: implicaciones para la seguridad de los inversores

by Viktoriia Palchik

14 de mayo de 2024

Ripple y Evmos colaboran en el desarrollo de la cadena lateral EVM de XRP Ledger con tecnología EvmOS

by alisa davidson

14 de mayo de 2024

5ireChain inicia el incentivo 'Testnet Thunder: GA' para pruebas de estrés de la red e invita a los usuarios a participar Airdrop Recompensas

by alisa davidson

14 de mayo de 2024

Acumula socios con Uphold para facilitar el comercio y las transferencias de activos sin problemas, reforzando la adopción de Bitcoin

by alisa davidson

14 de mayo de 2024

Últimas Noticias

Ripple y Evmos colaboran en el desarrollo de la cadena lateral EVM de XRP Ledger con tecnología EvmOS

by alisa davidson

14 de mayo de 2024

5ireChain inicia el incentivo 'Testnet Thunder: GA' para pruebas de estrés de la red e invita a los usuarios a participar Airdrop Recompensas

by alisa davidson

14 de mayo de 2024

Acumula socios con Uphold para facilitar el comercio y las transferencias de activos sin problemas, reforzando la adopción de Bitcoin

by alisa davidson

14 de mayo de 2024

Se sospecha que la cuenta X de Bitlayer está bajo ataque, se recomienda a los usuarios que tengan cuidado con los enlaces de phishing

by alisa davidson

14 de mayo de 2024

De Ripple a The Big Green DAO: cómo los proyectos de criptomonedas contribuyen a la caridad

Exploremos iniciativas que aprovechen el potencial de las monedas digitales para causas benéficas.

Para saber más

AlphaFold 3, Med-Gemini y otros: la forma en que la IA transformará la atención médica en 2024

La IA se manifiesta de varias maneras en la atención médica, desde descubrir nuevas correlaciones genéticas hasta potenciar sistemas quirúrgicos robóticos...

Para saber más

Únase a nuestra comunidad tecnológica innovadora