Informe de noticias Tecnología
Enero 31, 2023

MusicLM: un nuevo modelo de IA de texto a música e imagen a música de Google

En Resumen

Google presenta MusicLM, un modelo para generar música de alta fidelidad a partir de descripciones de texto.

MusicLM se puede condicionar tanto en texto como en melodía, ya que puede transformar melodías silbadas y tarareadas de acuerdo con el estilo descrito en una leyenda de texto.

El modelo puede generar musica en una variedad de géneros, incluidos clásico, jazz y rock.

Google presenta MusicLM, un modelo para generar música de alta fidelidad a partir de descripciones de texto como "una melodía relajante de violín respaldada por un riff de guitarra distorsionado". MusicLM proyecta el proceso de generación de música condicional como una tarea de modelado jerárquico de secuencia a secuencia, y genera música a 24 kHz que se mantiene constante durante varios minutos.

MusicLM: un nuevo modelo de IA de texto a música e imagen a música de Google

Los experimentos de Google muestran que MusicLM supera a los sistemas anteriores, tanto en calidad de audio como en adherencia a la descripción del texto. Además, demuestra que MusicLM se puede condicionar tanto en texto como en melodía, ya que puede transformar melodías silbadas y tarareadas de acuerdo con el estilo descrito en una leyenda de texto. Para respaldar futuras investigaciones, publicamos MusicCaps, un conjunto de datos compuesto por 5.5 pares de música y texto con descripciones de texto enriquecido proporcionadas por expertos humanos.

Artículo relacionado: Text-to-3D: Google ha desarrollado una red neuronal que genera modelos 3D a partir de descripciones de texto

El modelo MusicLM se ha entrenado en un gran corpus de partituras musicales, lo que ha permitido a la IA aprender la estructura de la música. El modelo puede generar musica en una variedad de géneros, incluidos clásico, jazz y rock. Además, el modelo de IA puede crear composiciones nuevas y originales.

El modelo MusicLM es un desarrollo importante en el campo de la música generada por IA. El modelo representa un avance significativo con respecto a los modelos anteriores, que se limitaban a piezas musicales más cortas o solo capaces de generar melodías simples. El nuevo modelo abre la posibilidad de usar IA para generar piezas musicales largas y complejas, que podrían usarse en películas, videojuegos u otros medios.

El nuevo modelo de IA puede generar música larga generaciones de hasta cinco minutos.

Artículo relacionado: Stable Diffusion puede crear nueva música generando espectrogramas basados ​​en texto

El modelo de IA puede crear música usando subtítulos de juegos y películas.

Además, el modelo de IA puede generar música utilizando imágenes como entrada.

Lea más sobre la IA en la industria de la música:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Hot Stories
Suscríbase a nuestro boletín.
Últimas Noticias

Crece el apetito institucional por los ETF de Bitcoin en medio de la volatilidad

Las divulgaciones a través de presentaciones 13F revelan que notables inversores institucionales incursionan en los ETF de Bitcoin, lo que subraya una creciente aceptación de...

Para saber más

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Mint Network Mint de capa 2 de Ethereum impulsada por el optimismo lanzará su red principal el 15 de mayo
Informe de noticias Tecnología
Mint Network Mint de capa 2 de Ethereum impulsada por el optimismo lanzará su red principal el 15 de mayo
10 de mayo de 2024
Las principales ofertas de esta semana, importantes inversiones en inteligencia artificial, TI, Web3y Cripto (06-10.04)
Digest Empresa Industrias Software Tecnología
Las principales ofertas de esta semana, importantes inversiones en inteligencia artificial, TI, Web3y Cripto (06-10.04)
10 de mayo de 2024
StaFi integra soporte para LRT de EigenLayer en su pila de participación líquida como servicio
Industrias Informe de noticias Tecnología
StaFi integra soporte para LRT de EigenLayer en su pila de participación líquida como servicio
10 de mayo de 2024
Las direcciones activas de Bitcoin se desploman al mínimo de cuatro años y se prevé que alcancen solo 1.3 millones en el ciclo actual, revela criptoanalista de Bloomberg
Industrias Informe de noticias Tecnología
Las direcciones activas de Bitcoin se desploman al mínimo de cuatro años y se prevé que alcancen solo 1.3 millones en el ciclo actual, revela criptoanalista de Bloomberg
10 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.