MusicLM: un nuevo modelo de IA de texto a música e imagen a música de Google
En Resumen
Google presenta MusicLM, un modelo para generar música de alta fidelidad a partir de descripciones de texto.
MusicLM se puede condicionar tanto en texto como en melodía, ya que puede transformar melodías silbadas y tarareadas de acuerdo con el estilo descrito en una leyenda de texto.
El modelo puede generar musica en una variedad de géneros, incluidos clásico, jazz y rock.
Google presenta MusicLM, un modelo para generar música de alta fidelidad a partir de descripciones de texto como "una melodía relajante de violín respaldada por un riff de guitarra distorsionado". MusicLM proyecta el proceso de generación de música condicional como una tarea de modelado jerárquico de secuencia a secuencia, y genera música a 24 kHz que se mantiene constante durante varios minutos.
Los experimentos de Google muestran que MusicLM supera a los sistemas anteriores, tanto en calidad de audio como en adherencia a la descripción del texto. Además, demuestra que MusicLM se puede condicionar tanto en texto como en melodía, ya que puede transformar melodías silbadas y tarareadas de acuerdo con el estilo descrito en una leyenda de texto. Para respaldar futuras investigaciones, publicamos MusicCaps, un conjunto de datos compuesto por 5.5 pares de música y texto con descripciones de texto enriquecido proporcionadas por expertos humanos.
Artículo relacionado: Text-to-3D: Google ha desarrollado una red neuronal que genera modelos 3D a partir de descripciones de texto |
El modelo MusicLM se ha entrenado en un gran corpus de partituras musicales, lo que ha permitido a la IA aprender la estructura de la música. El modelo puede generar musica en una variedad de géneros, incluidos clásico, jazz y rock. Además, el modelo de IA puede crear composiciones nuevas y originales.
El modelo MusicLM es un desarrollo importante en el campo de la música generada por IA. El modelo representa un avance significativo con respecto a los modelos anteriores, que se limitaban a piezas musicales más cortas o solo capaces de generar melodías simples. El nuevo modelo abre la posibilidad de usar IA para generar piezas musicales largas y complejas, que podrían usarse en películas, videojuegos u otros medios.
El nuevo modelo de IA puede generar música larga generaciones de hasta cinco minutos.
Artículo relacionado: Stable Diffusion puede crear nueva música generando espectrogramas basados en texto |
El modelo de IA puede crear música usando subtítulos de juegos y películas.
Además, el modelo de IA puede generar música utilizando imágenes como entrada.
Lea más sobre la IA en la industria de la música:
Observación
En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.
Sobre el Autor
Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.
Más artículosDamir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.