MusicLM: um novo modelo de IA de texto para música e imagem para música do Google
Em Breve
O Google apresenta o MusicLM, um modelo para gerar música de alta fidelidade a partir de descrições de texto.
O MusicLM pode ser condicionado tanto a um texto quanto a uma melodia, pois pode transformar melodias assobiadas e sussurradas de acordo com o estilo descrito em uma legenda de texto.
O modelo pode gerar música em uma variedade de gêneros, incluindo clássico, jazz e rock.
O Google apresenta o MusicLM, um modelo para gerar música de alta fidelidade a partir de descrições de texto como “uma melodia calmante de violino apoiada por um riff de guitarra distorcido”. O MusicLM lança o processo de geração condicional de música como uma tarefa de modelagem hierárquica de sequência a sequência e gera música a 24 kHz que permanece consistente por vários minutos.
Os experimentos do Google mostram que o MusicLM supera os sistemas anteriores, tanto em qualidade de áudio quanto em aderência à descrição do texto. Além disso, demonstra que o MusicLM pode ser condicionado tanto a um texto quanto a uma melodia, na medida em que pode transformar melodias assobiadas e sussurradas de acordo com o estilo descrito em uma legenda de texto. Para dar suporte a pesquisas futuras, lançamos publicamente o MusicCaps, um conjunto de dados composto por 5.5 mil pares de música e texto com descrições em rich text fornecidas por especialistas humanos.
Artigo relacionado: Text-to-3D: Google desenvolveu uma rede neural que gera modelos 3D a partir de descrições de texto |
O modelo MusicLM foi treinado em um grande corpus de partituras musicais, o que permitiu à IA aprender a estrutura da música. O modelo pode gerar música em uma variedade de gêneros, incluindo clássico, jazz e rock. Além disso, o modelo de IA pode criar composições novas e originais.
O modelo MusicLM é um desenvolvimento importante no campo da música gerada por IA. O modelo representa um avanço significativo em relação aos modelos anteriores, que se limitavam a trechos musicais mais curtos ou apenas capazes de gerar melodias simples. O novo modelo abre a possibilidade de usar IA para gerar músicas longas e complexas, que podem ser usadas em filmes, videogames ou outras mídias.
O novo modelo AI pode gerar música longa gerações de até cinco minutos.
Artigo relacionado: Stable Diffusion pode criar novas músicas gerando espectrogramas baseados em texto |
O modelo AI pode criar música usando legendas de jogos e filmes.
Além disso, o modelo AI pode gerar música usando imagens como entrada.
Leia mais sobre IA na indústria da música:
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.
Mais artigosDamir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.