Relatório de notícias
21 de outubro de 2022

O Google AI anunciou o primeiro gerador de texto para música AudioLM

Em Breve

AudioLM pode produzir música apenas ouvindo sons

Mubert AI para continuar a fala humana e a música de piano

Com o GPT-3 e outros, a ideia de IA generativa tem boas chances de avançar. Também descobrimos os conceitos de pintura interna e externa; A IA completa habilmente as imagens, mantendo o tema e o estilo. E a música?

E mais uma vez! Como tudo isso é baseado em modelos de linguagem AI que retêm o significado, era apenas uma questão de tempo até que essa tecnologia fosse aplicada à música. E agora chegou a hora.

O Google AI anunciou o primeiro gerador de texto para música AudioLM

De acordo com pesquisas recentes do Google, uma nova estrutura para produção de áudio chamada AudioLM pode ser ensinada a criar fala realista e música de piano simplesmente ouvindo sons. Devido à sua consistência de longo prazo e excelente fidelidade, o AudioLM supera os sistemas anteriores e avança na criação de áudio com aplicações em síntese de voz e música assistida por computador.

Desenvolvemos um sistema para reconhecer sons sintéticos produzidos pelo AudioLM usando os mesmos conceitos de IA que sustentaram a criação de nossos modelos anteriores.

ÁudioLM do Google AI pode estender uma passagem acústica, mantendo a "intenção". A partir de agora, ele foi treinado para continuar a fala humana e a música de piano, com base em uma amostra limitada de dados de entrada. Verifique a amostra abaixo.

Os critérios para a fala eram diretos: os ouvintes foram solicitados a avaliar se a continuação soava como a fala humana. Com a música, descobriu-se que a “continuação” da seção fornecida para entrada é muito superior em qualidade a todos os geradores de música atuais do zero, como Juke-box. Com uma sugestão na entrada, a IA continua a música consideravelmente melhor.

O Google AI anunciou o primeiro gerador de texto para música AudioLM

Avaliadores humanos ouviram amostras de áudio para confirmar os resultados. Eles determinaram se estavam ouvindo uma continuação real de uma voz humana que havia sido gravada ou uma voz artificial produzida pelo AudioLM. Seus dados indicam uma taxa de sucesso de 51.2%. Como resultado, será um desafio para o ouvinte médio distinguir entre a fala produzida pelo AudioLM e a fala humana real.

A tecnologia de conversão de texto em música altera o negócio da música?

Um gerador de texto para música baseado no API Mubert foi anunciado recentemente por outro modelo de IA, Mubert. Mubert cria um conjunto diferente de sons para cada solicitação enviada. A probabilidade de uma repetição é muito pequena. A música é criada quando um pedido é feito; ele não é extraído de um banco de dados de músicas finalizadas. Quão verdadeiramente generativo esta música Essa é uma pergunta comum.

A tecnologia de conversão de texto em música altera o negócio da música?

Os sons são escolhidos antes de serem criados. Tanto o prompt de entrada quanto as tags Mubert API são codificados para um vetor de espaço latente da rede neural do transformador. O vetor de tags mais próximo para cada consulta é então escolhido e as tags que o acompanham são transmitidas para nossa API para criar música. Nenhuma rede neural foi usada para construir qualquer um dos sons (loops separados para baixo, leads, etc.); todos os sons foram produzidos por músicos e designers de som.

O próximo passo significativo de Mubert é pegar itens do mundo atual, como fotos, filmes, cenários e apresentações, e criar a música do mundo ao seu redor.

Aqui está o que você pode obter colocando imprudentemente prompts de texto na boca do musical Mubert AI:

Este é o estágio inicial no processo de construção de um algoritmo de geração mais sofisticado e preciso, mas isso levará tempo e dinheiro.

No entanto, a tecnologia de conversão de texto em música já está disponível, portanto, você pode gerar álbuns em massa trocando “prompt de entrada” por “escrever um script de prompt aleatório”. Parece que os artistas não são mais necessários.

Leia mais notícias relacionadas:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Cresce apetite institucional por ETFs de Bitcoin em meio à volatilidade

As divulgações por meio de registros 13F revelam investidores institucionais notáveis ​​​​que se envolvem em ETFs Bitcoin, ressaltando uma aceitação crescente de ...

Saber Mais

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Injective une forças com AltLayer para trazer segurança de restabelecimento para inEVM
O negócio Relatório de notícias Equipar
Injective une forças com AltLayer para trazer segurança de restabelecimento para inEVM
3 de maio de 2024
Masa se une ao Teller para introduzir o pool de empréstimos MASA, permitindo empréstimos em USDC na base
Mercados Relatório de notícias Equipar
Masa se une ao Teller para introduzir o pool de empréstimos MASA, permitindo empréstimos em USDC na base
3 de maio de 2024
Velodrome lança versão beta do Superchain nas próximas semanas e se expande para blockchains OP Stack Layer 2
Mercados Relatório de notícias Equipar
Velodrome lança versão beta do Superchain nas próximas semanas e se expande para blockchains OP Stack Layer 2
3 de maio de 2024
CARV anuncia parceria com Aethir para descentralizar sua camada de dados e distribuir recompensas
O negócio Relatório de notícias Equipar
CARV anuncia parceria com Aethir para descentralizar sua camada de dados e distribuir recompensas
3 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.