O Google AI anunciou o primeiro gerador de texto para música AudioLM
Em Breve
AudioLM pode produzir música apenas ouvindo sons
Mubert AI para continuar a fala humana e a música de piano
Com o GPT-3 e outros, a ideia de IA generativa tem boas chances de avançar. Também descobrimos os conceitos de pintura interna e externa; A IA completa habilmente as imagens, mantendo o tema e o estilo. E a música?
E mais uma vez! Como tudo isso é baseado em modelos de linguagem AI que retêm o significado, era apenas uma questão de tempo até que essa tecnologia fosse aplicada à música. E agora chegou a hora.
De acordo com pesquisas recentes do Google, uma nova estrutura para produção de áudio chamada AudioLM pode ser ensinada a criar fala realista e música de piano simplesmente ouvindo sons. Devido à sua consistência de longo prazo e excelente fidelidade, o AudioLM supera os sistemas anteriores e avança na criação de áudio com aplicações em síntese de voz e música assistida por computador.
ÁudioLM do Google AI pode estender uma passagem acústica, mantendo a "intenção". A partir de agora, ele foi treinado para continuar a fala humana e a música de piano, com base em uma amostra limitada de dados de entrada. Verifique a amostra abaixo.
Os critérios para a fala eram diretos: os ouvintes foram solicitados a avaliar se a continuação soava como a fala humana. Com a música, descobriu-se que a “continuação” da seção fornecida para entrada é muito superior em qualidade a todos os geradores de música atuais do zero, como Juke-box. Com uma sugestão na entrada, a IA continua a música consideravelmente melhor.
Avaliadores humanos ouviram amostras de áudio para confirmar os resultados. Eles determinaram se estavam ouvindo uma continuação real de uma voz humana que havia sido gravada ou uma voz artificial produzida pelo AudioLM. Seus dados indicam uma taxa de sucesso de 51.2%. Como resultado, será um desafio para o ouvinte médio distinguir entre a fala produzida pelo AudioLM e a fala humana real.
A tecnologia de conversão de texto em música altera o negócio da música?
Um gerador de texto para música baseado no API Mubert foi anunciado recentemente por outro modelo de IA, Mubert. Mubert cria um conjunto diferente de sons para cada solicitação enviada. A probabilidade de uma repetição é muito pequena. A música é criada quando um pedido é feito; ele não é extraído de um banco de dados de músicas finalizadas. Quão verdadeiramente generativo esta música Essa é uma pergunta comum.
Os sons são escolhidos antes de serem criados. Tanto o prompt de entrada quanto as tags Mubert API são codificados para um vetor de espaço latente da rede neural do transformador. O vetor de tags mais próximo para cada consulta é então escolhido e as tags que o acompanham são transmitidas para nossa API para criar música. Nenhuma rede neural foi usada para construir qualquer um dos sons (loops separados para baixo, leads, etc.); todos os sons foram produzidos por músicos e designers de som.
O próximo passo significativo de Mubert é pegar itens do mundo atual, como fotos, filmes, cenários e apresentações, e criar a música do mundo ao seu redor.
Aqui está o que você pode obter colocando imprudentemente prompts de texto na boca do musical Mubert AI:
Este é o estágio inicial no processo de construção de um algoritmo de geração mais sofisticado e preciso, mas isso levará tempo e dinheiro.
No entanto, a tecnologia de conversão de texto em música já está disponível, portanto, você pode gerar álbuns em massa trocando “prompt de entrada” por “escrever um script de prompt aleatório”. Parece que os artistas não são mais necessários.
Leia mais notícias relacionadas:
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.
Mais artigosDamir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.