Relatório de notícias Equipar
08 de janeiro de 2023

VALL-E: O novo modelo de conversão de texto em voz zero da Microsoft pode duplicar a voz de todos em três segundos

Em Breve

Com apenas uma amostra de três segundos de qualquer voz, o modelo TTS baseado em transformador VALL-E pode produzir fala em todas as vozes.

Este é um avanço significativo na direção de sistemas TTS com som mais natural.

A Microsoft, no entanto, forneceu algumas amostras do modelo em uso e é evidente que isso representa um desenvolvimento significativo na tecnologia TTS.

Desde o lançamento do primeiro modelo de conversão de texto em fala (TTS), os pesquisadores têm procurado maneiras de melhorar a maneira como esses sistemas geram a fala. O modelo mais recente da Microsoft, VALE, é um avanço significativo nesse sentido.

O VALL-E é um modelo TTS baseado em transformador que pode gerar fala em qualquer voz depois de ouvir apenas uma amostra de três segundos dessa voz. Esta é uma melhoria significativa em relação aos modelos anteriores, que exigiam um período de treinamento muito mais longo para gerar uma nova voz.

O VALL-E é um feito tecnológico incrível que tem o potencial de mudar a forma como interagimos com a mídia digital.
Artigo relacionado: A Microsoft lançou um modelo de difusão que pode construir um avatar 3D a partir de uma única foto de uma pessoa

Além disso, a entonação, o carisma e o estilo da voz são mantidos intactos na fala gerada. Este é um passo importante para tornar os sistemas TTS mais naturais.

Este modelo é baseado em transformador e tem uma aparência Dale-1. Não confundir com o Dalle-2 baseado em difusão. O código ainda está faltando. E os usuários têm algum ceticismo de que irão publicá-lo.

Artigo relacionado: O VALL-E da Microsoft parece ser o software fraudulento mais perigoso de todos os tempos

No entanto, a Microsoft lançou alguns exemplos do modelo em ação e está claro que este é um grande avanço na tecnologia TTS.

Exemplo #1:

Exemplo #2:

Exemplo #3:

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Cresce apetite institucional por ETFs de Bitcoin em meio à volatilidade

As divulgações por meio de registros 13F revelam investidores institucionais notáveis ​​​​que se envolvem em ETFs Bitcoin, ressaltando uma aceitação crescente de ...

Saber Mais

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Morph apresenta sua rede de teste Holesky com integração zkEVM otimista, mecanismo de ponte e recursos de rede de sequenciador descentralizado
Relatório de notícias Equipar
Morph apresenta sua rede de teste Holesky com integração zkEVM otimista, mecanismo de ponte e recursos de rede de sequenciador descentralizado
6 de maio de 2024
Robinhood Crypto recebe aviso de poços da Comissão de Valores Mobiliários sobre supostas violações de títulos
Mercados Relatório de notícias Equipar
Robinhood Crypto recebe aviso de poços da Comissão de Valores Mobiliários sobre supostas violações de títulos
6 de maio de 2024
QuickSwap é implantado na rede principal X Layer e expande a rede Polygon CDK com o lançamento do Citadel
Relatório de notícias Equipar
QuickSwap é implantado na rede principal X Layer e expande a rede Polygon CDK com o lançamento do Citadel 
6 de maio de 2024
Camada 2 Network Linea inicia reivindicação de token ZERO da ZeroLend Airdrop Usuários e investidores
Mercados Relatório de notícias Equipar
Camada 2 Network Linea inicia reivindicação de token ZERO da ZeroLend Airdrop Usuários e investidores
6 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.