Relatório de notícias Equipar
08 de janeiro de 2023

VALL-E: O novo modelo de conversão de texto em voz zero da Microsoft pode duplicar a voz de todos em três segundos

Em Breve

Com apenas uma amostra de três segundos de qualquer voz, o modelo TTS baseado em transformador VALL-E pode produzir fala em todas as vozes.

Este é um avanço significativo na direção de sistemas TTS com som mais natural.

A Microsoft, no entanto, forneceu algumas amostras do modelo em uso e é evidente que isso representa um desenvolvimento significativo na tecnologia TTS.

Desde o lançamento do primeiro modelo de conversão de texto em fala (TTS), os pesquisadores têm procurado maneiras de melhorar a maneira como esses sistemas geram a fala. O modelo mais recente da Microsoft, VALE, é um avanço significativo nesse sentido.

O VALL-E é um modelo TTS baseado em transformador que pode gerar fala em qualquer voz depois de ouvir apenas uma amostra de três segundos dessa voz. Esta é uma melhoria significativa em relação aos modelos anteriores, que exigiam um período de treinamento muito mais longo para gerar uma nova voz.

O VALL-E é um feito tecnológico incrível que tem o potencial de mudar a forma como interagimos com a mídia digital.
Artigo relacionado: A Microsoft lançou um modelo de difusão que pode construir um avatar 3D a partir de uma única foto de uma pessoa

Além disso, a entonação, o carisma e o estilo da voz são mantidos intactos na fala gerada. Este é um passo importante para tornar os sistemas TTS mais naturais.

Este modelo é baseado em transformador e tem uma aparência Dale-1. Não confundir com o Dalle-2 baseado em difusão. O código ainda está faltando. E os usuários têm algum ceticismo de que irão publicá-lo.

Artigo relacionado: O VALL-E da Microsoft parece ser o software fraudulento mais perigoso de todos os tempos

No entanto, a Microsoft lançou alguns exemplos do modelo em ação e está claro que este é um grande avanço na tecnologia TTS.

Exemplo #1:

Exemplo #2:

Exemplo #3:

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais

Fundadores da Samourai Wallet acusados ​​de facilitar US$ 2 bilhões em negócios Darknet

A apreensão dos fundadores da Samourai Wallet representa um revés notável para a indústria, ressaltando a persistência ...

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Med-Gemini do Google preparado para dar uma vantagem inicial GPT-4 Com seu desempenho superior em saúde
AI Wiki Novidades Software Equipar
Med-Gemini do Google preparado para dar uma vantagem inicial GPT-4 Com seu desempenho superior em saúde
2 de maio de 2024
Wu Jiezhuang, membro do Conselho Legislativo de Hong Kong, sinaliza processo civil contra JPEX Crypto Exchange
O negócio Relatório de notícias Equipar
Wu Jiezhuang, membro do Conselho Legislativo de Hong Kong, sinaliza processo civil contra JPEX Crypto Exchange
2 de maio de 2024
AltLayer entra na segunda fase de sua iniciativa de piquetagem e apresenta o token reALT
Mercados Relatório de notícias Equipar
AltLayer entra na segunda fase de sua iniciativa de piquetagem e apresenta o token reALT
2 de maio de 2024
Rede BNB divulga relatório do primeiro trimestre de 1, destaca redução de 2024% em sua perda de valor, enquanto BSC TVL sobe 55.8%
Mercados Relatório de notícias Equipar
Rede BNB divulga relatório do primeiro trimestre de 1, destaca redução de 2024% em sua perda de valor, enquanto BSC TVL sobe 55.8%
2 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.