ElevenLabs torna-se assustadoramente bom na arte de imitar vozes por IA
Em Breve
Redes neurais são o futuro da tecnologia, e a atualização mais recente do ElevenLabs Neuron permite que ele faça algo ainda mais impressionante: personifique a voz de qualquer pessoa.
O sintetizador foi lançado em versão beta no final de janeiro e, uma semana depois, a Internet foi inundada com falsificações de áudio com vozes de pessoas famosas.
ElevenLabs prometeu lidar com falsificações e reconstruir o algoritmo.
Algumas pessoas dizem que as redes neurais são o futuro. Eles podem fazer as coisas mais rápido que os humanos e até conseguir coisas que os humanos não podem. Mas e se eles pudessem fazer algo ainda mais impressionante, como representar a voz de alguém? Isso é o que a atualização mais recente do ElevenLabs Neuron permite fazer, e é praticamente a coisa mais legal de todas.
Postagem recomendada: Mais de 120 conteúdos gerados por IA em 2023: imagens, músicas, vídeos |
Se você sempre quis soar como Tony Stark ou Steve Jobs, agora você pode. Ou se você estiver se sentindo extremamente ambicioso, pode até se passar por Kim Kardashian. Tudo que você precisa é de uma amostra de um minuto da voz de alguém e a IA fará o resto. Então, se você quer impressionar seu amigos da sua celebridade impressões ou apenas quer se divertir experimentando vozes diferentes, com certeza será incrível.
Claro, alguns usuários beta começam a usá-lo em experimentos assustadores. Houve alguns relatos na comunidade dizendo algumas coisas bem assustadoras, como quando o bot foi solicitado a ler uma passagem de um dos Harry Potter livros na voz de Emma Watson, em vez disso, fornecia uma passagem de “Mein Kampf” lida pela estrela da franquia Harry Potter. Mas, no geral, é um feito tecnológico impressionante e só vai melhorar a partir daqui.
A ElevenLabs, uma startup, lançou o sintetizador em versão beta no final de janeiro. E uma semana depois, a Internet foi inundada com falsificações de áudio com as vozes de pessoas famosas: Joe Biden, Margot Robbie, Joe Rogan, George Lucas, Emma Watson e Tom Cruise. O fato é que amostras muito curtas de áudio ou vídeo são suficientes para o treinamento do serviço. E as vozes são reais! ElevenLabs prometeu lidar com falsificações e reconstruir o algoritmo. |
Postagem recomendada: 10 melhores ferramentas de marketing de IA para publicidade digital eficaz |
Então, se você está procurando impressionar seus amigos com suas impressões de celebridades ou apenas quer se divertir experimentando vozes diferentes, confira ElevenLabs Neuron. Com certeza será uma explosão.
- Em janeiro, a Microsoft anunciou Vale, um novo modelo de texto para fala zero-shot que pode duplicar a voz de todos. O VALL-E da Microsoft é um modelo TTS baseado em transformador que pode gerar fala em qualquer voz depois de ouvir apenas uma amostra de três segundos. Esta é uma melhoria significativa em relação aos modelos anteriores e tem o potencial de mudar a forma como interagimos com a mídia digital. Ainda falta o código, mas a Microsoft lançou exemplos do modelo em ação.
- Vall-E parece ser o software fraudulento mais perigoso já lançado. É uma voz sintética que pode ser usada para imitar pessoas reais e é feita a partir de uma gravação da voz de uma pessoa real e de um código Microsoft. A melhor parte é que são necessários apenas três segundos de fala para aprendizagem, ou mais precisamente, para microaprendizagem. Vall-E é perigoso porque pode ser usado para enganar pessoas vulneráveis para que transfiram fundos para um cartão, e os vigaristas podem usá-lo para se passar por alguém conhecido da vítima.
Leia mais sobre IA:
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.
Mais artigosDamir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.