Novo modelo de IA sintetiza fala realista usando YouTube e podcasts
Em Breve
Pesquisadores da Universidade Carnegie Mellon criaram um novo modelo de inteligência artificial capaz de gerar fala realista aprendendo com vídeos do YouTube e podcasts.
O modelo foi capaz de aprender as nuances dos padrões de fala natural ouvindo quase 900 horas de conteúdo do YouTube e podcast, resultando em uma voz sintética mais realista e realista.
Pesquisadores da Carnegie Mellon University, nos Estados Unidos criaram um novo modelo de inteligência artificial capaz de gerar fala realista aprendendo com vídeos e podcasts do YouTube. O modelo é capaz de produzir fala em uma variedade de vozes e sotaques, tornando-se uma ferramenta potencialmente útil para setores como entretenimento e publicidade. Também pode ter implicações para aqueles que dependem de tecnologia assistiva para se comunicar.
Este é um desenvolvimento significativo, já que a maioria da fala gerada por IA foi considerada sem emoção e monótona devido ao fato de que geralmente é treinada em conjuntos de dados onde a fala de atores profissionais é gravada. A nova tecnologia pode ser usada para melhorar o desempenho de assistentes virtuais e chatbots, tornando-os mais envolventes e semelhantes aos humanos. Ele também tem aplicações potenciais em áreas como jogos, educação e entretenimento.
O novo modelo, no entanto, foi capaz de aprender as nuances dos padrões naturais da fala, como pausas, interjeições e palavras parasitas, ouvindo quase 900 horas de conteúdo do YouTube e podcast. Isso resultou em uma voz sintética mais realista e realista, que foi avaliada em 3.89 em uma escala de cinco pontos por pessoas que foram solicitadas a avaliá-la. Isso é mais alto do que a pontuação média recebida por modelos de IA semelhantes (uma voz humana real marcou 4.01).
As aplicações potenciais dessa tecnologia são vastas e incluem ajudar pessoas com problemas de fala, melhorar os sistemas de navegação e criar assistentes virtuais com som mais natural.
- Podcast AI é o primeiro podcast produzido pela AI, apresentando uma paródia de Joe Rogan entrevistando Steve Jobs. Este podcast é feito inteiramente por algoritmos de computador AI. A IA foi treinada para o episódio de Steve Jobs usando sua biografia e qualquer gravação dele na Internet que pudesse descobrir. Isso permitiu que a IA recriasse fielmente sua personalidade.
Leia mais artigos relacionados:
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.
Mais artigosDamir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.