Informe de noticias Tecnología
Marzo 15, 2023

Nuevo modelo de IA sintetiza un discurso realista utilizando YouTube y podcasts

En Resumen

Investigadores de la Universidad Carnegie Mellon han creado un nuevo modelo de inteligencia artificial que es capaz de generar un discurso realista aprendiendo de vídeos de YouTube y podcasts.

El modelo pudo aprender los matices de los patrones naturales del habla al escuchar casi 900 horas de contenido de YouTube y podcasts, lo que resultó en una voz sintética más realista y real.

Investigadores de la Universidad Carnegie Mellon de EE.UU. Hemos creado un nuevo modelo de inteligencia artificial que puede generar un discurso realista aprendiendo de los videos y podcasts de YouTube. El modelo es capaz de producir voz en una variedad de voces y acentos, lo que lo convierte en una herramienta potencialmente útil para industrias como la del entretenimiento y la publicidad. También podría tener implicaciones para aquellos que dependen de la tecnología de asistencia para comunicarse.

Un nuevo modelo de IA está sintetizando un discurso realista usando YouTube y podcasts
El modelo de IA es capaz de imitar los patrones y entonaciones del habla humana con gran precisión.

Este es un avance significativo, ya que se ha descubierto que la mayoría del discurso generado por IA no tiene emociones y es monótono debido al hecho de que generalmente se entrena en conjuntos de datos donde se graba el discurso de actores profesionales. La nueva tecnología se puede utilizar para mejorar el rendimiento de los asistentes virtuales y los chatbots, haciéndolos más atractivos y parecidos a los humanos. También tiene aplicaciones potenciales en campos como los juegos, la educación y el entretenimiento.

Más información: Los 15 mejores criptopodcasts que debes escuchar en 2023

Sin embargo, el nuevo modelo pudo aprender los matices de los patrones naturales del habla, como pausas, interjecciones y palabras parásitas, al escuchar casi 900 horas de contenido de YouTube y podcasts. Esto dio como resultado una voz sintética más realista y real, que fue calificada con 3.89 en una escala de cinco puntos por personas a las que se les pidió que la evaluaran. Esto es más alto que el puntaje promedio recibido por modelos de IA similares (una voz humana real obtuvo un puntaje de 4.01).

Las aplicaciones potenciales de esta tecnología son amplias e incluyen ayudar a las personas con problemas del habla, mejorar los sistemas de navegación y crear asistentes virtuales con un sonido más natural.

  • PodcastAI es el primer podcast producido por AI, que presenta una parodia de Joe Rogan entrevistando a Steve Jobs. Este podcast está hecho en su totalidad por algoritmos informáticos de IA. La IA fue entrenada para el episodio de Steve Jobs utilizando tanto su biografía como cualquier grabación de Internet que pudiera descubrir. Esto permitió que la IA recreara fielmente su personalidad.

Leer más artículos relacionados:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

El frenesí de DOGE: análisis del reciente aumento de valor de Dogecoin (DOGE)

La industria de las criptomonedas se está expandiendo rápidamente y las monedas meme se están preparando para un repunte significativo. Dogecoin (DOGE),...

Para saber más

La evolución del contenido generado por IA en el metaverso

La aparición del contenido de IA generativa es uno de los desarrollos más fascinantes dentro del entorno virtual...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
OKX Jumpstart enumera Runecoin y permite apostar BTC para ganar tokens RUNE
Industrias Informe de noticias Tecnología
OKX Jumpstart enumera Runecoin y permite apostar BTC para ganar tokens RUNE
Abril 29, 2024
Las principales ofertas de esta semana, importantes inversiones en inteligencia artificial, TI, Web3y Cripto (22-26.04)
Digest Empresa Industrias Tecnología
Las principales ofertas de esta semana, importantes inversiones en inteligencia artificial, TI, Web3y Cripto (22-26.04)
Abril 26, 2024
Vitalik Buterin comenta sobre la centralización de PoW y señala que fue una etapa temporal hasta PoS
Informe de noticias Tecnología
Vitalik Buterin comenta sobre la centralización de PoW y señala que fue una etapa temporal hasta PoS
Abril 26, 2024
Offchain Labs revela el descubrimiento de dos vulnerabilidades críticas en las pruebas de fraude de OP Stack de Optimism
Informe de noticias Software Tecnología
Offchain Labs revela el descubrimiento de dos vulnerabilidades críticas en las pruebas de fraude de OP Stack de Optimism
Abril 26, 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.