Nuevo modelo de IA sintetiza un discurso realista utilizando YouTube y podcasts
En Resumen
Investigadores de la Universidad Carnegie Mellon han creado un nuevo modelo de inteligencia artificial que es capaz de generar un discurso realista aprendiendo de vídeos de YouTube y podcasts.
El modelo pudo aprender los matices de los patrones naturales del habla al escuchar casi 900 horas de contenido de YouTube y podcasts, lo que resultó en una voz sintética más realista y real.
Investigadores de la Universidad Carnegie Mellon de EE.UU. Hemos creado un nuevo modelo de inteligencia artificial que puede generar un discurso realista aprendiendo de los videos y podcasts de YouTube. El modelo es capaz de producir voz en una variedad de voces y acentos, lo que lo convierte en una herramienta potencialmente útil para industrias como la del entretenimiento y la publicidad. También podría tener implicaciones para aquellos que dependen de la tecnología de asistencia para comunicarse.
Este es un avance significativo, ya que se ha descubierto que la mayoría del discurso generado por IA no tiene emociones y es monótono debido al hecho de que generalmente se entrena en conjuntos de datos donde se graba el discurso de actores profesionales. La nueva tecnología se puede utilizar para mejorar el rendimiento de los asistentes virtuales y los chatbots, haciéndolos más atractivos y parecidos a los humanos. También tiene aplicaciones potenciales en campos como los juegos, la educación y el entretenimiento.
Más información: Los 15 mejores criptopodcasts que debes escuchar en 2023 |
Sin embargo, el nuevo modelo pudo aprender los matices de los patrones naturales del habla, como pausas, interjecciones y palabras parásitas, al escuchar casi 900 horas de contenido de YouTube y podcasts. Esto dio como resultado una voz sintética más realista y real, que fue calificada con 3.89 en una escala de cinco puntos por personas a las que se les pidió que la evaluaran. Esto es más alto que el puntaje promedio recibido por modelos de IA similares (una voz humana real obtuvo un puntaje de 4.01).
Las aplicaciones potenciales de esta tecnología son amplias e incluyen ayudar a las personas con problemas del habla, mejorar los sistemas de navegación y crear asistentes virtuales con un sonido más natural.
- PodcastAI es el primer podcast producido por AI, que presenta una parodia de Joe Rogan entrevistando a Steve Jobs. Este podcast está hecho en su totalidad por algoritmos informáticos de IA. La IA fue entrenada para el episodio de Steve Jobs utilizando tanto su biografía como cualquier grabación de Internet que pudiera descubrir. Esto permitió que la IA recreara fielmente su personalidad.
Leer más artículos relacionados:
Observación
En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.
Sobre el Autor
Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.
Más artículosDamir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.