Informe de noticias Tecnología
Enero 08, 2023

VALL-E: el nuevo modelo de texto a voz zero-shot de Microsoft puede duplicar la voz de todos en tres segundos

En Resumen

Con sólo una muestra de tres segundos de cualquier voz, el modelo TTS basado en transformador VALL-E puede producir voz en cada voz.

Este es un avance significativo en la dirección de sistemas TTS con un sonido más natural.

Sin embargo, Microsoft ha proporcionado algunas muestras del modelo en uso y es evidente que esto representa un desarrollo significativo en la tecnología TTS.

Desde el lanzamiento del primer modelo de texto a voz (TTS), los investigadores han estado buscando formas de mejorar la forma en que estos sistemas generan voz. El último modelo de Microsoft, VALLE-E, es un importante paso adelante en este sentido.

VALL-E es un modelo TTS basado en un transformador que puede generar voz en cualquier voz después de escuchar solo una muestra de tres segundos de esa voz. Esta es una mejora significativa con respecto a los modelos anteriores, que requerían un período de entrenamiento mucho más largo para generar una nueva voz.

VALL-E es una hazaña tecnológica increíble que tiene el potencial de cambiar la forma en que interactuamos con los medios digitales.
Artículo relacionado: Microsoft ha lanzado un modelo de difusión que puede construir un avatar 3D a partir de una sola foto de una persona.

Además, la entonación, el carisma y el estilo de la voz se mantienen intactos en el discurso generado. Este es un importante paso adelante para hacer que los sistemas TTS suenen más naturales.

Este modelo está basado en un transformador y tiene una apariencia de Dale-1. No debe confundirse con el Dalle-2 basado en difusión. Aún falta el código. Y los usuarios tienen cierto escepticismo de que lo publiquen.

Artículo relacionado: VALL-E de Microsoft parece ser el software fraudulento más peligroso de la historia

Sin embargo, Microsoft ha publicado algunos ejemplos del modelo en acción y está claro que se trata de un gran avance en la tecnología TTS.

Ejemplo #1:

Ejemplo #2:

Ejemplo #3:

Lea más sobre la IA:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Hot Stories
Suscríbase a nuestro boletín.
Últimas Noticias

Crece el apetito institucional por los ETF de Bitcoin en medio de la volatilidad

Las divulgaciones a través de presentaciones 13F revelan que notables inversores institucionales incursionan en los ETF de Bitcoin, lo que subraya una creciente aceptación de...

Para saber más

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Advertencia final de Edward Snowden a los desarrolladores de Bitcoin: “Hagan de la privacidad una prioridad a nivel de protocolo o corren el riesgo de perderla
Industrias Seguridad Wiki Software Historias y comentarios Tecnología
Advertencia final de Edward Snowden a los desarrolladores de Bitcoin: “Hagan de la privacidad una prioridad a nivel de protocolo o corren el riesgo de perderla
10 de mayo de 2024
Mint Network Mint de capa 2 de Ethereum impulsada por el optimismo lanzará su red principal el 15 de mayo
Informe de noticias Tecnología
Mint Network Mint de capa 2 de Ethereum impulsada por el optimismo lanzará su red principal el 15 de mayo
10 de mayo de 2024
Las principales ofertas de esta semana, importantes inversiones en inteligencia artificial, TI, Web3y Cripto (06-10.04)
Digest Empresa Industrias Software Tecnología
Las principales ofertas de esta semana, importantes inversiones en inteligencia artificial, TI, Web3y Cripto (06-10.04)
10 de mayo de 2024
StaFi integra soporte para LRT de EigenLayer en su pila de participación líquida como servicio
Industrias Informe de noticias Tecnología
StaFi integra soporte para LRT de EigenLayer en su pila de participación líquida como servicio
10 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.