Informe de noticias SMW Tecnología
Sábado, Junio 19, 2023

Meta presenta Voicebox, herramienta de IA generativa de texto a voz

En Resumen

Voicebox, la última innovación de Meta, es un revolucionario texto a voz herramienta de IA generativa que transforma el texto escrito en un discurso realista.

Con capacidades comparables a modelos de renombre como ChatGPT y Dall-E, Voicebox puede realizar varias tareas de generación de voz, como edición de contenido, muestreo, conversión de estilo, eliminación de ruido, síntesis de texto a voz y transferencia de estilo entre idiomas.

Voicebox aún no está disponible públicamente.

Caja de voz es el avance de Meta en la inteligencia artificial del habla generativa, que transforma el texto en un habla realista y expresiva. La herramienta AI, que funciona de manera similar a ChatGPT o Dall-E, es un modelo avanzado de IA capaz de realizar tareas de generación de voz como edición de contenido, muestreo y conversión de estilo, incluso sin formación específica, gracias al aprendizaje en contexto. 

Meta presenta Voicebox, herramienta de IA generativa de texto a voz

Se diferencia de otros modelos de texto a voz al sobresalir en varias tareas, como la eliminación de ruido, la síntesis de texto a voz y la transferencia de estilo entre idiomas, superando los límites de la generación de voz sintética. Voicebox también supera a los modelos actuales en velocidad, operando a un ritmo 20 veces más rápido.

Voicebox se sometió a una amplia capacitación utilizando un conjunto de datos que comprende más de 50,000 XNUMX horas de audio sin filtrar. El modelo de IA se entrenó con la técnica innovadora de "Flow Matching" de Meta, una alternativa versátil a los métodos de aprendizaje basados ​​en la difusión empleados por otros modelos generativos. 

El conjunto de datos de entrenamiento de Meta incluye voz grabada y transcripciones de audiolibros de dominio público en varios idiomas, como inglés, francés, español, alemán, polaco y portugués.

Según Mark Zuckerberg, Voicebox es "el primer modelo generativo de voz de IA que puede realizar tareas para las que no fue entrenado específicamente".

Fuente: Mark Zuckerberg

En el futuro, Voicebox y modelos de IA similares pueden proporcionar voces de sonido natural para asistentes virtuales y personajes que no sean jugadores en el metaverso. También pueden permitir que las personas con discapacidades visuales escuchen mensajes escritos en voces familiares a través de IA y ofrecer a los creadores herramientas sencillas para edición de pistas de audio en vídeos

Voicebox y los peligros de los deepfakes

Sin embargo, Voicebox podría plantear algunos desafíos éticos y sociales, especialmente en el contexto de las falsificaciones profundas. Deepfakes, creados por modelos de IA, son medios sintéticos que manipulan la voz de una persona, a menudo de manera maliciosa. Voicebox podría crear deepfakes convincentes que se hagan pasar por la voz de alguien o que digan cosas que nunca dijeron. Esto podría tener serias implicaciones para la privacidad, la seguridad y la confianza.

El presidente de Microsoft Brad Smith levantó preocupaciones el mes pasado sobre el daño causado por los deepfakes. Hizo hincapié en la necesidad de mecanismos para diferenciar entre material genuino y material generado por IA, particularmente en casos de intención maliciosa. Pidió responsabilidad y medidas de seguridad para mantener el control humano sobre la infraestructura crítica gobernada por sistemas de IA. Además, propuso un sistema donde los desarrolladores monitorean el uso y brindan transparencia para identificar videos manipulados, similar a un enfoque KYC.

Meta afirma que es consciente del daño potencial que Voicebox podría causar y que la empresa está trabajando en una forma eficaz de distinguir entre voz auténtica y audio generado por Voicebox. Si bien Voicebox aún está en desarrollo y actualmente no es accesible al público, Meta reconoce el potencial Riesgos asociados con la tecnología avanzada de IA..

Más información:

Aviso

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Agne es una periodista que cubre las últimas tendencias y desarrollos en metaverso, IA y Web3 industrias para la Metaverse Post. Su pasión por contar historias la ha llevado a realizar numerosas entrevistas con expertos en estos campos, buscando siempre descubrir historias apasionantes y atrapantes. Agne tiene una licenciatura en literatura y tiene una amplia experiencia escribiendo sobre una amplia gama de temas, incluidos viajes, arte y cultura. También se ofreció como editora voluntaria de la organización de derechos de los animales, donde ayudó a crear conciencia sobre cuestiones de bienestar animal. Contáctala en [email protected].

Más artículos
Agne Cimerman
Agne Cimerman

Agne es una periodista que cubre las últimas tendencias y desarrollos en metaverso, IA y Web3 industrias para la Metaverse Post. Su pasión por contar historias la ha llevado a realizar numerosas entrevistas con expertos en estos campos, buscando siempre descubrir historias apasionantes y atrapantes. Agne tiene una licenciatura en literatura y tiene una amplia experiencia escribiendo sobre una amplia gama de temas, incluidos viajes, arte y cultura. También se ofreció como editora voluntaria de la organización de derechos de los animales, donde ayudó a crear conciencia sobre cuestiones de bienestar animal. Contáctala en [email protected].

Hot Stories
Suscríbase a nuestro boletín.
Últimas Noticias

De Ripple a The Big Green DAO: cómo los proyectos de criptomonedas contribuyen a la caridad

Exploremos iniciativas que aprovechen el potencial de las monedas digitales para causas benéficas.

Para saber más

AlphaFold 3, Med-Gemini y otros: la forma en que la IA transformará la atención médica en 2024

La IA se manifiesta de varias maneras en la atención médica, desde descubrir nuevas correlaciones genéticas hasta potenciar sistemas quirúrgicos robóticos...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Las 10 mejores herramientas de inteligencia artificial gratuitas para creación de contenido, edición de video y más
AI Wiki Digest Educación Estilo de vida Software Tecnología
Las 10 mejores herramientas de inteligencia artificial gratuitas para creación de contenido, edición de video y más
14 de mayo de 2024
La Comisión de Valores de Hong Kong advierte sobre estafas deepfake dirigidas a la criptoindustria: implicaciones para la seguridad de los inversores
Estilo de vida Seguridad Wiki Software Historias y comentarios Tecnología
La Comisión de Valores de Hong Kong advierte sobre estafas deepfake dirigidas a la criptoindustria: implicaciones para la seguridad de los inversores
14 de mayo de 2024
Ripple y Evmos colaboran en el desarrollo de la cadena lateral EVM de XRP Ledger con tecnología EvmOS
Empresa Informe de noticias Tecnología
Ripple y Evmos colaboran en el desarrollo de la cadena lateral EVM de XRP Ledger con tecnología EvmOS
14 de mayo de 2024
5ireChain inicia el incentivo 'Testnet Thunder: GA' para pruebas de estrés de la red e invita a los usuarios a participar Airdrop Recompensas
Informe de noticias Tecnología
5ireChain inicia el incentivo 'Testnet Thunder: GA' para pruebas de estrés de la red e invita a los usuarios a participar Airdrop Recompensas
14 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.