Rapport de nouvelles Technologie
08 janvier 2023

VALL-E : le nouveau modèle de synthèse vocale sans prise de vue de Microsoft peut dupliquer la voix de tout le monde en trois secondes

En bref

Avec seulement un échantillon de trois secondes de n'importe quelle voix, le modèle TTS basé sur un transformateur VALL-E peut produire la parole de chaque voix.

Il s'agit d'un progrès significatif dans la direction de systèmes TTS au son plus naturel.

Microsoft a cependant fourni quelques exemples du modèle utilisé, et il est évident que cela représente un développement significatif de la technologie TTS.

Depuis la sortie du premier modèle de synthèse vocale (TTS), les chercheurs ont cherché des moyens d'améliorer la façon dont ces systèmes génèrent la parole. Le dernier modèle de Microsoft, VALLÉE, constitue une avancée significative à cet égard.

VALL-E est un modèle TTS basé sur un transformateur qui peut générer de la parole dans n'importe quelle voix après seulement avoir entendu un échantillon de trois secondes de cette voix. Il s'agit d'une amélioration significative par rapport aux modèles précédents, qui nécessitaient une période de formation beaucoup plus longue afin de générer une nouvelle voix.

VALL-E est une prouesse technologique incroyable qui a le potentiel de changer la façon dont nous interagissons avec les médias numériques.
Article connexe: Microsoft a publié un modèle de diffusion capable de créer un avatar 3D à partir d'une seule photo d'une personne

De plus, l'intonation, le charisme et le style de la voix sont tous conservés intacts dans le discours généré. Il s'agit d'un pas en avant important pour rendre les systèmes TTS plus naturels.

Ce modèle est basé sur un transformateur et a une apparence Dale-1. À ne pas confondre avec le Dalle-2 basé sur la diffusion. Le code manque toujours. Et les utilisateurs ont un certain scepticisme quant à leur publication.

Article connexe: VALL-E de Microsoft semble être le logiciel d'escroquerie le plus dangereux de tous les temps

Cependant, Microsoft a publié quelques exemples du modèle en action, et il est clair qu'il s'agit d'une avancée majeure dans la technologie TTS.

Exemple #1:

Exemple #2:

Exemple #3:

En savoir plus sur l'IA :

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Plus d'articles
Damir Yalalov
Damir Yalalov

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus

Les fondateurs de Samourai Wallet accusés d'avoir facilité 2 milliards de dollars de transactions sur le Darknet

L'appréhension des fondateurs de Samourai Wallet représente un revers notable pour l'industrie, soulignant la persistance...

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Med-Gemini de Google s'apprête à donner une longueur d'avance à GPT-4 Avec ses performances supérieures dans le domaine de la santé
AI Wiki Actualité Logiciels Technologie
Med-Gemini de Google s'apprête à donner une longueur d'avance à GPT-4 Avec ses performances supérieures dans le domaine de la santé
2 mai 2024
Wu Jiezhuang, membre du Conseil législatif de Hong Kong, engage une action civile contre JPEX Crypto Exchange
La Brochure Rapport de nouvelles Technologie
Wu Jiezhuang, membre du Conseil législatif de Hong Kong, engage une action civile contre JPEX Crypto Exchange
2 mai 2024
AltLayer entre dans la deuxième phase de son initiative de jalonnement et présente le jeton reALT
Marchés Rapport de nouvelles Technologie
AltLayer entre dans la deuxième phase de son initiative de jalonnement et présente le jeton reALT
2 mai 2024
BNB Chain publie son rapport du premier trimestre 1 et met en évidence une réduction de 2024 % de sa perte de valeur, tandis que BSC TVL grimpe de 55.8 %
Marchés Rapport de nouvelles Technologie
BNB Chain publie son rapport du premier trimestre 1 et met en évidence une réduction de 2024 % de sa perte de valeur, tandis que BSC TVL grimpe de 55.8 %
2 mai 2024
CRYPTOMERIA LABS PTE. LTD.