Informe de notícies Tecnologia
Gener 08, 2023

VALL-E: el nou model de text a veu de tir zero de Microsoft pot duplicar la veu de tothom en tres segons

En breu

Amb només una mostra de tres segons de qualsevol veu, el model TTS basat en transformadors VALL-E pot produir veu en totes les veus.

Aquest és un avenç significatiu en la direcció de sistemes TTS de so més natural.

Microsoft, però, ha proporcionat algunes mostres del model en ús, i és evident que això representa un desenvolupament important en la tecnologia TTS.

Des del llançament del primer model de text a veu (TTS), els investigadors han estat buscant maneres de millorar la manera com aquests sistemes generen la parla. L'últim model de Microsoft, VALL-E, és un pas endavant important en aquest sentit.

VALL-E és un model TTS basat en transformadors que pot generar veu en qualsevol veu després d'escoltar només una mostra de tres segons d'aquesta veu. Es tracta d'una millora important respecte a models anteriors, que requerien un període de formació molt més llarg per generar una nova veu.

VALL-E és una proesa tecnològica increïble que té el potencial de canviar la manera com interactuem amb els mitjans digitals.
Article relacionat: Microsoft ha llançat un model de difusió que pot crear un avatar 3D a partir d'una sola foto d'una persona

A més, l'entonació, el carisma i l'estil de la veu es mantenen intactes en el discurs generat. Aquest és un pas important per fer que els sistemes TTS sonin més naturals.

Aquest model està basat en transformadors i té un aspecte Dale-1. No s'ha de confondre amb el Dalle-2 basat en difusió. Encara falta el codi. I els usuaris tenen cert escepticisme que el publicaran.

Article relacionat: El VALL-E de Microsoft sembla ser el programari d'estafa més perillós mai

No obstant això, Microsoft ha publicat alguns exemples del model en acció, i és evident que es tracta d'un gran avenç en la tecnologia TTS.

Exemple #1:

Exemple #2:

Exemple #3:

Llegeix més sobre AI:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

més articles
Damir Yalalov
Damir Yalalov

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

Arriba el dia de la sentència: el destí de CZ està en equilibri mentre el tribunal nord-americà considera la petició del DOJ

Changpeng Zhao està a punt d'enfrontar-se avui a la sentència en un tribunal dels Estats Units a Seattle.

saber Més

Fundadors de Samourai Wallet acusats de facilitar 2 milions de dòlars en ofertes de Darknet

L'aprehensió dels fundadors de Samourai Wallet representa un revés notable per a la indústria, subratllant la persistent ...

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
Med-Gemini de Google està disposat a donar un avantatge a GPT-4 Amb el seu rendiment superior en salut
AI Wiki Notícies Software Tecnologia
Med-Gemini de Google està disposat a donar un avantatge a GPT-4 Amb el seu rendiment superior en salut
Pot 2, 2024
El membre del Consell Legislatiu de Hong Kong, Wu Jiezhuang, anuncia una demanda civil contra JPEX Crypto Exchange
Negocis Informe de notícies Tecnologia
El membre del Consell Legislatiu de Hong Kong, Wu Jiezhuang, anuncia una demanda civil contra JPEX Crypto Exchange
Pot 2, 2024
AltLayer entra a la segona fase de la seva iniciativa de staking, presenta reALT Token
mercats Informe de notícies Tecnologia
AltLayer entra a la segona fase de la seva iniciativa de staking, presenta reALT Token
Pot 2, 2024
La cadena BNB publica l'informe del primer trimestre de 1, destaca una reducció del 2024% en la seva pèrdua de valor, mentre que BSC TVL augmenta un 55.8%
mercats Informe de notícies Tecnologia
La cadena BNB publica l'informe del primer trimestre de 1, destaca una reducció del 2024% en la seva pèrdua de valor, mentre que BSC TVL augmenta un 55.8%
Pot 2, 2024
CRYPTOMERIA LABS PTE. LTD.