Buletin de stiri Tehnologia
Ianuarie 08, 2023

VALL-E: Noul model de redare a textului în vorbire al Microsoft poate duplica vocea tuturor în trei secunde

Pe scurt

Cu doar o mostră de trei secunde din orice voce, modelul TTS bazat pe transformator VALL-E poate produce vorbire în fiecare voce.

Acesta este un progres semnificativ în direcția sistemelor TTS cu sunet mai natural.

Microsoft a oferit, totuși, câteva mostre ale modelului în uz și este evident că aceasta reprezintă o dezvoltare semnificativă în tehnologia TTS.

De la lansarea primului model text-to-speech (TTS), cercetătorii au căutat modalități de a îmbunătăți modul în care aceste sisteme generează vorbire. Cel mai recent model de la Microsoft, VALE, este un pas semnificativ înainte în acest sens.

VALL-E este un model TTS bazat pe transformator care poate genera vorbire în orice voce după ce a auzit doar o probă de trei secunde din acea voce. Aceasta este o îmbunătățire semnificativă față de modelele anterioare, care au necesitat o perioadă de antrenament mult mai lungă pentru a genera o nouă voce.

VALL-E este o performanță tehnologică uimitoare care are potențialul de a schimba modul în care interacționăm cu media digitală.
Articol asociat: Microsoft a lansat un model de difuzie care poate construi un avatar 3D dintr-o singură fotografie a unei persoane

În plus, intonația, carisma și stilul vocii sunt păstrate intacte în discursul generat. Acesta este un pas important înainte pentru ca sistemele TTS să sune mai natural.

Acest model este bazat pe transformator și are un aspect Dale-1. Nu trebuie confundat cu Dalle-2 pe bază de difuzie. Codul încă lipsește. Iar utilizatorii au un oarecare scepticism că îl vor posta.

Articol asociat: VALL-E de la Microsoft pare a fi cel mai periculos software de escrocherie vreodată

Cu toate acestea, Microsoft a lansat câteva exemple ale modelului în acțiune și este clar că acesta este un progres major în tehnologia TTS.

Exemplul #1:

Exemplul #2:

Exemplul #3:

Citiți mai multe despre AI:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Sosește ziua sentinței: soarta lui CZ este în echilibru, în timp ce tribunalul american ia în considerare pledoaria DOJ

Changpeng Zhao este pe cale de a fi condamnat astăzi într-un tribunal american din Seattle.

Aflați mai multe

Fondatorii portofelului Samourai sunt acuzați că au facilitat 2 miliarde de dolari în oferte Darknet

Reținerea fondatorilor Samourai Wallet reprezintă un regres notabil pentru industrie, subliniind persistenta...

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Med-Gemini de la Google este pregătit să dea un avans GPT-4 Cu performanța sa superioară în domeniul sănătății
AI Wiki Noutăţi Software Tehnologia
Med-Gemini de la Google este pregătit să dea un avans GPT-4 Cu performanța sa superioară în domeniul sănătății
2 Mai, 2024
Membrul Consiliului Legislativ din Hong Kong, Wu Jiezhuang, a semnalat o acțiune civilă împotriva schimbului criptografic JPEX
Afaceri Buletin de stiri Tehnologia
Membrul Consiliului Legislativ din Hong Kong, Wu Jiezhuang, a semnalat o acțiune civilă împotriva schimbului criptografic JPEX
2 Mai, 2024
AltLayer intră în a doua fază a inițiativei sale de staking și introduce reALT Token
pieţe Buletin de stiri Tehnologia
AltLayer intră în a doua fază a inițiativei sale de staking și introduce reALT Token
2 Mai, 2024
Lanțul BNB lansează raportul T1 2024, subliniază o reducere de 55.8% a pierderii sale de valoare, în timp ce BSC TVL crește cu 70.8%
pieţe Buletin de stiri Tehnologia
Lanțul BNB lansează raportul T1 2024, subliniază o reducere de 55.8% a pierderii sale de valoare, în timp ce BSC TVL crește cu 70.8%
2 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.