Buletin de stiri Tehnologia
Martie 15, 2023

Noul model AI sintetizează vorbirea realistă folosind YouTube și podcasturi

Pe scurt

Cercetătorii de la Universitatea Carnegie Mellon au creat un nou model de inteligență artificială care este capabil să genereze un discurs realist, învățând din videoclipuri YouTube și Podcast-uri.

Modelul a reușit să învețe nuanțele tiparelor naturale de vorbire ascultând aproape 900 de ore de conținut YouTube și podcast, rezultând o voce sintetică mai realistă și mai realistă.

Cercetători de la Universitatea Carnegie Mellon din SUA a creat un nou model de inteligență artificială care este capabil să genereze un discurs realist învățând din videoclipuri și podcasturi YouTube. Modelul este capabil să producă vorbire într-o varietate de voci și accente, ceea ce îl face un instrument potențial util pentru industrii precum divertismentul și publicitatea. Ar putea avea, de asemenea, implicații pentru cei care se bazează pe tehnologia de asistență pentru a comunica.

Un nou model de inteligență artificială sintetizează un discurs realist folosind YouTube și podcasturi
Modelul AI este capabil să imite tiparele de vorbire și intonațiile umane cu mare precizie.

Aceasta este o dezvoltare semnificativă, deoarece majoritatea discursului generat de AI s-a dovedit a fi lipsit de emoții și monoton datorită faptului că este de obicei antrenat pe seturi de date în care este înregistrat discursul actorilor profesioniști. Noua tehnologie poate fi folosită pentru a îmbunătăți performanța asistenților virtuali și a chatbot-urilor, făcându-le mai atractive și mai asemănătoare oamenilor. De asemenea, are potențiale aplicații în domenii precum jocurile, educația și divertismentul.

Citeşte mai mult: 15 cele mai bune podcasturi Crypto pe care trebuie să le ascultați în 2023

Cu toate acestea, noul model a reușit să învețe nuanțele tiparelor naturale de vorbire, cum ar fi pauzele, interjecțiile și cuvintele parazite, ascultând aproape 900 de ore de conținut YouTube și podcast. Acest lucru a dus la o voce sintetică mai realistă și mai realistă, care a fost evaluată cu 3.89 pe o scară de cinci puncte de către persoanele cărora li s-a cerut să o evalueze. Acesta este mai mare decât scorul mediu primit de modele similare AI (o voce umană reală a obținut 4.01).

Aplicațiile potențiale ale acestei tehnologii sunt vaste și includ ajutarea persoanelor cu deficiențe de vorbire, îmbunătățirea sistemelor de navigație și crearea de asistenți virtuali care sună mai natural.

  • PodcastAI este primul podcast produs vreodată de AI, care prezintă o falsă a lui Joe Rogan intervievând Steve Jobs. Acest podcast este realizat în întregime de algoritmi de computer AI. Inteligența artificială a fost antrenată pentru episodul Steve Jobs folosind atât biografia sa, cât și orice înregistrare pe internet a lui pe care a putut-o descoperi. Acest lucru a permis AI-ului să-și recreeze fidel personalitatea.

Citiți mai multe articole conexe:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Hot Stories
Alăturați-vă Newsletter-ului nostru.
Ultimele ştiri

Frenezia DOGE: Analizând creșterea recentă a valorii Dogecoin (DOGE).

Industria criptomonedelor se extinde rapid, iar monedele meme se pregătesc pentru o creștere semnificativă. Dogecoin (DOGE),...

Aflați mai multe

Evoluția conținutului generat de AI în metavers

Apariția conținutului AI generativ este una dintre cele mai fascinante dezvoltări din mediul virtual...

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Scroll finalizează upgrade-ul Bernoulli Mainnet, anticipează scăderea de 10 ori a costurilor de tranzacție
Buletin de stiri Tehnologia
Scroll finalizează upgrade-ul Bernoulli Mainnet, anticipează scăderea de 10 ori a costurilor de tranzacție
Aprilie 29, 2024
OKX Jumpstart listează Runecoin, permite miza BTC pentru a câștiga jetoane RUNE
pieţe Buletin de stiri Tehnologia
OKX Jumpstart listează Runecoin, permite miza BTC pentru a câștiga jetoane RUNE
Aprilie 29, 2024
Cele mai bune oferte din această săptămână, investiții majore în AI, IT, Web3și Crypto (22-26.04)
rezumat Afaceri pieţe Tehnologia
Cele mai bune oferte din această săptămână, investiții majore în AI, IT, Web3și Crypto (22-26.04)
Aprilie 26, 2024
Vitalik Buterin comentează despre centralizarea PoW, notează că a fost o etapă temporară până la PoS
Buletin de stiri Tehnologia
Vitalik Buterin comentează despre centralizarea PoW, notează că a fost o etapă temporară până la PoS
Aprilie 26, 2024
CRYPTOMERIA LABS PTE. LTD.