Novi AI model sintetizira realističan govor pomoću YouTubea i podcasta
Ukratko
Istraživači sa Sveučilišta Carnegie Mellon stvorili su novi model umjetne inteligencije koji može generirati realističan govor učeći iz YouTube videa i Podcasts.
Model je uspio naučiti nijanse prirodnih govornih obrazaca slušajući gotovo 900 sati YouTube i podcast sadržaja, što je rezultiralo realističnijim i realističnijim sintetičkim glasom.
Istraživači sa Sveučilišta Carnegie Mellon u SAD-u stvorili su novi model umjetne inteligencije koji može generirati realističan govor učeći iz YouTube videa i podcasta. Model je sposoban proizvesti govor s različitim glasovima i naglascima, što ga čini potencijalno korisnim alatom za industrije kao što su zabava i oglašavanje. To bi također moglo imati implikacije za one koji se oslanjaju na pomoćnu tehnologiju za komunikaciju.
Ovo je značajan napredak jer je utvrđeno da je većina govora generiranog umjetnom inteligencijom bez emocija i monotona zbog činjenice da se obično trenira na skupovima podataka u kojima se bilježi govor profesionalnih glumaca. Nova tehnologija može se koristiti za poboljšanje performansi virtualnih pomoćnika i chatbota, čineći ih privlačnijim i sličnijim ljudima. Također ima potencijalne primjene u poljima kao što su igre, obrazovanje i zabava.
Pročitajte više: 15 najboljih kripto podcasta koje morate poslušati u 2023 |
Novi model je, međutim, mogao naučiti nijanse prirodnih govornih obrazaca, kao što su pauze, uzviki i parazitske riječi, slušajući gotovo 900 sati YouTube i podcast sadržaja. To je rezultiralo realističnijim i realističnijim sintetičkim glasom, koji su ljudi koji su zamoljeni da ga ocijene ocijenili s 3.89 na ljestvici od pet stupnjeva. To je više od prosječne ocjene sličnih modela umjetne inteligencije (stvarni ljudski glas dobio je ocjenu 4.01).
Potencijalne primjene ove tehnologije su ogromne i uključuju pomoć osobama s oštećenjima govora, poboljšanje navigacijskih sustava i stvaranje virtualnih asistenata koji zvuče prirodnije.
- PodcastAI je prvi podcast ikada proizveden od strane AI-a, koji prikazuje špicu intervjua Joea Rogana sa Steveom Jobsom. Ovaj podcast u potpunosti je izrađen računalnim algoritmima umjetne inteligencije. AI je uvježban za epizodu o Steveu Jobsu koristeći njegovu biografiju i sve njegove internetske snimke koje je mogao otkriti. To je omogućilo umjetnoj inteligenciji da vjerno rekreira njegovu osobnost.
Pročitajte više povezanih članaka:
Izjava o odricanju od odgovornosti
U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.
O autoru
Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.
Više članakaDamir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.