Vijesti Tehnologija
Ožujak 15, 2023

Novi AI model sintetizira realističan govor pomoću YouTubea i podcasta

Ukratko

Istraživači sa Sveučilišta Carnegie Mellon stvorili su novi model umjetne inteligencije koji može generirati realističan govor učeći iz YouTube videa i Podcasts.

Model je uspio naučiti nijanse prirodnih govornih obrazaca slušajući gotovo 900 sati YouTube i podcast sadržaja, što je rezultiralo realističnijim i realističnijim sintetičkim glasom.

Istraživači sa Sveučilišta Carnegie Mellon u SAD-u stvorili su novi model umjetne inteligencije koji može generirati realističan govor učeći iz YouTube videa i podcasta. Model je sposoban proizvesti govor s različitim glasovima i naglascima, što ga čini potencijalno korisnim alatom za industrije kao što su zabava i oglašavanje. To bi također moglo imati implikacije za one koji se oslanjaju na pomoćnu tehnologiju za komunikaciju.

Novi AI model sintetizira realističan govor pomoću YouTubea i podcasta
AI model sposoban je oponašati uzorke i intonacije ljudskog govora s velikom točnošću.

Ovo je značajan napredak jer je utvrđeno da je većina govora generiranog umjetnom inteligencijom bez emocija i monotona zbog činjenice da se obično trenira na skupovima podataka u kojima se bilježi govor profesionalnih glumaca. Nova tehnologija može se koristiti za poboljšanje performansi virtualnih pomoćnika i chatbota, čineći ih privlačnijim i sličnijim ljudima. Također ima potencijalne primjene u poljima kao što su igre, obrazovanje i zabava.

Pročitajte više: 15 najboljih kripto podcasta koje morate poslušati u 2023

Novi model je, međutim, mogao naučiti nijanse prirodnih govornih obrazaca, kao što su pauze, uzviki i parazitske riječi, slušajući gotovo 900 sati YouTube i podcast sadržaja. To je rezultiralo realističnijim i realističnijim sintetičkim glasom, koji su ljudi koji su zamoljeni da ga ocijene ocijenili s 3.89 na ljestvici od pet stupnjeva. To je više od prosječne ocjene sličnih modela umjetne inteligencije (stvarni ljudski glas dobio je ocjenu 4.01).

Potencijalne primjene ove tehnologije su ogromne i uključuju pomoć osobama s oštećenjima govora, poboljšanje navigacijskih sustava i stvaranje virtualnih asistenata koji zvuče prirodnije.

  • PodcastAI je prvi podcast ikada proizveden od strane AI-a, koji prikazuje špicu intervjua Joea Rogana sa Steveom Jobsom. Ovaj podcast u potpunosti je izrađen računalnim algoritmima umjetne inteligencije. AI je uvježban za epizodu o Steveu Jobsu koristeći njegovu biografiju i sve njegove internetske snimke koje je mogao otkriti. To je omogućilo umjetnoj inteligenciji da vjerno rekreira njegovu osobnost.

Pročitajte više povezanih članaka:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Hot Stories
Pridružite se našem biltenu.
Najnovije vijesti

DOGE Frenzy: analiziranje nedavnog porasta vrijednosti Dogecoina (DOGE)

Industrija kriptovaluta brzo se širi, a meme kovanice se pripremaju za značajan uzlet. Dogecoin (DOGE), ...

Znati više

Evolucija sadržaja generiranog umjetnom inteligencijom u metaverzumu

Pojava generativnog AI sadržaja jedan je od najfascinantnijih razvoja unutar virtualnog okruženja...

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Scroll dovršava Bernoulli Mainnet nadogradnju, predviđa desetostruko smanjenje transakcijskih troškova
Vijesti Tehnologija
Scroll dovršava Bernoulli Mainnet nadogradnju, predviđa desetostruko smanjenje transakcijskih troškova
Travnja 29, 2024
OKX Jumpstart navodi Runecoin, omogućuje BTC Staking za zaradu RUNE tokena
tržišta Vijesti Tehnologija
OKX Jumpstart navodi Runecoin, omogućuje BTC Staking za zaradu RUNE tokena
Travnja 29, 2024
Najbolje ponude ovog tjedna, velika ulaganja u AI, IT, Web3, i Crypto (22-26.04.)
probaviti posao tržišta Tehnologija
Najbolje ponude ovog tjedna, velika ulaganja u AI, IT, Web3, i Crypto (22-26.04.)
Travnja 26, 2024
Vitalik Buterin komentira centralizaciju PoW-a, napominje da je to bila privremena faza do PoS-a
Vijesti Tehnologija
Vitalik Buterin komentira centralizaciju PoW-a, napominje da je to bila privremena faza do PoS-a
Travnja 26, 2024
CRYPTOMERIA LABS PTE. LTD.