Nov model umetne inteligence sintetizira realističen govor z uporabo YouTuba in podcastov
Na kratko
Raziskovalci z univerze Carnegie Mellon so ustvarili nov model umetne inteligence, ki lahko ustvari realističen govor z učenjem iz videoposnetkov v YouTubu in podcasti.
Model se je lahko naučil odtenkov naravnih govornih vzorcev s poslušanjem skoraj 900 ur YouTuba in vsebine podcastov, kar je povzročilo bolj realističen in resničen sintetični glas.
Raziskovalci z univerze Carnegie Mellon v ZDA so ustvarili nov model umetne inteligence, ki lahko ustvari realističen govor z učenjem iz videoposnetkov in podcastov YouTube. Model je sposoben proizvesti govor z različnimi glasovi in poudarki, zaradi česar je potencialno uporabno orodje za industrije, kot sta zabava in oglaševanje. Lahko bi vplivalo tudi na tiste, ki se za komunikacijo zanašajo na podporno tehnologijo.
To je pomemben napredek, saj je bilo ugotovljeno, da je večina govora, ustvarjenega z umetno inteligenco, brez čustev in monotonega zaradi dejstva, da se običajno uri na naborih podatkov, kjer je posnet govor profesionalnih igralcev. Novo tehnologijo je mogoče uporabiti za izboljšanje delovanja virtualnih pomočnikov in chatbotov, zaradi česar so bolj privlačni in podobni ljudem. Ima tudi potencialne aplikacije na področjih, kot so igre na srečo, izobraževanje in zabava.
Novi model pa se je lahko naučil nians naravnih govornih vzorcev, kot so premori, medmeti in parazitske besede, s poslušanjem skoraj 900 ur YouTube in podcast vsebin. Posledica tega je bil bolj realističen in resničen sintetični glas, ki so ga ljudje, ki so bili pozvani, da ga ocenijo, ocenili s 3.89 na petstopenjski lestvici. To je višje od povprečne ocene podobnih modelov umetne inteligence (pravi človeški glas je dosegel 4.01).
Potencialne uporabe te tehnologije so ogromne in vključujejo pomoč ljudem z motnjami govora, izboljšanje navigacijskih sistemov in ustvarjanje bolj naravno zvenečih virtualnih pomočnikov.
- PodcastAI je prvi podcast, ki ga je kadarkoli ustvaril AI, ki prikazuje prevaro intervjuja Joeja Rogana s Stevom Jobsom. Ta podcast je v celoti narejen z računalniškimi algoritmi AI. Umetna inteligenca je bila usposobljena za epizodo Steva Jobsa z uporabo njegove biografije in vseh njegovih internetnih posnetkov, ki bi jih lahko odkrili. To je AI omogočilo, da zvesto poustvari njegovo osebnost.
Preberite več sorodnih člankov:
Zavrnitev odgovornosti
V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.
O avtorju
Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta.
več člankovDamir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta.