Novice Tehnologija
Marec 15, 2023

Nov model umetne inteligence sintetizira realističen govor z uporabo YouTuba in podcastov

Na kratko

Raziskovalci z univerze Carnegie Mellon so ustvarili nov model umetne inteligence, ki lahko ustvari realističen govor z učenjem iz videoposnetkov v YouTubu in podcasti.

Model se je lahko naučil odtenkov naravnih govornih vzorcev s poslušanjem skoraj 900 ur YouTuba in vsebine podcastov, kar je povzročilo bolj realističen in resničen sintetični glas.

Raziskovalci z univerze Carnegie Mellon v ZDA so ustvarili nov model umetne inteligence, ki lahko ustvari realističen govor z učenjem iz videoposnetkov in podcastov YouTube. Model je sposoben proizvesti govor z različnimi glasovi in ​​poudarki, zaradi česar je potencialno uporabno orodje za industrije, kot sta zabava in oglaševanje. Lahko bi vplivalo tudi na tiste, ki se za komunikacijo zanašajo na podporno tehnologijo.

Nov model AI sintetizira realističen govor s pomočjo YouTuba in podcastov
Model AI je sposoben posnemati vzorce in intonacije človeškega govora z visoko natančnostjo.

To je pomemben napredek, saj je bilo ugotovljeno, da je večina govora, ustvarjenega z umetno inteligenco, brez čustev in monotonega zaradi dejstva, da se običajno uri na naborih podatkov, kjer je posnet govor profesionalnih igralcev. Novo tehnologijo je mogoče uporabiti za izboljšanje delovanja virtualnih pomočnikov in chatbotov, zaradi česar so bolj privlačni in podobni ljudem. Ima tudi potencialne aplikacije na področjih, kot so igre na srečo, izobraževanje in zabava.

Preberite več: 15 najboljših kripto podcastov, ki jih morate poslušati v letu 2023

Novi model pa se je lahko naučil nians naravnih govornih vzorcev, kot so premori, medmeti in parazitske besede, s poslušanjem skoraj 900 ur YouTube in podcast vsebin. Posledica tega je bil bolj realističen in resničen sintetični glas, ki so ga ljudje, ki so bili pozvani, da ga ocenijo, ocenili s 3.89 na petstopenjski lestvici. To je višje od povprečne ocene podobnih modelov umetne inteligence (pravi človeški glas je dosegel 4.01).

Potencialne uporabe te tehnologije so ogromne in vključujejo pomoč ljudem z motnjami govora, izboljšanje navigacijskih sistemov in ustvarjanje bolj naravno zvenečih virtualnih pomočnikov.

  • PodcastAI je prvi podcast, ki ga je kadarkoli ustvaril AI, ki prikazuje prevaro intervjuja Joeja Rogana s Stevom Jobsom. Ta podcast je v celoti narejen z računalniškimi algoritmi AI. Umetna inteligenca je bila usposobljena za epizodo Steva Jobsa z uporabo njegove biografije in vseh njegovih internetnih posnetkov, ki bi jih lahko odkrili. To je AI omogočilo, da zvesto poustvari njegovo osebnost.

Preberite več sorodnih člankov:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

več člankov
Damir Yalalov
Damir Yalalov

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

Hot Stories
Pridružite se našemu glasilu.
Zadnje novice

The DOGE Frenzy: Analiza nedavnega porasta vrednosti Dogecoina (DOGE)

Industrija kriptovalut se hitro širi in meme kovanci se pripravljajo na pomemben vzpon. Dogecoin (DOGE), ...

Več o tem

Razvoj vsebine, ustvarjene z umetno inteligenco, v metaverzumu

Pojav generativne vsebine AI je eden najbolj fascinantnih dogodkov v virtualnem okolju ...

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
Scroll dokončal nadgradnjo Bernoulli Mainnet, predvideva 10-kratno znižanje transakcijskih stroškov
Novice Tehnologija
Scroll dokončal nadgradnjo Bernoulli Mainnet, predvideva 10-kratno znižanje transakcijskih stroškov
April 29, 2024
OKX Jumpstart navaja Runecoin, omogoča vlaganje BTC za zaslužek žetonov RUNE
Prisotnost Novice Tehnologija
OKX Jumpstart navaja Runecoin, omogoča vlaganje BTC za zaslužek žetonov RUNE
April 29, 2024
Najboljše ponudbe tega tedna, velike naložbe v AI, IT, Web3, in Crypto (22-26.04)
prebaviti ŽELITE POSTATI PARTNER Prisotnost Tehnologija
Najboljše ponudbe tega tedna, velike naložbe v AI, IT, Web3, in Crypto (22-26.04)
April 26, 2024
Vitalik Buterin komentira centralizacijo PoW, ugotavlja, da je bila to začasna faza do PoS
Novice Tehnologija
Vitalik Buterin komentira centralizacijo PoW, ugotavlja, da je bila to začasna faza do PoS
April 26, 2024
CRYPTOMERIA LABS PTE. LTD.