Tudósítást Technológia
Március 15, 2023

Az új AI-modell valósághű beszédet szintetizál a YouTube és a podcastok segítségével

Röviden

A Carnegie Mellon Egyetem kutatói új mesterséges intelligencia-modellt hoztak létre, amely képes valósághű beszédet generálni a YouTube-videókból és podcast.

A modell csaknem 900 órányi YouTube és podcast tartalom meghallgatásával tudta megtanulni a természetes beszédminták árnyalatait, ami valósághűbb és élethűbb szintetikus hangot eredményezett.

Az amerikai Carnegie Mellon Egyetem kutatói létrehoztak egy új mesterséges intelligencia-modell, amely YouTube-videókból és podcastokból tanulva képes valósághű beszédet generálni. A modell többféle hangon és akcentussal képes beszédet előállítani, így potenciálisan hasznos eszköz lehet olyan iparágakban, mint a szórakoztatás és a reklám. Ez hatással lehet azokra is, akik a kisegítő technológiára támaszkodnak a kommunikációban.

Egy új mesterséges intelligencia modell valósághű beszédet szintetizál a YouTube és a podcastok segítségével
Az AI-modell nagy pontossággal képes utánozni az emberi beszédmintákat és intonációkat.

Ez jelentős fejlemény, mivel a mesterséges intelligencia által generált beszéd többsége érzelemmentes és monoton, mivel általában olyan adathalmazokon tanítják, ahol a professzionális színészek beszédét rögzítik. Az új technológia segítségével javítható a virtuális asszisztensek és chatbotok teljesítménye, ezáltal vonzóbbá és emberszerűbbé tehető. Olyan területeken is lehetséges, mint a játék, az oktatás és a szórakoztatás.

Bővebben: 15 legjobb kriptopodcast, amit meg kell hallgatnod 2023-ban

Az új modell azonban képes volt megtanulni a természetes beszédminták árnyalatait, például a szüneteket, a közbeszólásokat és a parazita szavakat közel 900 órányi YouTube és podcast tartalom meghallgatásával. Ez valósághűbb és élethűbb szintetikus hangot eredményezett, amelyet egy ötfokú skálán 3.89-re értékeltek az értékelésre felkért emberek. Ez magasabb, mint a hasonló AI-modellek átlagos pontszáma (egy valódi emberi hang 4.01 pontot kapott).

Ennek a technológiának a lehetséges alkalmazásai hatalmasak, és magukban foglalják a beszédfogyatékos emberek megsegítését, a navigációs rendszerek fejlesztését és a természetesebb hangzású virtuális asszisztensek létrehozását.

  • PodcastAI Ez az első olyan podcast, amelyet az AI készített, és Joe Rogan hamisítását tartalmazza, aki interjút készít Steve Jobs-szal. Ezt a podcastot teljes mértékben mesterséges intelligencia számítógépes algoritmusai készítik. Az MI-t a Steve Jobs-epizódhoz képezték ki, felhasználva mind az életrajzát, mind a róla készült internetes felvételeket, amelyek felfedezhetők. Ez lehetővé tette a mesterséges intelligencia számára, hogy hűen újrateremtse személyiségét.

Olvasson további kapcsolódó cikkeket:

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

A DOGE Frenzy: A Dogecoin (DOGE) közelmúltbeli értéknövekedésének elemzése

A kriptovaluta ipar rohamosan bővül, a mémérmék pedig jelentős fellendülésre készülnek. Dogecoin (DOGE), ...

Tudjon meg többet

A mesterséges intelligencia által generált tartalom evolúciója a metaverzumban

A generatív AI-tartalom megjelenése az egyik leglenyűgözőbb fejlemény a virtuális környezetben...

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
A Scroll befejezi a Bernoulli Mainnet frissítését, a tranzakciós költségek 10-szeres csökkenésére számít
Tudósítást Technológia
A Scroll befejezi a Bernoulli Mainnet frissítését, a tranzakciós költségek 10-szeres csökkenésére számít
April 29, 2024
Az OKX Jumpstart listázza a Runecoint, lehetővé teszi a BTC Staking-et, hogy RUNE tokeneket szerezzen
piacok Tudósítást Technológia
Az OKX Jumpstart listázza a Runecoint, lehetővé teszi a BTC Staking-et, hogy RUNE tokeneket szerezzen
April 29, 2024
A hét legjobb ajánlatai, jelentősebb befektetések az AI-ba, IT-be, Web3és Crypto (22-26.04)
megemészteni üzleti piacok Technológia
A hét legjobb ajánlatai, jelentősebb befektetések az AI-ba, IT-be, Web3és Crypto (22-26.04)
April 26, 2024
Vitalik Buterin megjegyzéseket fűzött a PoW központosításához, megjegyzi, hogy az ideiglenes szakasz volt a PoS-ig
Tudósítást Technológia
Vitalik Buterin megjegyzéseket fűzött a PoW központosításához, megjegyzi, hogy az ideiglenes szakasz volt a PoS-ig
April 26, 2024
CRYPTOMERIA LABS PTE. KFT.