Az új AI-modell valósághű beszédet szintetizál a YouTube és a podcastok segítségével
Röviden
A Carnegie Mellon Egyetem kutatói új mesterséges intelligencia-modellt hoztak létre, amely képes valósághű beszédet generálni a YouTube-videókból és podcast.
A modell csaknem 900 órányi YouTube és podcast tartalom meghallgatásával tudta megtanulni a természetes beszédminták árnyalatait, ami valósághűbb és élethűbb szintetikus hangot eredményezett.
Az amerikai Carnegie Mellon Egyetem kutatói létrehoztak egy új mesterséges intelligencia-modell, amely YouTube-videókból és podcastokból tanulva képes valósághű beszédet generálni. A modell többféle hangon és akcentussal képes beszédet előállítani, így potenciálisan hasznos eszköz lehet olyan iparágakban, mint a szórakoztatás és a reklám. Ez hatással lehet azokra is, akik a kisegítő technológiára támaszkodnak a kommunikációban.
Ez jelentős fejlemény, mivel a mesterséges intelligencia által generált beszéd többsége érzelemmentes és monoton, mivel általában olyan adathalmazokon tanítják, ahol a professzionális színészek beszédét rögzítik. Az új technológia segítségével javítható a virtuális asszisztensek és chatbotok teljesítménye, ezáltal vonzóbbá és emberszerűbbé tehető. Olyan területeken is lehetséges, mint a játék, az oktatás és a szórakoztatás.
Az új modell azonban képes volt megtanulni a természetes beszédminták árnyalatait, például a szüneteket, a közbeszólásokat és a parazita szavakat közel 900 órányi YouTube és podcast tartalom meghallgatásával. Ez valósághűbb és élethűbb szintetikus hangot eredményezett, amelyet egy ötfokú skálán 3.89-re értékeltek az értékelésre felkért emberek. Ez magasabb, mint a hasonló AI-modellek átlagos pontszáma (egy valódi emberi hang 4.01 pontot kapott).
Ennek a technológiának a lehetséges alkalmazásai hatalmasak, és magukban foglalják a beszédfogyatékos emberek megsegítését, a navigációs rendszerek fejlesztését és a természetesebb hangzású virtuális asszisztensek létrehozását.
- PodcastAI Ez az első olyan podcast, amelyet az AI készített, és Joe Rogan hamisítását tartalmazza, aki interjút készít Steve Jobs-szal. Ezt a podcastot teljes mértékben mesterséges intelligencia számítógépes algoritmusai készítik. Az MI-t a Steve Jobs-epizódhoz képezték ki, felhasználva mind az életrajzát, mind a róla készült internetes felvételeket, amelyek felfedezhetők. Ez lehetővé tette a mesterséges intelligencia számára, hogy hűen újrateremtse személyiségét.
Olvasson további kapcsolódó cikkeket:
A felelősség megtagadása
Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.
A szerzőről
Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján.
További cikkekDamir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján.