Informe de notícies Tecnologia
Març 15, 2023

El nou model d'IA sintetitza un discurs realista mitjançant YouTube i podcasts

En breu

Investigadors de la Universitat Carnegie Mellon han creat un nou model d'intel·ligència artificial que és capaç de generar un discurs realista aprenent dels vídeos de YouTube i podcasts.

El model va poder aprendre els matisos dels patrons de parla naturals escoltant gairebé 900 hores de contingut de YouTube i podcasts, donant com a resultat una veu sintètica més realista i realista.

Investigadors de la Universitat Carnegie Mellon dels Estats Units han creat un nou model d'intel·ligència artificial que és capaç de generar un discurs realista aprenent dels vídeos i podcasts de YouTube. El model és capaç de produir veu en una varietat de veus i accents, el que el converteix en una eina potencialment útil per a indústries com l'entreteniment i la publicitat. També podria tenir implicacions per a aquells que depenen de la tecnologia d'assistència per comunicar-se.

Un nou model d'IA està sintetitzant un discurs realista mitjançant YouTube i podcasts
El model d'IA és capaç d'imitar els patrons de parla i les entonacions humanes amb gran precisió.

Es tracta d'un desenvolupament important, ja que s'ha trobat que la majoria del discurs generat per IA és sense emocions i monòtons a causa del fet que normalment s'entrena en conjunts de dades on es registra el discurs dels actors professionals. La nova tecnologia es pot utilitzar per millorar el rendiment dels assistents virtuals i els chatbots, fent-los més atractius i semblants als humans. També té aplicacions potencials en camps com els jocs, l'educació i l'entreteniment.

Llegir més: 15 millors podcasts criptogràfics que heu d'escoltar el 2023

El nou model, però, va poder aprendre els matisos dels patrons de parla naturals, com ara pauses, interjeccions i paraules paràsites, escoltant gairebé 900 hores de contingut de YouTube i podcast. Això va donar lloc a una veu sintètica més realista i realista, que va rebre una qualificació de 3.89 en una escala de cinc punts per part de les persones a qui se'ls va demanar que l'avaluessin. Això és superior a la puntuació mitjana rebuda per models d'IA similars (una veu humana real va obtenir un 4.01).

Les aplicacions potencials d'aquesta tecnologia són àmplies i inclouen ajudar a persones amb problemes de parla, millorar els sistemes de navegació i crear assistents virtuals més naturals.

  • PodcastAI és el primer podcast produït per AI, amb una parodia de Joe Rogan entrevistant Steve Jobs. Aquest podcast està fet completament per algorismes informàtics d'IA. La IA es va entrenar per a l'episodi de Steve Jobs utilitzant tant la seva biografia com qualsevol gravació a Internet d'ell que pogués descobrir. Això va permetre a la IA recrear fidelment la seva personalitat.

Llegeix més articles relacionats:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

més articles
Damir Yalalov
Damir Yalalov

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

The DOGE Frenzy: anàlisi de l'augment recent del valor de Dogecoin (DOGE).

La indústria de la criptomoneda s'està expandint ràpidament i les monedes memes es preparen per a un augment significatiu. Dogecoin (DOGE),...

saber Més

L'evolució del contingut generat per IA al metavers

L'aparició del contingut generatiu d'IA és un dels desenvolupaments més fascinants dins de l'entorn virtual...

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
Les millors ofertes d'aquesta setmana, les principals inversions en IA, TI, Web3i Crypto (22-26.04)
Resum Negocis mercats Tecnologia
Les millors ofertes d'aquesta setmana, les principals inversions en IA, TI, Web3i Crypto (22-26.04)
Abril 26, 2024
Vitalik Buterin comenta sobre la centralització de PoW, assenyala que va ser una etapa temporal fins a PoS
Informe de notícies Tecnologia
Vitalik Buterin comenta sobre la centralització de PoW, assenyala que va ser una etapa temporal fins a PoS
Abril 26, 2024
Offchain Labs revela el descobriment de dues vulnerabilitats crítiques a les proves de frau de l'OP Stack d'Optimism
Informe de notícies Software Tecnologia
Offchain Labs revela el descobriment de dues vulnerabilitats crítiques a les proves de frau de l'OP Stack d'Optimism
Abril 26, 2024
El mercat obert de Dymension per a la liquiditat de pont de RollApps eIBC es llança a Mainnet
Informe de notícies Tecnologia
El mercat obert de Dymension per a la liquiditat de pont de RollApps eIBC es llança a Mainnet 
Abril 26, 2024
CRYPTOMERIA LABS PTE. LTD.