Notizie Tecnologia
15 Marzo 2023

Il nuovo modello di intelligenza artificiale sintetizza un discorso realistico utilizzando YouTube e podcast

In Breve

I ricercatori della Carnegie Mellon University hanno creato un nuovo modello di intelligenza artificiale in grado di generare discorsi realistici imparando da video di YouTube e podcast.

Il modello è stato in grado di apprendere le sfumature dei modelli vocali naturali ascoltando quasi 900 ore di contenuti di YouTube e podcast, ottenendo una voce sintetica più realistica e realistica.

Ricercatori della Carnegie Mellon University negli Stati Uniti ho creato un nuovo modello di intelligenza artificiale in grado di generare discorsi realistici imparando dai video e dai podcast di YouTube. Il modello è in grado di produrre discorsi in una varietà di voci e accenti, rendendolo uno strumento potenzialmente utile per settori come l'intrattenimento e la pubblicità. Potrebbe anche avere implicazioni per coloro che si affidano alla tecnologia assistiva per comunicare.

Un nuovo modello di intelligenza artificiale sta sintetizzando discorsi realistici utilizzando YouTube e podcast
Il modello AI è in grado di imitare i modelli e le intonazioni del linguaggio umano con elevata precisione.

Si tratta di uno sviluppo significativo, poiché la maggior parte dei discorsi generati dall'intelligenza artificiale si è rivelata priva di emozioni e monotona a causa del fatto che di solito viene addestrata su set di dati in cui viene registrato il discorso di attori professionisti. La nuova tecnologia può essere utilizzata per migliorare le prestazioni degli assistenti virtuali e dei chatbot, rendendoli più coinvolgenti e simili a quelli umani. Ha anche potenziali applicazioni in campi come i giochi, l'istruzione e l'intrattenimento.

Leggi di più: I 15 migliori podcast crittografici che devi ascoltare nel 2023

Il nuovo modello, tuttavia, è stato in grado di apprendere le sfumature dei modelli vocali naturali, come pause, interiezioni e parole parassitarie, ascoltando quasi 900 ore di contenuti di YouTube e podcast. Ciò ha portato a una voce sintetica più realistica e realistica, che è stata valutata 3.89 su una scala a cinque punti dalle persone a cui è stato chiesto di valutarla. Questo è superiore al punteggio medio ricevuto da modelli di intelligenza artificiale simili (una vera voce umana ha ottenuto un punteggio di 4.01).

Le potenziali applicazioni di questa tecnologia sono vaste e includono l'aiuto alle persone con problemi di linguaggio, il miglioramento dei sistemi di navigazione e la creazione di assistenti virtuali dal suono più naturale.

  • PodcastAI è il primo podcast mai prodotto da AI, con una parodia di Joe Rogan che intervista Steve Jobs. Questo podcast è realizzato interamente da algoritmi di computer AI. L'intelligenza artificiale è stata addestrata per l'episodio di Steve Jobs utilizzando sia la sua biografia che qualsiasi registrazione su Internet che potesse scoprire. Ciò ha permesso all'IA di ricreare fedelmente la sua personalità.

Leggi altri articoli correlati:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

La frenesia del DOGE: analisi del recente aumento di valore di Dogecoin (DOGE).

L’industria delle criptovalute è in rapida espansione e le monete meme si stanno preparando per una significativa ripresa. Dogecoin (DOGE), ...

Per saperne di più

L'evoluzione dei contenuti generati dall'intelligenza artificiale nel Metaverso

L’emergere di contenuti di intelligenza artificiale generativa è uno degli sviluppi più affascinanti all’interno dell’ambiente virtuale…

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Scroll completa l'aggiornamento della mainnet Bernoulli e prevede una riduzione di 10 volte dei costi di transazione
Notizie Tecnologia
Scroll completa l'aggiornamento della mainnet Bernoulli e prevede una riduzione di 10 volte dei costi di transazione
29 aprile 2024
OKX Jumpstart elenca Runecoin, consente lo staking di BTC per guadagnare token RUNE
Mercati Notizie Tecnologia
OKX Jumpstart elenca Runecoin, consente lo staking di BTC per guadagnare token RUNE
29 aprile 2024
Le migliori offerte di questa settimana, i principali investimenti in AI, IT, Web3e Criptovaluta (22-26.04)
digerire Affari Mercati Tecnologia
Le migliori offerte di questa settimana, i principali investimenti in AI, IT, Web3e Criptovaluta (22-26.04)
26 aprile 2024
Vitalik Buterin commenta la centralizzazione del PoW, sottolineando che si trattava di una fase temporanea fino al PoS
Notizie Tecnologia
Vitalik Buterin commenta la centralizzazione del PoW, sottolineando che si trattava di una fase temporanea fino al PoS
26 aprile 2024
LABORATORI DI CRITTOMERIA PTE. srl.