Notizie Tecnologia
Gennaio 08, 2023

VALL-E: il nuovo modello di sintesi vocale zero-shot di Microsoft può duplicare la voce di tutti in tre secondi

In Breve

Con solo un campione di tre secondi di qualsiasi voce, il modello TTS basato su trasformatore VALL-E può produrre parlato con ogni voce.

Questo è un progresso significativo nella direzione di sistemi TTS dal suono più naturale.

Microsoft ha, tuttavia, fornito alcuni esempi del modello in uso, ed è evidente che questo rappresenta uno sviluppo significativo nella tecnologia TTS.

Dal rilascio del primo modello di sintesi vocale (TTS), i ricercatori hanno cercato modi per migliorare il modo in cui questi sistemi generano la voce. L'ultimo modello di Microsoft, VALLE, rappresenta un significativo passo avanti in questo senso.

VALL-E è un modello TTS basato su trasformatore in grado di generare parlato in qualsiasi voce dopo aver ascoltato solo un campione di tre secondi di quella voce. Si tratta di un miglioramento significativo rispetto ai modelli precedenti, che richiedevano un periodo di addestramento molto più lungo per generare una nuova voce.

VALL-E è un'incredibile impresa tecnologica che ha il potenziale per cambiare il modo in cui interagiamo con i media digitali.
Articolo correlato: Microsoft ha rilasciato un modello di diffusione in grado di costruire un avatar 3D da una singola foto di una persona

Inoltre, l'intonazione, il carisma e lo stile della voce sono tutti mantenuti intatti nel discorso generato. Questo è un importante passo avanti per rendere i sistemi TTS più naturali.

Questo modello è basato su trasformatore e ha un aspetto Dale-1. Da non confondere con il Dalle-2 basato sulla diffusione. Il codice è ancora mancante. E gli utenti hanno un certo scetticismo sul fatto che lo pubblicheranno.

Articolo correlato: VALL-E di Microsoft sembra essere il software di truffa più pericoloso di sempre

Tuttavia, Microsoft ha rilasciato alcuni esempi del modello in azione ed è chiaro che si tratta di un importante progresso nella tecnologia TTS.

Esempio #1:

Esempio #2:

Esempio #3:

Per saperne di più sull'intelligenza artificiale:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Arriva il giorno della sentenza: il destino di CZ è in bilico mentre la Corte degli Stati Uniti considera l'appello del Dipartimento di Giustizia

Changpeng Zhao è pronto ad affrontare oggi la sentenza in un tribunale americano a Seattle.

Per saperne di più

I fondatori di Samourai Wallet sono accusati di aver facilitato 2 miliardi di dollari in affari nel Darknet

L'apprensione dei fondatori di Samourai Wallet rappresenta una notevole battuta d'arresto per il settore, sottolineando la persistente ...

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Med-Gemini di Google è pronto a dare un vantaggio GPT-4 Con le sue prestazioni superiori nel settore sanitario
AI Wiki Notizie Software Tecnologia
Med-Gemini di Google è pronto a dare un vantaggio GPT-4 Con le sue prestazioni superiori nel settore sanitario
2 Maggio 2024
Il membro del Consiglio legislativo di Hong Kong Wu Jiezhuang segnala una causa civile contro lo scambio di criptovalute JPEX
Affari Notizie Tecnologia
Il membro del Consiglio legislativo di Hong Kong Wu Jiezhuang segnala una causa civile contro lo scambio di criptovalute JPEX
2 Maggio 2024
AltLayer entra nella seconda fase della sua iniziativa di staking e presenta reALT Token
Mercati Notizie Tecnologia
AltLayer entra nella seconda fase della sua iniziativa di staking e presenta reALT Token
2 Maggio 2024
La catena BNB pubblica il rapporto del primo trimestre del 1, evidenziando una riduzione del 2024% della perdita di valore, mentre BSC TVL aumenta del 55.8%
Mercati Notizie Tecnologia
La catena BNB pubblica il rapporto del primo trimestre del 1, evidenziando una riduzione del 2024% della perdita di valore, mentre BSC TVL aumenta del 55.8%
2 Maggio 2024
LABORATORI DI CRITTOMERIA PTE. srl.