Notizie
Ottobre 21, 2022

Google AI ha annunciato il primo generatore di testo in musica AudioLM

In Breve

AudioLM può produrre musica semplicemente ascoltando i suoni

Mubert AI per continuare il linguaggio umano e la musica per pianoforte

Con GPT-3 e altri, l’idea dell’intelligenza artificiale generativa ha buone possibilità di andare avanti. Abbiamo anche scoperto i concetti di inpainting e outpainting; L'intelligenza artificiale completa abilmente le immagini mantenendo il tema e lo stile. E la musica?

E ancora! Poiché tutto questo si basa su modelli di linguaggio AI che mantengono il significato, era solo una questione di tempo prima che questa tecnologia venisse applicata alla musica. E ora è giunto il momento.

Google AI ha annunciato AudioLM, il primo generatore di testo in musica

Secondo una recente ricerca di Google, un nuovo framework per la produzione audio chiamato AudioLM può essere insegnato a creare discorsi realistici e musica per pianoforte semplicemente ascoltando i suoni. Grazie alla sua coerenza a lungo termine e all'eccellente fedeltà, AudioLM supera i sistemi precedenti e migliora la creazione audio con applicazioni di sintesi vocale e musica assistita da computer.

Abbiamo sviluppato un sistema per riconoscere i suoni sintetici prodotti da AudioLM utilizzando gli stessi concetti di intelligenza artificiale che hanno sostenuto la creazione dei nostri modelli precedenti.

AudioLM di Google AI può estendere un passaggio acustico mantenendo "l'intento". A partire da ora, è stato addestrato a continuare il linguaggio umano e la musica per pianoforte, sulla base di un campione limitato di dati di input. Controlla il campione qui sotto.

I criteri per il discorso erano semplici: agli ascoltatori veniva chiesto di valutare se la continuazione suonava come un discorso umano. Con la musica si è scoperto che la “continuazione” della sezione fornita per l'input è di qualità di gran lunga superiore rispetto a tutti gli attuali generatori di musica da zero, come JukeBox. Con un suggerimento all'ingresso, l'IA continua la musica in modo notevolmente migliore.

Google AI ha annunciato AudioLM, il primo generatore di testo in musica

I valutatori umani hanno ascoltato campioni audio per confermare i risultati. Hanno determinato se stavano ascoltando una vera continuazione di una voce umana che era stata registrata o una voce artificiale prodotta da AudioLM. I loro dati indicano un tasso di successo del 51.2%. Di conseguenza, sarà difficile per l'ascoltatore medio distinguere tra il parlato prodotto da AudioLM e il vero parlato umano.

La tecnologia text-to-music altera il business della musica?

Un generatore di testo in musica basato su API Mubert è stato recentemente annunciato da un altro modello di intelligenza artificiale, Mubert. Mubert crea un diverso set di suoni per ogni richiesta che invii. La probabilità che si ripeta è davvero scarsa. La musica viene creata quando viene effettuata una richiesta; non viene estratto da un database di brani finiti. Quanto è vero generativa questa musica questa è una domanda comune.

La tecnologia text-to-music altera il business della musica?

I suoni vengono scelti prima di essere creati. Sia il prompt di input che i tag dell'API Mubert sono codificati nel vettore spaziale latente di una rete neurale del trasformatore. Viene quindi scelto il vettore di tag più vicino per ogni query e i tag associati vengono trasmessi alla nostra API per creare musica. Nessuna rete neurale è stata utilizzata per costruire nessuno dei suoni (loop separati per bassi, lead, ecc.); tutti i suoni sono stati prodotti da musicisti e sound designer.

Il prossimo passo significativo di Mubert è prendere elementi dal mondo attuale, come foto, film, scenari e presentazioni, e creare la musica del mondo che ti circonda.

Ecco cosa puoi ottenere mettendo sconsideratamente messaggi di testo nella bocca del musical Mubert AI:

Questa è la fase iniziale del processo di creazione di un algoritmo di generazione più sofisticato e preciso, ma ciò richiederà tempo e denaro.

Tuttavia, la tecnologia text-to-music è già disponibile, quindi puoi generare album in blocco disattivando "prompt di input" per "scrivi uno script di prompt casuale". Sembra che gli artisti non siano più richiesti.

Leggi altre notizie correlate:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Cresce l’appetito istituzionale verso gli ETF Bitcoin in un contesto di volatilità

Le informazioni fornite tramite la documentazione 13F rivelano importanti investitori istituzionali che si dilettano negli ETF Bitcoin, sottolineando una crescente accettazione di...

Per saperne di più

Arriva il giorno della sentenza: il destino di CZ è in bilico mentre la Corte degli Stati Uniti considera l'appello del Dipartimento di Giustizia

Changpeng Zhao è pronto ad affrontare oggi la sentenza in un tribunale americano a Seattle.

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Injective unisce le forze con AltLayer per portare la sicurezza del ripristino in inEVM
Affari Notizie Tecnologia
Injective unisce le forze con AltLayer per portare la sicurezza del ripristino in inEVM
3 Maggio 2024
Masa collabora con Teller per presentare il pool di prestiti MASA e consentire il prestito su base USDC
Mercati Notizie Tecnologia
Masa collabora con Teller per presentare il pool di prestiti MASA e consentire il prestito su base USDC
3 Maggio 2024
Velodrome lancia la versione beta di Superchain nelle prossime settimane e si espande su blockchain OP Stack Layer 2
Mercati Notizie Tecnologia
Velodrome lancia la versione beta di Superchain nelle prossime settimane e si espande su blockchain OP Stack Layer 2
3 Maggio 2024
CARV annuncia una partnership con Aethir per decentralizzare il proprio livello dati e distribuire premi
Affari Notizie Tecnologia
CARV annuncia una partnership con Aethir per decentralizzare il proprio livello dati e distribuire premi
3 Maggio 2024
LABORATORI DI CRITTOMERIA PTE. srl.