StabilityAI ha annunciato AI Music Generator Harmonai basato su Dance Diffusion Model
In Breve
Harmonai offre modelli audio open source per aiutare a plasmare il futuro della musica
Dance Diffusion mira a rendere la produzione musicale più accessibile e piacevole per tutti
Con Harmonai, un nuovo metodo abilmente chiamato per, avete indovinato, creare un audio dal nulla, StabilityAII ricercatori di hanno fatto un grande progresso nel campo della generazione audio AI. I risultati sono sorprendenti e diversi, e sono tutti solo un po' inquietanti.
Cos'è Harmonai?
armonia è un'organizzazione guidata dalla comunità che pubblica strumenti audio generativi open source per aumentare l'accesso e il divertimento di tutti dalla composizione musicale. Per dirla semplicemente, genera suoni mai uditi prima in un processo chiamato emittente, in cui il rumore bianco casuale viene perfezionato in suoni basati su un modello pre-addestrato che contiene milioni di parametri calcolati durante il suo processo di addestramento per incapsulare le caratteristiche del materiale sorgente su cui è stato addestrato.
L'obiettivo del laboratorio di ricerca sul deep learning Harmonai è produrre modelli audio generativi open source, supportare ricercatori e sviluppatori attraverso finanziamenti informatici e una comunità e offrire nuovi strumenti creativi ad artisti e professionisti dell'audio. L'obiettivo di Harmonai è rendere la produzione musicale più accessibile e piacevole per tutti sviluppando strumenti di sintesi e manipolazione audio open source.
Cos'è la diffusione della danza?
Immaginare Stable Diffusion producendo solo suoni invece di immagini. Danza Diffusion è una raccolta di modelli di diffusione musicale generativa disponibili al pubblico. I modelli iniziali generano 1-3 secondi di audio e possono essere utilizzati anche per interpolare e trasferire stili di registrazioni audio più lunghe.
È quindi simile all'intelligenza artificiale da testo a immagine per l'audio?
Nello spirito, ma con alcune variazioni significative. Non esiste un modulo di immissione testo in cui puoi digitare "rullante" e premere GO, quindi questo non è un testo in audio o generatore di sintesi vocale. Mai dire mai, ovviamente—questo progetto è ancora nelle sue fasi iniziali—ma per ora spetta a te, l'utente, fornire un pool di file audio (siano essi rullanti o qualunque cosa desideri generare variazioni di ) su cui addestrare il modello. In alternativa è possibile utilizzare uno dei 6 modelli pre-addestrati già presenti nel Quaderno Dance Diffusion per iniziare, e ci si diverte un sacco a giocare con loro da soli!
Harmonai è imparentato con i Dadabot?
Sì. Harmonai è Dadabot + persone più straordinarie + 4000 GPU. Nel loro canale YouTube, gli artisti di Dadabots utilizzano già musica generata dall'intelligenza artificiale:
Campioni audio AI appena generati da armonia
Segui la comunità canale discordia per ascoltare più file audio.
Interessato a leggere di più? Ecco alcune notizie aggiuntive da verificare:
Negazione di responsabilità
In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.
Circa l'autore
Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet.
Altri articoliDamir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet.