StabilityAI 發布基於舞蹈擴散模型的AI音樂生成器Harmonai
簡單來說
Harmonai 帶來開源音頻模型以幫助塑造音樂的未來
Dance Diffusion 旨在讓音樂製作對每個人來說都更加平易近人和愉快
Harmonai,一種被巧妙地稱為新方法的方法,你猜對了,從無到有地創建音頻, StabilityAI的研究人員在人工智能音頻生成領域取得了重大進展。 結果令人震驚且多種多樣,而且都有點令人不安。
什麼是和聲?
和聲內 是一個社區驅動的組織,發布開源生成音頻工具,以增加每個人對音樂創作的訪問和享受。 簡單來說,它在一個叫做 廣播,其中基於預訓練模型將隨機白噪聲細化為聲音,該模型包含數百萬個參數,這些參數是在訓練過程中計算出來的,以封裝其訓練源材料的特徵。
深度學習研究實驗室 Harmonai 的目標是製作開源生成音頻模型,通過計算資金和社區支持研究人員和開發人員,並為藝術家和音頻專業人士提供新的創意工具。 Harmonai 的目標是通過開發開源音頻合成和處理工具,使音樂製作對每個人來說都更加平易近人和愉快。
什麼是舞蹈擴散?
想像 Stable Diffusion 只產生聲音而不產生影像。 舞蹈 Diffusion 是公開的生成音樂擴散模型的集合。 初始模型產生 1-3 秒的音頻,也可用於插入和風格轉換更長的音頻錄音。
因此,它是否類似於音頻的文本到圖像 AI?
在精神上,但有一些重大差異。 沒有文字輸入表單,您可以在其中輸入“軍鼓”並按 GO,因此這不是一個 文本到音頻 或文字轉語音產生器。 當然,永遠不要說永遠——這個項目仍處於早期階段——但現在,由你,用戶,提供一個音頻文件池(無論是軍鼓還是任何你希望生成的變體) )來訓練模型。 或者,您可以使用 6 個預訓練模型中已有的模型之一 舞蹈擴散筆記本 讓您入門 - 單獨和他們一起玩會很有趣!
Harmonai 和 Dadabots 有關係嗎?
是的。 和聲是 達達機器人 + 更多了不起的人 + 4000 個 GPU。 在他們的 YouTube 頻道中,Dadabots 的藝術家已經在使用 AI 生成的音樂:
新生成的 AI 音頻樣本 和聲內
關注社區 不和諧的渠道 收聽更多音頻文件。
有興趣閱讀更多嗎? 這裡有一些額外的新聞要檢查:
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。
更多文章Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。