新聞報導 專業技術
2024 年 1 月 03 日

AI新創公司MyShell發布OpenVoice演算法,實現精準語音克隆

簡單來說

加拿大人工智慧新創公司 MyShell 宣布開源其用於即時語音克隆的 OpenVoice 演算法。

AI新創公司MyShell發布OpenVoice演算法,實現精準語音克隆

Respeecher、Voicemod 和 十一實驗室 – 這三家新創公司都有一個共同點 – 他們都提供用於製作語音克隆的演算法和人工智慧軟體。現在,一個新玩家,加拿大人工智慧新創公司 我的外殼 宣布已開源其用於即時語音克隆的 OpenVoice 演算法。

MyShell 分享了更新 社群媒體平台X 並說:“克隆聲音具有無與倫比的精確度,可以對音調進行精細控制,從情感到口音、節奏、停頓和語調,僅使用一個小音頻片段。”

在此次合作下,麻省理工學院、MyShell.ai 和清華大學的研究人員推出了 OpenVoice,它可以複製說話者的聲音並產生語音 多種語言,僅使用原始來源中的簡短音訊片段。它還捕捉說話者聲音的獨特音調和音色。

據該公司稱,該演算法添加了關鍵的風格元素,如情感、口音、節奏、停頓和語調。這些元素對於使語音聽起來真實並創造有趣的對話至關重要。它有助於避免常規文字轉語音時經常出現的無聊聲音。

語音克隆人工智慧模型如何運作

研究論文,OpenVoice 分享了其語音複製 AI 背後的方法論。 OpenVoice 由兩個不同的部分組成 AI模型:文字轉語音 (TTS) 模型和「音調轉換器」。

該模型可以管理風格參數和語言,並接受了英語(美式和英式口音)、漢語和日語使用者的「使用 30,000 個句子的訓練」。訓練包括根據表達的情緒標記樣本,模型從這些音訊片段中學習語調、節奏和停頓。

另一方面,音調轉換器模型是在來自 300,000 多個不同說話者的超過 20,000 個音訊樣本的龐大資料集上進行訓練的。在這兩種情況下,人類語音音訊都被轉換為音​​素(區分單字的特定聲音)並使用向量嵌入來表示。

TTS 模型使用“基礎揚聲器”,與訓練過程中使用者錄製的音訊所產生的音調相結合。這兩個模型一起可以複製使用者的聲音並修改音色——口語文本中傳達的情感表達。

這家新創公司成立於 2023 年。去年,MyShell 籌集了 5.6 萬美元的種子資金,由 INCE Capital 領投,Folius Ventures、Hashkey Capital、SevenX Ventures、TSVC 和 OP Crypto 等知名投資者參與其中。

據該公司稱,這筆資金將有助於推動專有技術的發展 AI模型,創建專為人工智慧原生應用程式量身定制的創作者工作室,並在區塊鏈技術領域建立充滿活力的創作者生態系統。

免責聲明

在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。

關於作者

Kumar 是一位經驗豐富的科技記者,專門研究人工智慧/機器學習、行銷技術以及加密貨幣、區塊鏈和人工智慧等新興領域的動態交叉領域。 NFTs。 Kumar 擁有超過 3 年的行業經驗,在撰寫引人入勝的敘述、進行富有洞察力的採訪和提供全面的見解方面建立了良好的記錄。 Kumar 的專長在於製作高影響力的內容,包括為著名產業平台製作文章、報告和研究出版物。 庫馬爾擁有結合技術知識和講故事的獨特技能,擅長以清晰且引人入勝的方式向不同的受眾傳達複雜的技術概念。

更多文章
庫馬爾·甘達夫
庫馬爾·甘達夫

Kumar 是一位經驗豐富的科技記者,專門研究人工智慧/機器學習、行銷技術以及加密貨幣、區塊鏈和人工智慧等新興領域的動態交叉領域。 NFTs。 Kumar 擁有超過 3 年的行業經驗,在撰寫引人入勝的敘述、進行富有洞察力的採訪和提供全面的見解方面建立了良好的記錄。 Kumar 的專長在於製作高影響力的內容,包括為著名產業平台製作文章、報告和研究出版物。 庫馬爾擁有結合技術知識和講故事的獨特技能,擅長以清晰且引人入勝的方式向不同的受眾傳達複雜的技術概念。

Hot Stories
加入我們的時事通訊。
最新消息

在波動中機構對比特幣 ETF 的興趣增強

透過 13F 文件揭露的資訊顯示,著名機構投資者涉足比特幣 ETF,突顯出人們越來越接受...

了解更多

宣判日到來:美國法院考慮司法部的認罪,CZ 的命運懸而未決

趙長鵬將於今日在西雅圖的美國法院接受宣判。

了解更多
加入我們的創新技術社區
了解更多
阅读更多
加密貨幣交易所 OKX 上線 Notcoin,將於 16 月 XNUMX 日推出 NOT-USDT 貨幣對現貨交易
市場 新聞報導 專業技術
加密貨幣交易所 OKX 上線 Notcoin,將於 16 月 XNUMX 日推出 NOT-USDT 貨幣對現貨交易  
2024 年 5 月 10 日
Blast 推出第三次 Blast 黃金分配活動,為 DApp 分配 15 萬積分
市場 新聞報導 專業技術
Blast 推出第三次 Blast 黃金分配活動,為 DApp 分配 15 萬積分
2024 年 5 月 10 日
Espresso Systems 與 Polygon Labs 合作開發 AggLayer 以增強 Rollup 互通性
購物 新聞報導 專業技術
Espresso Systems 與 Polygon Labs 合作開發 AggLayer 以增強 Rollup 互通性
2024 年 5 月 9 日
ZKP 支援的基礎設施協定 ZKBase 公佈路線圖,計劃於 5 月啟動測試網
新聞報導 專業技術
ZKP 支援的基礎設施協定 ZKBase 公佈路線圖,計劃於 5 月啟動測試網
2024 年 5 月 9 日