新聞報導專業技術

2023 年 1 月 08 日

VALL-E：微軟新的零鏡頭文本轉語音模型可以在三秒內復制每個人的聲音

by 達米爾亞拉洛夫

發布日期：08 年 2023 月 3 日上午 30:20 更新日期：2023 年 9 月 13 日上午 XNUMX:XNUMX

簡單來說

只需任何語音的三秒樣本，基於 Transformer 的 TTS 模型 VALL-E 可以產生各種聲音的語音.

這是在聽起來更自然的 TTS 系統方向上的重大進步。

然而，Microsoft 提供了一些正在使用的模型示例，很明顯，這代表了 TTS 技術的重大發展。

自第一個文本轉語音 (TTS) 模型發布以來，研究人員一直在尋找改進這些系統生成語音方式的方法。微軟最新型號，瓦力, 是在這方面向前邁出的重要一步。

VALL-E 是一種基於變壓器的 TTS 模型，它可以在僅聽到該語音的三秒樣本後生成任何語音的語音。與以前的模型相比，這是一個重大改進，以前的模型需要更長的訓練時間才能生成新的聲音。

VALL-E 是一項了不起的技術壯舉，它有可能改變我們與數字媒體互動的方式。

相關文章： 微軟發布了一個擴散模型，可以從一個人的單張照片中構建一個 3D 頭像

此外，語音的語調、魅力和風格在生成的語音中都保持完好無損。這是使 TTS 系統聽起來更自然的重要一步。

該模型基於變形金剛並具有 Dale-1 外觀。不要與基於擴散的 Dalle-2 相混淆。代碼仍然缺乏。用戶對他們是否會發布它持懷疑態度。

相關文章： 微軟的 VALL-E 似乎是有史以來最危險的詐騙軟件

不過，Microsoft 已經發布了幾個實際模型示例，很明顯這是 TTS 技術的重大進步。

例如#1：

例子＃2:

例如#3：

閱讀有關人工智能的更多信息：

標籤：

免責聲明

在與線信託專案指南，請注意，本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。重要的是，僅投資您可以承受損失的金額，並在有任何疑問時尋求獨立的財務建議。如需了解更多信息，我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告，但市場狀況如有變更，恕不另行通知。

關於作者

Damir 是團隊領導、產品經理和編輯 Metaverse Post，涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。他的文章每月吸引超過一百萬用戶的大量讀者。他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。達米爾獲得了物理學學士學位，他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。

達米爾亞拉洛夫

達米爾亞拉洛夫

Damir 是團隊領導、產品經理和編輯 Metaverse Post，涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。他的文章每月吸引超過一百萬用戶的大量讀者。他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。達米爾獲得了物理學學士學位，他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。

Hot Stories

Morph 推出其 Holesky 測試網，具有樂觀的 zkEVM 整合、橋接機制和去中心化定序器網路功能

by 艾莉莎戴維森

2024 年 5 月 06 日

Robinhood Crypto 因涉嫌證券違規而收到美國證券交易委員會的 Wells 通知

by 艾莉莎戴維森

2024 年 5 月 06 日

QuickSwap 部署在 X Layer 主網上，並透過 Citadel 發布擴展 Polygon CDK 網絡

by 艾莉莎戴維森

2024 年 5 月 06 日

Layer 2 網路 Linea 發起 ZeroLend 零代幣認領 Airdrop 用戶和投資者

by 艾莉莎戴維森

2024 年 5 月 06 日

最新消息

Morph 推出其 Holesky 測試網，具有樂觀的 zkEVM 整合、橋接機制和去中心化定序器網路功能

by 艾莉莎戴維森

2024 年 5 月 06 日

Robinhood Crypto 因涉嫌證券違規而收到美國證券交易委員會的 Wells 通知

by 艾莉莎戴維森

2024 年 5 月 06 日

QuickSwap 部署在 X Layer 主網上，並透過 Citadel 發布擴展 Polygon CDK 網絡

by 艾莉莎戴維森

2024 年 5 月 06 日

Layer 2 網路 Linea 發起 ZeroLend 零代幣認領 Airdrop 用戶和投資者

by 艾莉莎戴維森

2024 年 5 月 06 日

在波動中機構對比特幣 ETF 的興趣增強

透過 13F 文件揭露的資訊顯示，著名機構投資者涉足比特幣 ETF，突顯出人們越來越接受...

宣判日到來：美國法院考慮司法部的認罪，CZ 的命運懸而未決

趙長鵬將於今日在西雅圖的美國法院接受宣判。

加入我們的創新技術社區

了解更多

Morph 推出其 Holesky 測試網，具有樂觀的 zkEVM 整合、橋接機制和去中心化定序器網路功能

新聞報導專業技術

Morph 推出其 Holesky 測試網，具有樂觀的 zkEVM 整合、橋接機制和去中心化定序器網路功能

by 艾莉莎戴維森

2024 年 5 月 6 日

Robinhood Crypto 因涉嫌證券違規而收到美國證券交易委員會的 Wells 通知

市場新聞報導專業技術

Robinhood Crypto 因涉嫌證券違規而收到美國證券交易委員會的 Wells 通知

by 艾莉莎戴維森

2024 年 5 月 6 日

QuickSwap 部署在 X Layer 主網上，並透過 Citadel 發布擴展 Polygon CDK 網絡

新聞報導專業技術

QuickSwap 部署在 X Layer 主網上，並透過 Citadel 發布擴展 Polygon CDK 網絡

by 艾莉莎戴維森

2024 年 5 月 6 日

Layer 2 網路 Linea 發起 ZeroLend 零代幣認領 Airdrop 用戶和投資者

市場新聞報導專業技術

Layer 2 網路 Linea 發起 ZeroLend 零代幣認領 Airdrop 用戶和投資者

by 艾莉莎戴維森

2024 年 5 月 6 日