新闻报道专业技术

2023 年 1 月 08 日

VALL-E：微软新的零镜头文本转语音模型可以在三秒内复制每个人的声音

by 达米尔亚拉洛夫

发布时间：08 年 2023 月 3 日上午 30:20 更新日期：2023 年 9 月 13 日上午 XNUMX:XNUMX

简单来说

只需任何语音的三秒样本，基于 Transformer 的 TTS 模型 VALL-E 可以产生各种声音的语音.

这是在听起来更自然的 TTS 系统方向上的重大进步。

然而，Microsoft 提供了一些正在使用的模型示例，很明显，这代表了 TTS 技术的重大发展。

自第一个文本转语音 (TTS) 模型发布以来，研究人员一直在寻找改进这些系统生成语音方式的方法。微软最新型号，瓦力, 是在这方面向前迈出的重要一步。

VALL-E 是一种基于变压器的 TTS 模型，它可以在仅听到该语音的三秒样本后生成任何语音的语音。这是对以前模型的重大改进，以前的模型需要更长的训练时间才能生成新的声音。

VALL-E 是一项了不起的技术壮举，它有可能改变我们与数字媒体互动的方式。

相关文章： 微软发布了一个扩散模型，可以从一个人的单张照片中构建一个 3D 头像

此外，语音的语调、魅力和风格在生成的语音中都保持完好无损。这是使 TTS 系统听起来更自然的重要一步。

该模型基于变形金刚并具有 Dale-1 外观。不要与基于扩散的 Dalle-2 相混淆。代码仍然缺乏。用户对他们是否会发布它持怀疑态度。

相关文章： 微软的 VALL-E 似乎是有史以来最危险的诈骗软件

不过，Microsoft 已经发布了几个实际模型示例，很明显这是 TTS 技术的重大进步。

例＃1：

示例#2:

例＃3：

阅读有关人工智能的更多信息：

标签：

免责声明

在与行信托项目指南，请注意，本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。重要的是，仅投资您可以承受损失的金额，并在有任何疑问时寻求独立的财务建议。如需了解更多信息，我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告，但市场状况如有变更，恕不另行通知。

关于作者

Damir 是团队领导、产品经理和编辑 Metaverse Post，涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。他的文章每月吸引超过一百万用户的大量读者。他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。达米尔获得了物理学学士学位，他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。

达米尔亚拉洛夫

达米尔亚拉洛夫

Damir 是团队领导、产品经理和编辑 Metaverse Post，涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。他的文章每月吸引超过一百万用户的大量读者。他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。达米尔获得了物理学学士学位，他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。

Hot Stories

Morph 推出其 Holesky 测试网，具有乐观的 zkEVM 集成、桥接机制和去中心化定序器网络功能

by 艾丽莎·戴维森

2024 年 5 月 06 日

Robinhood Crypto 因涉嫌证券违规而收到美国证券交易委员会的 Wells 通知

by 艾丽莎·戴维森

2024 年 5 月 06 日

QuickSwap 部署在 X Layer 主网上并通过 Citadel 发布扩展 Polygon CDK 网络

by 艾丽莎·戴维森

2024 年 5 月 06 日

Layer 2 网络 Linea 发起 ZeroLend 零代币认领 Airdrop 用户和投资者

by 艾丽莎·戴维森

2024 年 5 月 06 日

最新消息

Morph 推出其 Holesky 测试网，具有乐观的 zkEVM 集成、桥接机制和去中心化定序器网络功能

by 艾丽莎·戴维森

2024 年 5 月 06 日

Robinhood Crypto 因涉嫌证券违规而收到美国证券交易委员会的 Wells 通知

by 艾丽莎·戴维森

2024 年 5 月 06 日

QuickSwap 部署在 X Layer 主网上并通过 Citadel 发布扩展 Polygon CDK 网络

by 艾丽莎·戴维森

2024 年 5 月 06 日

Layer 2 网络 Linea 发起 ZeroLend 零代币认领 Airdrop 用户和投资者

by 艾丽莎·戴维森

2024 年 5 月 06 日

在波动中机构对比特币 ETF 的兴趣增强

通过 13F 文件披露的信息显示，著名机构投资者涉足比特币 ETF，突显出人们越来越接受......

宣判日到来：美国法院考虑司法部的认罪，CZ 的命运悬而未决

赵长鹏将于今天在西雅图的美国法院接受宣判。

加入我们的创新技术社区

了解更多

Morph 推出其 Holesky 测试网，具有乐观的 zkEVM 集成、桥接机制和去中心化定序器网络功能

新闻报道专业技术

Morph 推出其 Holesky 测试网，具有乐观的 zkEVM 集成、桥接机制和去中心化定序器网络功能

by 艾丽莎·戴维森

2024 年 5 月 6 日

Robinhood Crypto 因涉嫌证券违规而收到美国证券交易委员会的 Wells 通知

市场新闻报道专业技术

Robinhood Crypto 因涉嫌证券违规而收到美国证券交易委员会的 Wells 通知

by 艾丽莎·戴维森

2024 年 5 月 6 日

QuickSwap 部署在 X Layer 主网上并通过 Citadel 发布扩展 Polygon CDK 网络

新闻报道专业技术

QuickSwap 部署在 X Layer 主网上并通过 Citadel 发布扩展 Polygon CDK 网络

by 艾丽莎·戴维森

2024 年 5 月 6 日

Layer 2 网络 Linea 发起 ZeroLend 零代币认领 Airdrop 用户和投资者

市场新闻报道专业技术

Layer 2 网络 Linea 发起 ZeroLend 零代币认领 Airdrop 用户和投资者

by 艾丽莎·戴维森

2024 年 5 月 6 日