ElevenLabs 在 AI 模仿声音方面变得非常擅长
简单来说
神经网络 是技术的未来,ElevenLabs Neuron 的最新更新使其能够做一些更令人印象深刻的事情:模仿任何人的声音。
该合成器于 XNUMX 月底发布了测试版,一周后,互联网上充斥着以名人声音为特色的假冒音频。
ElevenLabs 已承诺处理假货并重建算法。
有人说神经网络是未来。 他们可以比人类更快地做事,甚至可以做到人类做不到的事情。 但是,如果他们可以做一些更令人印象深刻的事情,比如模仿任何人的声音呢? 这就是 ElevenLabs Neuron 的最新更新允许它做的事情,而且它几乎是有史以来最酷的事情。
如果您曾经想听起来像托尼·斯塔克或史蒂夫·乔布斯,现在就可以。 或者,如果您感觉特别雄心勃勃,您甚至可以模仿金·卡戴珊 (Kim Kardashian)。 你所需要的只是某人一分钟的声音样本,人工智能将完成剩下的工作。 因此,如果您想给自己留下深刻印象 与你的明星成为朋友 印象或只是想尝试不同的声音以获得一些乐趣,这肯定会很有趣。
当然,一些测试版用户开始在令人毛骨悚然的实验中使用它。 社区中有一些报告提到了一些非常令人毛骨悚然的事情,比如当机器人被要求阅读其中一篇文章时 哈利·波特 书中以艾玛·沃特森的声音提供了一段由《哈利·波特》系列明星朗读的《我的奋斗》。 但总的来说,这是一项令人印象深刻的技术壮举,而且只会变得更好。
初创公司 ElevenLabs 在 XNUMX 月底发布了合成器测试版。 一周后,互联网上充斥着以名人声音为特色的假冒音频:乔·拜登、玛格特·罗比、乔·罗根、乔治·卢卡斯、艾玛·沃特森和汤姆·克鲁斯。 事实上,非常短的音频或视频样本就足以用于服务的培训。 而且声音是真实的! ElevenLabs 承诺会处理假货并重建算法。 |
推荐帖子: 有效数字广告的 10 种最佳人工智能营销工具 |
因此,如果您想通过对名人的真实印象给您的朋友留下深刻印象,或者只是想尝试不同的声音来获得一些乐趣, 查看 ElevenLabs 神经元. 这肯定会很精彩。
- 一月份,微软宣布 谷,一种新的零镜头文本到语音模型,可以复制每个人的声音。 微软的 VALL-E 是一种基于 transformer 的 TTS 模型,只需听到三秒钟的样本,就可以生成任何语音的语音。 这是对以前模型的重大改进,并有可能改变我们与数字媒体互动的方式。 代码仍然缺乏,但微软已经发布了该模型的实际示例。
- Vall-E 似乎是 最危险的诈骗软件 曾经被释放过。 它是一种可用于模仿真人的合成语音,是使用真人语音录音和 Microsoft 代码制作的。 最好的部分是,它只需要三秒钟的演讲就可以进行学习,或者更准确地说,进行微学习。 Val-E很危险 因为它可以用来欺骗弱势群体将资金转移到卡上,而骗子可以用它来冒充受害者熟悉的人。
阅读有关人工智能的更多信息:
免责声明
在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。
关于作者
Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。
更多文章Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。