StabilityAI 发布基于舞蹈扩散模型的AI音乐生成器Harmonai
简单来说
Harmonai 带来开源音频模型以帮助塑造音乐的未来
Dance Diffusion 旨在让音乐制作对每个人来说都更加平易近人和愉快
Harmonai,一种被巧妙地称为新方法的方法,你猜对了,从无到有地创建音频, StabilityAI的研究人员在人工智能音频生成领域取得了重大进展。 结果令人震惊且多种多样,而且都有点令人不安。
什么是和声?
和声内 是一个社区驱动的组织,发布开源生成音频工具,以增加每个人对音乐创作的访问和享受。 简单来说,它在一个叫做 扩散,其中基于预训练模型将随机白噪声细化为声音,该模型包含数百万个参数,这些参数是在训练过程中计算出来的,以封装其训练源材料的特征。
深度学习研究实验室 Harmonai 的目标是制作开源生成音频模型,通过计算资金和社区支持研究人员和开发人员,并为艺术家和音频专业人士提供新的创意工具。 Harmonai 的目标是通过开发开源音频合成和处理工具,使音乐制作对每个人来说都更加平易近人和愉快。
什么是舞蹈扩散?
Imagine Stable Diffusion 只产生声音而不产生图像。 舞蹈 Diffusion 是公开的生成音乐扩散模型的集合。 初始模型生成 1-3 秒的音频,也可用于插入和风格转换更长的音频录音。
因此,它是否类似于音频的文本到图像 AI?
在精神上,但有一些重大差异。 没有文本输入表单,您可以在其中输入“军鼓”并按 GO,因此这不是一个 文本到音频 或文本转语音生成器。 当然,永远不要说永远——这个项目仍处于早期阶段——但现在,由你,用户,提供一个音频文件池(无论是军鼓还是任何你希望生成的变体) )来训练模型。 或者,您可以使用 6 个预训练模型中已有的模型之一 舞蹈扩散笔记本 让您入门 - 单独和他们一起玩会很有趣!
Harmonai 和 Dadabots 有关系吗?
是的。 和声是 达达机器人 + 更多了不起的人 + 4000 个 GPU。 在他们的 YouTube 频道中,Dadabots 的艺术家已经在使用 AI 生成的音乐:
新生成的 AI 音频样本 和声内
关注社区 不和谐的渠道 收听更多音频文件。
有兴趣阅读更多吗? 这里有一些额外的新闻要检查:
免责声明
在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。
关于作者
Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。
更多文章Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。