2023 年 1 月 31 日

MusicLM：来自谷歌的一种新的文本到音乐和图像到音乐的 AI 模型

发布时间：31 年 2023 月 11 日上午 54:31 更新日期：2023 年 11 月 54 日上午 XNUMX:XNUMX

简单来说

Google 推出了 MusicLM，这是一种从文本描述中生成高保真音乐的模型。

MusicLM 可以以文本和旋律为条件，因为它可以根据文本标题中描述的风格转换吹口哨和哼唱的旋律。

该模型可以生成音乐各种流派，包括古典乐、爵士乐和摇滚乐。

谷歌推出了 MusicLM，这是一种从文本描述中生成高保真音乐的模型，例如“平静的小提琴旋律由扭曲的吉他即兴重复段支持”。 MusicLM 将条件音乐生成过程视为分层的序列到序列建模任务，它以 24 kHz 的频率生成音乐，并在几分钟内保持一致。

谷歌实验表明，MusicLM 在音频质量和对文本描述的遵守方面都优于以前的系统。此外，它表明 MusicLM 可以同时以文本和旋律为条件，因为它可以根据文本标题中描述的风格转换口哨和哼唱的旋律。为了支持未来的研究，我们公开发布了 MusicCaps，这是一个由 5.5k 音乐文本对组成的数据集，其中包含由人类专家提供的丰富文本描述。

MusicLM 模型已经在大量乐谱上进行了训练，这使得人工智能能够学习音乐的结构。该模型可以生成音乐各种流派，包括古典乐、爵士乐和摇滚乐。此外，人工智能模型还可以创作新的原创作品。

MusicLM 模型是 AI 生成音乐领域的一项重要发展。该模型比以前的模型取得了重大进步，以前的模型仅限于较短的音乐片段或只能生成简单的旋律。新模型开辟了使用人工智能生成长而复杂的音乐片段的可能性，这些音乐片段可用于电影、视频游戏或其他媒体。

新的AI模型可以生成长音乐长达五分钟的世代.

人工智能模型可以使用游戏和电影中的字幕创作音乐。

此外，人工智能模型可以使用图像作为输入来生成音乐。

阅读有关音乐行业 AI 的更多信息：

标签：

免责声明

在与行信托项目指南，请注意，本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。重要的是，仅投资您可以承受损失的金额，并在有任何疑问时寻求独立的财务建议。如需了解更多信息，我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告，但市场状况如有变更，恕不另行通知。

关于作者

Damir 是团队领导、产品经理和编辑 Metaverse Post，涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。他的文章每月吸引超过一百万用户的大量读者。他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。达米尔获得了物理学学士学位，他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。