ニュースレポート テクノロジー
2023 年 1 月 31 日

MusicLM: Google の新しいテキストから音楽、画像から音楽への AI モデル

簡単に言えば

Google は、テキストの説明から忠実度の高い音楽を生成するモデルである MusicLM を導入しました。

MusicLM は、テキスト キャプションに記述されたスタイルに従って、口笛やハミングのメロディーを変換できるという点で、テキストとメロディーの両方で調整できます。

モデルができるのは、 音楽を生成する クラシック、ジャズ、ロックなど様々なジャンルで活躍します。

Google は、「歪んだギター リフに裏打ちされた落ち着いたヴァイオリンのメロディー」などのテキスト記述から忠実度の高い音楽を生成するためのモデルである MusicLM を導入しました。 MusicLM は、条件付き音楽生成のプロセスを階層的なシーケンスからシーケンスへのモデリング タスクとしてキャストし、数分間にわたって一貫性を保つ 24 kHz の音楽を生成します。

MusicLM: Google の新しいテキストから音楽、画像から音楽への AI モデル

Google の実験によると、MusicLM は以前のシステムよりも、音質とテキスト説明の順守の両方で優れていることが示されています。 さらに、テキスト キャプションに記述されたスタイルに従って、口笛やハミングのメロディーを変換できるという点で、MusicLM がテキストとメロディーの両方で条件付けできることを示しています。 将来の研究をサポートするために、私たちは MusicCaps を公開しています。これは、5.5k の音楽とテキストのペアで構成され、人間の専門家によって提供されたリッチ テキストの説明が含まれています。

関連記事: テキストから 3D へ: Google は、テキストの説明から 3D モデルを生成するニューラル ネットワークを開発しました。

MusicLM モデルは、楽譜の大規模なコーパスでトレーニングされており、AI が音楽の構造を学習できるようになりました。 モデルができるのは、 音楽を生成する クラシック、ジャズ、ロックなど様々なジャンルで活躍します。 さらに、AI モデルは新しいオリジナルの作品を作成できます。

MusicLM モデルは、AI 生成音楽の分野における重要な開発です。 このモデルは、短い曲に限定されていたり、単純なメロディしか生成できなかったりした以前のモデルよりも大幅に進歩しています。 新しいモデルは、AI を使用して、映画、ビデオ ゲーム、またはその他のメディアで使用できる長くて複雑な音楽を生成する可能性を開きます。

新しい AI モデルは長い音楽を生成できます 最大 XNUMX 分間の世代.

関連記事: Stable Diffusion テキストに基づいてスペクトログラムを生成することで新しい音楽を作成できます

AI モデルは、ゲームや映画のキャプションを使用して音楽を作成できます。

さらに、AI モデルは画像を入力として音楽を生成できます。

音楽業界における AI について詳しく読む:

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

より多くの記事
ダミル・ヤラロフ
ダミル・ヤラロフ

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

Hot Stories

今週のトップセール、AI、IT、 Web3、および暗号化 (22-26.04)

by ヴィクトリア・パルチク
2024 年 4 月 26 日
ニュースレターにご参加ください。
最新ニュース

今週のトップセール、AI、IT、 Web3、および暗号化 (22-26.04)

by ヴィクトリア・パルチク
2024 年 4 月 26 日

DOGE の熱狂: ドージコイン (DOGE) の最近の価値の急騰を分析する

暗号通貨業界は急速に拡大しており、ミームコインは大幅な上昇に備えています。ドージコイン (DOGE)、...

詳細を知りたい

メタバースにおける AI 生成コンテンツの進化

生成 AI コンテンツの出現は、仮想環境内での最も魅力的な発展の 1 つです。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
今週のトップセール、AI、IT、 Web3、および暗号化 (22-26.04)
ダイジェスト ビジネス マーケット テクノロジー
今週のトップセール、AI、IT、 Web3、および暗号化 (22-26.04)
2024 年 4 月 26 日
ヴィタリック・ブテリン氏はPoWの一元化についてコメントし、PoSまでの一時的な段階だったと指摘
ニュースレポート テクノロジー
ヴィタリック・ブテリン氏はPoWの一元化についてコメントし、PoSまでの一時的な段階だったと指摘
2024 年 4 月 26 日
Offchain Labs が Optimism の OP スタックの不正証明に 2 つの重大な脆弱性を発見したことを明らかに
ニュースレポート ソフトウェア テクノロジー
Offchain Labs が Optimism の OP スタックの不正証明に 2 つの重大な脆弱性を発見したことを明らかに
2024 年 4 月 26 日
RollApps eIBCから流動性を橋渡しするDymensionのオープンマーケットがメインネットで開始
ニュースレポート テクノロジー
RollApps eIBCから流動性を橋渡しするDymensionのオープンマーケットがメインネットで開始 
2024 年 4 月 26 日
CRYPTOMERIA LABS PTE。 株式会社。