ニュースレポート テクノロジー
2023 年 1 月 31 日

MusicLM: Google の新しいテキストから音楽、画像から音楽への AI モデル

簡単に言えば

Google は、テキストの説明から忠実度の高い音楽を生成するモデルである MusicLM を導入しました。

MusicLM は、テキスト キャプションに記述されたスタイルに従って、口笛やハミングのメロディーを変換できるという点で、テキストとメロディーの両方で調整できます。

モデルができるのは、 音楽を生成する クラシック、ジャズ、ロックなど様々なジャンルで活躍します。

Google は、「歪んだギター リフに裏打ちされた落ち着いたヴァイオリンのメロディー」などのテキスト記述から忠実度の高い音楽を生成するためのモデルである MusicLM を導入しました。 MusicLM は、条件付き音楽生成のプロセスを階層的なシーケンスからシーケンスへのモデリング タスクとしてキャストし、数分間にわたって一貫性を保つ 24 kHz の音楽を生成します。

MusicLM: Google の新しいテキストから音楽、画像から音楽への AI モデル

Google の実験によると、MusicLM は以前のシステムよりも、音質とテキスト説明の順守の両方で優れていることが示されています。 さらに、テキスト キャプションに記述されたスタイルに従って、口笛やハミングのメロディーを変換できるという点で、MusicLM がテキストとメロディーの両方で条件付けできることを示しています。 将来の研究をサポートするために、私たちは MusicCaps を公開しています。これは、5.5k の音楽とテキストのペアで構成され、人間の専門家によって提供されたリッチ テキストの説明が含まれています。

関連記事: テキストから 3D へ: Google は、テキストの説明から 3D モデルを生成するニューラル ネットワークを開発しました。

MusicLM モデルは、楽譜の大規模なコーパスでトレーニングされており、AI が音楽の構造を学習できるようになりました。 モデルができるのは、 音楽を生成する クラシック、ジャズ、ロックなど様々なジャンルで活躍します。 さらに、AI モデルは新しいオリジナルの作品を作成できます。

MusicLM モデルは、AI 生成音楽の分野における重要な開発です。 このモデルは、短い曲に限定されていたり、単純なメロディしか生成できなかったりした以前のモデルよりも大幅に進歩しています。 新しいモデルは、AI を使用して、映画、ビデオ ゲーム、またはその他のメディアで使用できる長くて複雑な音楽を生成する可能性を開きます。

新しい AI モデルは長い音楽を生成できます 最大 XNUMX 分間の世代.

関連記事: Stable Diffusion テキストに基づいてスペクトログラムを生成することで新しい音楽を作成できます

AI モデルは、ゲームや映画のキャプションを使用して音楽を作成できます。

さらに、AI モデルは画像を入力として音楽を生成できます。

音楽業界における AI について詳しく読む:

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

より多くの記事
ダミル・ヤラロフ
ダミル・ヤラロフ

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

Hot Stories
ニュースレターにご参加ください。
最新ニュース

今週のトップセール、AI、IT、 Web3、および暗号化 (06-10.04)

by ヴィクトリア・パルチク
2024 年 5 月 10 日

ボラティリティの中でビットコインETFへの機関投資家の意欲が高まる

13Fの提出書類による開示では、著名な機関投資家がビットコインETFに手を出していることが明らかになり、...

詳細を知りたい

量刑の日が到来:米国裁判所が司法省の申し立てを検討する中、CZの運命は均衡を保っている

Changpeng Zhao氏は本日、シアトルの米国裁判所で判決を受ける予定である。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
ドナルド・トランプの仮想通貨への移行:反対派から擁護者へ、そしてそれが米国の仮想通貨市場にとって何を意味するか
ビジネス マーケット ストーリーとレビュー テクノロジー
ドナルド・トランプの仮想通貨への移行:反対派から擁護者へ、そしてそれが米国の仮想通貨市場にとって何を意味するか
2024 年 5 月 10 日
Layer3、今夏L3トークンを発売、総供給量の51%をコミュニティに割り当てる
マーケット ニュースレポート テクノロジー
Layer3、今夏L3トークンを発売、総供給量の51%をコミュニティに割り当てる
2024 年 5 月 10 日
エドワード・スノーデン氏、ビットコイン開発者への最終警告:「プライバシーをプロトコルレベルの優先事項にしなければ、それを失う危険がある」
マーケット セキュリティ Wiki ソフトウェア ストーリーとレビュー テクノロジー
エドワード・スノーデン氏、ビットコイン開発者への最終警告:「プライバシーをプロトコルレベルの優先事項にしなければ、それを失う危険がある」
2024 年 5 月 10 日
楽観主義を原動力とするイーサリアムレイヤー2ネットワークMint、15月XNUMX日にメインネットを開始
ニュースレポート テクノロジー
楽観主義を原動力とするイーサリアムレイヤー2ネットワークMint、15月XNUMX日にメインネットを開始
2024 年 5 月 10 日
CRYPTOMERIA LABS PTE。 株式会社。