MusicLM: Google の新しいテキストから音楽、画像から音楽への AI モデル
簡単に言えば
Google は、テキストの説明から忠実度の高い音楽を生成するモデルである MusicLM を導入しました。
MusicLM は、テキスト キャプションに記述されたスタイルに従って、口笛やハミングのメロディーを変換できるという点で、テキストとメロディーの両方で調整できます。
モデルができるのは、 音楽を生成する クラシック、ジャズ、ロックなど様々なジャンルで活躍します。
Google は、「歪んだギター リフに裏打ちされた落ち着いたヴァイオリンのメロディー」などのテキスト記述から忠実度の高い音楽を生成するためのモデルである MusicLM を導入しました。 MusicLM は、条件付き音楽生成のプロセスを階層的なシーケンスからシーケンスへのモデリング タスクとしてキャストし、数分間にわたって一貫性を保つ 24 kHz の音楽を生成します。
Google の実験によると、MusicLM は以前のシステムよりも、音質とテキスト説明の順守の両方で優れていることが示されています。 さらに、テキスト キャプションに記述されたスタイルに従って、口笛やハミングのメロディーを変換できるという点で、MusicLM がテキストとメロディーの両方で条件付けできることを示しています。 将来の研究をサポートするために、私たちは MusicCaps を公開しています。これは、5.5k の音楽とテキストのペアで構成され、人間の専門家によって提供されたリッチ テキストの説明が含まれています。
MusicLM モデルは、楽譜の大規模なコーパスでトレーニングされており、AI が音楽の構造を学習できるようになりました。 モデルができるのは、 音楽を生成する クラシック、ジャズ、ロックなど様々なジャンルで活躍します。 さらに、AI モデルは新しいオリジナルの作品を作成できます。
MusicLM モデルは、AI 生成音楽の分野における重要な開発です。 このモデルは、短い曲に限定されていたり、単純なメロディしか生成できなかったりした以前のモデルよりも大幅に進歩しています。 新しいモデルは、AI を使用して、映画、ビデオ ゲーム、またはその他のメディアで使用できる長くて複雑な音楽を生成する可能性を開きます。
新しい AI モデルは長い音楽を生成できます 最大 XNUMX 分間の世代.
AI モデルは、ゲームや映画のキャプションを使用して音楽を作成できます。
さらに、AI モデルは画像を入力として音楽を生成できます。
音楽業界における AI について詳しく読む:
免責事項
に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。
著者について
Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。
より多くの記事Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。