Google AI が史上初のテキストから音楽へのジェネレーター AudioLM を発表
簡単に言えば
AudioLMは音を聞くだけで音楽を作ることができます
Mubert AI が人間の音声とピアノ音楽を継続
GPT-3 など、生成 AI のアイデアは前進する可能性が十分にあります。 また、インペイントとアウトペイントの概念も発見しました。 テーマやスタイルを保ちながらAIが巧みに映像を完成させます。 音楽はどうですか?
そしてまた! これらはすべて意味を保持する AI 言語モデルに基づいているため、この技術が音楽に適用されるのは時間の問題でした。 そして今、その時が来ました。
最近の Google の調査によると、AudioLM と呼ばれるオーディオ制作の新しいフレームワークは、音を聞くだけでリアルなスピーチやピアノ音楽を作成できるようになる可能性があります。 その長期的な一貫性と優れた忠実度により、AudioLM は以前のシステムを凌駕し、音声合成とコンピューター支援音楽のアプリケーションでオーディオ作成を進歩させます。
AudioLM Google の AI は、「意図」を保ちながら音響通路を拡張できます。 現時点では、入力データの限られたサンプルに基づいて、人間の音声とピアノ音楽を継続するようにトレーニングされています。 以下のサンプルを確認してください。
発話の基準は簡単で、聞き手は継続が人間の発話のように聞こえるかどうかを評価するように求められました。 音楽では、入力用に提供されたセクションの「継続」が、現在のすべての音楽ジェネレーターをゼロから作成するよりもはるかに優れた品質であることが発見されました。 ジュークボックス. 入力での提案により、AI は音楽をかなり良く続けます。
人間の評価者が音声サンプルを聞いて結果を確認しました。 彼らは、録音された人間の声の実際の続きを聞いているのか、AudioLM によって生成された人工の声を聞いているのかを判断しました。 彼らのデータは、51.2% の成功率を示しています。 その結果、平均的なリスナーにとって、AudioLM によって生成された音声と実際の人間の音声を区別することは困難になります。
テキストから音楽への変換技術は音楽ビジネスを変えますか?
に基づくテキストから音楽へのジェネレーター ムベール API は別の AI モデルである Mubert によって最近発表されました。 Mubert は、送信されるリクエストごとに異なるサウンドのセットを作成します。 再発の可能性は非常に低いです。 音楽はリクエストが行われると作成されます。 完成した曲のデータベースから抽出されたものではありません。 本当に 生成的なこの音楽 はよくある質問です。
サウンドは作成前に選択されます。 入力プロンプトと Mubert API タグの両方が、Transformer ニューラル ネットワークの潜在空間ベクトルにエンコードされます。 次に、各クエリに最も近いタグ ベクトルが選択され、付随するタグが API に送信されて音楽が作成されます。 サウンドの構築にニューラル ネットワークは使用されていません (ベース、リードなどの個別のループ)。 すべてのサウンドは、ミュージシャンとサウンドデザイナーによって作成されました。
Mubert の次の重要なステップは、写真、映画、シナリオ、プレゼンテーションなどの現在の世界からアイテムを取得し、あなたの周りの世界の音楽を作成することです。
無謀にもテキスト プロンプトをミュージカル Mubert AI の口に入れることで得られるものは次のとおりです。
これは、より洗練された正確な生成アルゴリズムを構築するプロセスの初期段階ですが、これには時間と費用がかかります。
ただし、テキストから音楽へのテクノロジーは既に利用可能であるため、「入力プロンプト」を「ランダムプロンプトスクリプトを書く」に切り替えることで、アルバムを大量に生成できます。 アーティストはもう必要ないようです。
関連ニュースをもっと読む:
免責事項
に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。
著者について
Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。
より多くの記事Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。