ニュースレポート テクノロジー
2023 年 2 月 15 日

SingSong: Google の AI 研究者が入力ボーカルに合わせて音楽を生成する方法を発見

簡単に言えば

SingSong と呼ばれる新しいシステムは、深い 学習モデル 既存のシステムよりも歌とより同期した音楽を生成します。

研究者は、このシステムを使用して、プロの歌手向けのカラオケ トラックを作成したり、アマチュアの歌手が自分の声に合った伴奏を見つけたりするのに役立てることができると述べています。

Google の研究者は、人工知能を使用して歌と互換性のある音楽を生成する方法を発見しました。 SingSong と呼ばれる新しいシステムは、ディープ ラーニング モデルを使用して、他の既存のシステムよりも歌と同期した伴奏を生成します。 研究者は、このシステムを使用して、プロの歌手向けのカラオケ トラックを作成したり、アマチュアの歌手が自分の声により適した伴奏を見つけたりするのに役立てることができると述べています。

逆のカラオケ: AI 研究者が歌うための音楽を生成する方法を発見
伴奏を生成する以前のシステムは、歌のタイミングとピッチを一致させようとするアルゴリズムに依存していました。

歌を歌う は、Google が開発した、入力されたボーカルに合わせてインストゥルメンタル音楽を作成するシステムです。 それは、ミュージシャンとそうでない人の両方に、自分の声を特徴とする音楽を作るためのシンプルで新しいアプローチを提供するかもしれません. 開発者は、これを実現するために、音楽ソースの分離とオーディオ制作における最近の進歩に基づいています。 開発者は、特に最先端のソース分離方法を使用して、大量の音楽録音のコーパスから整列したボーカルと楽器のソースのペアを構築します。 次に、開発者は変更します AudioLMこれは、条件付きの「オーディオからオーディオへ」の生成タスクのために、ソースが分離された (ボーカル、インストゥルメンタル) ペアでトレーニングできるようにする、無条件のオーディオ制作のための最先端の方法です。

おすすめの投稿: ロイヤリティ フリーのトラックを作成するための AI Music&Audio Generator トップ 5

AI研究者は、音声入力のさまざまな特徴付けを調査し、その最良のものは、ソース分離されたトレーニングデータからのシステムの一般化を改善するために、デフォルトのAudioLM特徴付けと比較して、分離されたボーカルの定量的パフォーマンスを53%向上させます(ボーカルにはインストルメンタル) 開発者がユーザーに期待するかもしれない孤立したボーカルに。 リスナーは、同じ音声入力とのペアごとの比較で、強力な検索ベースラインからのインストルメンタルよりも、SingSong によって生成されたインストルメンタルに対してかなりの好みを示しました。

対照的に、新しいシステムでは、 深層学習モデル それは音楽の大規模なデータセットでトレーニングされています。 これにより、システムは歌手の声とタイミングに同期した伴奏を生成することができます。

この研究では、リスナーには 10 つの 18 秒間のボーカルと楽器のマッシュアップが与えられます。この中で、声 (MUDBXNUMX テストから取得) は同じですが、楽器は異なり、さまざまなソース (グラウンド トゥルース、グラウンド トゥルース、 Googleモデル、またはベースライン)。 この質問では、XNUMX つの組み合わせのうち、どちらの組み合わせが音楽的によりボーカルに合っているかをリスナーに選択してもらいます。

おすすめの投稿: テキスト読み上げ用の上位 7 つの AI 音声ジェネレーターと音声クローニング

SingSong の新鮮な例

一連のディープ ニューラル ネットワークを使用することで、 生成モデル、開発者は、長いセグメントでもレイテンシーなしでハーモニーの伴奏を生成できます。

前の例では、MUDB18 データセットのプロの声が使用されました。 また、誰もが自分の声で音楽を作成できるようにする SingSong の能力にも興味をそそられます。 ここでは、家庭用電化製品で作成されたアマチュア ボーカリストの録音を含む Vocadito データセットのボーカル サンプルを使用して、これを調べます。

システムはまだ開発の初期段階にあります。 研究者は、商業的に使用する前に改善する必要があると述べていますが、カラオケ業界に革命をもたらし、アマチュア歌手が自分に合った伴奏を見つけるのに役立つ可能性があると考えています.

関連記事をもっと読む:

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

より多くの記事
ダミル・ヤラロフ
ダミル・ヤラロフ

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

Hot Stories

Injective が AltLayer と提携して inEVM にセキュリティを再構築

by アリサ・デビッドソン
2024 年 5 月 03 日
ニュースレターにご参加ください。
最新ニュース

Injective が AltLayer と提携して inEVM にセキュリティを再構築

by アリサ・デビッドソン
2024 年 5 月 03 日

ボラティリティの中でビットコインETFへの機関投資家の意欲が高まる

13Fの提出書類による開示では、著名な機関投資家がビットコインETFに手を出していることが明らかになり、...

詳細を知りたい

量刑の日が到来:米国裁判所が司法省の申し立てを検討する中、CZの運命は均衡を保っている

Changpeng Zhao氏は本日、シアトルの米国裁判所で判決を受ける予定である。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
Injective が AltLayer と提携して inEVM にセキュリティを再構築
ビジネス ニュースレポート テクノロジー
Injective が AltLayer と提携して inEVM にセキュリティを再構築
2024 年 5 月 3 日
MASA が窓口と提携して MASA 貸付プールを導入し、基地内での USDC 借入を可能にします
マーケット ニュースレポート テクノロジー
MASA が窓口と提携して MASA 貸付プールを導入し、基地内での USDC 借入を可能にします
2024 年 5 月 3 日
ベロドロームは今後数週間以内にスーパーチェーンのベータ版をリリースし、OPスタックレイヤー2ブロックチェーン全体に拡張します
マーケット ニュースレポート テクノロジー
ベロドロームは今後数週間以内にスーパーチェーンのベータ版をリリースし、OPスタックレイヤー2ブロックチェーン全体に拡張します
2024 年 5 月 3 日
CARV、データレイヤーを分散化して報酬を分配するためのAethirとの提携を発表
ビジネス ニュースレポート テクノロジー
CARV、データレイヤーを分散化して報酬を分配するためのAethirとの提携を発表
2024 年 5 月 3 日
CRYPTOMERIA LABS PTE。 株式会社。