ニュースレポート テクノロジー
2024 年 1 月 03 日

AI スタートアップ MyShell が正確な音声クローン作成用の OpenVoice アルゴリズムをリリース

簡単に言えば

カナダの AI スタートアップ MyShell は、インスタント音声クローン作成用の OpenVoice アルゴリズムをオープンソース化したと発表しました。

AI スタートアップ MyShell が正確な音声クローン作成用の OpenVoice アルゴリズムをリリース

レスピーチャー、Voicemod、 イレブンラボ – 3 つのスタートアップには共通点が 1 つあります。それらはいずれも音声クローンを作成するためのアルゴリズムと AI ソフトウェアを提供しています。さて、新たなプレーヤー、カナダの AI スタートアップ マイシェル インスタント音声クローン作成用の OpenVoice アルゴリズムをオープンソース化したと発表しました。

MyShell がアップデートを共有しました ソーシャルメディアプラットフォームX 「わずかなオーディオ クリップを使用して、感情からアクセント、リズム、ポーズ、イントネーションに至るまで、トーンをきめ細かく制御して、比類のない精度で音声のクローンを作成します。」

この提携の下で、MIT、MyShell.ai、清華大学の研究者は、話者の声を複製し、音声を生成できる OpenVoice を発表しました。 複数の言語、元のソースからの短い音声スニペットのみを使用します。また、話者の声の独特のトーンや色もキャプチャします。

同社によると、このアルゴリズムにより、感情、アクセント、リズム、ポーズ、イントネーションなどの重要な文体要素が追加されるという。これらの要素は、音声をリアルに聞こえさせ、興味深い会話を生み出すために重要です。通常のテキスト読み上げでよく発生する退屈な音声を避けるのに役立ちます。

音声クローン AI モデルの仕組み

研究論文, OpenVoiceは、音声クローンAIの背後にある方法論を共有しました。 OpenVoice は 2 つの異なる要素で構成されています AIモデル: テキスト読み上げ (TTS) モデルと「トーン コンバーター」。

このモデルはスタイル パラメータと言語を管理でき、英語 (アメリカとイギリスの両方のアクセント)、中国語、日本語話者の「30,000 文を使用したトレーニング」を受けています。トレーニングでは、表現された感情に基づいてサンプルにラベルを付けることが含まれ、モデルはこれらのオーディオ クリップからイントネーション、リズム、ポーズを学習しました。

一方、トーン コンバーター モデルは、300,000 を超える異なる話者からの 20,000 を超えるオーディオ サンプルからなる膨大なデータセットでトレーニングされました。どちらの場合も、人間の音声は音素 (単語を区別する特定の音) に変換され、ベクトル埋め込みを使用して表現されました。

TTS モデルは、「ベース スピーカー」を使用し、トレーニング プロセスでユーザーの録音音声から得られたトーンと組み合わせます。これら 2 つのモデルを組み合わせることで、ユーザーの声を複製し、音色、つまり音声テキストで伝わる感情表現を変更できます。

このスタートアップは 2023 年に設立されました。昨年、MyShell は INCE Capital 主導のシード資金で 5.6 万ドルを調達し、特に Folius Ventures、Hashkey Capital、SevenX Ventures、TSVC、OP Crypto などの著名な投資家が参加しました。

同社によると、この資金は独自の開発の推進に役立つとのことです。 AIモデル、AI ネイティブ アプリ向けに調整されたクリエイター スタジオの作成、およびブロックチェーン テクノロジーの領域内での活気のあるクリエイター エコシステムの確立です。

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Kumar は経験豊富なテクノロジー ジャーナリストであり、AI/ML、マーケティング テクノロジー、および暗号、ブロックチェーン、 NFTs. 業界で 3 年以上の経験を持つクマールは、説得力のある物語を作成し、洞察力に富んだインタビューを実施し、包括的な洞察を提供するという実績を確立してきました。 Kumar の専門知識は、著名な業界プラットフォーム向けの記事、レポート、研究出版物など、影響力の高いコンテンツの作成にあります。 技術的な知識とストーリーテリングを組み合わせた独自のスキルセットを備えたクマールは、複雑な技術概念を明確かつ魅力的な方法で多様な聴衆に伝えることに優れています。

より多くの記事
クマール・ガンダールフ
クマール・ガンダールフ

Kumar は経験豊富なテクノロジー ジャーナリストであり、AI/ML、マーケティング テクノロジー、および暗号、ブロックチェーン、 NFTs. 業界で 3 年以上の経験を持つクマールは、説得力のある物語を作成し、洞察力に富んだインタビューを実施し、包括的な洞察を提供するという実績を確立してきました。 Kumar の専門知識は、著名な業界プラットフォーム向けの記事、レポート、研究出版物など、影響力の高いコンテンツの作成にあります。 技術的な知識とストーリーテリングを組み合わせた独自のスキルセットを備えたクマールは、複雑な技術概念を明確かつ魅力的な方法で多様な聴衆に伝えることに優れています。

Hot Stories
ニュースレターにご参加ください。
最新ニュース

ボラティリティの中でビットコインETFへの機関投資家の意欲が高まる

13Fの提出書類による開示では、著名な機関投資家がビットコインETFに手を出していることが明らかになり、...

詳細を知りたい

量刑の日が到来:米国裁判所が司法省の申し立てを検討する中、CZの運命は均衡を保っている

Changpeng Zhao氏は本日、シアトルの米国裁判所で判決を受ける予定である。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
仮想通貨取引所OKXがノットコインを上場、16月XNUMX日にNOT-USDTペアによるスポット取引を導入予定
マーケット ニュースレポート テクノロジー
仮想通貨取引所OKXがノットコインを上場、16月XNUMX日にNOT-USDTペアによるスポット取引を導入予定  
2024 年 5 月 10 日
Blast、第15回Blastゴールド配布イベントを開始、XNUMX万ポイントをDAppsに割り当てる
マーケット ニュースレポート テクノロジー
Blast、第15回Blastゴールド配布イベントを開始、XNUMX万ポイントをDAppsに割り当てる
2024 年 5 月 10 日
Espresso Systems が Polygon Labs と協力してロールアップの相互運用性を強化する AggLayer を開発
ビジネス ニュースレポート テクノロジー
Espresso Systems が Polygon Labs と協力してロールアップの相互運用性を強化する AggLayer を開発
2024 年 5 月 9 日
ZKP を利用したインフラストラクチャ プロトコル ZKBase がロードマップを発表、5 月にテストネットの立ち上げを計画
ニュースレポート テクノロジー
ZKP を利用したインフラストラクチャ プロトコル ZKBase がロードマップを発表、5 月にテストネットの立ち上げを計画
2024 年 5 月 9 日
CRYPTOMERIA LABS PTE。 株式会社。