ニュースレポート テクノロジー
2023 年 3 月 15 日

新しい AI モデルは、YouTube とポッドキャストを使用してリアルな音声を合成します

簡単に言えば

カーネギーメロン大学の研究者らは、YouTube ビデオや動画から学習してリアルな音声を生成できる新しい人工知能モデルを作成しました。 ポッドキャスト.

このモデルは、約 900 時間分の YouTube とポッドキャストのコンテンツを聞くことで、自然な発話パターンのニュアンスを学習することができ、その結果、よりリアルで生き生きとした合成音声が得られました。

アメリカ・カーネギーメロン大学の研究者 作成しました YouTube の動画やポッドキャストから学習することで、リアルな音声を生成できる新しい人工知能モデル。 このモデルは、さまざまな声やアクセントで音声を生成できるため、エンターテイメントや広告などの業界で有用なツールになる可能性があります。 また、コミュニケーションを支援技術に頼っている人にも影響を与える可能性があります。

新しい AI モデルは、YouTube とポッドキャストを使用してリアルな音声を合成しています
AI モデルは、人間の発話パターンとイントネーションを高精度で模倣できます。

AI で生成された音声の大部分は、通常、プロの俳優の音声が記録されたデータセットでトレーニングされているため、感情がなく単調であることがわかっているため、これは重要な進展です。 この新しいテクノロジーを使用して、仮想アシスタントとチャットボットのパフォーマンスを向上させ、より魅力的で人間に似たものにすることができます。 また、ゲーム、教育、エンターテイメントなどの分野での潜在的なアプリケーションもあります。

続きを読む: 15 年に聴くべき 2023 の最高の仮想通貨ポッドキャスト

しかし、新しいモデルは、約 900 時間の YouTube とポッドキャストのコンテンツを聞くことで、休止、間投詞、寄生語などの自然な発話パターンのニュアンスを学習することができました。 これにより、よりリアルでリアルな合成音声が得られ、評価を求められた人々によって3.89段階で4.01と評価されました. これは、同様の AI モデルが受け取る平均スコア (実際の人間の声のスコアは XNUMX) よりも高くなっています。

この技術の潜在的なアプリケーションは広大で、言語障害を持つ人々の支援、ナビゲーション システムの改善、より自然な音声の仮想アシスタントの作成などがあります。

  • ポッドキャストAI は AI によって制作された最初のポッドキャストであり、スティーブ ジョブズにインタビューするジョー ローガンのなりすましが特徴です。 このポッドキャストは、すべて AI コンピューター アルゴリズムによって作成されています。 AI は、スティーブ ジョブズ エピソードのために、彼の伝記と発見できる彼のインターネット記録の両方を使用してトレーニングされました。 これにより、AI は彼の性格を忠実に再現することができました。

関連記事をもっと読む:

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

より多くの記事
ダミル・ヤラロフ
ダミル・ヤラロフ

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

Hot Stories

今週のトップセール、AI、IT、 Web3、および暗号化 (22-26.04)

by ヴィクトリア・パルチク
2024 年 4 月 26 日
ニュースレターにご参加ください。
最新ニュース

今週のトップセール、AI、IT、 Web3、および暗号化 (22-26.04)

by ヴィクトリア・パルチク
2024 年 4 月 26 日

DOGE の熱狂: ドージコイン (DOGE) の最近の価値の急騰を分析する

暗号通貨業界は急速に拡大しており、ミームコインは大幅な上昇に備えています。ドージコイン (DOGE)、...

詳細を知りたい

メタバースにおける AI 生成コンテンツの進化

生成 AI コンテンツの出現は、仮想環境内での最も魅力的な発展の 1 つです。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
Scroll がベルヌーイ メインネットのアップグレードを完了、トランザクション コストの 10 倍の削減が見込まれる
ニュースレポート テクノロジー
Scroll がベルヌーイ メインネットのアップグレードを完了、トランザクション コストの 10 倍の削減が見込まれる
2024 年 4 月 29 日
OKXジャンプスタートがRunecoinをリストし、BTCステーキングでRUNEトークンを獲得できるようにする
マーケット ニュースレポート テクノロジー
OKXジャンプスタートがRunecoinをリストし、BTCステーキングでRUNEトークンを獲得できるようにする
2024 年 4 月 29 日
今週のトップセール、AI、IT、 Web3、および暗号化 (22-26.04)
ダイジェスト ビジネス マーケット テクノロジー
今週のトップセール、AI、IT、 Web3、および暗号化 (22-26.04)
2024 年 4 月 26 日
ヴィタリック・ブテリン氏はPoWの一元化についてコメントし、PoSまでの一時的な段階だったと指摘
ニュースレポート テクノロジー
ヴィタリック・ブテリン氏はPoWの一元化についてコメントし、PoSまでの一時的な段階だったと指摘
2024 年 4 月 26 日
CRYPTOMERIA LABS PTE。 株式会社。