ニュースレポート テクノロジー
2023 年 1 月 08 日

VALL-E: Microsoft の新しいゼロショット テキスト読み上げモデルは、XNUMX 秒で全員の声を複製できます

簡単に言えば

トランスベースの TTS モデルは、あらゆる音声のわずか XNUMX 秒のサンプルで、 VALL-E はあらゆる声で音声を生成できます.

これは、より自然なサウンドの TTS システムに向けた大きな進歩です。

ただし、Microsoft は使用中のモデルのサンプルをいくつか提供しており、これが TTS テクノロジの重要な発展を表していることは明らかです。

最初のテキスト読み上げ (TTS) モデルがリリースされて以来、研究者はこれらのシステムが音声を生成する方法を改善する方法を探してきました。 マイクロソフトの最新モデル、 、この点で重要な前進です。

VALL-E は、その音声の XNUMX 秒間のサンプルを聞くだけで、任意の音声で音声を生成できるトランスフォーマー ベースの TTS モデルです。 これは、新しい音声を生成するためにはるかに長いトレーニング期間を必要とした以前のモデルよりも大幅に改善されています。

VALL-E は、私たちがデジタル メディアとやり取りする方法を変える可能性を秘めた驚くべき技術的偉業です。
関連記事: 3枚の人物写真からXNUMXDアバターを構築できる拡散モデルをMicrosoftが公開

さらに、声のイントネーション、カリスマ性、スタイルはすべて、生成された音声でそのまま維持されます。 これは、TTS システムのサウンドをより自然にするための重要な前進です。

このモデルはトランスベースで、Dale-1 の外観をしています。 拡散ベースの Dalle-2 と混同しないでください。 コードはまだ不足しています。 そして、ユーザーはそれを投稿することに懐疑的です。

関連記事: Microsoft の VALL-E は、これまでで最も危険な詐欺ソフトウェアのようです

ただし、Microsoft はモデルの動作例をいくつか公開しており、これが TTS テクノロジの大きな進歩であることは明らかです。

例#1:

例 #2:

例#3:

AI について詳しく読む:

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

より多くの記事
ダミル・ヤラロフ
ダミル・ヤラロフ

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

Hot Stories
ニュースレターにご参加ください。
最新ニュース

量刑の日が到来:米国裁判所が司法省の申し立てを検討する中、CZの運命は均衡を保っている

Changpeng Zhao氏は本日、シアトルの米国裁判所で判決を受ける予定である。

詳細を知りたい

Samourai Wallet創設者、ダークネット取引で2億ドルを仲介したとして告発

Samourai Wallet 創設者の懸念は業界にとって顕著な後退を表しており、永続的な問題を浮き彫りにしています。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
Google の Med-Gemini が有利なスタートを切る準備が整っている GPT-4 ヘルスケア分野で優れたパフォーマンスを発揮
AI Wiki ニュース ソフトウェア テクノロジー
Google の Med-Gemini が有利なスタートを切る準備が整っている GPT-4 ヘルスケア分野で優れたパフォーマンスを発揮
2024 年 5 月 2 日
香港立法会議員呉潔荘氏、JPEX仮想通貨取引所に対して民事訴訟を提起
ビジネス ニュースレポート テクノロジー
香港立法会議員呉潔荘氏、JPEX仮想通貨取引所に対して民事訴訟を提起
2024 年 5 月 2 日
AltLayer がステーキング イニシアチブの第 2 フェーズに入り、reALT トークンを導入
マーケット ニュースレポート テクノロジー
AltLayer がステーキング イニシアチブの第 2 フェーズに入り、reALT トークンを導入
2024 年 5 月 2 日
BNBチェーンが1年第2024四半期レポートを発表、価値損失が55.8%削減され、BSC TVLが70.8%急騰していることを強調
マーケット ニュースレポート テクノロジー
BNBチェーンが1年第2024四半期レポートを発表、価値損失が55.8%削減され、BSC TVLが70.8%急騰していることを強調
2024 年 5 月 2 日
CRYPTOMERIA LABS PTE。 株式会社。