ニュースレポート テクノロジー
2023 年 6 月 26 日

Google、音声生成用の強力な AI 言語モデルである AudioPaLM を発表

簡単に言えば

AudioPaLM は、によって開発された強力な言語モデルです。 でログイン テキストベースのモデルと音声ベースのモデルを組み合わせて、シームレスな音声とテキストの処理を実現します。

パラ言語情報を保存し、音声翻訳タスクにおいて既存のシステムよりも優れたパフォーマンスを発揮します。

AudioPaLM は、アクセントのある言語を翻訳し、音声から音声への翻訳のための音声転送を実行できます。

Googleは、と呼ばれる言語モデルを発表しました。 AudioPaLM、テキストベースの言語モデルと音声ベースの言語モデルを組み合わせて、音声とテキストをシームレスに処理および生成します。 の機能を統合することで、 PaLM-2 および AudioLM, AudioPaLM は、音声認識や音声音声翻訳など、幅広いアプリケーションを可能にする統合マルチモーダル アーキテクチャを提供します。

Google、音声生成用の強力な言語モデルである AudioPaLM を発表
クレジット: Metaverse Post (mpost.io)

AudioPaLM の注目すべき機能の 2 つは、AudioLM の影響により、話者のアイデンティティやイントネーションなどのパラ言語情報を保存できることです。 同時に、PaLM-XNUMX のようなテキストベースの言語モデルに見られる言語知識を利用します。 AudioPaLM をテキストのみの大規模言語モデルの重みで初期化することにより、このモデルは事前トレーニングで使用される広範なテキスト トレーニング データを活用して音声処理に優れています。

AudioPaLM の優れた機能は、さまざまな実験を通じて実証されています。 音声翻訳タスクにおいて既存のシステムを上回っており、ゼロショットを実行する能力を示しています。 音声からテキストへの翻訳 トレーニング中に遭遇しなかった言語の場合。

さらに、AudioPaLM は次の機能を示します。 音声言語モデル 短い音声プロンプトに基づいて音声を言語間で転送することによって。

Googleが作った AudioPaLM の機能の例 探索に利用可能です。 イタリア語やドイツ語など、独特のアクセントを持つ言語を翻訳するこのモデルの機能は、研究者とユーザーの両方に興味をそそりました。 さらに、音声から音声への翻訳のための音声転送の実行における熟練度は、自動メトリクスと人間の評価者の両方によって確認されているように、既存のベースラインとは一線を画しています。

このモデルは、人の声や感情を維持しながら、ある言語を音声から別の言語の音声に翻訳することに非常に優れています。 興味深いことに、イタリア語やドイツ語などの一部の言語を翻訳する場合、モデルは顕著なアクセントを持ちますが、他の言語、たとえばフランス語を翻訳する場合、モデルは完全なアメリカのアクセントで話します。

音声から音声への翻訳と自動音声認識の例を含む AudioPaLM モデル。

AI について詳しく読む:

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

より多くの記事
ダミル・ヤラロフ
ダミル・ヤラロフ

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

Hot Stories
ニュースレターにご参加ください。
最新ニュース

ボラティリティの中でビットコインETFへの機関投資家の意欲が高まる

13Fの提出書類による開示では、著名な機関投資家がビットコインETFに手を出していることが明らかになり、...

詳細を知りたい

量刑の日が到来:米国裁判所が司法省の申し立てを検討する中、CZの運命は均衡を保っている

Changpeng Zhao氏は本日、シアトルの米国裁判所で判決を受ける予定である。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
MPost 「ビットコインには絵文字が必要だ」キャンペーンに業界リーダーに加わり、すべての仮想キーボードへのビットコインのシンボル統合をサポート
ライフスタイル ニュースレポート テクノロジー
MPost 「ビットコインには絵文字が必要だ」キャンペーンに業界リーダーに加わり、すべての仮想キーボードへのビットコインのシンボル統合をサポート
2024 年 5 月 10 日
仮想通貨取引所OKXがノットコインを上場、16月XNUMX日にNOT-USDTペアによるスポット取引を導入予定
マーケット ニュースレポート テクノロジー
仮想通貨取引所OKXがノットコインを上場、16月XNUMX日にNOT-USDTペアによるスポット取引を導入予定  
2024 年 5 月 10 日
Blast、第15回Blastゴールド配布イベントを開始、XNUMX万ポイントをDAppsに割り当てる
マーケット ニュースレポート テクノロジー
Blast、第15回Blastゴールド配布イベントを開始、XNUMX万ポイントをDAppsに割り当てる
2024 年 5 月 10 日
Espresso Systems が Polygon Labs と協力してロールアップの相互運用性を強化する AggLayer を開発
ビジネス ニュースレポート テクノロジー
Espresso Systems が Polygon Labs と協力してロールアップの相互運用性を強化する AggLayer を開発
2024 年 5 月 9 日
CRYPTOMERIA LABS PTE。 株式会社。