ニュースレポート テクノロジー
2025 年 11 月 11 日

Meta AIがオムニリンガルASRを発表、1,600以上の言語で自動音声認識を進化させる

簡単に言えば

Meta AI は、1,600 以上の言語の音声認識機能を提供する Omnilingual ASR システムを立ち上げ、十分にサービスが提供されていない 350 の言語のオープンソース モデルとコーパスをリリースしました。

Meta AIがオムニリンガルASRを発表、1,600以上の言語で自動音声認識を進化させる

AIと拡張現実を専門とするテクノロジー企業Metaの研究部門。 メタAI Meta Omnilingual自動音声認識(ASR)システムのリリースを発表しました。 

このモデルスイートは、1,600以上の言語の自動音声認識を実現し、前例のない規模で高品質なパフォーマンスを実現します。さらに、Meta AIは、7億のパラメータを持つ自己教師型大規模多言語音声表現モデルであるOmnilingual wav2vec 2.0をオープンソース化しました。これは、様々な下流の音声タスクをサポートするように設計されています。

同組織はこれらのツールに加え、世界中の協力者と共同で開発された、サービスが行き届いていない 350 言語の音声を文字起こしして収集した、オムニリンガル ASR コーパスもリリースしています。

自動音声認識は近年進歩し、広く話されている多くの言語においてほぼ完璧な精度を達成しています。しかしながら、既存のAIアーキテクチャは膨大なデータと計算負荷を必要とするため、リソースの少ない言語への対応は依然として困難です。Omnilingual ASRシステムは、wav2vec 2.0音声エンコーダを70億パラメータに拡張することでこの限界に対処し、未転写の生の音声から豊富な多言語表現を作成します。デコーダには2つのバリエーションがあり、これらの表現を文字トークンにマッピングします。1つはコネクショニスト時間分類(CTC)を使用し、もう1つは大規模言語モデルに類似したトランスフォーマーベースのアプローチを使用します。

この LLM にヒントを得た ASR アプローチは、1,600 を超える言語で最先端のパフォーマンスを実現し、その 78% で文字エラー率が 10 未満であり、新しい言語を追加するためのより柔軟な方法を導入しています。 

専門家による微調整を必要とする従来のシステムとは異なり、Omnilingual ASRは、音声とテキストのペアをわずか数例用意するだけで、これまでサポートされていなかった言語を組み込むことができるため、膨大なデータ、専門知識、あるいはハイエンドのコンピューティング能力を必要とせずに文字起こしが可能になります。ゼロショットの結果はまだ完全に学習されたシステムに匹敵するものではありませんが、この手法は、十分にサービスが提供されていない言語をデジタルエコシステムに取り込むためのスケーラブルな方法を提供します。

Meta AI、全言語対応ASRスイートとコーパスで音声認識を進化させる 

研究部門は、あらゆる言語の音声技術を進歩させるために設計された包括的なモデルスイートとデータセットをリリースしました。FAIRのこれまでの研究に基づき、Omnilingual ASRには、低消費電力デバイス向けの軽量300Mモデルから、多様なアプリケーションで高精度を実現する7Bモデルまで、2つのデコーダーバリアントが含まれています。汎用的なwav2vec 2.0音声基盤モデルも複数のサイズで提供されており、ASRだけでなく、幅広い音声関連タスクを可能にします。すべてのモデルはApache 2.0ライセンスの下で提供され、データセットはCC-BYの下で利用可能であるため、研究者、開発者、言語支持者は、PyTorchエコシステム内のFAIRのオープンソースfairseq2フレームワークを使用して、音声ソリューションを適応および拡張できます。

Omnilingual ASRは、公開データセットとコミュニティから提供された音声録音を組み合わせた、これまでに構築された中で最大規模かつ最も言語的に多様なASRコーパスの一つに基づいて学習されています。デジタルプレゼンスが限られている言語をサポートするため、 メタAI 遠隔地や文書化が不十分な地域のネイティブスピーカーを募集し、報酬を支払うために現地組織と提携し、これまでで最大の超低リソース自発的ASRデータセットであるオムニリンガルASRコーパスを作成しました。言語技術パートナープログラムを通じて、Mozilla FoundationのCommon VoiceやLanfrica/NaijaVoicesとのパートナーシップなど、世界中の言語学者、研究者、言語コミュニティが協力しました。これらの取り組みにより、深い言語的洞察と文化的文脈が得られ、技術が地域のニーズを満たすと同時に、世界中の多様な言語コミュニティのエンパワーメントを実現しました。

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

アリサ、専属ジャーナリスト MPost、暗号通貨、ゼロ知識証明、投資、および広範な領域を専門としています。 Web3。彼女は新たなトレンドやテクノロジーに鋭い目を向け、包括的な報道を提供して、読者に情報を提供し、進化し続けるデジタル金融の状況に興味を持ってもらえるようにしています。

より多くの記事
アリサ・デビッドソン
アリサ・デビッドソン

アリサ、専属ジャーナリスト MPost、暗号通貨、ゼロ知識証明、投資、および広範な領域を専門としています。 Web3。彼女は新たなトレンドやテクノロジーに鋭い目を向け、包括的な報道を提供して、読者に情報を提供し、進化し続けるデジタル金融の状況に興味を持ってもらえるようにしています。

Hot Stories
ニュースレターにご参加ください。
最新ニュース

Solanaの嵐の前の静けさ:チャート、クジラ、オンチェーンシグナルが今何を語っているか

Solana は、採用の増加、機関投資家の関心、主要なパートナーシップに牽引され、強力なパフォーマンスを発揮してきましたが、潜在的なリスクにも直面しています...

詳細を見る

2025年XNUMX月の暗号通貨:主要トレンド、変化、そして今後の展望

2025 年 XNUMX 月、暗号通貨業界ではコア インフラストラクチャの強化に重点が置かれ、イーサリアムは Pectra の準備を進めていました...

詳細を見る
続きを読む
続きを読む
Bitget WalletがOndoと提携し、BNBチェーン上で100以上のトークン化された株式を発行 
スタ-トアップ ニュースレポート テクノロジー
Bitget WalletがOndoと提携し、BNBチェーン上で100以上のトークン化された株式を発行 
2025 年 12 月 11 日
ゲート、2025年11月の透明性レポートを発表、主要事業ラインのマイルストーンを明らかに 
ニュースレポート テクノロジー
ゲート、2025年11月の透明性レポートを発表、主要事業ラインのマイルストーンを明らかに 
2025 年 12 月 11 日
アニモカ・ブランズ・ジャパンとソルブが連携し、機関投資家向けビットコイン・トレジャリー管理を強化
ニュースレポート テクノロジー
アニモカ・ブランズ・ジャパンとソルブが連携し、機関投資家向けビットコイン・トレジャリー管理を強化
2025 年 12 月 11 日
Sei、Xiaomiデバイスにプリインストールされたアプリをリリース、パートナーシップ拡大に向けた決済インフラを開発
ニュースレポート テクノロジー
Sei、Xiaomiデバイスにプリインストールされたアプリをリリース、パートナーシップ拡大に向けた決済インフラを開発
2025 年 12 月 11 日
CRYPTOMERIA LABS PTE。 株式会社。