新聞報導 專業技術
2023 年 5 月 23 日

Meta 開發了一種開源語音 AI,可識別 4,000 多種口頭語言

簡單來說

該公司的 MMS 項目可以識別 4,000 多種語言。

與大多數其他公開宣布的 AI 項目一樣,Meta 正在共享其模型和代碼,以幫助保護語言多樣性。

通過這項工作,他們希望為保護世界上令人難以置信的語言多樣性做出一點貢獻。

Meta 創造了 一個令人耳目一新的人工智能語言模型 ChatGPT。 開源的 彩信項目 旨在保護語言多樣性和鼓勵研究,可以識別 4,000 多種口頭語言並生成 1,100 多種語言的文本(語音)。 公司擁有 公開發布 它的模型和代碼今天以進一步實現其目標。

“我們正在公開分享我們的創作和代碼,以鼓勵研究界的其他人以我們的工作為基礎,”Meta 寫道。 “通過這項努力,我們希望保護世界上巨大的語言多樣性。”

Meta 開發了一種開源語音 AI,可識別 4,000 多種口頭語言

在沒有轉錄標籤的大量音頻上訓練語音識別器和文本到語音模型的難度是典型的。 標籤對於 機器學習,可以正確識別和分類數據。 然而,對於將在未來幾十年消失的語言,“這些數據根本不存在,”正如 Meta 解釋的那樣。

Meta 使用宗教文本的錄音以非常規的方式收集數據。 “我們使用了聖經等宗教文本的翻譯,這些文本已被廣泛研究用於多種語言的基於文本的語言翻譯研究,因為它們被翻譯成多種不同的語言,”該公司表示。 我們從公開的翻譯中提取了人們用不同語言閱讀這些文本的錄音。” Meta 的研究人員將 4,000 多種語言添加到 模型.

這種方法聽起來像是一個偏向於基督教世界觀的嚴重偏見人工智能模型的秘訣。 然而,在你嘲笑這個想法之前,請從 Meta 的角度考慮它:研究人員認為情況確實如此,因為他們採用了連接主義的 CTC 時間分類(或序列到序列或序列類型模型),該模型在術語方面更加有限計算能力與 大型語言模型 (也稱為序列類型)或用於語音識別的序列模型。 Meta 說,這並沒有導致大多數男性演講者錄製的宗教錄音中存在男性偏見。

Meta 使用 wav2vec 2.0,一種“自監督語音表示學習”模型,來訓練 wav2vec 2.0 對齊模型 這使數據更有用。 Meta 從未標記數據中自我監督的自我監督語音模型取得了很好的效果。 Meta 發現,與現有模型相比,大規模多語言語音模型表現良好,覆蓋的語言數量是現有模型的 10 倍,特別是與 耳語. Meta 實現了一半的單詞錯誤率,而 Massively Multilingual Speech 覆蓋的語言數量是原來的 11 倍。

Meta 表示其新的語音轉文本模型並不完美。 該公司寫道,例如,他們可能會錯誤翻譯單詞或短語,這可能會導致冒犯性和/或不正確的言論。 人工智能技術的負責任發展必須通過人工智能社區之間的合作來實現。

由於 Meta 發布了用於開源研究的 MMS,它希望能夠扭轉語言使用消失的趨勢。 在這個願景中,輔助技術、TTS,甚至虛擬現實和增強現實技術可能會讓每個人都用他們的母語說話和學習。 它說:“我們設想一個技術具有相反效果的世界,促使人們保持他們的語言的活力,因為他們可以通過說他們喜歡的語言來獲取信息和使用技術。”

  • 最近,元 已公佈 2023 年第一季度的財務業績。儘管最近進行了重組,但該公司第一季度的銷售額意外增長,令投資者感到意外。 股價週三飆升 12%。

閱讀更多相關文章:

免責聲明

在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。

關於作者

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

更多文章
達米爾亞拉洛夫
達米爾亞拉洛夫

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

Hot Stories

Injective 與 AltLayer 聯手為 inEVM 帶來重新抵押安全性

by 艾莉莎戴維森
2024 年 5 月 03 日

Masa 與 Teller 合作推出 MASA 借貸池,支援 USDC 借貸

by 艾莉莎戴維森
2024 年 5 月 03 日

CARV 宣布與 Aethir 合作,以分散其數據層並分配獎勵

by 艾莉莎戴維森
2024 年 5 月 03 日
加入我們的時事通訊。
最新消息

Injective 與 AltLayer 聯手為 inEVM 帶來重新抵押安全性

by 艾莉莎戴維森
2024 年 5 月 03 日

Masa 與 Teller 合作推出 MASA 借貸池,支援 USDC 借貸

by 艾莉莎戴維森
2024 年 5 月 03 日

CARV 宣布與 Aethir 合作,以分散其數據層並分配獎勵

by 艾莉莎戴維森
2024 年 5 月 03 日

在波動中機構對比特幣 ETF 的興趣增強

透過 13F 文件揭露的資訊顯示,著名機構投資者涉足比特幣 ETF,突顯出人們越來越接受...

了解更多

宣判日到來:美國法院考慮司法部的認罪,CZ 的命運懸而未決

趙長鵬將於今日在西雅圖的美國法院接受宣判。

了解更多
加入我們的創新技術社區
了解更多
阅读更多
Injective 與 AltLayer 聯手為 inEVM 帶來重新抵押安全性
購物 新聞報導 專業技術
Injective 與 AltLayer 聯手為 inEVM 帶來重新抵押安全性
2024 年 5 月 3 日
Masa 與 Teller 合作推出 MASA 借貸池,支援 USDC 借貸
市場 新聞報導 專業技術
Masa 與 Teller 合作推出 MASA 借貸池,支援 USDC 借貸
2024 年 5 月 3 日
Velodrome 將在未來幾週內推出 Superchain Beta 版本,並在 OP 堆疊第 2 層區塊鏈上進行擴展
市場 新聞報導 專業技術
Velodrome 將在未來幾週內推出 Superchain Beta 版本,並在 OP 堆疊第 2 層區塊鏈上進行擴展
2024 年 5 月 3 日
CARV 宣布與 Aethir 合作,以分散其數據層並分配獎勵
購物 新聞報導 專業技術
CARV 宣布與 Aethir 合作,以分散其數據層並分配獎勵
2024 年 5 月 3 日