新聞報導 專業技術
2023 年 2 月 06 日

XLM-V:一種嘗試解決詞彙瓶頸問題的多語言掩碼語言模型新方法

簡單來說

文章提出了以下問題: 語言模型 參數增加,深度增加,但詞彙量仍然相同。

研究人員開始以意想不到的方式使用詞彙表中的 1 萬個標記訓練新模型。

研究人員決心通過如此顯著的代幣增加來了解他們可以做出什麼樣的改進。

所提出的問題 文章 題為“XLM-V: Overcoming the Vocabulary Bottleneck in Multilingual Masked Language Models”的文章指出,當語言模型的參數和深度增加時,其詞彙量保持不變。 例如,mT5 模型有 13B 個參數,但有 250K 詞的詞彙表,支持 100 多種語言。 因此,每種語言大約有 2,500 個獨特的標記,這顯然是一個非常小的數字。

XLM-V:一種嘗試解決詞彙瓶頸問題的多語言掩蔽語言模型的新方法
@ Midjourney / 沙律

作者採取什麼行動? 他們以意想不到的方式開始使用詞彙表中的 1 萬個標記訓練新模型。 XLM-R 以前存在,但是,通過這次升級,它將成為 XLM-V。 作者決心看看他們可以通過如此顯著的代幣增加做出什麼樣的改進。

相關文章: 到 100 年,AI 模型訓練成本預計將從 500 億美元增加到 2030 億美元

XLM-V 是 XLM-R 沒有的新東西怎麼樣?

XLM-V 是 XLM-R 沒有的新東西怎麼樣?

改進的 多語言模型 with Language-Clustered Vocabularies 方法用於為每種語言構造詞彙表示向量,如下所示:對於語言集合中的每種語言,它們構成一個二元向量,其中每個元素都是該語言中的一個特定單詞。 一個表示該詞包含在該語言的詞典中(您可以在附件中查看帶有圖形描述的圖像。)但是,通過利用每個詞位出現的負對數概率創建一個向量,作者增強了引用的方式.

  1. 之後對向量進行分組。 此外,在每個特定的集群上訓練了一個句子模型,以阻止詞彙不相關的語言之間的詞彙轉移。
  2. ALP 評估字典表示特定語言的能力。
  3. 使用算法創建 ULM 字典是以下步驟。 它從一個大的初始字典開始,然後逐漸減少它,直到標記的數量低於字典大小的某個閾值。

閱讀有關人工智能的更多信息:

標籤:

免責聲明

在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。

關於作者

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

更多文章
達米爾亞拉洛夫
達米爾亞拉洛夫

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

Hot Stories

金磚國家關注穩定幣貿易解決方案

by 維多利亞·帕爾奇克
2024 年 5 月 01 日

比特幣 L2 網路 BOB 與 LayerZero 整合以增強功能

by 艾莉莎戴維森
2024 年 5 月 01 日
加入我們的時事通訊。
最新消息

比特幣 L2 網路 BOB 與 LayerZero 整合以增強功能

by 艾莉莎戴維森
2024 年 5 月 01 日

宣判日到來:美國法院考慮司法部的認罪,CZ 的命運懸而未決

趙長鵬將於今日在西雅圖的美國法院接受宣判。

了解更多

Samourai Wallet 創辦人被指控在暗網交易中協助 2 億美元

Samourai 錢包創始人的被捕對整個行業來說是一個顯著的挫折,凸顯了持續的...

了解更多
加入我們的創新技術社區
了解更多
阅读更多
Ankr 與人工智慧區塊鏈平台 Talus Network 合作,為人工智慧解鎖比特幣流動性
購物 新聞報導 專業技術
Ankr 與人工智慧區塊鏈平台 Talus Network 合作,為人工智慧解鎖比特幣流動性
2024 年 5 月 1 日
幣安實驗室支援Movement Labs以促進Facebook跨區塊鏈的Move集成
購物 新聞報導 專業技術
幣安實驗室支援Movement Labs以促進Facebook跨區塊鏈的Move集成
2024 年 5 月 1 日
金磚國家關注穩定幣貿易解決方案
購物 市場 故事和評論 專業技術
金磚國家關注穩定幣貿易解決方案
2024 年 5 月 1 日
比特幣 L2 網路 BOB 與 LayerZero 整合以增強功能
購物 新聞報導 專業技術
比特幣 L2 網路 BOB 與 LayerZero 整合以增強功能
2024 年 5 月 1 日