新聞報導 專業技術
2023 年 3 月 15 日

Facebook 開發了一種將 AI Transformer 性能翻倍的新方法

簡單來說

Facebook 基於 Transformer 架構開發了一種新方法,可以將 AI Transformer 的性能提高一倍。

新方法在處理不同塊之間的間隙中找到最相似的補丁,並將它們組合起來以降低計算複雜度。

臉書開發了一個 新方法 將 AI 變壓器的性能提高一倍。 方法是 基於變壓器架構 專為書籍、文章和博客等長篇文本而設計。 新的 AI Transformer 的目標是提高 基於變壓器的模型 通過使它們在處理長序列時更加高效和有效來處理長格式文本。 AI Transformer 的結果非常有希望,這種新方法有機會幫助提高基於 Transformer 的模型在各種任務上的性能。

這種新方法有望對自然語言處理任務產生重大影響,例如語言翻譯、摘要和問答系統。 它還有望導致開發更複雜的 AI 模型,這些模型可以處理更長、更複雜的文本。

Facebook 開發了一種新方法,可以將 AI 轉換器的性能提高一倍
閱讀更多: 10 年 2023 多個最佳 AI 照片編輯器:在線且免費

為了處理圖像,現代變壓器將其切成小塊(通常是正方形:見下面的 gif),然後對這些粒子的表示進行操作,每個粒子都由一個“令牌”表示。 正如我們所知,Transformers 的工作速度越慢,這些 token 片段越多(這適用於文本和圖像),並且最常見的 transformer 具有二次關係。 也就是說,添加的令牌越多,處理速度就越慢。 為了解決這個問題,研究人員提出了各種技術來減少圖像處理所需的令牌數量,例如分層和自適應池化。 這些方法旨在保持輸出質量,同時最小化計算成本。

新方法在處理不同塊之間的間隙中找到最相似的補丁並將它們組合起來以降低計算複雜度。 合併令牌的份額是一個超參數; 它越高,質量越低,但加速度也越高。 實驗表明,可以合併大約 40% 的令牌,質量損失為 0.1-0.4%,並獲得雙倍加速(因此消耗更少的內存)。 這種新方法是一種很有前途的解決方案,可以降低圖像處理的計算複雜性,並且可以在不影響最終輸出質量的情況下實現更快、更高效的處理。

當我們可視化我們合併了哪些補丁時,我們可以看到它們 1) 彼此靠近並且 2) 描述相同的對象(參見 GIF 上相同顏色的區域)。 也就是說,不會丟失任何重要信息; 對象保持在模型的“視野中”。 這在轉換器中應用得越晚,合併的標記就越多(因為這些是更高級別的表示,它們本身很好地描述了圖像的內容)。

這種基於獨創性和理解事物工作原理的工程方法看起來非常有吸引力。 此外,Meta 的開發人員承諾為 StableDiffusion 帶來更多,以加快速度。 很棒的是,因為變壓器無處不在,所以可以在各種模型中快速實施這些技巧。 這顯示了工程解決方案對各行各業產生廣泛影響的潛力。 看看這些進步如何在 變壓器型號 將隨著時間的推移繼續發展和改進。

  • 元 AI 和 Paperswithcode 已經發布了第一個 120B 模型卡拉狄加訓練科學文本,允許更準確和更快的預測。 Galactica 的目標是幫助研究人員區分重要的和不相關的。

閱讀更多相關新聞:

免責聲明

在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。

關於作者

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

更多文章
達米爾亞拉洛夫
達米爾亞拉洛夫

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

Hot Stories

Injective 與 AltLayer 聯手為 inEVM 帶來重新抵押安全性

by 艾莉莎戴維森
2024 年 5 月 03 日

Masa 與 Teller 合作推出 MASA 借貸池,支援 USDC 借貸

by 艾莉莎戴維森
2024 年 5 月 03 日

CARV 宣布與 Aethir 合作,以分散其數據層並分配獎勵

by 艾莉莎戴維森
2024 年 5 月 03 日
加入我們的時事通訊。
最新消息

Injective 與 AltLayer 聯手為 inEVM 帶來重新抵押安全性

by 艾莉莎戴維森
2024 年 5 月 03 日

Masa 與 Teller 合作推出 MASA 借貸池,支援 USDC 借貸

by 艾莉莎戴維森
2024 年 5 月 03 日

CARV 宣布與 Aethir 合作,以分散其數據層並分配獎勵

by 艾莉莎戴維森
2024 年 5 月 03 日

在波動中機構對比特幣 ETF 的興趣增強

透過 13F 文件揭露的資訊顯示,著名機構投資者涉足比特幣 ETF,突顯出人們越來越接受...

了解更多

宣判日到來:美國法院考慮司法部的認罪,CZ 的命運懸而未決

趙長鵬將於今日在西雅圖的美國法院接受宣判。

了解更多
加入我們的創新技術社區
了解更多
阅读更多
Injective 與 AltLayer 聯手為 inEVM 帶來重新抵押安全性
購物 新聞報導 專業技術
Injective 與 AltLayer 聯手為 inEVM 帶來重新抵押安全性
2024 年 5 月 3 日
Masa 與 Teller 合作推出 MASA 借貸池,支援 USDC 借貸
市場 新聞報導 專業技術
Masa 與 Teller 合作推出 MASA 借貸池,支援 USDC 借貸
2024 年 5 月 3 日
Velodrome 將在未來幾週內推出 Superchain Beta 版本,並在 OP 堆疊第 2 層區塊鏈上進行擴展
市場 新聞報導 專業技術
Velodrome 將在未來幾週內推出 Superchain Beta 版本,並在 OP 堆疊第 2 層區塊鏈上進行擴展
2024 年 5 月 3 日
CARV 宣布與 Aethir 合作,以分散其數據層並分配獎勵
購物 新聞報導 專業技術
CARV 宣布與 Aethir 合作,以分散其數據層並分配獎勵
2024 年 5 月 3 日