新聞報導 專業技術
2023 年 6 月 05 日

LLaMa 擁有 7 億個參數,在 Apple M2 Max 晶片上實現閃電般的快速推理

簡單來說

LLaMa 模型在 M40 Max 晶片上以每秒 2 個代幣的速度運行,展示了 0% 的 CPU 使用率,激發了 AI 愛好者和用戶的想像。

人工智能模型可以根據個人需求量身定制,並在個人設備上本地運行,提供個性化幫助並簡化日常任務。

人工智能領域的一項突破性成果被揭曉為 LLaMa 擁有驚人 7 億個參數的模型 現在在配備尖端 M40 Max 芯片的 MacBook 上以每秒 2 個令牌的驚人速度運行。 通過最近對 GIT 存儲庫的更新,使這一非凡的壯舉成為可能 格雷加諾夫,誰成功地實施了模型推理 金屬顯卡,一種在 Apple 最新芯片中發現的專用加速器。

LLaMa 擁有 7 億個參數,在 Apple M2 Max 晶片上實現閃電般的快速推理
信用: Metaverse Post (mpost.io)
推薦的: guanaco 成為潛在的開源項目 ChatGPT 競爭者

在 Metal GPU 上實現模型推理取得了非凡的成果。 利用這種特殊的硬件, LLaMa 該模型展示了令人震驚的 0% CPU 使用率,有效利用了所有 38 個金屬核心的處理能力。 這項成就不僅展示了該模型的能力,還突顯了 Greganov 作為傑出工程師的卓越技能和專業知識。

這項發展的影響是深遠的,激發了人工智慧愛好者和使用者的想像。 具有個性化的 LLaMa 本地運行的模型,日常任務可以由個人輕鬆管理,開創了一個新時代 模塊化. 這個概念圍繞著一個 訓練有素的大規模模型 集中,然後由每個用戶根據他們的個人數據進行微調和定制,從而產生高度個性化和高效的 AI 助手。

擁有個性化的願景 LLaMa 幫助個人處理日常事務的模型具有巨大的潛力。 透過在個人裝置上在地化模型,使用者可以體驗強大人工智慧的優勢,同時 保持對其數據的控制. 這種本地化還確保了快速響應時間,從而實現與 AI 助手的快速無縫交互。

大規模模型尺寸與專用硬件上的高效推理相結合,為人工智能成為人們生活不可或缺的一部分的未來鋪平了道路,提供個性化幫助並簡化日常任務。

這些進步使我們更接近實現一個人工智慧模型可以根據個人需求定制並在個人設備上本地運行的世界。 每個用戶都有能力完善和優化他們的 LLaMa 基於其獨特數據的模型,人工智慧驅動的效率和生產力的潛力是無限的。

見證的成就 LLaMa 該模型在 Apple M2 Max 晶片上的性能證明了 快速進步 正在人工智能研究和開發中。 隨著像 Greganov 這樣敬業的工程師不斷突破可能的界限,未來有望實現個性化、高效和本地化運營 將改變方式的 AI 模型 我們與技術互動。

閱讀有關人工智能的更多信息:

免責聲明

在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。

關於作者

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

更多文章
達米爾亞拉洛夫
達米爾亞拉洛夫

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

Hot Stories
加入我們的時事通訊。
最新消息

在波動中機構對比特幣 ETF 的興趣增強

透過 13F 文件揭露的資訊顯示,著名機構投資者涉足比特幣 ETF,突顯出人們越來越接受...

了解更多

宣判日到來:美國法院考慮司法部的認罪,CZ 的命運懸而未決

趙長鵬將於今日在西雅圖的美國法院接受宣判。

了解更多
加入我們的創新技術社區
了解更多
阅读更多
Morph 推出其 Holesky 測試網,具有樂觀的 zkEVM 整合、橋接機制和去中心化定序器網路功能
新聞報導 專業技術
Morph 推出其 Holesky 測試網,具有樂觀的 zkEVM 整合、橋接機制和去中心化定序器網路功能
2024 年 5 月 6 日
Robinhood Crypto 因涉嫌證券違規而收到美國證券交易委員會的 Wells 通知
市場 新聞報導 專業技術
Robinhood Crypto 因涉嫌證券違規而收到美國證券交易委員會的 Wells 通知
2024 年 5 月 6 日
QuickSwap 部署在 X Layer 主網上,並透過 Citadel 發布擴展 Polygon CDK 網絡
新聞報導 專業技術
QuickSwap 部署在 X Layer 主網上,並透過 Citadel 發布擴展 Polygon CDK 網絡 
2024 年 5 月 6 日
Layer 2 網路 Linea 發起 ZeroLend 零代幣認領 Airdrop 用戶和投資者
市場 新聞報導 專業技術
Layer 2 網路 Linea 發起 ZeroLend 零代幣認領 Airdrop 用戶和投資者
2024 年 5 月 6 日