Báo cáo tin tức Công nghệ
05 Tháng Sáu, 2023

LLaMa với 7 tỷ thông số đạt được khả năng suy luận nhanh như chớp trên chip Apple M2 Max

Tóm lại

LLaMa mô hình chạy ở tốc độ 40 token mỗi giây trên chip M2 Max, thể hiện mức sử dụng CPU là 0%, khơi dậy trí tưởng tượng của những người đam mê AI và người dùng.

Các mô hình AI có thể được điều chỉnh theo nhu cầu cá nhân và chạy cục bộ trên các thiết bị cá nhân, cung cấp hỗ trợ được cá nhân hóa và hợp lý hóa các tác vụ thông thường.

Một thành tựu đột phá trong lĩnh vực AI đã được công bố là LLaMa mô hình với 7 tỷ thông số đáng kinh ngạc hiện chạy với tốc độ ấn tượng 40 mã thông báo mỗi giây trên MacBook được trang bị chip M2 Max tiên tiến. Kỳ tích đáng chú ý này đã được thực hiện thông qua một bản cập nhật gần đây cho kho lưu trữ GIT của Greganov, người đã thực hiện thành công suy luận mô hình trên GPU kim loại, một máy gia tốc chuyên dụng được tìm thấy trong các chip mới nhất của Apple.

LLaMa với 7 tỷ thông số đạt được khả năng suy luận nhanh như chớp trên chip Apple M2 Max
Tín dụng: Metaverse Post (mpost.io)
Đề xuất: Guanaco nổi lên như một nguồn mở tiềm năng ChatGPT Đối thủ

Việc triển khai suy luận mô hình trên GPU Metal đã mang lại kết quả phi thường. Bằng cách sử dụng phần cứng đặc biệt này, LLaMa mô hình thể hiện mức sử dụng CPU đáng kinh ngạc là 0%, khai thác hiệu quả sức mạnh xử lý của tất cả 38 lõi Metal. Thành tích này không chỉ thể hiện khả năng của mô hình mà còn nêu bật kỹ năng và kiến ​​thức chuyên môn đặc biệt của Greganov với tư cách là một kỹ sư xuất sắc.

Ý nghĩa của sự phát triển này rất sâu rộng, khơi dậy trí tưởng tượng của những người đam mê AI cũng như người dùng. Với cá nhân hóa LLaMa các mô hình chạy cục bộ, các tác vụ thông thường có thể được các cá nhân quản lý dễ dàng, mở ra một kỷ nguyên mới của mô đun hóa. Khái niệm xoay quanh một đào tạo người mẫu đồ sộ tập trung, sau đó được mỗi người dùng tinh chỉnh và tùy chỉnh trên dữ liệu cá nhân của họ, tạo ra một trợ lý AI hiệu quả và được cá nhân hóa cao.

Tầm nhìn về việc có một cá nhân hóa LLaMa mô hình hỗ trợ các cá nhân trong các vấn đề hàng ngày có tiềm năng to lớn. Bằng cách bản địa hóa mô hình trên thiết bị cá nhân, người dùng có thể trải nghiệm những lợi ích của AI mạnh mẽ trong khi duy trì quyền kiểm soát dữ liệu của họ. Bản địa hóa này cũng đảm bảo thời gian phản hồi nhanh, cho phép tương tác nhanh chóng và liền mạch với trợ lý AI.

Sự kết hợp giữa kích thước mô hình khổng lồ và khả năng suy luận hiệu quả trên phần cứng chuyên dụng mở đường cho một tương lai nơi AI trở thành một phần không thể thiếu trong cuộc sống của con người, cung cấp hỗ trợ được cá nhân hóa và đơn giản hóa các tác vụ thường ngày.

Những tiến bộ như thế này đưa chúng ta đến gần hơn với việc hiện thực hóa một thế giới nơi các mô hình AI có thể được điều chỉnh theo nhu cầu cá nhân và chạy cục bộ trên thiết bị cá nhân. Với mỗi người dùng có khả năng tinh chỉnh và tối ưu hóa LLaMa dựa trên dữ liệu duy nhất của họ, tiềm năng về hiệu quả và năng suất do AI điều khiển là vô hạn.

Những thành tựu đạt được trong LLaMa hiệu suất của mô hình trên chip Apple M2 Max là một minh chứng cho tiến bộ nhanh chóng đang được thực hiện trong nghiên cứu và phát triển AI. Với các kỹ sư tận tụy như Greganov vượt qua ranh giới của những gì có thể, tương lai hứa hẹn cho các dịch vụ được cá nhân hóa, hiệu quả và vận hành tại địa phương Các mô hình AI sẽ thay đổi cách thức chúng ta tương tác với công nghệ.

Đọc thêm về AI:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Xem thêm bài viết
Damir Yalalov
Damir Yalalov

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Sự thèm muốn của các tổ chức ngày càng tăng đối với các quỹ ETF Bitcoin trong bối cảnh biến động

Tiết lộ thông qua hồ sơ 13F cho thấy các nhà đầu tư tổ chức đáng chú ý đang đầu tư vào Bitcoin ETF, nhấn mạnh sự chấp nhận ngày càng tăng đối với ...

Biết thêm

Ngày tuyên án đến: Số phận của CZ đang cân bằng khi Tòa án Hoa Kỳ xem xét lời bào chữa của DOJ

Changpeng Zhao sẽ phải đối mặt với bản tuyên án tại tòa án Hoa Kỳ ở Seattle vào ngày hôm nay.

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Injective hợp tác với AltLayer để mang lại tính bảo mật cho việc thiết lập lại inEVM
Kinh doanh Báo cáo tin tức Công nghệ
Injective hợp tác với AltLayer để mang lại tính bảo mật cho việc thiết lập lại inEVM
3 Tháng Năm, 2024
Masa hợp tác với Teller để giới thiệu nhóm cho vay MASA, cho phép vay USDC trên cơ sở
thị trường Báo cáo tin tức Công nghệ
Masa hợp tác với Teller để giới thiệu nhóm cho vay MASA, cho phép vay USDC trên cơ sở
3 Tháng Năm, 2024
Velodrome ra mắt phiên bản Superchain Beta trong những tuần tới và mở rộng trên các chuỗi khối lớp 2 của OP
thị trường Báo cáo tin tức Công nghệ
Velodrome ra mắt phiên bản Superchain Beta trong những tuần tới và mở rộng trên các chuỗi khối lớp 2 của OP
3 Tháng Năm, 2024
CARV công bố hợp tác với Aethir để phân cấp lớp dữ liệu và phân phối phần thưởng
Kinh doanh Báo cáo tin tức Công nghệ
CARV công bố hợp tác với Aethir để phân cấp lớp dữ liệu và phân phối phần thưởng
3 Tháng Năm, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH