Các nhà nghiên cứu của Carnegie Mellon trình bày MLC LLM để chạy các mô hình ngôn ngữ trên mọi thiết bị
Tóm lại
MLC LLM và Web LLM cho phép người dùng triển khai mô hình ngôn ngữ trên mọi thiết bị, cho phép tạo ra các ứng dụng và cách sử dụng mới để hiểu ngôn ngữ tự nhiên.
Các nhà nghiên cứu của Đại học Carnegie Mellon đã trình bày công ty TNHH MLC, một bộ công cụ có thể cách mạng hóa cách chạy các mô hình ngôn ngữ trên bất kỳ thiết bị nào. Những mô hình như vậy cho phép người dùng tạo ra một loạt các ứng dụng ngôn ngữ tự nhiên, chẳng hạn như trợ lý ảo và chatbot thông minh. Thông qua các tối ưu hóa hiệu suất riêng biệt, MLC LLM hiện có thể được sử dụng trên các nền tảng và tình huống khác nhau.
Tìm hiểu thêm: 10 trường đại học tốt nhất để nghiên cứu trí tuệ nhân tạo |
Công cụ mới, được gọi là Web LLM, cũng là một phần của sáng kiến này. Nó cho phép khởi chạy các mô hình ngôn ngữ trực tiếp trong trình duyệt, nghĩa là người dùng không phải tải xuống hệ thống theo cách thủ công, hệ thống có thể có kích thước vài gigabyte. Mô hình Vicuna 7B, có 7 tỷ thông số, đã được tạo ra theo cách này. Điều này có thể cực kỳ hữu ích khi thiết kế các trợ lý ảo và chatbot phù hợp hơn vì chúng yêu cầu một lượng lớn tham số.
Sử dụng MLC LLM và Web LLM, giờ đây có thể triển khai bất kỳ mô hình ngôn ngữ lựa chọn trên bất kỳ thiết bị nào. Các nhà nghiên cứu tại Carnegie Mellon đã báo cáo rằng điều này sẽ mở ra một loạt ứng dụng mà trước đây không thể thực hiện được. Bất kì mô hình ngôn ngữ giờ đây có thể được triển khai trên nhiều thiết bị điện toán khác nhau, chẳng hạn như máy tính xách tay và điện thoại, hoặc thậm chí cả bộ xử lý và bộ tăng tốc video. Điều này mở ra một thế giới khả năng xử lý ngôn ngữ tự nhiên và học máy.
Sáng kiến mới của Carnegie Mellon mở đường cho một loạt ứng dụng và cách sử dụng mới để hiểu ngôn ngữ tự nhiên. Vì bạn có thể sử dụng các mô hình ngôn ngữ này trên mọi thiết bị nên việc triển khai công nghệ như vậy trong nhiều tình huống khác nhau sẽ dễ dàng hơn nhiều. Cho dù đó là trợ lý ảo hay dịch vụ khách hàng tự động, công cụ mới này có thể có tác động mạnh mẽ đến cách thực hiện các nhiệm vụ này.
Nhóm nghiên cứu của Carnegie Mellon đã phát triển MLC LLM để chạy trên mọi thiết bị, bao gồm iPhone và các thiết bị nhà thông minh khác, với bộ xử lý hiện đại và RAM 6GB trở lên. Cách tiếp cận hợp lý này có nghĩa là các thiết bị hiện có thể chạy các mô hình ngôn ngữ với tốc độ tạo gần như theo thời gian thực, ngay cả khi được tối ưu hóa bởi các nhà phát triển bên ngoài chứ không phải các kỹ sư của Apple.
Ngoài việc cho phép tương tác tự nhiên với các sản phẩm, MLC LLM cũng có thể được sử dụng để tối ưu hóa các tác vụ quản lý thiết bị. Chỉ cần 4GB đến 6GB RAM để chạy, mô hình ngôn ngữ mang tính cách mạng này sẽ là sự bổ sung tuyệt vời cho các mẫu iPhone trong tương lai và có khả năng được đưa vào sản xuất mà không mất nhiều thời gian. quá trình phát triển.
Bằng cách giới thiệu MLC LLM mô hình ngôn ngữ, các nhà nghiên cứu của Carnegie Mellon đã tạo ra một cách hiệu quả và mạnh mẽ để chạy các mô hình ngôn ngữ trên bất kỳ thiết bị nào. Hệ thống MLC LLM là một bước đột phá trong xử lý ngôn ngữ tự nhiên và sẽ cho phép người dùng để tương tác tự nhiên với thiết bị của họ hiệu quả hơn. Nó cũng có khả năng tăng tốc đáng kể quá trình phát triển cho các tác vụ quản lý thiết bị trong tương lai. Khả năng là vô tận với MLC LLM, và công việc của Carnegie Mellon chắc chắn sẽ thay đổi cách chúng ta nghĩ về các mô hình ngôn ngữ Để tốt hơn.
Đọc thêm về AI:
Từ chối trách nhiệm
Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.
Giới thiệu về Tác giả
Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet.
Xem thêm bài viếtDamir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet.