Luma ra mắt Uni-1, mẫu robot đầu tiên tích hợp khả năng suy luận và tạo ảnh.
Tóm lại
Luma đã ra mắt Uni-1, mô hình đầu tiên của hãng kết hợp khả năng suy luận và tạo hình ảnh trong cùng một kiến trúc — đánh dấu một bước chuyển lớn so với nguồn gốc tập trung vào video của công ty khởi nghiệp này.
Công ty khởi nghiệp tạo video bằng AI Luma Hãng đã giới thiệu Uni-1, mô hình đầu tiên tích hợp khả năng suy luận và tạo hình ảnh trong một kiến trúc duy nhất, đánh dấu một sự chuyển đổi chiến lược so với trọng tâm trước đây của công ty vào nội dung video.
Theo công ty, trong ba năm qua, công việc của Luma đã phát triển từ việc tái tạo hiện trường sang tạo hình 3D và mở rộng phạm vi khuếch tán video, nhưng phương tiện truyền thông hình ảnh đơn thuần có những hạn chế nếu thiếu sự hiểu biết tích hợp. Uni-1 được định vị là mô hình thống nhất đầu tiên của công ty được thiết kế để kết hợp khả năng suy luận và tạo sinh, nhằm mục đích thúc đẩy trí tuệ tổng quát đa phương thức.
Luma mô tả trí tuệ tổng quát là khả năng suy luận, tưởng tượng, thao tác các ký hiệu và mô phỏng môi trường. Trong khi các hệ thống AI hiện có thể thực hiện các chức năng này một cách riêng biệt, Uni-1 tìm cách kết hợp chúng trong một khuôn khổ duy nhất, mô hình hóa thời gian, không gian và logic cùng nhau để cho phép giải quyết vấn đề mà các quy trình phân mảnh truyền thống không thể đạt được.
Mô hình được xây dựng như một bộ chuyển đổi tự hồi quy chỉ có bộ giải mã, biểu diễn văn bản và hình ảnh trong một chuỗi xen kẽ duy nhất hoạt động như cả đầu vào và đầu ra. Uni-1 có khả năng thực hiện suy luận nội bộ có cấu trúc, phân tích các chỉ thị, giải quyết các ràng buộc, lập kế hoạch bố cục và hiển thị hình ảnh tương ứng.
Uni-1 thể hiện khả năng “suy nghĩ bằng ngôn ngữ, tưởng tượng và hiện thực hóa bằng pixel”, một khả năng được Luma mô tả là “trí thông minh trong pixel”. Các sản phẩm đầu ra bổ sung, bao gồm tạo âm thanh và video, dự kiến sẽ có trong các phiên bản tiếp theo. Mô hình này không chỉ được coi là một công cụ mà còn là một nền tảng giúp chuyển đổi cách thức hoạt động của doanh nghiệp bằng cách tích hợp trực tiếp khả năng suy luận vào quy trình làm việc sáng tạo.
Các đặc vụ Luma mở rộng trí tuệ thống nhất.
Tiếp nối Uni-1, Luma gần đây đã ra mắt Luma Agents, một bộ công cụ dựa trên trí tuệ nhân tạo được thiết kế để xử lý toàn bộ quy trình sản xuất sáng tạo trên nhiều định dạng văn bản, hình ảnh, video và âm thanh. Các tác nhân này hoạt động bằng cách sử dụng hệ thống mô hình Trí tuệ Thống nhất của Luma, được đào tạo trên một hệ thống suy luận đa phương thức duy nhất. Luma định vị các tác nhân này như một giải pháp dành cho các công ty quảng cáo, đội ngũ tiếp thị, studio thiết kế và khách hàng doanh nghiệp, cung cấp khả năng tạo ra nội dung sáng tạo phối hợp trên nhiều định dạng khác nhau.
Các Luma Agent tương thích với các mô hình AI khác, bao gồm Ray 3.14 của Luma, Veo 3 và Nano Banana Pro của Google, Seedream của ByteDance và các công cụ tạo giọng nói của ElevenLabs. Theo Amit Jain, Giám đốc điều hành kiêm đồng sáng lập của Luma, các agent này tận dụng kiến trúc tích hợp của Uni-1, được đào tạo trên nhiều lĩnh vực như âm thanh, video, hình ảnh, ngôn ngữ và khả năng suy luận không gian, cho phép chúng lập kế hoạch, thực hiện và tạo nội dung trong một quy trình làm việc phối hợp và thông minh.
Trách nhiệm công ty
Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.
Giới thiệu về Tác giả
Alisa, một nhà báo tận tâm tại MPostchuyên về tiền điện tử, trí tuệ nhân tạo, đầu tư và lĩnh vực rộng lớn khác. Web3. Với con mắt quan tâm đến các xu hướng và công nghệ mới nổi, cô cung cấp thông tin toàn diện để cung cấp thông tin và thu hút độc giả trong bối cảnh không ngừng phát triển của tài chính kỹ thuật số.
Xem thêm bài viết
Alisa, một nhà báo tận tâm tại MPostchuyên về tiền điện tử, trí tuệ nhân tạo, đầu tư và lĩnh vực rộng lớn khác. Web3. Với con mắt quan tâm đến các xu hướng và công nghệ mới nổi, cô cung cấp thông tin toàn diện để cung cấp thông tin và thu hút độc giả trong bối cảnh không ngừng phát triển của tài chính kỹ thuật số.



