Google phát hành một “GPT-like”, mô hình robot RT-1
Google đã phát hành một mẫu robot mới, RT-1, tương tự như GPT mô hình được sử dụng trong nó OpenAI chương trình trí tuệ nhân tạo. Mô hình mới được thiết kế với các chương trình robot khác của Google, bao gồm cả chương trình ô tô không người lái. Mô hình RT-1 được trình bày ở đây là một bước tiến tới các mô hình AI tổng quát trong lĩnh vực người máy. Trong thế giới thực, RT-1 có thể thực hiện hơn 700 lệnh với tỷ lệ thành công 97%.
Những tiến bộ gần đây trong nghiên cứu máy học (ML), chẳng hạn như thị giác máy tính và xử lý ngôn ngữ tự nhiên, đã được kích hoạt nhờ một phương pháp chung được chia sẻ sử dụng các bộ dữ liệu lớn, đa dạng và các mô hình biểu cảm. Mặc dù đã có nhiều nỗ lực khác nhau để áp dụng cách tiếp cận này cho người máy, nhưng cho đến nay, người máy vẫn chưa sử dụng các mô hình có khả năng cao như các lĩnh vực phụ khác.
Các nhà phát triển đã thu thập một bộ dữ liệu lớn, đa dạng về quỹ đạo của rô-bốt để phát triển một hệ thống có thể khái quát hóa cho các nhiệm vụ mới và thể hiện sự mạnh mẽ trước nhiều phiền nhiễu và bối cảnh khác nhau. Để thu thập 130 tập trong 17 tháng, họ đã triển khai 13 bộ điều khiển rô-bốt EDR, mỗi bộ có một cánh tay 7 bậc tự do, một bộ kẹp hai ngón tay và một đế di động. Các nhà nghiên cứu đã sử dụng các ví dụ của con người thu được bằng cách điều khiển từ xa và họ đánh dấu từng sự kiện bằng một lời giải thích bằng văn bản về mệnh lệnh mà robot vừa thực hiện. Nhặt và sắp xếp đồ vật, mở và đóng ngăn kéo, lấy đồ vật vào và lấy ra khỏi ngăn kéo, đặt đồ vật dài thẳng đứng, lật đổ đồ vật, kéo khăn ăn và mở lọ nằm trong số các kỹ năng cấp cao có trong bộ dữ liệu.
Video sau đây trình bày một vài màn trình diễn tác vụ đường dài PaLM-SayCan-RT1 mẫu trong một số nhà bếp thực tế.
Trong cả bốn lĩnh vực, RT-1 hoạt động tốt hơn đáng kể so với đường cơ sở, thể hiện mức độ khái quát hóa và khả năng phục hồi vượt trội.
RT-1 Robotics Transformer là một mô hình tạo hành động cho các nhiệm vụ chế tạo rô-bốt trong thế giới thực, đơn giản và có thể mở rộng. Nó mã hóa tất cả đầu vào và đầu ra, đồng thời nén chúng bằng mô hình EfficientNet được đào tạo trước với sự kết hợp ngôn ngữ ban đầu và trình học mã thông báo. RT-1 thể hiện hiệu suất mạnh mẽ qua hàng trăm tác vụ, cũng như khả năng khái quát hóa rộng rãi và mạnh mẽ trong các cài đặt trong thế giới thực.
Tìm hiểu thêm:
Từ chối trách nhiệm
Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.
Giới thiệu về Tác giả
Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet.
Xem thêm bài viếtDamir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet.