Báo cáo tin tức SMW Công nghệ
10 Tháng Năm, 2023

Anthropic đề xuất 'AI theo ngữ cảnh' cho các mô hình trò chuyện dựa trên 60 nguyên tắc

Tóm lại

OpenAI sử dụng học tăng cường từ phản hồi của con người (RLHF) để căn chỉnh mô hình ngôn ngữ với các nguyên tắc của con người, an toàn và hữu ích.

Anthropic đã đề xuất một cách tiếp cận khác: AI theo ngữ cảnh, liên quan đến việc mọi người viết hiến pháp mà mô hình nên tuân theo.

Hiến pháp này dựa trên Tuyên ngôn Nhân quyền của Liên Hợp Quốc, Điều khoản Dịch vụ của Apple, Nguyên tắc Khuyến khích Xem xét Quan điểm Phi Phương Tây.

Anthropic đã đề xuất một cách tiếp cận mới để đào tạo các mô hình trò chuyện bằng cách sử dụng 'AI hiến pháp'. Phương pháp này được xây dựng trên OpenAI'S học tăng cường từ phản hồi của con người nhưng được xây dựng dựa trên phản hồi đó bằng cách tránh phải viết các mẫu đào tạo sâu. Thay vào đó, mô hình được đào tạo để đáp ứng đầu vào thông qua việc sử dụng hiến pháp có nghĩa là hoạt động như một bộ luật để mô hình tuân theo.

Anthropic đề xuất 'AI theo ngữ cảnh' cho các mô hình trò chuyện dựa trên 60 nguyên tắc
anthropic.com
Đề nghị: Ví dụ-OpenAI các nhân viên đã thành lập Anthropic, một doanh nghiệp đã thu hút được hơn 700 triệu đô la tài trợ

Thông qua phương pháp này, AI có thể tạo các mẫu đào tạo của riêng mình bằng cách đánh giá những gì nó đã nói so với bộ nguyên tắc được chấp nhận về mặt pháp lý. Kỹ thuật tiết kiệm thời gian này có thể được coi là Isaac Asimov'S Định luật người máy đưa vào thực tế.

Có quá nhiều nguyên tắc hình thành nên cơ sở của mô hình để có thể thảo luận chi tiết. Tuy nhiên, chúng đề cập đến nhiều chủ đề, chẳng hạn như đạo đức, lo ngại rủi ro, kinh tế và trí tuệ nhân tạo. Mỗi cái đã được phát triển để giúp hướng dẫn các quyết định của AI khi phản hồi lời nhắc đàm thoại.

Anthropic đã quản lý để đào tạo hiệu quả một mô hình AI tên là Claude, mô hình này đã cạnh tranh thành công với OpenAI'S ChatGPT. Sử dụng Phương pháp hiến pháp-AI, Claude có thể trả lời các lời nhắc đàm thoại ở mức độ chính xác ấn tượng, nhưng dự kiến ​​sẽ có những cải tiến bổ sung khi Anthropic tiếp tục phát triển dựa trên công nghệ thay đổi cuộc chơi này.

Sử dụng bộ nguyên tắc và một vài ví dụ về quy trình, mô hình được dạy cách đánh giá và sửa đổi các câu trả lời của chính nó trong suốt giai đoạn đầu tiên. Giai đoạn thứ hai liên quan đến việc đào tạo một mô hình bằng cách sử dụng phương pháp học tăng cường, nhưng thay vì sử dụng đầu vào từ con người, nó sử dụng phản hồi do AI tạo ra dựa trên một bộ nguyên tắc để chọn đầu ra lành tính hơn.

Thật vậy, cách tiếp cận mới này có khả năng tiết kiệm thời gian và tiền bạc cho các công ty không cần phải xây dựng các mẫu đào tạo của riêng họ nữa. Thay vào đó, phương pháp 'làm sẵn' này có thể được sử dụng làm cơ sở để tạo các mô hình phù hợp với tùy chỉnh - không yêu cầu kiến ​​thức lập trình. Cũng cần lưu ý rằng công nghệ này cũng hứa hẹn tăng cường độ an toàn khi nói đến các bot đàm thoại. Tạo ra một tập hợp các nguyên tắc được chấp nhận về mặt pháp lý giảm thiểu rủi ro của việc AI trở nên lừa đảo.

Do đó, Constituation AI không chỉ hứa hẹn giúp việc phát triển mô hình trò chuyện trở nên dễ dàng và nhanh chóng hơn mà còn giúp nó trở nên an toàn hơn. Một tình huống đôi bên cùng có lợi cho thế giới Trí tuệ nhân tạo và ChatBots.

Cái nhìn phân tích về “AI theo ngữ cảnh” của Anthropic dành cho Chatbot

AI theo ngữ cảnh của Anthropic dựa trên việc kết hợp hơn 60 nguyên tắc bắt nguồn từ Tuyên bố Nhân quyền của Liên hợp quốc, Điều khoản dịch vụ của Apple, Nguyên tắc khuyến khích xem xét các quan điểm phi phương Tây, của Deepmind Quy tắc chim sẻ và Nghiên cứu nhân loại Tập 1 và Tập 2.

Việc AI giờ đây có thể được dạy cách hành xử theo các nguyên tắc bắt nguồn từ nguồn nguồn mở rộng và đa dạng như vậy thực sự đáng chú ý. Ví dụ, bằng cách kết hợp các nguyên tắc từ Tuyên bố Nhân quyền của Liên hợp quốc, các phản hồi của chatbot hiện phản ánh tầm quan trọng của việc duy trì khái niệm tự do, bình đẳng và tình anh em. Những nguyên tắc như vậy là một thành phần quan trọng để đảm bảo rằng hội thoại chatbot vẫn giữ đạo đức và tôn trọng. Tương tự như vậy, việc đưa vào Điều khoản dịch vụ của Apple đảm bảo chatbot xem xét lợi ích riêng tư của người dùng của nó.

Các nguyên tắc khuyến khích xem xét các quan điểm phi phương Tây cũng đóng một vai trò quan trọng trong mô hình “AI theo ngữ cảnh”. Những nguyên tắc này phản ánh sự cần thiết của AI trong việc tôn trọng các nền văn hóa khác và đảm bảo rằng các phản hồi của chatbot không bị coi là có hại hoặc xúc phạm. Tương tự, Quy tắc Sparrow của Deepmind quy định rằng chatbot phản hồi bằng các phản hồi nhằm xây dựng mối quan hệ với người dùng.

Sự kết hợp của Nhóm nghiên cứu nhân chủng học 1 và Nhóm 2 cung cấp sự đảm bảo cuối cùng rằng các cuộc trò chuyện AI vẫn lịch sự và tôn trọng. AI được đào tạo để đảm bảo rằng nó trả lời các câu hỏi một cách chu đáo và lịch sự.

Nói chung, mô hình “AI theo ngữ cảnh” của Anthropic là một bước đột phá cực kỳ quan trọng trong lĩnh vực Nghiên cứu AI. Bằng cách cho phép AI được dạy theo các nguyên tắc bắt nguồn từ nhiều nguồn khác nhau như vậy, ý nghĩa đạo đức của các cuộc hội thoại tự động được cải thiện rất nhiều.

Đọc thêm về AI:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Xem thêm bài viết
Damir Yalalov
Damir Yalalov

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Sự thèm muốn của các tổ chức ngày càng tăng đối với các quỹ ETF Bitcoin trong bối cảnh biến động

Tiết lộ thông qua hồ sơ 13F cho thấy các nhà đầu tư tổ chức đáng chú ý đang đầu tư vào Bitcoin ETF, nhấn mạnh sự chấp nhận ngày càng tăng đối với ...

Biết thêm

Ngày tuyên án đến: Số phận của CZ đang cân bằng khi Tòa án Hoa Kỳ xem xét lời bào chữa của DOJ

Changpeng Zhao sẽ phải đối mặt với bản tuyên án tại tòa án Hoa Kỳ ở Seattle vào ngày hôm nay.

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Injective hợp tác với AltLayer để mang lại tính bảo mật cho việc thiết lập lại inEVM
Kinh doanh Báo cáo tin tức Công nghệ
Injective hợp tác với AltLayer để mang lại tính bảo mật cho việc thiết lập lại inEVM
3 Tháng Năm, 2024
Masa hợp tác với Teller để giới thiệu nhóm cho vay MASA, cho phép vay USDC trên cơ sở
thị trường Báo cáo tin tức Công nghệ
Masa hợp tác với Teller để giới thiệu nhóm cho vay MASA, cho phép vay USDC trên cơ sở
3 Tháng Năm, 2024
Velodrome ra mắt phiên bản Superchain Beta trong những tuần tới và mở rộng trên các chuỗi khối lớp 2 của OP
thị trường Báo cáo tin tức Công nghệ
Velodrome ra mắt phiên bản Superchain Beta trong những tuần tới và mở rộng trên các chuỗi khối lớp 2 của OP
3 Tháng Năm, 2024
CARV công bố hợp tác với Aethir để phân cấp lớp dữ liệu và phân phối phần thưởng
Kinh doanh Báo cáo tin tức Công nghệ
CARV công bố hợp tác với Aethir để phân cấp lớp dữ liệu và phân phối phần thưởng
3 Tháng Năm, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH