Anthropic đề xuất 'AI theo ngữ cảnh' cho các mô hình trò chuyện dựa trên 60 nguyên tắc
Tóm lại
OpenAI sử dụng học tăng cường từ phản hồi của con người (RLHF) để căn chỉnh mô hình ngôn ngữ với các nguyên tắc của con người, an toàn và hữu ích.
Anthropic đã đề xuất một cách tiếp cận khác: AI theo ngữ cảnh, liên quan đến việc mọi người viết hiến pháp mà mô hình nên tuân theo.
Hiến pháp này dựa trên Tuyên ngôn Nhân quyền của Liên Hợp Quốc, Điều khoản Dịch vụ của Apple, Nguyên tắc Khuyến khích Xem xét Quan điểm Phi Phương Tây.
Anthropic đã đề xuất một cách tiếp cận mới để đào tạo các mô hình trò chuyện bằng cách sử dụng 'AI hiến pháp'. Phương pháp này được xây dựng trên OpenAI'S học tăng cường từ phản hồi của con người nhưng được xây dựng dựa trên phản hồi đó bằng cách tránh phải viết các mẫu đào tạo sâu. Thay vào đó, mô hình được đào tạo để đáp ứng đầu vào thông qua việc sử dụng hiến pháp có nghĩa là hoạt động như một bộ luật để mô hình tuân theo.
Thông qua phương pháp này, AI có thể tạo các mẫu đào tạo của riêng mình bằng cách đánh giá những gì nó đã nói so với bộ nguyên tắc được chấp nhận về mặt pháp lý. Kỹ thuật tiết kiệm thời gian này có thể được coi là Isaac Asimov'S Định luật người máy đưa vào thực tế.
Có quá nhiều nguyên tắc hình thành nên cơ sở của mô hình để có thể thảo luận chi tiết. Tuy nhiên, chúng đề cập đến nhiều chủ đề, chẳng hạn như đạo đức, lo ngại rủi ro, kinh tế và trí tuệ nhân tạo. Mỗi cái đã được phát triển để giúp hướng dẫn các quyết định của AI khi phản hồi lời nhắc đàm thoại.
Anthropic đã quản lý để đào tạo hiệu quả một mô hình AI tên là Claude, mô hình này đã cạnh tranh thành công với OpenAI'S ChatGPT. Sử dụng Phương pháp hiến pháp-AI, Claude có thể trả lời các lời nhắc đàm thoại ở mức độ chính xác ấn tượng, nhưng dự kiến sẽ có những cải tiến bổ sung khi Anthropic tiếp tục phát triển dựa trên công nghệ thay đổi cuộc chơi này.
Thật vậy, cách tiếp cận mới này có khả năng tiết kiệm thời gian và tiền bạc cho các công ty không cần phải xây dựng các mẫu đào tạo của riêng họ nữa. Thay vào đó, phương pháp 'làm sẵn' này có thể được sử dụng làm cơ sở để tạo các mô hình phù hợp với tùy chỉnh - không yêu cầu kiến thức lập trình. Cũng cần lưu ý rằng công nghệ này cũng hứa hẹn tăng cường độ an toàn khi nói đến các bot đàm thoại. Tạo ra một tập hợp các nguyên tắc được chấp nhận về mặt pháp lý giảm thiểu rủi ro của việc AI trở nên lừa đảo.
Do đó, Constituation AI không chỉ hứa hẹn giúp việc phát triển mô hình trò chuyện trở nên dễ dàng và nhanh chóng hơn mà còn giúp nó trở nên an toàn hơn. Một tình huống đôi bên cùng có lợi cho thế giới Trí tuệ nhân tạo và ChatBots.
Cái nhìn phân tích về “AI theo ngữ cảnh” của Anthropic dành cho Chatbot
AI theo ngữ cảnh của Anthropic dựa trên việc kết hợp hơn 60 nguyên tắc bắt nguồn từ Tuyên bố Nhân quyền của Liên hợp quốc, Điều khoản dịch vụ của Apple, Nguyên tắc khuyến khích xem xét các quan điểm phi phương Tây, của Deepmind Quy tắc chim sẻ và Nghiên cứu nhân loại Tập 1 và Tập 2.
Việc AI giờ đây có thể được dạy cách hành xử theo các nguyên tắc bắt nguồn từ nguồn nguồn mở rộng và đa dạng như vậy thực sự đáng chú ý. Ví dụ, bằng cách kết hợp các nguyên tắc từ Tuyên bố Nhân quyền của Liên hợp quốc, các phản hồi của chatbot hiện phản ánh tầm quan trọng của việc duy trì khái niệm tự do, bình đẳng và tình anh em. Những nguyên tắc như vậy là một thành phần quan trọng để đảm bảo rằng hội thoại chatbot vẫn giữ đạo đức và tôn trọng. Tương tự như vậy, việc đưa vào Điều khoản dịch vụ của Apple đảm bảo chatbot xem xét lợi ích riêng tư của người dùng của nó.
Các nguyên tắc khuyến khích xem xét các quan điểm phi phương Tây cũng đóng một vai trò quan trọng trong mô hình “AI theo ngữ cảnh”. Những nguyên tắc này phản ánh sự cần thiết của AI trong việc tôn trọng các nền văn hóa khác và đảm bảo rằng các phản hồi của chatbot không bị coi là có hại hoặc xúc phạm. Tương tự, Quy tắc Sparrow của Deepmind quy định rằng chatbot phản hồi bằng các phản hồi nhằm xây dựng mối quan hệ với người dùng.
Sự kết hợp của Nhóm nghiên cứu nhân chủng học 1 và Nhóm 2 cung cấp sự đảm bảo cuối cùng rằng các cuộc trò chuyện AI vẫn lịch sự và tôn trọng. AI được đào tạo để đảm bảo rằng nó trả lời các câu hỏi một cách chu đáo và lịch sự.
Nói chung, mô hình “AI theo ngữ cảnh” của Anthropic là một bước đột phá cực kỳ quan trọng trong lĩnh vực Nghiên cứu AI. Bằng cách cho phép AI được dạy theo các nguyên tắc bắt nguồn từ nhiều nguồn khác nhau như vậy, ý nghĩa đạo đức của các cuộc hội thoại tự động được cải thiện rất nhiều.
Đọc thêm về AI:
Từ chối trách nhiệm
Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.
Giới thiệu về Tác giả
Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet.
Xem thêm bài viếtDamir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet.